Khi NVIDIA trình diễn DLSS 4 tạo ra mười lăm trên mỗi mười sáu pixel bằng AI, một bộ phận lớn khán giả lại không thấy sự tiến bộ. Họ thấy "khung hình giả" và "AI slop": những chi tiết được tạo ra trông có vẻ đúng cho đến khi nó không còn đúng nữa, và bạn không thể gỡ lỗi theo cách bạn gỡ một polygon đặt sai chỗ. Một bài viết của PCGuide về một cuộc thăm dò cộng đồng cho thấy 54% phản hồi là một câu "Không" thẳng thừng về DLSS 5, với phần lớn lời chỉ trích nhắm vào các đặc điểm khuôn mặt và phản ứng "AI slop". Phản ứng đó đáng được xem xét nghiêm túc, và chúng ta sẽ quay lại với nó.
Nhưng vấn đề lớn hơn trong mỗi lập luận đó là "neural rendering" được dùng cho ít nhất năm thứ khác nhau: upscaling, các khung hình do AI tạo ra, tái dựng cảnh từ ảnh chụp, các bản demo NeRF và Gaussian Splatting bạn từng thấy trên mạng xã hội, và các hệ thống nghiên cứu render cả một bức ảnh bằng một mạng duy nhất. Người ta tranh cãi mà không gặp nhau vì mỗi người đang chỉ vào một lớp khác nhau nhưng dùng cùng một từ. Jensen Huang của NVIDIA đã gọi sự chuyển dịch này là "khoảnh khắc GPT cho đồ họa". Đó là tuyên bố. Câu hỏi hữu ích là điều gì đang diễn ra bên dưới nó.
Đây là mạch xuyên suốt khiến toàn bộ chuyện này trở nên dễ hiểu: GPU ngày càng dự đoán bức ảnh thay vì tính toán nó. Theo truyền thống, GPU tính toán từng pixel bằng cách mô phỏng hình học, ánh sáng và vật liệu (rasterization, và gần đây hơn là ray tracing chồng lên trên). Neural rendering thay đổi cái gì được tính toán so với cái gì được dự đoán bởi một mạng đã được huấn luyện. Một khác biệt duy nhất đó chính là xương sống của bài viết này. Đến cuối bài bạn sẽ có thể đặt bất kỳ kỹ thuật nào lên một phổ, biết cái nào chạy thời gian thực và trên phần cứng nào, và phân biệt cái gì đang có trong một trò chơi hôm nay với cái gì chỉ là một bài báo nghiên cứu hay một bản demo GTC. Đây là một tấm bản đồ, không phải hướng dẫn cách làm. Cơ chế sâu của bất kỳ kỹ thuật đơn lẻ nào đều là bài viết riêng của chúng.
Phiên bản ngắn gọn
- Neural rendering là một phổ, không phải từ đồng nghĩa của DLSS. Nó trải dài từ nghiên cứu tái dựng cảnh (NeRF, Gaussian Splatting), các thành phần thời gian thực nằm bên trong đường ống render (DLSS, Ray Reconstruction, neural radiance cache), đến các phương pháp sinh tạo bịa ra chi tiết mà khung hình chưa từng có.
- Mạch xuyên suốt là "dự đoán thay vì tính toán". Mỗi kỹ thuật thay thế một giai đoạn tính toán tốn kém của đường ống bằng một mạng dự đoán kết quả mà nó đã được huấn luyện.
- Phần lớn những gì xuất xưởng hôm nay là lai (hybrid). Upscaling, sinh khung hình và khử nhiễu bằng AI giờ đã chạy trong các trò chơi thời gian thực, trong khi nén kết cấu neural và neural shaders đang xuất hiện qua các bộ công cụ cho nhà phát triển. Các bộ render neural đầy đủ vẽ toàn bộ bức ảnh bằng một mạng vẫn còn ở giai đoạn nghiên cứu.
- Nó đang trở thành câu chuyện liên nhà cung cấp, không chỉ riêng của NVIDIA. Công việc DirectX của Microsoft về ML cấp shader bắt đầu với Cooperative Vectors trong Shader Model 6.9 và đang tiến tới hỗ trợ đại số tuyến tính rộng hơn trong Shader Model 6.10, mở ra cho các engine một con đường nhắm tới các tải công việc shader kiểu neural vượt ngoài ngăn xếp của một nhà cung cấp.
Tại sao "Neural Rendering" lại có nghĩa là năm thứ khác nhau
Neural rendering là một nhóm phương pháp dùng mạng neural để dự đoán các phần của bức ảnh (pixel, ánh sáng, vật liệu, thậm chí cả khung hình) mà nếu không thì GPU sẽ phải tính toán từ đầu. Khảo sát của Tewari và cộng sự định nghĩa nó là sự kết hợp đồ họa máy tính cổ điển với các mô hình sinh tạo sâu để cho đầu ra giống thật. Thuật ngữ này trải dài trên một phổ rộng, và "DLSS" chỉ là một điểm trên đó.
Lý do cuộc trò chuyện trở nên lộn xộn là vì phổ này có ít nhất ba lớp riêng biệt, mà công chúng lại dùng một từ cho tất cả.
Lớp thứ nhất là neural rendering học thuật / tái dựng: NeRF, 3D Gaussian Splatting và differentiable rendering. Những thứ này lấy ảnh chụp hoặc số đo của một cảnh thực rồi học một cách biểu diễn mà bạn có thể render từ những góc máy mới. bài báo NeRF gốc (Mildenhall và cộng sự, 2020) huấn luyện một mạng nhỏ để ánh xạ một tọa độ 3D và hướng nhìn thành màu sắc và mật độ, rồi render các góc nhìn mới bằng cách truy vấn nó. Lớp này phần lớn là ngoại tuyến. Nó tái dựng cảnh; nó không vận hành vòng lặp khung hình của trò chơi bạn.
Lớp thứ hai là neural rendering đường ống thời gian thực: các mạng chạy bên trong hoặc song song với một khung hình được rasterize bình thường. DLSS upscaling, Ray Reconstruction và neural radiance cache sống ở đây. Đường ống vẫn rasterize và ray-trace; một mạng xử lý một giai đoạn tốn kém của nó. Đây là lớp đang có trong các trò chơi hôm nay.
Lớp thứ ba là neural rendering sinh tạo: mạng tạo ra nội dung hình ảnh mà khung hình chưa từng tính toán chút nào. Các khung hình sinh ra của DLSS 4 nằm ở rìa của lớp này, và DLSS 5 (mà NVIDIA đã công bố cho Mùa thu 2026) đẩy sâu hơn vào đó bằng cách sinh ra chi tiết ánh sáng và vật liệu thay vì chỉ nội suy giữa các khung hình đã render.
Ba lớp này hành xử khác nhau, chạy ở tốc độ khác nhau và cần phần cứng khác nhau. Việc coi chúng là một thứ chính là lý do hai người có thể đồng thời nói "neural rendering bị thổi phồng quá mức" và "neural rendering là tương lai" mà cả hai đều đúng một phần.
Điểm chính của phần: Thuật ngữ này có trước DLSS và không phải từ đồng nghĩa của nó. DLSS là một ứng dụng (thời gian thực, trong đường ống) nằm bên trong một phổ rộng hơn nhiều, trải từ tái dựng cảnh ngoại tuyến đến các khung hình được sinh ra hoàn toàn.
Neural Rendering Đang Thay Thế Các Phần Của Đường Ống Vét Cạn Như Thế Nào
Với sinh đa khung hình DLSS 4 đầy đủ, khoảng mười lăm trên mỗi mười sáu pixel trên màn hình là do AI tạo ra chứ không phải render theo cách truyền thống (theo số liệu DLSS 4 của NVIDIA). Con số đó là toàn bộ sự chuyển dịch nén lại trong một thống kê: bộ render tính toán một phần nhỏ của bức ảnh và dự đoán phần còn lại.
Render truyền thống kiếm được từng pixel. GPU rasterize hình học, chạy shaders để tính ánh sáng và vật liệu, và (với ray tracing) mô phỏng ánh sáng nảy quanh cảnh. Riêng ray tracing tốn kém một cách tàn bạo, vì ánh sáng chân thực cần nhiều lần nảy và nhiều mẫu trên mỗi pixel, và nhiễu do lấy mẫu thiếu phải được làm sạch sau đó. Khi cảnh trở nên tham vọng hơn, các giai đoạn tốn kém nhất trở thành mục tiêu hiển nhiên: thay vì tính toán chúng, hãy huấn luyện một mạng để dự đoán đầu ra của chúng.
Quá trình tiến triển diễn ra đều đặn chứ không đột ngột:
- 2018, DLSS 1.0. Bước thương mại đầu tiên: render ở độ phân giải thấp, dự đoán bức ảnh độ phân giải cao. Chuyển việc upscale từ "tính nhiều pixel hơn" sang "dự đoán nhiều pixel hơn".
- 2020, NeRF. Tái dựng cảnh từ ảnh thông qua một trường bức xạ (radiance field) đã học. Dự đoán các góc nhìn mới thay vì mô hình hóa và render hình học.
- 2021, Neural Radiance Cache. Dự đoán ánh sáng nảy trong lúc path tracing để bộ render có thể dừng truy vết sớm.
- 2022, DLSS 3 Frame Generation. Sinh nguyên cả khung hình trung gian thay vì render chúng.
- 2023, 3D Gaussian Splatting. Một lựa chọn thay thế NeRF nhanh hơn, thiên về thời gian thực hơn cho các cảnh được tái dựng.
- 2025, DLSS 4 + RTX Kit. Sinh đa khung hình cộng với một bộ công cụ gồm các thành phần neural (nén kết cấu, radiance cache, neural shaders).
- 2025, DirectX Cooperative Vectors (bản xem trước). Một API liên nhà cung cấp cho phép toán ma trận mà neural shaders cần (giới thiệu ở dạng xem trước như một phần của Shader Model 6.9).
- 2026, DLSS 4.5. Cải thiện chất lượng và Ray Reconstruction theo từng bước (được NVIDIA mô tả tại Computex).
- Mùa thu 2026, DLSS 5 (đã công bố). Cú đẩy tiếp theo hướng tới neural rendering sinh tạo.
Đọc từ trên xuống dưới, mỗi hàng là cùng một nước đi áp dụng cho một giai đoạn khác nhau: lấy một thứ mà đường ống từng tính toán và để một mạng dự đoán nó thay thế.
Sáu Lớp: AI Thay Thế Gì Ở Mỗi Giai Đoạn Của Đường Ống
Sáu kỹ thuật gánh phần lớn neural rendering thời gian thực hiện nay, và mỗi kỹ thuật thay thế một giai đoạn tính toán cụ thể: upscaling (độ phân giải), sinh khung hình (số lượng khung hình), ray reconstruction (khử nhiễu), neural radiance cache (chiếu sáng toàn cục), nén kết cấu neural (lưu trữ vật liệu), và neural shaders (tính toán bên trong shader). Biết mỗi kỹ thuật chạm vào giai đoạn nào là phần lớn của trận đấu.
Chúng phân chia theo vị trí trong đường ống nơi mạng chạy. Một số hoạt động ở tận cùng dưới dạng hậu xử lý trên một khung hình đã hoàn thành; một số chạy giữa đường ống song song với ray tracing; một số sống bên trong chính shader. Vị trí đó không phải chi tiết vụn vặt. Nó quyết định kỹ thuật có thể chạy nhanh tới đâu và cần phần cứng gì. Bảng ánh xạ sáu kỹ thuật đó; các tiểu mục bên dưới giải thích cơ chế không vừa gọn vào từng ô.
| Kỹ thuật | Thay thế cái gì | Khả năng thời gian thực | Phần cứng cần thiết | Liên nhà cung cấp? |
|---|---|---|---|---|
| Upscaling bằng AI (siêu phân giải) | Tính toán pixel ở độ phân giải gốc | Thời gian thực, chi phí thấp | Nhân Tensor / ma trận (RTX 20+, RDNA 4, Intel XMX) | Có, xét như một loại; cách triển khai vẫn riêng theo nhà cung cấp (DLSS, FSR / FSR Upscaling, XeSS) |
| Sinh khung hình | Render các khung hình trung gian | Thời gian thực; thêm độ trễ | RTX 40+ (DLSS 3), RTX 50 cho đa khung hình | Một phần; riêng theo nhà cung cấp |
| Ray reconstruction | Ngăn xếp bộ khử nhiễu tinh chỉnh thủ công | Thời gian thực | RTX 20+ | Hiện tại là NVIDIA |
| Neural radiance cache | Tính toán ánh sáng gián tiếp nhiều lần nảy | Thời gian thực (báo cáo ~2,6 ms) | Nhân ma trận cấp RTX | Hiện tại là NVIDIA (RTX Kit) |
| Nén kết cấu neural | Lưu trữ vật liệu nén theo khối | Giải mã thời gian thực | Nhân ma trận cấp RTX | Hiện tại là SDK/công cụ của NVIDIA; hỗ trợ ML cấp shader rộng hơn đang được chuẩn hóa riêng |
| Neural shaders | Các đường mã shader từng được tính toán | Thời gian thực | ML cấp shader / GPU có khả năng ma trận | Đang xuất hiện qua con đường DirectX SM 6.9 / SM 6.10 |
Upscaling Bằng AI (Siêu Phân Giải)
Upscaling bằng AI render khung hình ở độ phân giải thấp hơn rồi dự đoán kết quả độ phân giải cao, nên GPU vẽ ít pixel hơn nhiều và một mạng lấp đầy cấu trúc. DLSS, FSR 4 của AMD và XeSS của Intel đều làm điều này qua upsampling theo thời gian (temporal) : chúng lấy mẫu các pixel khác nhau qua các khung hình liên tiếp và kết hợp lịch sử đó với các vector chuyển động để tái dựng chi tiết mà một khung hình độ phân giải thấp đơn lẻ không chứa.
Đây là lớp trưởng thành nhất và được triển khai rộng rãi nhất, và đó là nơi thực tế liên nhà cung cấp rõ ràng nhất. DLSS 4 đã chuyển bộ upscaler của nó từ mạng tích chập sang transformer để chi tiết ổn định hơn. FSR 4 là bộ upscaler dựa trên ML đầu tiên của AMD, chạy trên RDNA 4 với suy luận FP8 thay vì các heuristic viết tay của các phiên bản FSR trước. XeSS dùng các đơn vị ma trận XMX của Intel. Ba nhà cung cấp, cùng một ý tưởng nền tảng: dự đoán những pixel bạn đã không render.
Sinh Khung Hình Và Sinh Đa Khung Hình
Sinh khung hình dự đoán nguyên cả khung hình nằm giữa những khung mà GPU thực sự render, bằng cách kết hợp dữ liệu trò chơi như vector chuyển động với ước lượng optical-flow và AI. DLSS 3 dùng Optical Flow Accelerator của dòng RTX 40 để chèn một khung hình sinh ra giữa các khung đã render; DLSS 4 Multi Frame Generation trên phần cứng dòng RTX 50 có thể sinh tối đa ba khung hình bổ sung cho mỗi khung được render theo cách truyền thống, và NVIDIA cho biết DLSS 4 thay thế bước optical-flow phần cứng bằng một mô hình AI hiệu quả hơn.
Đây là lớp mà lập luận "khung hình giả" thực sự nói đến, và cách đóng khung ở đây rất quan trọng. Một khung hình sinh ra là một phép nội suy hợp lý về nơi cảnh đang hướng tới: nó cho bạn thấy nội dung hình ảnh dùng được. Nhưng nó được dự đoán, chứ không render từ trạng thái thực tế của trò chơi, và nó không mang logic trò chơi mới hay đầu vào mới. Quan trọng là, sinh khung hình chạy sau (after) khi một khung hình đã được render, điều đó thêm độ trễ chứ không loại bỏ nó; Reflex 2 của NVIDIA tồn tại chính là để giành lại độ trễ đó. Vậy nên "sinh khung hình làm trò chơi nhanh hơn" là một nửa sự thật: nó nâng độ mượt cảm nhận được (nhiều khung hình hiển thị hơn) mà không nâng tốc độ trò chơi thực sự cập nhật và phản hồi. Khoảng cách giữa cái bạn thấy và cái trò chơi biết chính là toàn bộ cuộc tranh luận, và với chơi cạnh tranh, nơi độ trễ đầu vào quyết định kết quả, đó là một sự đánh đổi đáng cân nhắc.
Ray Reconstruction (Khử Nhiễu Bằng AI)
Ray Reconstruction thay thế ngăn xếp các bộ lọc khử nhiễu tinh chỉnh thủ công mà render ray-trace dựa vào, bằng một mạng neural duy nhất được huấn luyện để tái dựng một bức ảnh sạch từ đầu vào ray-trace nhiễu, lấy mẫu thiếu. Path tracing chỉ có thể kham được vài mẫu ánh sáng trên mỗi pixel trong thời gian thực, khiến đầu ra thô bị nhiễu; phải có thứ gì đó làm sạch nó trước khi bạn thấy.
Cách tiếp cận truyền thống là một chuỗi các bộ khử nhiễu chuyên biệt, mỗi cái được tinh chỉnh thủ công cho một hiệu ứng cụ thể. Đổi nó lấy một mạng đã huấn luyện thường giữ được chi tiết mà các bộ lọc thủ công làm nhòe, đặc biệt là trên phản chiếu và ánh sáng tinh tế, và nó là một mạng để bảo trì thay vì một đường ống dễ vỡ gồm nhiều bộ. Đây là một ví dụ rõ ràng của mạch xuyên suốt: giai đoạn khử nhiễu chuyển từ "tính toán bằng heuristic viết tay" sang "dự đoán bằng một mô hình đã huấn luyện".
Neural Radiance Cache (Chiếu Sáng Toàn Cục)
neural radiance cache (NRC) dự đoán ánh sáng nảy quanh cảnh ra sao để bộ path tracer có thể dừng truy vết phần lớn các tia sớm thay vì theo từng lần nảy đến tận cùng. Chiếu sáng toàn cục (ánh sáng gián tiếp mềm mại nảy ra từ tường và sàn) là một trong những thứ tốn kém nhất trong đồ họa thời gian thực, và cơ chế khiến NRC hoạt động hiếm khi được giải thích bằng ngôn ngữ giản dị, nên đáng để chậm lại mà xem.
Cơ chế là thế này. Một path tracer thường theo mỗi tia sáng qua nhiều lần nảy, đó là nơi chi phí bùng nổ. NRC huấn luyện một mạng nhỏ trong lúc (during) render (chứ không phải trước đó) để dự đoán ánh sáng đến một điểm sau những lần nảy tiếp theo. Vậy path tracer truy vết một tia qua một hoặc hai lần nảy, rồi hỏi mạng "phần ánh sáng còn lại ở đây là gì?" và kết thúc đường đi sớm; bài báo về neural radiance caching thời gian thực (Müller và cộng sự, 2021) báo cáo rằng phần lớn các đường đi được kết thúc theo cách này. Hãy nghĩ về nó như một bộ nhớ đệm không lưu các câu trả lời chính xác từng thấy trước đó, mà học khuôn mẫu chiếu sáng của cảnh đủ tốt để trả lời cả những truy vấn nó chưa thấy, và liên tục học lại khi cảnh thay đổi. NVIDIA báo cáo NRC chạy với chi phí khoảng 2,6 ms, chính điều đó khiến nó khả thi thời gian thực chứ không phải một thứ tò mò trong nghiên cứu.
Nén Kết Cấu Neural
nén kết cấu neural (NTC) nén tất cả các kênh kết cấu của một vật liệu cùng nhau bằng một mạng, đạt mức tiết kiệm VRAM tới 8 lần so với nén theo khối truyền thống ở chất lượng hình ảnh tương đương (theo tài liệu RTX Kit của NVIDIA). Một vật liệu hiện đại không phải là một kết cấu. Nó là một chồng kết cấu (màu, normal, độ nhám, độ kim loại và nhiều thứ khác), và các kênh đó tương quan với nhau theo những cách mà nén theo khối, vốn ép từng kênh độc lập, vứt bỏ đi.
NTC khai thác tương quan đó. Bằng cách học cấu trúc chung trên tất cả các kênh của một vật liệu cùng một lúc, nó lưu cùng một vật liệu trong bộ nhớ ít hơn nhiều và giải mã nó tức thời lúc render. VRAM là một ràng buộc dai dẳng khi các trò chơi đẩy chi tiết kết cấu, nên "nhét vật liệu nhiều hơn 8 lần trong cùng bộ nhớ" là một thắng lợi trực tiếp, thiết thực chứ không phải một chiêu trò hình ảnh.
Neural Shaders Và DirectX Cooperative Vectors
Neural shaders chạy các mạng neural nhỏ bên trong một shader lập trình được (các chương trình theo từng pixel/từng đỉnh mà GPU vốn đã thực thi) để một mạng có thể xấp xỉ một hiệu ứng tính toán tốn kém ngay tại nơi cần hiệu ứng đó. Thay vì gắn AI vào như một lượt riêng, MLP chạy như một phần của shader trên các đơn vị ma trận của GPU (Tensor Cores trên phần cứng NVIDIA).
Tensor Cores xử lý phép toán ma trận mà các mạng này chạy trên đó, tách biệt với các nhân đa dụng xử lý phần công việc còn lại. Thứ biến neural shaders từ một tính năng của một nhà cung cấp thành một năng lực rộng hơn của ngành chính là lớp API bên dưới chúng. Microsoft đã giới thiệu DirectX Cooperative Vectors ở dạng xem trước cùng Shader Model 6.9 vào năm 2025 để phơi bày các phép toán vector/ma trận bên trong các shader HLSL. Đến năm 2026, Shader Model 6.9 đã chuyển sang bản chính thức, và Microsoft cho biết Cooperative Vector đang bị loại bỏ để nhường chỗ cho một thiết kế đại số tuyến tính rộng hơn dự kiến cho Shader Model 6.10. Điểm rút ra an toàn không phải là Cooperative Vectors là API cuối cùng, mà là DirectX đang tiến tới hỗ trợ ML cấp shader liên nhà cung cấp.
Điểm chính của phần: Sáu kỹ thuật được sắp xếp theo nơi mạng chạy: hậu xử lý ở cuối khung hình, giữa đường ống song song với ray tracing, hoặc bên trong chính shader. Vị trí đó là thứ quyết định một kỹ thuật có thể chạy thời gian thực hay không và cần phần cứng nào.
Cái Gì Chạy Thời Gian Thực, Và Trên Phần Cứng Nào
Lằn ranh thời gian thực sắc nét hơn so với những gì sự thổi phồng gợi ý: upscaling bằng AI thường chạy với chi phí thấp, NRC thêm khoảng 2,6 ms, và 3D Gaussian Splatting tiệm cận thời gian thực cho cảnh tĩnh. NeRF gốc và các bộ render neural đầy đủ như RenderFormer thì chắc chắn chỉ dành cho nghiên cứu, tốn quá nhiều thời gian cho mỗi khung hình để dùng tương tác. "Neural rendering là thời gian thực" đúng với lớp trong đường ống và sai với lớp tái dựng cùng lớp render đầy đủ.
Sự phân chia đó bám theo phổ một cách chính xác. Một số thành phần trong đường ống, đặc biệt là upscaling, sinh khung hình và Ray Reconstruction, đã chạy trong các trò chơi đã phát hành. Những thứ khác, như NRC, NTC và neural shaders, được mô tả đúng hơn là các công nghệ cho nhà phát triển và các tính năng bộ công cụ đang xuất hiện, hơn là các tính năng sản xuất phổ biến. Lớp tái dựng thì hỗn hợp: NeRF gốc chậm, nhưng 3D Gaussian Splatting là một cú đẩy có chủ ý hướng tới thời gian thực và đạt được điều đó cho cảnh tĩnh. Lớp bộ render neural đầy đủ (một mạng duy nhất tạo ra cả bức ảnh) là nơi nghiên cứu cư ngụ và thời gian mỗi khung hình còn xa mới đến mức tương tác.
Phần cứng là nửa còn lại của câu trả lời, và đây là nơi câu chuyện liên nhà cung cấp đáp xuống. Mọi kỹ thuật ở đây đều chạy trên các đơn vị toán ma trận mà GPU hiện đại trang bị cho suy luận AI:
- NVIDIA có Tensor Cores trên mọi card RTX từ dòng 20 trở đi, đó là lý do hầu hết các kỹ thuật này ra mắt ở đó.
- của AMD FSR Upscaling dựa trên ML hiện nhắm tới các GPU dòng RDNA 4 / Radeon RX 9000 cho con đường ML; trên phần cứng đời cũ hơn, SDK của AMD lùi về các đường FSR 3.1.5 phân tích. Hãy coi việc hỗ trợ GPU cũ rộng hơn là một mục lộ trình đang thay đổi, không phải tính năng FSR 4 được bảo đảm, trừ khi bạn dẫn một thông báo cụ thể của AMD.
- Intel dùng các engine ma trận XMX trên GPU Arc cho XeSS.
Bản thân DLSS bị giới hạn tính năng theo thế hệ: upscaling chạy lùi về tới dòng RTX 20, sinh khung hình gốc cần dòng RTX 40, và sinh đa khung hình chỉ dành cho dòng RTX 50. Nếu bạn đang cố suy luận xem một card nhất định làm được gì, việc giới hạn theo thế hệ đó là câu trả lời thiết thực, chứ không phải bậc tiếp thị.
Cái bạn có thể dùng hôm nay so với cái sắp tới: Upscaling, sinh khung hình và Ray Reconstruction đã có sẵn trong các trò chơi hôm nay. Các thành phần RTX Kit như NRC, NTC và neural shaders có sẵn dưới dạng công nghệ và công cụ cho nhà phát triển, nhưng bạn không nên ngụ ý rằng tất cả chúng đã phổ biến trong các trò chơi đã phát hành. Gaussian Splatting có công cụ mở dùng được để chụp cảnh. Cái chưa có ở đây: các bộ render neural đầy đủ vẽ nguyên cả khung hình bằng một mạng, neural shaders liên nhà cung cấp đã chín muồi (hỗ trợ của AMD còn sớm), và các tính năng sinh tạo của DLSS 5 (công bố cho Mùa thu 2026). Nếu bạn muốn thử nghiệm phía tái dựng (tự chạy NeRF hay các tải công việc suy luận), đó là một công việc GPU compute , chứ không phải thứ trò chơi làm hộ bạn.
Neural Rendering Không Phải Là Gì: Năm Hiểu Lầm
Phần lớn các lập luận về neural rendering trở nên dễ hơn một khi bạn xác định được lập luận đó nói về lớp nào của phổ. Năm hiểu lầm cứ xuất hiện đi xuất hiện lại.
1. "DLSS upscaling là neural rendering." DLSS là an ứng dụng của neural rendering, lớp thời gian thực trong đường ống, không phải toàn bộ lĩnh vực. Thuật ngữ này có trước DLSS và bao gồm NeRF, Gaussian Splatting và các phương pháp sinh tạo. Đánh đồng hai thứ này cũng như gọi "cơ sở dữ liệu" là từ đồng nghĩa của một sản phẩm mà bạn tình cờ dùng.
2. "Sinh khung hình làm trò chơi nhanh hơn." Nó nâng số khung hình bạn thấy, làm chuyển động trông mượt hơn, nhưng nó chạy sau khi render và thêm độ trễ. Tốc độ trò chơi cập nhật và phản hồi đầu vào của bạn không tăng. Với chơi cạnh tranh, độ trễ đó là một đánh đổi thực sự; với độ mượt hình ảnh thì đó là một thắng lợi đích thực. "Nhanh hơn" gộp lẫn hai điều đó.
3. "DLSS 5 nhận biết 3D / đọc cảnh 3D." Đây là điều đáng hiểu cho đúng nhất, vì giới đưa tin công nghệ cứ mô tả sai về nó. Như NVIDIA mô tả, DLSS 5 lấy dữ liệu màu và vector chuyển động của mỗi khung hình làm đầu vào, rồi dùng mô hình đã huấn luyện để suy ra ngữ nghĩa của cảnh như nhân vật, tóc, vải, da và điều kiện ánh sáng. Nó bám vào nội dung của trò chơi, nhưng NVIDIA không mô tả nó như đọc trực tiếp tệp cảnh 3D đầy đủ của trò chơi. "Dẫn hướng bằng 3D (3D-guided)" nghĩa là suy luận nhất quán với hình học (nó tôn trọng cách các bề mặt di chuyển và liên hệ với nhau), không phải mạng đọc trực tiếp hình học của cảnh. Sự phân biệt này quan trọng vì nó giới hạn những gì kỹ thuật có thể biết và không thể biết.
4. "NeRF giờ đã là thời gian thực." Tùy vào bạn nói đến kỹ thuật nào, mà đó chính xác là vấn đề của phổ. NeRF gốc không phải thời gian thực. 3D Gaussian Splatting tiệm cận thời gian thực cho cảnh tĩnh. Các hệ thống nghiên cứu render nguyên một khung hình bằng một mạng (RenderFormer và những thứ tương tự) thì hoàn toàn không phải thời gian thực. "NeRF" đã trở thành một cái tên gộp cho cả nửa tá phương pháp với tốc độ khác nhau một trời một vực.
5. "Neural rendering sẽ sớm thay thế rasterization." Các hệ thống hôm nay là lai: các thành phần neural nằm bên trong một đường ống rasterization-và-ray-tracing, chứ không thay thế nó. Thay thế hoàn toàn đường ống cổ điển bằng một bộ render sinh tạo duy nhất là một mục tiêu nghiên cứu dài hạn, không phải một hướng sản phẩm gần. Hãy coi "tương lai là hoàn toàn neural" như một hướng đi, chứ không phải một dự đoán có gắn mốc thời gian.
Điểm chính của phần: Căn nguyên gốc duy nhất của gần như mọi bất đồng về neural rendering là người ta dùng cùng một từ cho các lớp khác nhau của phổ. Hãy định vị lập luận trên phổ trước, rồi phần lớn cuộc tranh cãi sẽ biến mất.
Điều Này Đang Đi Về Đâu
Quỹ đạo này nhất quán với mọi thứ ở trên: đường ống lai hôm nay, nhiều giai đoạn hơn chuyển từ tính toán sang dự đoán, neural shaders liên nhà cung cấp mở rộng ai có thể xuất xưởng thứ này, và biên giới bộ render neural đầy đủ vẫn còn nhiều năm nữa. Bước tiếp theo cho người dùng là DLSS 5, công bố cho Mùa thu 2026, đẩy vào neural rendering sinh tạo bằng cách tạo ra chi tiết ánh sáng và vật liệu mà trò chơi chưa từng tính toán, thay vì chỉ nội suy giữa các khung hình đã render. NVIDIA đã trình diễn công nghệ này trong bối cảnh dòng RTX 50, nhưng các yêu cầu phần cứng người dùng cuối cùng của nó nên được coi là chưa xác nhận cho đến khi NVIDIA công bố một danh sách tương thích rõ ràng.
Cái nhìn về phía trước có hai nửa. Ở phía gần, nước đi quan trọng nhất không phải bất kỳ kỹ thuật đơn lẻ nào. Đó là sự chuẩn hóa. Con đường DirectX của Microsoft đang chuyển từ Cooperative Vectors sang đại số tuyến tính cấp shader rộng hơn, điều có thể cho phép các engine nhắm tới các tải công việc kiểu neural mà không phải đặt cược vào một thương hiệu GPU. Ở phía xa, các nhà nghiên cứu của NVIDIA đã mô tả một đích đến tương lai xa, đôi khi được nêu ra như một "DLSS 10" giả định, nơi bộ render hoàn toàn là neural và đường ống cổ điển biến mất (được thuật lại gián tiếp từ một bàn tròn của Digital Foundry; hãy coi đó là một hướng được nêu, không phải một lộ trình). Đích đến của cái thang là một hệ thống tạo ra một thế giới mạch lạc thay vì vẽ ra một thế giới.
Tuy vậy vẫn đáng giữ sự hoài nghi. Chi tiết được sinh ra có thể đi chệch khỏi ý đồ nghệ thuật, và một mạng có thể ảo giác ra những hình ảnh trông hợp lý nhưng sai, không có đối chiếu truyền thống nào để gỡ lỗi: một vấn đề QA được nêu tại GDC 2026, và là cái thực chất nằm sau phần lớn phản ứng "AI slop". Xây dựng cho nơi đồ họa đang hướng tới không có nghĩa là vờ rằng đầu ra hiện tại đã hoàn thiện. Nó có nghĩa là theo dõi xem giai đoạn nào chuyển từ tính toán sang dự đoán tiếp theo, và đánh giá mỗi cái bằng việc nó làm gì với bức ảnh chứ không phải bằng cái từ gắn vào nó.
Câu hỏi thường gặp
DLSS Có Phải Là Neural Rendering Không?
Có, nhưng nó chỉ là một loại. DLSS là một ứng dụng của neural rendering: cụ thể là lớp thời gian thực, trong đường ống, bao gồm upscaling bằng AI và sinh khung hình. Thuật ngữ rộng hơn có trước DLSS và cũng bao gồm các phương pháp tái dựng cảnh như NeRF và Gaussian Splatting và các phương pháp sinh tạo bịa ra chi tiết hình ảnh mới. Vậy nên mọi tính năng DLSS đều là neural rendering, nhưng rất nhiều neural rendering không phải là DLSS.
Sự Khác Biệt Giữa Neural Rendering Và Ray Tracing Là Gì?
Ray tracing mô phỏng ánh sáng bằng cách tính toán các tia nảy qua một cảnh ra sao; neural rendering dự đoán kết quả từ một mạng đã huấn luyện thay vì tính toán chúng. Chúng không phải đối thủ. Chúng kết hợp với nhau. Chẳng hạn, Ray Reconstruction dùng một mạng neural để khử nhiễu đầu ra ray-trace bị nhiễu, và neural radiance cache dự đoán ánh sáng nảy để bộ ray tracer có thể dừng sớm. Các kỹ thuật neural khiến ray tracing trở nên kham được trong thời gian thực.
DLSS Frame Generation Có Thêm Độ Trễ Không?
Có. Sinh khung hình chạy sau khi một khung hình đã được render và chèn các khung hình dự đoán vào giữa các khung đã render, điều đó thêm độ trễ chứ không loại bỏ nó: Reflex 2 của NVIDIA tồn tại chính là để bù lại. Nó tăng độ mượt cảm nhận được (nhiều khung hình hiển thị hơn) mà không tăng tốc độ trò chơi cập nhật và phản hồi đầu vào. Với chơi cạnh tranh đó là một đánh đổi; với độ mượt khi chơi đơn thì thường là một thắng lợi ròng.
NeRF Có Phải Là Thời Gian Thực Không?
Tùy vào bạn nói đến kỹ thuật nào. NeRF gốc không phải thời gian thực. 3D Gaussian Splatting, một phương pháp ra đời sau, tiệm cận thời gian thực cho cảnh tĩnh. Các bộ render neural đầy đủ vẽ nguyên một khung hình bằng một mạng chỉ dành cho nghiên cứu và còn xa mới đạt tốc độ tương tác. "NeRF" thường được dùng một cách lỏng lẻo để bao trùm nhiều phương pháp với hiệu năng rất khác nhau, đó là nguồn gốc của phần lớn sự nhầm lẫn.
Neural Rendering Có Thay Thế Rasterization Không?
Không sớm đâu. Các hệ thống hôm nay là lai: các thành phần neural chạy bên trong một đường ống rasterization-và-ray-tracing, chứ không thay thế nó. Thay thế hoàn toàn đường ống cổ điển bằng một bộ render sinh tạo duy nhất là một mục tiêu nghiên cứu dài hạn, không phải một sản phẩm gần. Hướng đi thực tế là ngày càng nhiều giai đoạn của đường ống chuyển từ tính toán sang dự đoán theo thời gian, với rasterization vẫn làm việc thực trong nhiều năm nữa.
Nén Kết Cấu Neural Là Gì?
nén kết cấu neural (NTC) là một phương pháp neural nén tất cả các kênh kết cấu của một vật liệu cùng nhau (màu, normal, độ nhám và phần còn lại), đạt mức tiết kiệm VRAM tới 8 lần so với nén theo khối truyền thống ở chất lượng hình ảnh tương đương, theo NVIDIA. Nó hoạt động bằng cách học các tương quan giữa các kênh mà nén theo khối, vốn ép từng kênh riêng rẽ, loại bỏ đi. Vật liệu đã nén được giải mã tức thời lúc render.