Amikor az NVIDIA bemutatta, hogy a DLSS 4 generál minden tizenhat képpontból tizenötöt MI-vel, a közönség jó része nem fejlődést látott. Hanem "hamis képkockákat" és "MI-zagyvaságot": generált részleteket, amelyek addig néznek ki helyesen, amíg el nem romlanak, és amelyeket nem lehet úgy hibakeresni, ahogy egy rossz helyre került poligont. A PCGuide egy közösségi szavazásról szóló beszámolója szerint a válaszok 54%-a egy egyszerű "Nem" volt a következőre: DLSS 5 kinézetére, a kritika nagy része az arcvonásokra és az "MI-zagyvaság" reakcióra irányult. Ezt a reakciót érdemes komolyan venni, és vissza is térünk rá.
De a nagyobb probléma mindegyik vita esetében az, hogy a "neurális renderelést" legalább öt különböző dologra használják: felskálázásra, MI által generált képkockákra, jelenet rekonstruálására fényképekből, a közösségi médiában látott NeRF- és Gaussian Splatting-demókra, valamint azokra a kutatási rendszerekre, amelyek egyetlen hálózattal renderelnek egy teljes képet. Az emberek elbeszélnek egymás mellett, mert mindegyikük más rétegre mutat, miközben ugyanazt a szót használja. Az NVIDIA Jensen Huangja ezt a váltást a "grafika GPT-pillanatának" nevezte. Ez az állítás. A hasznos kérdés az, hogy mi történik mögötte.
Íme a vezérfonal, amely az egészet érthetővé teszi: a GPU egyre inkább megjósolja a képet, ahelyett hogy kiszámítaná. Hagyományosan a GPU minden képpontot a geometria, a megvilágítás és az anyagok szimulálásával számít ki (raszterizálás, újabban pedig az erre épülő ray tracing). A neurális renderelés megváltoztatja, hogy mi az, amit kiszámítanak szemben azzal, amit megjósolnak egy betanított hálózat. Ez az egyetlen megkülönböztetés a cikk gerince. A végére bármelyik technikát el tudod majd helyezni egy spektrumon, tudni fogod, melyek futnak valós időben és milyen hardveren, és meg tudod különböztetni azt, ami ma egy játékban már elérhető, attól, ami csak egy kutatási cikk vagy egy GTC-demó. Ez egy térkép, nem útmutató. Bármely egyes technika mélyebb működése külön cikket érdemel.
A rövid verzió
- A neurális renderelés egy spektrum, nem a DLSS szinonimája. Felöleli a jelenet-rekonstrukciós kutatást (NeRF, Gaussian Splatting), a renderelési folyamatban belül elhelyezkedő valós idejű komponenseket (DLSS, Ray Reconstruction, neurális sugárzási gyorsítótár), valamint azokat a generatív módszereket, amelyek olyan részleteket találnak ki, amilyenek a képkockában sosem voltak.
- A vezérfonal a "jósolj ahelyett, hogy számolnál". Minden egyes technika a folyamat egy költséges, kiszámított szakaszát váltja fel egy hálózattal, amely megjósolja azt az eredményt, amelyre betanították.
- Amit ma kiadnak, az nagyrészt hibrid. A felskálázás, a képkocka-generálás és az MI-alapú zajszűrés ma már valós idejű játékokban fut, miközben a neurális textúratömörítés és a neurális shaderek fejlesztői eszközkészleteken keresztül kezdenek megjelenni. Azok a teljes neurális renderelők, amelyek egy hálózattal rajzolják meg az egész képet, még kutatási szakaszban vannak.
- Egyre inkább gyártófüggetlenné válik, nem csak az NVIDIA története. A Microsoft shader szintű ML-re irányuló DirectX-munkája a Shader Model 6.9 Cooperative Vectors funkciójával indult, és a Shader Model 6.10 szélesebb körű lineáris algebrai támogatása felé halad, így a motoroknak utat adva ahhoz, hogy egyetlen gyártó technológiai csomagján túl is megcélozhassák a neurális jellegű shader-terheléseket.
Miért jelent a "neurális renderelés" öt különböző dolgot
A neurális renderelés módszerek olyan osztálya, amelyek neurális hálózatokkal jósolják meg egy kép részeit (képpontokat, megvilágítást, anyagokat, sőt teljes képkockákat), amelyeket a GPU egyébként a nulláról számítana ki. A Tewari és munkatársai áttekintő tanulmánya úgy határozza meg, mint a klasszikus számítógépes grafika ötvözését mély generatív modellekkel a fotórealisztikus kimenet érdekében. A kifejezés széles spektrumot ölel fel, és a "DLSS" csak egy pont rajta.
A beszélgetés azért zűrzavaros, mert a spektrumnak legalább három különálló rétege van, a közvélemény pedig mindegyikre ugyanazt az egy szót használja.
Az első réteg az akadémiai / rekonstrukciós neurális renderelés: NeRF, 3D Gaussian Splatting és differenciálható renderelés. Ezek egy valós jelenetről készült fényképeket vagy méréseket vesznek, és megtanulnak egy olyan reprezentációt, amelyből új kameraszögekből renderelhetsz. Az eredeti NeRF-tanulmány (Mildenhall és munkatársai, 2020) egy kis hálózatot tanít be arra, hogy egy 3D-koordinátát és nézési irányt színhez és sűrűséghez rendeljen, majd a lekérdezésével új nézeteket renderel. Ez a réteg többnyire offline. Jeleneteket rekonstruál; nem hajtja a játékod képkocka-ciklusát.
A második réteg a valós idejű, folyamatba épülő neurális renderelés: olyan hálózatok, amelyek egy szokásos raszterizált képkockán belül vagy mellette futnak. A DLSS felskálázás, a Ray Reconstruction és a neurális sugárzási gyorsítótár ide tartozik. A folyamat továbbra is raszterizál és ray tracinget végez; egy hálózat kezeli ennek egy költséges szakaszát. Ez az a réteg, amely ma a játékokban elérhető.
A harmadik réteg a generatív neurális renderelés: a hálózat olyan képtartalmat állít elő, amelyet a képkocka egyáltalán sosem számított ki. A DLSS 4 generált képkockái ennek a szélén helyezkednek el, a DLSS 5 (amelyet az NVIDIA 2026 őszére jelentett be) pedig tovább nyomul bele azzal, hogy megvilágítási és anyagrészleteket generál, nem pusztán a renderelt képkockák közt interpolál.
Ez a három réteg másképp viselkedik, eltérő sebességgel fut, és más hardvert igényel. Az, hogy egyként kezelik őket, az oka annak, hogy két ember egyaránt mondhatja, hogy "a neurális renderelés túl van hájpolva" és hogy "a neurális renderelés a jövő", és mindkettőnek részben igaza van.
A szakasz tanulsága: A kifejezés régebbi a DLSS-nél, és nem a szinonimája. A DLSS egyetlen alkalmazás (valós idejű, folyamatba épülő) egy sokkal szélesebb spektrumon belül, amely az offline jelenet-rekonstrukciótól a teljesen generált képkockákig terjed.
Hogyan váltja fel a neurális renderelés a nyers erőre épülő folyamat egyes részeit
A teljes DLSS 4 többképkockás generálásnál a képernyőn minden tizenhat képpontból nagyjából tizenötöt MI állít elő, nem pedig hagyományos rendereléssel készül (az NVIDIA DLSS 4-es adatai szerint). Ez a szám az egész váltást egyetlen statisztikába sűríti: a renderelő a kép töredékét számítja ki, a többit pedig megjósolja.
A hagyományos renderelés minden képpontot megdolgozik. A GPU raszterizálja a geometriát, shadereket futtat a megvilágítás és az anyagok kiszámításához, és (ray tracinggel) szimulálja a fény pattogását a jelenetben. Különösen a ray tracing brutálisan költséges, mert a valósághű fényhez sok pattanás és képpontonként sok minta kell, az alulmintavételezésből származó zajt pedig utólag ki kell tisztítani. Ahogy a jelenetek egyre nagyratörőbbek lettek, a legköltségesebb szakaszok lettek a kézenfekvő célpontok: kiszámításuk helyett taníts be egy hálózatot a kimenetük megjóslására.
A fejlődés inkább folyamatos volt, mint hirtelen:
- 2018, DLSS 1.0. Az első kereskedelmi lépés: renderelj alacsony felbontáson, jósold meg a nagy felbontású képet. Vidd át a felskálázást a "számolj ki több képpontot" felől a "jósolj meg több képpontot" felé.
- 2020, NeRF. Jelenet rekonstruálása képekből egy megtanult sugárzási mezőn keresztül. A geometria modellezése és renderelése helyett új nézetek megjóslása.
- 2021, neurális sugárzási gyorsítótár. A path tracing során a pattant fény megjóslása, hogy a renderelő korán abbahagyhassa a követést.
- 2022, DLSS 3 képkocka-generálás. Teljes köztes képkockák generálása a renderelésük helyett.
- 2023, 3D Gaussian Splatting. Gyorsabb, a valós idő felé hajló alternatíva a NeRF helyett rekonstruált jelenetekhez.
- 2025, DLSS 4 + RTX Kit. Többképkockás generálás, plusz egy neurális komponensekből álló eszközkészlet (textúratömörítés, sugárzási gyorsítótár, neurális shaderek).
- 2025, DirectX Cooperative Vectors (előzetes). Gyártófüggetlen API a neurális shaderek által igényelt mátrixszámításokhoz (előzetesben bevezetve a Shader Model 6.9 részeként).
- 2026, DLSS 4.5. Fokozatos minőség- és Ray Reconstruction-fejlesztések (az NVIDIA a Computexen ismertette).
- 2026 ősz, DLSS 5 (bejelentve). A következő lökés a generatív neurális renderelés felé.
Fentről lefelé olvasva minden sor ugyanaz a lépés egy másik szakaszra alkalmazva: végy valamit, amit a folyamat korábban kiszámított, és ehelyett jósoltasd meg egy hálózattal.
A hat réteg: mit vált fel az MI a folyamat egyes szakaszaiban
Hat technika viszi a mai valós idejű neurális renderelés nagy részét, és mindegyik egy adott kiszámított szakaszt vált fel: felskálázás (felbontás), képkocka-generálás (képkockaszám), ray reconstruction (zajszűrés), neurális sugárzási gyorsítótár (globális megvilágítás), neurális textúratömörítés (anyagtárolás) és neurális shaderek (shaderen belüli számítás). Annak ismerete, hogy mindegyik melyik szakaszt érinti, a csata javát megnyeri.
Ezek aszerint oszlanak meg, hogy a folyamat mely pontján fut a hálózat. Némelyik a legvégén működik, utófeldolgozásként egy kész képkockán; némelyik a folyamat közepén fut a ray tracing mellett; némelyik magán a shaderen belül él. Ez a hely nem apróság. Meghatározza, milyen gyorsan futhat a technika, és milyen hardvert igényel. A táblázat feltérképezi ezt a hat technikát; az alábbi alfejezetek elmagyarázzák azt a mechanizmust, amely nem fért volna el rendesen az egyes cellákban.
| Technika | Mit vált fel | Valós idejű életképesség | Szükséges hardver | Gyártófüggetlen? |
|---|---|---|---|---|
| MI-felskálázás (super resolution) | Natív felbontású képpontok kiszámítása | Valós idejű, alacsony többletterhelés | Tensor- / mátrixmagok (RTX 20+, RDNA 4, Intel XMX) | Kategóriaként igen; a megvalósítások gyártófüggők maradnak (DLSS, FSR / FSR Upscaling, XeSS) |
| Képkocka-generálás | Köztes képkockák renderelése | Valós idejű; késleltetést ad hozzá | RTX 40+ (DLSS 3), többképkockáshoz RTX 50 | Részben; gyártófüggő |
| Ray reconstruction | A kézzel hangolt zajszűrő-verem | Valós idejű | RTX 20+ | Ma NVIDIA |
| Neurális sugárzási gyorsítótár | Többszörös pattanású közvetett fény kiszámítása | Valós idejű (jelentések szerint ~2,6 ms) | RTX-osztályú mátrixmagok | Ma NVIDIA (RTX Kit) |
| Neurális textúratömörítés | Blokktömörített anyagtárolás | Valós idejű dekódolás | RTX-osztályú mátrixmagok | Ma NVIDIA SDK/eszköztár; a szélesebb körű shader szintű ML-támogatást külön szabványosítják |
| Neurális shaderek | Kiszámított shader-kódutak | Valós idejű | Shader szintű ML / mátrixképes GPU-k | A DirectX SM 6.9 / SM 6.10 úton keresztül bontakozik ki |
MI-felskálázás (Super Resolution)
Az MI-felskálázás alacsonyabb felbontáson rendereli a képkockát, és megjósolja a nagy felbontású eredményt, így a GPU jóval kevesebb képpontot rajzol, a szerkezetet pedig egy hálózat tölti ki. A DLSS, az AMD FSR 4-e és az Intel XeSS-e mind temporális felskálázással csinálja ezt: egymást követő képkockákon át más-más képpontokból mintáznak, és ezt az előzményt mozgásvektorokkal kombinálva rekonstruálnak olyan részleteket, amelyeket egyetlen alacsony felbontású képkocka nem tartalmaz.
Ez a legérettebb és legszélesebb körben telepített réteg, és itt a legtisztább a gyártófüggetlen valóság. A DLSS 4 a felskálázóját egy konvolúciós hálózatról transformerre váltotta a jobb részletstabilitásért. Az FSR 4 az AMD első ML-alapú felskálázója, amely RDNA 4-en fut FP8 inferenciával, a korábbi FSR-verziók kézzel írt heurisztikái helyett. A XeSS az Intel XMX mátrixegységeit használja. Három gyártó, ugyanaz az alapötlet: jósold meg azokat a képpontokat, amelyeket nem rendereltél.
Képkocka-generálás és többképkockás generálás
A képkocka-generálás teljes képkockákat jósol meg azok közé, amelyeket a GPU ténylegesen renderel, úgy, hogy a játékadatokat, például a mozgásvektorokat, optikai áramlás becsléssel és MI-vel kombinálja. A DLSS 3 az RTX 40-es sorozat Optical Flow Acceleratorát használta egyetlen generált képkocka beszúrására a renderelt képkockák közé; az RTX 50-es sorozat hardverén futó DLSS 4 többképkockás generálás akár három további képkockát is generálhat minden hagyományosan renderelt képkockára, és az NVIDIA szerint a DLSS 4 a hardveres optikai áramlás lépést egy hatékonyabb MI-modellel váltja fel.
Valójában erről a rétegről szól a "hamis képkockák" vita, és itt számít a megfogalmazás. Egy generált képkocka egy hihető interpoláció arról, hogy merre tartott a jelenet: használható vizuális tartalmat mutat. De megjósolnak, nem a játék tényleges állapotából renderelve, és nem hordoz friss játéklogikát vagy bemenetet. Döntő fontosságú, hogy a képkocka-generálás után egy képkocka renderelése után fut, ami inkább növeli, mintsem csökkenti a késleltetést; az NVIDIA Reflex 2-je kifejezetten azért létezik, hogy ezt a késleltetést visszakaparja. Tehát a "a képkocka-generálás gyorsabbá teszi a játékot" csak részben igaz: megemeli az érzékelt simaságot (több megjelenített képkocka) anélkül, hogy megemelné azt az ütemet, amellyel a játék ténylegesen frissül és válaszol. A szakadék aközött, amit látsz, és amit a játék tud, maga az egész vita, és a versenyszerű játékban, ahol a bemeneti késleltetés dönti el a kimeneteleket, ez egy mérlegelésre érdemes kompromisszum.
Ray Reconstruction (MI-zajszűrés)
A Ray Reconstruction azt a kézzel hangolt zajszűrő szűrőkből álló vermet, amelyre a ray tracinges renderelés támaszkodik, egyetlen neurális hálózattal váltja fel, amelyet arra tanítottak be, hogy zajos, alulmintavételezett ray tracinges bemenetből tiszta képet rekonstruáljon. A path tracing valós időben csak néhány fénymintát engedhet meg képpontonként, ami zajossá teszi a nyers kimenetet; valaminek meg kell tisztítania, mielőtt meglátod.
A hagyományos megközelítés specializált zajszűrők láncolata volt, mindegyiket kézzel hangolva egy adott hatásra. Ennek egyetlen betanított hálózatra cserélése hajlamos megőrizni azt a részletet, amelyet a kézzel hangolt szűrők elkentek, különösen a tükröződéseknél és a finom megvilágításnál, és egyetlen hálózatot kell karbantartani egy törékeny szűrőfolyamat helyett. Ez a vezérfonal tiszta példája: a zajszűrési szakasz a "kézzel írt heurisztikákkal való számítástól" a "betanított modellel való jósláshoz" mozdult el.
Neurális sugárzási gyorsítótár (globális megvilágítás)
A neurális sugárzási gyorsítótár (NRC) megjósolja, hogyan pattog a fény a jelenetben, így a path tracer a legtöbb sugár követését korán abbahagyhatja, ahelyett hogy minden pattanást a végéig követne. A globális megvilágítás (az a lágy, közvetett fény, amely a falakról és padlókról pattan vissza) az egyik legköltségesebb dolog a valós idejű grafikában, és az NRC működését lehetővé tevő mechanizmust ritkán magyarázzák el közérthetően, ezért érdemes lelassítani miatta.
Íme a mechanizmus. Egy path tracer normál esetben minden fénysugarat sok pattanáson át követ, és itt robban a költség. Az NRC egy kis hálózatot tanít be közben a renderelés (nem előre), hogy megjósolja a további pattanások után egy pontba érkező fényt. Így a path tracer egy-két pattanásig követ egy sugarat, majd megkérdezi a hálózattól, hogy "mennyi a fény többi része itt?", és korán lezárja az útvonalat; a valós idejű neurális sugárzási gyorsítótárazásról szóló tanulmány (Müller és munkatársai, 2021) arról számol be, hogy az útvonalak túlnyomó többségét így zárja le. Gondolj rá úgy, mint egy gyorsítótárra, amely nem a korábban látott pontos válaszokat tárolja, hanem megtanulja a jelenet megvilágításának a mintázatát elég jól ahhoz, hogy olyan lekérdezésekre is válaszoljon, amelyeket nem látott, és folyamatosan újratanul, ahogy a jelenet változik. Az NVIDIA arról számol be, hogy az NRC nagyjából 2,6 ms többletterheléssel fut, és éppen ez teszi valós időben életképessé, nem pedig pusztán kutatási érdekességgé.
Neurális textúratömörítés
A neurális textúratömörítés (NTC) egy hálózattal egyszerre tömöríti egy anyag összes textúracsatornáját, hasonló vizuális minőség mellett akár 8-szoros VRAM-megtakarítást elérve a hagyományos blokktömörítéshez képest (az NVIDIA RTX Kit dokumentációja szerint). Egy modern anyag nem egyetlen textúra. Ezek egy halmaza (szín, normálok, érdesség, fémesség és még több), és ezek a csatornák olyan módon korrelálnak, amit a blokktömörítés, amely minden csatornát külön-külön présel össze, eldob.
Az NTC kihasználja ezt a korrelációt. Azzal, hogy egyszerre tanulja meg egy anyag összes csatornájának együttes szerkezetét, ugyanazt az anyagot jóval kevesebb memóriában tárolja, és renderelés közben menet közben dekódolja. A VRAM tartós korlát, ahogy a játékok feszegetik a textúrarészletességet, így a "férjen el 8-szor annyi anyag ugyanannyi memóriában" közvetlen, gyakorlati nyereség, nem pedig vizuális trükk.
Neurális shaderek és a DirectX Cooperative Vectors
A neurális shaderek kis neurális hálózatokat futtatnak egy programozható shaderen belül (a képpontonkénti/csúcspontonkénti programokon, amelyeket a GPU már amúgy is végrehajt), így egy hálózat épp ott közelíthet meg egy költséges, kiszámított hatást, ahol arra a hatásra szükség van. Ahelyett, hogy az MI-t külön menetként szerelnék rá, az MLP a shader részeként fut a GPU mátrixegységein (NVIDIA hardveren a Tensor Cores).
A Tensor Cores végzi azt a mátrixszámítást, amelyen ezek a hálózatok futnak, elkülönülve az általános célú magoktól, amelyek a munka többi részét végzik. Az, ami a neurális shadereket egyetlen gyártó funkciójából szélesebb iparági képességgé változtatja, az alattuk lévő API-réteg. A Microsoft a DirectX Cooperative Vectorst a Shader Model 6.9-cel 2025-ben előzetesben vezette be, hogy vektor-/mátrixműveleteket tegyen elérhetővé a HLSL shadereken belül. 2026-ra a Shader Model 6.9 átkerült éles használatba, és a Microsoft közölte, hogy a Cooperative Vectort kivezetik egy szélesebb körű, a Shader Model 6.10-re tervezett lineáris algebrai kialakítás javára. A biztos tanulság nem az, hogy a Cooperative Vectors a végleges API, hanem hogy a DirectX a gyártófüggetlen, shader szintű ML-támogatás felé halad.
A szakasz tanulsága: A hat technika aszerint rendeződik, hogy hol fut a hálózat: utófeldolgozásként a képkocka végén, a folyamat közepén a ray tracing mellett, vagy magán a shaderen belül. Ez a hely határozza meg, hogy egy technika futhat-e valós időben, és milyen hardvert igényel.
Mi fut valós időben, és milyen hardveren
A valós idejűség határvonala élesebb, mint amit a hájp sugall: az MI-felskálázás általában alacsony többletterheléssel fut, az NRC nagyjából 2,6 ms-ot ad hozzá, a 3D Gaussian Splatting pedig statikus jelenetek esetén megközelíti a valós időt. Az eredeti NeRF és az olyan teljes neurális renderelők, mint a RenderFormer, határozottan csak kutatási célúak, képkockánként túl sokáig tartanak az interaktív használathoz. A "a neurális renderelés valós idejű" igaz a folyamatba épülő rétegre, és hamis a rekonstrukciós és a teljes renderelő rétegekre.
Ez a felosztás pontosan követi a spektrumot. Néhány folyamatba épülő komponens, különösen a felskálázás, a képkocka-generálás és a Ray Reconstruction, már a kiadott játékokban fut. Másokat, például az NRC-t, az NTC-t és a neurális shadereket, jobb fejlesztői technológiákként és kibontakozó eszközkészlet-funkciókként leírni, semmint elterjedt éles funkciókként. A rekonstrukciós réteg vegyes kép: az eredeti NeRF lassú, de a 3D Gaussian Splatting tudatos lökés volt a valós idő felé, és statikus jelenetek esetén el is éri azt. A teljes neurális renderelő réteg (egyetlen hálózat, amely az egész képet előállítja) ott él, ahol a kutatás zajlik, és a képkocka-idők meg sem közelítik az interaktívat.
A hardver a válasz másik fele, és itt ér földet a gyártófüggetlen történet. Az itteni minden technika azokon a mátrixszámító egységeken fut, amelyeket a modern GPU-k MI-inferenciához szállítanak:
- NVIDIA minden RTX-kártyán rendelkezik Tensor Cores-szal a 20-as sorozattól kezdve, ezért is mutatkozott be ott e technikák többsége.
- Az AMD ML-alapú FSR Upscalingja jelenleg az RDNA 4 / Radeon RX 9000 sorozatú GPU-kat célozza az ML-úton; korábbi hardveren az AMD SDK-ja az analitikus FSR 3.1.5 utakra esik vissza. A szélesebb körű, régebbi GPU-támogatást kezeld változó útiterv-elemként, ne pedig garantált FSR 4 funkcióként, hacsak nem hivatkozol egy konkrét AMD-bejelentésre.
- Intel az Arc GPU-kon XMX mátrixmotorokat használ a XeSS-hez.
Maga a DLSS generációnként funkciókorlátozott: a felskálázás visszamenőleg az RTX 20-as sorozatig működik, az eredeti képkocka-generáláshoz RTX 40-es sorozat kell, a többképkockás generálás pedig csak RTX 50-es sorozatos. Ha azt próbálod kikövetkeztetni, mit tud egy adott kártya, ez a generációs korlátozás a gyakorlati válasz, nem a marketingkategória.
Mit használhatsz ma, szemben azzal, ami jön: a felskálázás, a képkocka-generálás és a Ray Reconstruction ma elérhető a játékokban. Az RTX Kit komponensei , mint az NRC, az NTC és a neurális shaderek, fejlesztői technológiákként és eszköztárként elérhetők, de nem szabad azt sugallnod, hogy mindegyikük már elterjedt a kiadott játékokban. A Gaussian Splattinghez van használható nyílt eszköztár jelenetrögzítéshez. Ami még nincs itt: a teljes neurális renderelők, amelyek egy hálózattal rajzolnak meg egy egész képkockát, az érett gyártófüggetlen neurális shaderek (az AMD-támogatás korai), és a DLSS 5 generatív funkciói (2026 őszére bejelentve). Ha kísérletezni akarsz a rekonstrukciós oldallal (NeRF vagy inferenciaterhelések saját futtatása), az egy GPU-számítási feladat, nem olyasmi, amit a játékod elvégez helyetted.
Mi nem a neurális renderelés: öt tévhit
A legtöbb neurális rendereléssel kapcsolatos vita könnyebbé válik, ha azonosítod, a spektrum melyik rétegéről szól az állítás. Öt tévhit bukkan fel újra és újra.
1. "A DLSS-felskálázás neurális renderelés." A DLSS a neurális renderelés an alkalmazása, a folyamatba épülő, valós idejű réteg, nem az egész terület. A kifejezés régebbi a DLSS-nél, és magában foglalja a NeRF-et, a Gaussian Splattinget és a generatív módszereket. A kettő egyenlővé tétele olyan, mintha az "adatbázisokat" egy véletlenül használt termék szinonimájának neveznéd.
2. "A képkocka-generálás gyorsabbá teszi a játékokat." Megemeli az általad látott képkockaszámot, amitől a mozgás simábbnak tűnik, de a renderelés után fut, és késleltetést ad hozzá. Az az ütem, amellyel a játék frissül és válaszol a bemenetedre, nem nő. A versenyszerű játékhoz az a késleltetés valódi kompromisszum; a vizuális simasághoz viszont igazi nyereség. A "gyorsabb" összemossa a kettőt.
3. "A DLSS 5 3D-tudatos / beolvassa a 3D-jelenetet." Ezt érdemes a leginkább helyesen érteni, mert a technológiai sajtó folyton tévesen jellemzi. Ahogy az NVIDIA leírja, a DLSS 5 minden képkocka színadatait és mozgásvektorait veszi bemenetként, majd a betanított modelljével következtet a jelenet szemantikájára, például a karakterekre, a hajra, a szövetre, a bőrre és a megvilágítási viszonyokra. A játék tartalmán alapul, de az NVIDIA nem írja le úgy, mintha közvetlenül beolvasná a játék teljes 3D-jelenetfájlját. A "3D-vezérelt" azt jelenti, hogy a következtetés geometriailag konzisztens (tiszteletben tartja, hogyan mozognak és viszonyulnak egymáshoz a felületek), nem azt, hogy a hálózat közvetlenül olvassa a jelenet geometriáját. A megkülönböztetés számít, mert behatárolja, mit tudhat és mit nem tudhat a technika.
4. "A NeRF most már valós idejű." Attól függ, melyik technikára gondolsz, és pontosan ez a spektrum problémája. Az eredeti NeRF nem valós idejű. A 3D Gaussian Splatting statikus jeleneteknél megközelíti a valós időt. Azok a kutatási rendszerek, amelyek egyetlen hálózattal renderelnek egy teljes képkockát (RenderFormer és hasonlók), egyáltalán nem valós idejűek. A "NeRF" egy fél tucat, vadul eltérő sebességű módszer gyűjtőfogalmává vált.
5. "A neurális renderelés hamarosan felváltja a raszterizálást." A mai rendszerek hibridek: a neurális komponensek egy raszterizálás-és-ray-tracing folyamaton belül belül helyezkednek el, nem annak helyén. A klasszikus folyamat teljes felváltása egyetlen generatív renderelővel hosszú távú kutatási cél, nem közeli termékirány. A "a jövő teljesen neurális"-t haladási irányként vedd, ne pedig dátumhoz kötött jóslatként.
A szakasz tanulsága: Szinte minden neurális rendereléssel kapcsolatos nézeteltérés egyetlen gyökeroka az, hogy az emberek ugyanazt a szót használják a spektrum különböző rétegeire. Helyezd el előbb az állítást a spektrumon, és a vita nagy része eltűnik.
Merre tart ez
A pálya összhangban van a fentebbi mindennel: ma hibrid folyamatok, egyre több szakasz mozdul el a számítástól a jóslás felé, a gyártófüggetlen neurális shaderek kiszélesítik, ki adhat ki ilyet, a teljes neurális renderelő határvonala pedig még évekre van. A következő fogyasztói lépés a DLSS 5, amelyet 2026 őszére jelentettek be, és amely a generatív neurális renderelésbe nyomul azzal, hogy olyan megvilágítási és anyagrészletet állít elő, amelyet a játék sosem számított ki, nem pusztán a renderelt képkockák közt interpolál. Az NVIDIA RTX 50-es sorozatú környezetben mutatta be a technológiát, de a végleges fogyasztói hardverkövetelményeit megerősítetlennek kell tekinteni, amíg az NVIDIA közzé nem tesz egy egyértelmű kompatibilitási listát.
Az előretekintésnek két fele van. A közeli oldalon a legfontosabb lépés nem egyetlen technika. Hanem a szabványosítás. A Microsoft DirectX-útja a Cooperative Vectorstól a szélesebb körű, shader szintű lineáris algebra felé halad, ami lehetővé tehetné a motorok számára, hogy neurális jellegű terheléseket célozzanak meg anélkül, hogy egyetlen GPU-márkára tennének. A távoli oldalon az NVIDIA kutatói egy távoli jövőbeli végpontot írtak le, amelyet olykor egy feltételezett "DLSS 10"-ként emlegetnek, ahol a renderelő teljesen neurális, és a klasszikus folyamat eltűnt (egy Digital Foundry kerekasztalról másodkézből származó beszámoló alapján; kezeld kinyilvánított irányként, ne útitervként). A létra végpontja egy olyan rendszer, amely egy koherens világot generál, ahelyett hogy megrajzolna egyet.
A szkepszist viszont érdemes megtartani. A generált részlet eltérhet a művészi szándéktól, és egy hálózat hihető, de hibás vizuális elemeket hallucinálhat, amelyeknek nincs hagyományos megfelelője a hibakereséshez: ez egy GDC 2026-on jelzett QA-probléma, és sok "MI-zagyvaság" reakció mögötti tartalom. Arra építeni, amerre a grafika tart, nem azt jelenti, hogy úgy teszünk, mintha a jelenlegi kimenet kész volna. Azt jelenti, hogy figyeljük, mely szakaszok mozdulnak el legközelebb a számítástól a jóslás felé, és mindegyiket aszerint ítéljük meg, mit tesz a képpel, nem pedig a rá aggatott szó alapján.
Gyakran ismételt kérdések
A DLSS neurális renderelés?
Igen, de csak az egyik fajtája. A DLSS a neurális renderelés egy alkalmazása: konkrétan a valós idejű, folyamatba épülő réteg, amely magában foglalja az MI-felskálázást és a képkocka-generálást. A tágabb kifejezés régebbi a DLSS-nél, és magában foglalja az olyan jelenet-rekonstrukciós módszereket is, mint a NeRF és a Gaussian Splatting, valamint a generatív módszereket, amelyek új képrészletet találnak ki. Tehát minden DLSS-funkció neurális renderelés, de rengeteg neurális renderelés nem DLSS.
Mi a különbség a neurális renderelés és a ray tracing között?
A ray tracing szimulálja a fényt azzal, hogy kiszámítja, hogyan pattognak a sugarak egy jeleneten át; a neurális renderelés pedig megjósolja az eredményeket egy betanított hálózattal jósolja meg, ahelyett hogy kiszámítaná őket. Nem riválisok. Kiegészítik egymást. A Ray Reconstruction például egy neurális hálózatot használ a zajos ray tracinges kimenet zajszűrésére, a neurális sugárzási gyorsítótár pedig megjósolja a pattant fényt, hogy a ray tracer korán abbahagyhassa. A neurális technikák valós időben megfizethetővé teszik a ray tracinget.
A DLSS képkocka-generálás növeli a késleltetést?
Igen. A képkocka-generálás egy képkocka renderelése után fut, és megjósolt képkockákat szúr be a renderelt képkockák közé, ami inkább növeli, mintsem csökkenti a késleltetést: az NVIDIA Reflex 2-je kifejezetten ennek ellensúlyozására létezik. Megnöveli az érzékelt simaságot (több megjelenített képkocka) anélkül, hogy megnövelné, milyen gyorsan frissül és válaszol a bemenetre a játék. A versenyszerű játékhoz ez kompromisszum; az egyjátékos simasághoz általában nettó nyereség.
Valós idejű a NeRF?
Attól függ, melyik technikára gondolsz. Az eredeti NeRF nem valós idejű. A 3D Gaussian Splatting, egy későbbi módszer, statikus jeleneteknél megközelíti a valós időt. Azok a teljes neurális renderelők, amelyek egyetlen hálózattal rajzolnak meg egy egész képkockát, csak kutatási célúak, és messze vannak az interaktív sebességtől. A "NeRF"-et gyakran lazán használják arra, hogy több, nagyon eltérő teljesítményű módszert lefedjen, és ez a zűrzavar nagy részének forrása.
Felváltja a neurális renderelés a raszterizálást?
Nem hamarosan. A mai rendszerek hibridek: a neurális komponensek egy raszterizálás-és-ray-tracing folyamaton belül futnak, nem annak helyett. A klasszikus folyamat teljes felváltása egyetlen generatív renderelővel hosszú távú kutatási cél, nem közeli termék. A reális irány az, hogy az idő múlásával egyre több folyamatszakasz mozdul el a kiszámítottól a megjósolt felé, miközben a raszterizálás még évekig valódi munkát végez.
Mi a neurális textúratömörítés?
A neurális textúratömörítés (NTC) egy neurális módszer, amely egy anyag összes textúracsatornáját együtt tömöríti (szín, normálok, érdesség és a többi), és az NVIDIA szerint hasonló vizuális minőség mellett akár 8-szoros VRAM-megtakarítást ér el a hagyományos blokktömörítéshez képest. Úgy működik, hogy megtanulja a csatornák közötti korrelációkat, amelyeket a blokktömörítés, amely minden csatornát külön présel össze, eldob. A tömörített anyagot renderelés közben menet közben dekódolja.