Yapay Zeka Oyun Motoru Olmadan Oyunları Nasıl Üretiyor (GameNGen, Genie 3)

2024 yılında, bir Google Research ve Google DeepMind ekibi, bir sinir ağı modelinin, altında orijinal oyun motorunu çalıştırmadan saniyede 20'nin üzerinde kareyle oynanabilir DOOM'u simüle edebildiğini gösterdi. Koordinatları, fizik nesnelerini, can değişkenlerini ya da harita durumunu alışılagelen şekilde açıkça depolayan geleneksel bir motor döngüsü yoktu. Bunun yerine GameNGen, bir sonraki kareyi son karelerden ve oyuncu girdilerinden çıkarmayı öğrendi; buna can, mühimmat, düşmanlar, kapılar ve duvarlar gibi görsel ipuçları da dahildi. GameNGen adı verilen sistem, Stable Diffusion'ın (metinden görsel üreten model türünün aynısı) değiştirilmiş bir sürümüdür ve DOOM'u, önceki karelerden ve az önce hangi tuşa bastığınızdan yola çıkarak her bir sonraki kareyi halüsinasyonla üreterek oynar.

Bu, "oyun motorunun içindeki yapay zeka"dan kökten farklı bir şeydir. Bir stüdyo, Unity'de doku üretmek ya da NPC diyalogları yazmak için yapay zekayı kullandığında, asıl işi yapan motor hâlâ oradadır. GameNGen'in motoru yoktur. Model is oyunun kendisidir. Ve bu, manşetlerin sürekli yanlış aktardığı gerçek bir sınırın başlangıcıdır. GameNGen, ICLR araştırma kanalı üzerinden ortaya çıktı, DIAMOND, NeurIPS 2024 üzerinden geldive Google DeepMind, Microsoft Research, Decart ve Skywork AI gibi şirketler artık bu fikri makalelerden demolara, API'lere ve açık kaynaklı sistemlere taşıyor.

İşte bu sistemlerin gerçekte ne yaptığı, bir sonraki kareyi tahmin etmenin nasıl işlediği, daha uzun etkileşimlerde tutarlılık ve belleğin neden hâlâ bozulduğu, çalıştırılmalarının ne kadara mal olduğu ve Unity'nin peşine düşüp düşmedikleri. Sonuncusunun kısa yanıtı hayır; en azından abartının ima ettiği şekilde değil. Sebep mimaridir: daha fazla işlem gücü yardımcı olur, ama tek başına kalıcı durum, deterministik mantık ya da hata ayıklanabilir bir oyun döngüsü yaratmaz.

Kısa Versiyon

Bu modeller kareleri tahmin eder; kuralları simüle etmez. Bir oyun motoru, bir sonraki durumu mantıktan ve depolanmış değişkenlerden hesaplar. GameNGen ya da Oasis gibi bir dünya modeli ise bir sonraki görseli önceki karelerden ve sizin girdinizden tahmin eder. Açık nesne durumu, fizik kodu ve incelenebilir değişkenlerle çalışan geleneksel bir oyun motoru simülasyonu yürütmüyordur; öğrenilmiş bir model aracılığıyla bir sonraki gözlemi üretiyordur.
Tutarlılıkları hâlâ bellek ve bağlamla sınırlıdır, ama bu sınır artık "birkaç saniye sonra her şey çöker" kadar basit değil. GameNGen'in 3 saniyenin biraz üzerinde doğrudan kare geçmişi vardır, yine de öğrenilmiş sezgisel yöntemlerle daha uzun yörüngeler boyunca görsel olarak kararlı kalabilir. Genie 2 genellikle 10-20 saniyelik örnekler gösterdi ve kimi zaman görüş alanı dışındaki ayrıntıları koruyabildi; Genie 3 ise tutarlılığı 720p/24fps'de birkaç dakikaya çıkarıyor. Temel zayıflık geçerliliğini koruyor: bu sistemler henüz üretim oyunlarının dayandığı kalıcı, incelenebilir, kaydedilebilir durumu sağlamıyor.
Üretim oyunlarının ihtiyaç duyduğu anlamda doğal olarak deterministik değildirler. Örneklemeyi kısıtlayabilir ya da tohumları (seed) sabitleyebilirsiniz, ama bu yine de size normal bir motorun temiz, incelenebilir durum güncellemelerini vermez. Çok oyunculu mod, rekabetçi denge, tekrar oynatmalar, beceri ilerlemesi ve kaydet/yükle, hepsi güvenilir durum geçişlerine bağlıdır. Bir kare üreteci bu davranışı yaklaşık olarak verebilir, ama bir üretim oyunu yine de altında ya da yanında deterministik bir mantık katmanına ihtiyaç duyardı.
DeepMind, dünya modellerini zengin simüle edilmiş ortamlarda yapay zeka ajanlarını eğitmek ve değerlendirmek için bir temel olarak konumlandırıyor, Project Genie ise aynı teknolojiyi tüketiciye yönelik bir dünya yaratma prototipinde gösteriyor. Decart'ın daha yeni Oasis 3'ü fiziksel yapay zekaya, robotiğe ve otonom araç simülasyonuna daha da açıkça yönelmiş durumda. Bu, "bu Unity'nin peşine mi düşüyor?" sorusunu yeniden çerçeveliyor: yakın vadede en ciddi pazar, bitmiş tüketici oyunları değil, ajan eğitimi ve simülasyon olabilir.

Bu Makalenin Kapsamadığı Konular

Aynı konuşmaya çekilen ama buraya ait olmayan birkaç komşu konu var:

DLSS, FSR, ölçek büyütme (upscaling) ve kare üretimi. Bunlar, yapay zekanın normal bir işleme hattının ayrı aşamalarının of a normal rendering pipeline; the engine is still running. That's a separate topic, neural rendering, and not what this article covers.
Eğitim verisi toplamak için kullanılan ayrıntılı pekiştirmeli öğrenme yöntemi. Bunu kavramsal düzeyde anlatacağım; tam tarif makalelerde mevcut.
Oyun sunucusu barındırma ve altyapı kurulumu. Bu, modellerin nasıl çalıştığını anlatan bir açıklama yazısı, bir dağıtım kılavuzu değil.

İnsanlar "Yapay Zeka Oyun Motoru" Derken Neyi Kastediyor (ve Bu Hangisi)

"Yapay zeka oyun motoru" ifadesi birbirinden tamamen farklı üç şeye yapıştırılıyor ve bu konudaki kafa karışıklığının çoğu, onları tek bir şeyde birleştirmekten geliyor. Bu makale tam olarak bunlardan biriyle ilgili: her kareyi tahmin eden ve motorun tamamen yerini alan bir model. Geleneksel bir motora cıvatalanmış yapay zeka araçları değil, ve sonradan motora yüklediğiniz 3D ortamlar oluşturan bir araç da değil.

Üç anlam, sade bir dille:

Geleneksel bir motorun içindeki yapay zeka araçları. Varlık üretimi, doku sentezi, NPC davranış ağaçları, diyalog yazımı: hepsi Unity ya da Unreal içinde çalışır. Motor hâlâ kareleri işler, fiziği çalıştırır ve durumu tutar. Yapay zeka, içerik hattındaki bir asistandır. "Yapay zeka oyun motoru" için çıkan arama sonuçlarının çoğu aslında bununla ilgilidir ve bu, bu makalenin konusu değildir. bu makalenin konusu.
Tasarlanmış 3D-uzay üreteçleri. Fei-Fei Li'nin kurucu ortaklarından olduğu World Labs, Marbleadlı, metinden, görsellerden, videolardan ya da diğer girdilerden kalıcı, indirilebilir 3D ortamlar oluşturan bir aracı sunuyor. Önemli olan şu ki Marble, mekânsal bir içerik oluşturma aracına daha yakındır: içinde dolaşılabilen, düzenlenebilen, indirilebilen ya da sonraki iş akışlarına aktarılabilen kalıcı 3D dünyalar üretir. Bu, onu, oynanabilir deneyimin kendisinin kare kare üretim yoluyla canlı olarak ortaya çıktığı GameNGen, Oasis ya da Genie tarzı sistemlerden farklı kılar.
Motorun yerini alan dünya modelleri. GameNGen, Oasis, Genie ailesi, DIAMOND, MineWorld, Matrix-Game. Bunlar, Unity ya da Unreal'a normal bir şekilde tasarlanmış bir sahne yüklemek yerine, oynanabilir gözlemleri doğrudan üretir. Bazı daha yeni sistemler bellek ve tutarlılık mekanizmaları ekler, ama yine de geleneksel bir oyun motorunun kalıcı, incelenebilir, geliştirici tarafından kontrol edilen durum modelini sunmazlar. İşte buradaki konu bu.

Okuduğunuz herhangi bir makale için hızlı bir karar kuralı: eğer sistem, Unity'ye yüklediğiniz bir dosyaüretiyorsa, 1. ya da 2. kategoridedir. Eğer sistemin kendisi is kareleri canlı olarak üretilen, oynadığınız şeyse, 3. kategoridedir: bir dünya modeli.

Infographic titled Three Meanings of AI Game Engine: category 1 is AI tools inside a traditional engine for assets, textures and NPC behavior; category 2 is authored 3D-space generators that export scenes; category 3 is world models that replace the engine and generate the interactive frame by frame. A banner notes this article is about category 3.

Bir Model Motor Olmadan Oyunu Nasıl Üretir

Bir dünya modeli, bir oyunun hareket halinde nasıl göründüğünü öğrenir, ardından son karelere ve oyuncunun mevcut girdisine bağlı olarak bir sonraki kareyi tahmin eder. Geleneksel bir motorun aksine, "kapı açık," "bu düşman öldü" ya da "oyuncu X koordinatında" gibi temiz değişkenler sunmaz. İlk dönem kare tahmini sistemlerinde model çoğunlukla, belirli görsel durumların belirli girdileri takip etme eğiliminde olduğunu öğrenir. Oynamak, sadece bu öğrenilmiş tahmin döngüsünü etkileşimli hissettirecek kadar hızlı çalıştırmaktır.

GameNGen en temiz işlenmiş örnektir, çünkü makale her adımı ortaya koyuyor. İş akışı iki aşamada işler. Önce, bir pekiştirmeli öğrenme ajanı binlerce DOOM oturumu oynar ve her oturum, onları üreten eylemlerle eşleştirilmiş bir kare akışı olarak kaydedilir. İkinci olarak, değiştirilmiş bir Stable Diffusion v1.4, bu veri üzerinde, önceki kareler ve oyuncunun eylemi verildiğinde bir sonraki kareyi tahmin etmek için eğitilir. Eylem doğrudan koşullandırmaya işlenir, ve onu sadece bir video üreteci değil de bir oyun yapan işin püf noktası budur. Tuşa basışınız, bir sonraki görselin isteminin (prompt) bir parçasıdır.

Zor kısım hızdır. Normal bir difüzyon modeli, gürültüyü bir görsele dönüştürmek için 20 ila 50 gürültü giderme adımı çalıştırır, ki bu gerçek zamanlı oyun için fazlasıyla yavaştır. GameNGen bunu 4 gürültü giderme adımınaindirir; bu da toplam çıkarımı kare başına kabaca 50 milisaniyeye getirir: DOOM'un yerel 320×240 çözünürlüğünde tek bir TPU üzerinde 20 FPSiçin yeterince hızlı. İnsan değerlendiriciler, simülasyonun kısa kliplerini gerçek DOOM görüntülerinden ayırt etmede şanstan yalnızca biraz daha iyi sonuç verebildi.

Bu alandaki çoğu sistem, birbiriyle örtüşen mimari kalıplara girer:

Difüzyon tabanlı sistemler (GameNGen, Oasis, DIAMOND, Genie 2): gürültüden başlar ve adım adım gürültüyü giderip bir sonraki kareye dönüşür. Güçlü, kısa ufuklu görsel kalite üretebilirler, ama etkileşimli çalışmak için hız hileleri gerektirirler.
Otoregresif sistemler (MineWorld): gelecekteki kareleri ya da jetonları sırayla tahmin eder, bir dil modelinin metni tahmin etme biçimine daha yakındır. MineWorld, daha sıkı eylem takibi uğruna kare hızından feragat eder ve 4-7 FPS civarına oturur.
Bellek ve kontrol bakımından güçlendirilmiş melezler (Matrix-Game 2.0/3.0 ve daha yeni sistemler): gerçek zamanlı üretimi, eylem koşullandırması, kamera kontrolü ve uzun ufuklu kaymayı azaltmaya yönelik açık bellek mekanizmalarıyla birleştirir.

Bir ayrıntı bir sonraki bölüm için önemli. Eğitim sırasında GameNGen, koşullandırdığı geçmiş karelere kasıtlı olarak gürültü ekler. Bu, modeli, hatalarını biriktirmek yerine kendi hatalarını düzeltmeyi öğrenmeye zorlar; kayma sorununa karşı bir önlemdir. Yardımcı olur. Ama çözmez.

Diagram of how next-frame prediction works in five steps: recent frames, player input, the world model running denoising diffusion steps, the predicted next frame, and a prediction loop that repeats at real time for interactive speed.

Soy Ağacı: İki Yılda Genie 1'den Genie 3'e

Bu alandaki en çarpıcı şey eğimdir. Şubat 2024'te, Genie 1 256×256 çözünürlükte kontrol edilebilir 2D platform oyunları üretti. On sekiz ay sonra, Genie 3 bir metin isteminden 720p ve 24 FPS'de gezilebilir 3D dünyalar üretiyordu. Dikkat etmeye değer olan yörünge budur: tek bir demo değil, aralarındaki değişim hızı.

Tek bir ilerleme olarak okunduğunda, hikaye şöyle gidiyor. Genie 1 (DeepMind, ICML 2024), etiketlenmemiş videodan etkileşimli ortamlar öğrenebileceğinizi kanıtladı. GameNGen (Google, ICLR 2025), aynı fikrin gerçek, hızlı tempolu bir oyunu (DOOM) gerçek zamanlı çalıştırabileceğini gösterdi. Oasis (Decart, Ekim 2024), bunu Minecraft'a taşıdı ve herkesin oynayabileceği hâle getirdi. Genie 2 (DeepMind, Aralık 2024), tek bir görselden üretilen 3D dünyalara sıçradı. DIAMOND (NeurIPS 2024), yaklaşımı açık kaynak ve bir tüketici GPU'sunda çalıştırılabilir hâle getirdi. GameGen-X ve MineWorld (Microsoft, 2025), açık ekosistemi daha da ileri taşıdı. Genie 3 (Ağustos 2025; Ocak 2026'da Project Genie olarak halka açık), metinden gerçek zamanlı 3D'ye ulaştı. Matrix-Game 2.0 açık kaynaklı, gerçek zamanlı akış üretimini 25 FPS'ye çıkardı, ve Matrix-Game 3.0 bellek sorununa uzun ufuklu bir bellek mimarisiyle daha doğrudan saldırdı.

This is, in a real sense, the other end of the neural-rendering trend. Neural rendering is AI replacing individual stages of the graphics pipeline (upscaling here, shading there) while the engine keeps running. World models are AI replacing the pipeline entirely. If you read the two together, neural rendering is the "AI eats the parts" story and this is the "AI eats the whole thing" story. Each is the other's logical next step.

Başlıca sistemlerin teknik özellikleri aşağıdaki tabloda; anlatının amacı sayılar değil, çizgidir.

Sistem	Geliştirici	Yıl	Yaklaşım	Çözünürlük / FPS	Açık kaynak mı?	Kaynak
Genie 1	Google DeepMind	2024	Gizli (latent) eylem	256×256	No	arXiv
GameNGen	Google	2024	Difüzyon	320×240 / 20 FPS	No	arXiv
Oasis	Decart + Etched	2024	Difüzyon (Forcing)	360p / 20 FPS	Kısmi (500M ckpt)	Proje
Oasis 3	Decart	2026	Fiziksel yapay zeka için API'den erişilebilir etkileşimli dünya modeli	Gerçek zamanlı API önizlemesi	No	Decart / TechCrunch
Genie 2	Google DeepMind	2024	Otoregresif gizli (latent) difüzyon	Yok	No	DeepMind
DIAMOND	Geneva / Edinburgh / MSR	2024	Difüzyon	Atari / CS:GO	Evet (MIT)	arXiv
GameGen-X	Akademik	2024	Difüzyon transformatörü	Yok	Evet	arXiv
MineWorld	Microsoft Research	2025	Otoregresif	4-7 FPS	Evet	arXiv
Genie 3	Google DeepMind	2025	Genel amaçlı gerçek zamanlı dünya modeli	720p / 24 FPS	No	DeepMind
Matrix-Game 2.0	Skywork AI	2025	Az adımlı otoregresif difüzyon	Tek bir H100 üzerinde 25 FPS	Evet	Proje
Matrix-Game 3.0	Skywork AI	2026	Bellekle güçlendirilmiş etkileşimli dünya modeli	5B model ile 720p'de 40 FPS'ye kadar	Evet	Proje / arXiv

Timeline titled Rapid Evolution of Interactive World Models showing Genie 1 in 2024, GameNGen in 2024, Oasis in 2024, Genie 2 in 2024, DIAMOND in 2024, MineWorld in 2025, Genie 3 in 2025, and Matrix-Game 3.0 in 2026, illustrating the move from controllable 2D worlds to real-time 3D interactive generation in roughly two years.

Bu Dünyalar Neden Dağılıyor

Bu sistemler hâlâ dört önemli açıdan bozuluyor, ama başarısızlık biçimi sadece "yeterli işlem gücü yok" değil. Daha fazla GPU çözünürlüğü, gecikmeyi ve model ölçeğini iyileştirebilir, ama üretim düzeyinde tutarlılık daha iyi bellek, durum takibi ve kontrol mimarisi gerektirir. Akla yatkın kareler tahmin eden bir model, açık kuralları, incelenebilir değişkenleri, deterministik durum güncellemeleri ve kaydet/yükle anlambilimi olan bir motorla aynı şey değildir. Aşağıdaki her sınırlama, modelin henüz yeterince iyi hâle gelmediği şey değil, yapısal olarak yapamadığı şeydir.yapamadığı şeydir, henüz yeterince iyi hâle gelmediği şey değil.

Kalıcı Dünya Durumu Yok

Bu sistemler, geleneksel bir motorun yaptığı şekilde değişkenler sunmaz. Normal bir motor, dünyayı veri olarak depolar: bu sandık açık, bu düşman öldü, oyuncu (412, 88) koordinatında. İlk dönem kare tahmini sistemlerinde, o oyun geliştirme anlamında kalıcı bir motor durumu yoktur. Model çoğunlukla son görsel bağlama ve öğrenilmiş ön bilgilere (prior) dayanır, dolayısıyla nesneler görüş alanından çıktığında değişebilir, yok olabilir ya da yanlış biçimde yeniden belirebilir. Daha yeni sistemler açık bellek ve tutarlılık mekanizmaları ekliyor, ama yine de geleneksel bir motorun geliştiricilere verdiği türden temiz, hata ayıklanabilir bir dünya durumu sunmuyorlar.

Daha zayıf ya da ilk dönem kare tahmini sistemlerinde, açtığınız bir sandık kapalı olarak yeniden belirebilir, öldürdüğünüz bir canavar geri yürüyebilir ve inşa ettiğiniz bir yapı kareden çıktığında dağılabilir. Oyuncular, orijinal Oasis demosunu "rüya mantığına" sahip olarak tanımladı: dönüyorsunuz ve tam olarak aynı yere geri dönmeyebiliyorsunuz. Daha yeni sistemler bu sorunu daha güçlü bellek ve tutarlılık mekanizmalarıyla azaltmaya çalışıyor, ama açık kapalı: hâlâ geleneksel, incelenebilir bir oyun durumu katmanı sunmuyorlar.

Bağlam Penceresi Tavanı

Tutarlılık, sadece ham görsel kaliteyle değil, modelin bellek tasarımıyla sınırlıdır. GameNGen kısa, doğrudan bir kare geçmişi kullanır ama yine de öğrenilmiş düzeltme yoluyla kararlı, birkaç dakikalık oyun oturumları bildiriyor. Genie 2, görünür uzun ufuklu bellek örnekleri sundu ve çoğu örneği 10-20 saniye sürse de tutarlılığı bir dakikaya kadar korudu. Genie 3, sürekli etkileşimi birkaç dakikaya çıkarıyor ve Matrix-Game 3.0 soruna uzun ufuklu bellekle doğrudan saldırıyor. Çözülmemiş mesele "model birkaç saniyeden fazla dayanabilir mi?" değil. Mesele, gerçek bir oyunun uzunluğu ve karmaşıklığı boyunca güvenilir, incelenebilir, kaydedilebilir bir dünya durumunu koruyup koruyamayacağıdır.

Stokastik, Deterministik Değil

Çıktı varsayılan olarak olasılıksaldır. Aynı kurulumu iki kez çalıştırın ve sistem ağır şekilde kısıtlanmadıkça farklı kareler elde edebilirsiniz. Bir sanat aracı için bu yararlı olabilir; birçok üretim oyunu için bir sorundur. Çok oyunculu mod, rekabetçi denge, tekrar oynatmalar, beceri ilerlemesi ve kaydet/yükle, hepsi güvenilir durum geçişlerine bağlıdır. Bir dünya modeli daha tekrarlanabilir hâle getirilebilir, ama bir üretim oyunu, oyuncuların ve geliştiricilerin beklediği davranışı garanti etmek için yine de deterministik bir mantık katmanına ya da durum sistemine ihtiyaç duyardı.

Bu Bir Oyun mu, Yoksa Klavyeyle Video Tahmini mi?

En keskin eleştiri, bu sistemlerin geleneksel oyun motoru anlamında dünyaları simüle etmediği; akla yatkın görsel devamlar üretip onları yönlendirmenize izin verdiğidir. Bir oyun motoru kuralları kodlar; bir dünya modeli akla yatkınlığı kodlar. GameNGen Hacker News başlığındaki bir yorumcu buna "dünyanın en verimsiz video sıkıştırması" dedi ve bir kışkırtma olarak yerini buluyor: model esasen oyun görüntüleri üzerinde bir dağılımı ezberledi ve girdilerinize yanıt olarak onun içinde ara değer hesaplıyor (interpolating). Bunun temiz bir testi var, aşağıdaki kutucukta.

"Dururken kayma" işareti. Bir dünya modeli gerçekten bir dünyayı hesaplasaydı, hareketsiz bir oyuncu kararlı bir görsel vermeliydi: hiçbir şey değişmiyor, dolayısıyla hiçbir şey değişmemeli. Daha zayıf ya da ilk dönem kare tahmini sistemlerinde, hareketsiz durmak bile kaymayı açığa çıkarabilir: model, sabit, incelenebilir bir dünya durumundan işlemek yerine bir sonraki akla yatkın kareyi tahmin ettiği için küçük ayrıntılar kayar. İşte işaret budur. Sahne bir süre kararlı görünebilir, ama sistem hâlâ devamlılığı geleneksel bir motordan okumak yerine üretiyordur.

Temel çıkarım: deterministiklik ve kalıcılık sınırları mimari sorunlardır, ham ölçeklendirmenin tek başına çözeceği meseleler değil. Güvenilir, tekrarlanabilir, kaydedilebilir bir dünya gerektiren herhangi bir sistem, mevcut kare üretim yaklaşımlarının tek başlarına sağlamadığı deterministik bir mantık katmanına, açık bir bellek/durum sistemine ya da melez bir motor tasarımına yine de ihtiyaç duyar.

Infographic titled Why World Models Drift with four panels: no traditional world state means no clean inspectable engine variables; memory limits make long-horizon consistency difficult; probabilistic output means the same setup can yield different results; and drift over time means continuity is generated rather than retrieved from stable engine state.

Çalıştırmak Gerçekte Ne Kadara Mal Oluyor

Gerçek zamanlı üretim pahalıdır ve manşet rakamları çok şeyi gizler. GameNGen'in "tek TPU'su", DOOM'u modern, yüksek çözünürlüklü bir oyun değil, 320×240'ta simüle ettiğini hatırlayana kadar ucuz gelir. Orijinal Oasis demosu, H100 sınıfı altyapıda gerçek zamanlı çalıştı ve Decart'ın daha yeni Oasis 3'ü ekonomiyi daha somut hâle getiriyor. Decart, Oasis 3'ü fiziksel yapay zeka için API'den erişilebilir etkileşimli bir dünya modeli olarak konumlandırıyor, ve TechCrunch, önizleme erişim fiyatlandırmasını saniye başına $0.02 ya da 60 saniyelik bir oturum için $1.20 olarak bildirdi. Bu, test, simülasyon ve araştırma iş akışları için yararlıdır, ama yine de normal bir oyun istemcisi göndermekten çok farklı bir maliyet modelidir.

Ölçeği belirtmek gerekirse: gerçek zamanlı dünya üretimi hâlâ pahalı, ama donanım tablosu hızla değişiyor. Bazı açık araştırma sistemleri artık tek H100 sınıfı GPU'larda gerçek zamanlı ya da gerçek zamanlıya yakın üretim bildiriyor, sınırdaki tüketiciye yönelik sistemler ise bulutta barındırılmaya devam ediyor ve çoğu zaman açıklanmıyor. Kesin nokta "bir GPU bunu asla yapamaz" değil; nokta şu ki üretim kalitesinde, düşük gecikmeli, yüksek çözünürlüklü dünya üretimi hâlâ ciddi bir altyapı sorunu.

Karşı görüş şu ki taban hızla düşüyor ve açık kaynak katmanı gerçek. DIAMOND, tek bir RTX 4090 üzerinde yaklaşık 12 günde eğitildi ve resmi proje sayfasınagöre bir RTX 3090'da kabaca 10 FPS'de oynanabiliyor. MineWorld ve Matrix-Game herkes tarafından çalıştırılabilir. Yani en etkileyici demolar hâlâ özelleşmiş, pahalı altyapıya bağlı olsa da, meraklı bir geliştirici erişilebilir donanımda şimdiden bazı gerçek dünya modeli deneyleri çalıştırabilir. İki şey aynı anda doğru: sınırdaki kalitede etkileşim pahalı ve deney için giriş noktası şimdiden gerçek.

Peki Yapay Zeka Unity ve Unreal'ın Yerini Alacak mı?

Yakın vadede hayır, ve sebep yatırım eksikliği değil, yukarıdaki sınırlar. Pazar bunu ciddiye aldı. Google, Project Genie'yi 29 Ocak 2026'da ABD'deki Google AI Ultra abonelerine sunduve ertesi gün birkaç oyun hissesi sert şekilde satıldı: The Verge, Unity'nin %24,22, Roblox'un %13,17 ve Take-Two'nun %7,93 düştüğünü bildirdi Cuma kapanışında. Endişe sektörün içinde de görüldü: GDC'nin 2026 anketi oyun profesyonellerinin %52'sinin üretken yapay zekayı oyunlar üzerinde olumsuz etkisi olan bir şey olarak gördüğünü buldu; bu oran bir önceki yıl %30'du. Ama hisse hareketleri ve anket endişesi bir demoya verilen tepkilerdir. Asıl zaman çizelgesini belirleyen şey mimaridir.

Yörüngeyi olduğu hâliyle okursak, ve bu benim okumam, yerleşmiş bir tahmin değil, önümüzdeki 1-3 yıl muhtemelen dünya modellerini tam ticari oyunlar yerine araştırma prototiplerinde, simülasyon altyapısında, robotik/fiziksel-yapay zeka eğitiminde ve dar, tüketiciye yönelik demolarda tutacak. Akla yatkın 3-7 yıllık yol, yerini alma değil melez: görsel üretimi yürüten bir dünya modeli, asıl oyun mantığını tutan hafif, deterministik bir durum makinesinin üzerinde oturur. Bu güçlendirmedir. Yörünge yeterince dik (kabaca bir yılda 320p'de DOOM'dan metinden-720p'ye) ki kendinden emin uzun vadeli tahminler akıllıca değil, o yüzden birini yapmayacağım.

Tüm soruyu yeniden çerçeveleyen ayrıntı: DeepMind, dünya modellerini ajan eğitimine ve AGI araştırmasına bağlıyor, Project Genie ise aynı teknolojiyi tüketiciye yönelik bir dünya yaratma prototipi olarak gösteriyor. Decart'ın Oasis 3'ü robotiğe, otonom araçlara ve fiziksel-yapay zeka simülasyonuna daha da açıkça yönelmiş durumda. Tüketici oyunları hikaye için önemli, ama yakın vadedeki ticari çekim önce simülasyon, eğitim ve prototipleme tarafından gelebilir.

Sıkça Sorulan Sorular

Bir Dünya Modeli ile Bir Oyun Motoru Arasındaki Fark Nedir?

Bir oyun motoru açık kuralları kodlar ve oyun durumunu veri olarak depolar: deterministik, incelenebilir ve hata ayıklanabilirdir. GameNGen gibi bir dünya modeli ise, geliştiricilerin normalde inceleyip kontrol ettiği geleneksel motor tarzı durum, kurallar ve nesne değişkenleri olmadan, son karelerden ve sizin girdinizden akla yatkın bir sonraki kareleri tahmin eder. Motor dünyayı hesaplar; dünya modeli onu tahmin eder. İşte bu yüzden biri tekrarlanabilirken öteki değildir.

GameNGen Nasıl Çalışır?

GameNGen, DOOM'u üç genel adımda çalıştırır. Önce, bir pekiştirmeli öğrenme ajanı binlerce DOOM oturumu oynar; bunlar eylemlerle eşleştirilmiş kareler olarak kaydedilir. İkinci olarak, değiştirilmiş bir Stable Diffusion v1.4, geçmiş karelere ve oyuncunun girdisine bağlı olarak bir sonraki kareyi tahmin etmeyi öğrenir. Üçüncü olarak, çıkarım 4 gürültü giderme adımına indirilir ve 320×240'ta tek bir TPU üzerinde kabaca 20 FPS üretir.

Oasis'teki Dünya Etrafınızda Döndüğünüzde Neden Sürekli Değişiyor?

Orijinal Minecraft benzeri Oasis demosunda, sistem geleneksel, motor tarzı bir dünya durumunu korumadığı için döndüğünüzde dünya değişebiliyordu. Bir sonraki görüntüyü son görsel bağlamdan ve öğrenilmiş ön bilgilerden üretiyordu, dolayısıyla görüş alanı dışındaki nesneler değişmiş biçimde geri dönebiliyordu. Daha yeni sistemler daha güçlü bellek ve tutarlılık mekanizmaları ekliyor, ama o orijinal "rüya mantığı", tam da sınırlamayı fark etmeyi kolaylaştıran şeydi.

Yapay Zeka Tarafından Üretilen Bir Oyun Dünyası Kaymadan Önce Ne Kadar Süre Tutarlı Kalabilir?

Bu modele bağlı. İlk dönem sistemler çoğu zaman saniyeler içinde ya da onlarca saniye içinde kayar, ama daha yeni sistemler bu ufku genişletiyor. GameNGen'in 3 saniyenin biraz üzerinde doğrudan bağlamı vardır, yine de öğrenilmiş sezgisel yöntemlerle daha uzun oynanış boyunca kararlı kalabilir. Genie 2 çoğunlukla 10-20 saniyelik örnekler ve bazı durumlarda bir dakikaya kadar gösterdi. Genie 3 iddiayı 720p/24fps'de birkaç dakikaya çıkarıyor ve Matrix-Game 3.0 bir dakikalık bellek tutarlılığı bildiriyor. Çözülmemiş sorun kısa klipler değil; kalıcı, incelenebilir, kaydedilebilir dünya durumudur.

Yapay Zeka Unity ya da Unreal Gibi Oyun Motorlarının Yerini Alacak mı?

Yakın vadede hayır. Engeller, salt bir ölçek sorunundan çok mimaridir: üretim oyunları kalıcı duruma, güvenilir mantığa, deterministik davranışa ve kaydet/yükle anlambilimine ihtiyaç duyar. Ölçeklendirme kaliteye ve tutarlılığa yardımcı olur, ama tek başına geleneksel bir oyun döngüsü yaratmaz. Akla yatkın yol melezdir: oyun mantığı için deterministik bir motorun üzerinde görseller üreten bir dünya modeli, ki bu yerini alma değil güçlendirmedir. DeepMind, dünya modellerini ajan eğitimi ve AGI araştırması için önemli olarak sunuyor, Project Genie ise teknolojiyi tüketiciye yönelik bir dünya yaratma prototipi olarak da görünür kılıyor. Decart'ın Oasis 3'ü, robotiğe, otonom araçlara ve fiziksel-yapay zeka simülasyonuna açıkça yönelmiş bir modelin daha temiz örneğidir.

Bu Yapay Zeka Tarafından Üretilen Oyunlardan Herhangi Birini Şu Anda Oynayabilir misiniz?

Evet, birkaçını. Decart'ın orijinal Oasis'i herkese açık, Minecraft benzeri bir web demosuna sahipti ve daha yeni Oasis 3 Önizlemesi artık gerçek zamanlı dünya modeli deneyleri için API'den erişilebilir. Google'ın Project Genie'si de Ocak 2026'da ABD'deki Google AI Ultra abonelerine açıldı. Açık kaynak katmanı için DIAMOND ve MineWorld indirilip tüketici GPU'larında çalıştırılabilir; DIAMOND bir RTX 3090'da yaklaşık 10 FPS olarak bildirildi.

Oyun Motoru Olmadan Oyunlar: Yapay Zeka Modelleri Oynanabilir Dünyaları Nasıl Üretiyor