Az első napon a Fable 5-t állítottam be alapértelmezettként a Claude Code-ban, és átadtam neki azt a fajta többfájlos feladatot, ami általában egész délutánomat megeszi. Mentem kávét csinálni. Mire visszaültem, elkészült — és csendben megjavított két szomszédos dolgot is, amelyekre nem is kértem.
Ez valódi váltás valódi munkán, nem egy benchmark eredmény. És 2x annyiba kerül, mint amennyit az Opus 4.8-ért fizettem, szóval az megéri-e valódi kérdés, nem retorikai. Három dolog tényleg megváltozott a munkamódszeremben. Egy dolog őszintén szólva frusztráló. Íme minden, plusz amit kevesebb mint egy óra alatt kipróbálhatsz.
A rövid verzió
Három valódi változás: az összetett, többfájlos refaktorálások kevesebb körben zárulnak, mert Fable 5 visszaadás előtt ellenőrzi a saját munkáját; az alárendelt ügynökök delegálása felügyelet nélkül fut; a vizuális feladatok képernyőképeket olvasnak, és sokkal kevesebb kézen fogással rekonstruálják a logikát. Az egyetlen csalódás: egy védelmi mechanizmus néha aktiválódik, és az Opus 4.8-ra irányít. A válaszban tudod meg, nem a küldés előtt, és Fable 5 helyett Opus-választ kapsz. Következtetésem: nehéz, hosszú távú munkán megéri. Tesztelje egy valódi feladaton, mielőtt elkötelezi magát az árak mellett — triviális munkán a 2x csak 2x.
Kevesebb kör, mert ellenőrzi a saját munkáját
Az említett refaktorálás: az Opus 4.8-on egy héttel korábban futtatott verziója nyolc-kilenc oda-vissza kört vett igénybe, amelyek közül kettőben én kaptam el a visszaadott, elromlott buildet. Fable 5 hármon belül lezárta, és már maga kereste a hibákat, ahelyett, hogy megvárt volna, amíg megtalálom. Az ok: Fable 5 több kontextust tartalmaz, és átadás előtt önmagát is ellenőrzi. Simon Willison ugyanezzel találkozott, de még erőteljesebben: in első napi benyomásai leírja, hogy a modell egy olyan feladatnál, amely csak egy könyvtárprobléma javítását kérte, több mögöttes könyvtárproblémát is megtalál és javít.
Tehát a különbség itt nem a sebesség. Arról van szó, hogy a Fable 5 ellenőrzi a saját munkáját, mielőtt visszaadja, így kevesebb hibás builddel találkozol, és kevesebb kört égetsz el az utána való takarítással. Egy fejlesztő a HN kiadásának szálában úgy fogalmazta meg, hogy a modell „mások által okozott hibákat talál meg“; egy Canva-mérnök ugyanabban a szálban „feleannyi tokenről jobb eredményekkel“ és kevesebb kódot tartalmazó pull requestekről számolt be. Ha az érzés mögötti egyetlen benchmark-számot keresi: az Anthropic a Fable 5-öt 80,3%-on helyezi el a SWE-Bench Pro-n az Opus 4.8 69,2%-ával szemben. A különbséget már a szám elolvasása előtt éreztem.
A változás nem a sebességben rejlik. Hanem abban, hogy kevesebb kimenete jön vissza hibásan.
Alügynök-delegálás állandó felügyelet nélkül
Átadtam neki egy háromszakaszos refaktort, és két szakaszt befejezett, mielőtt felnéztem. Ez a második változás, és az, amelyikre nem számítottam. A Fable 5 hosszú horizontú viselkedése azt jelenti, hogy delegálhat egy több szakaszból álló feladatot, és az elvégzi a szakaszokat egyedül, ahelyett hogy minden lépés után megállna ellenőrizni. A páros, amely ezt valóra váltja, Dynamic Workflows, az Anthropic párhuzamos alárendelt ügynök-vezénylésével (általánosan elérhető május végétől), és nem standard egyszeri munkamenet módban. A HN-szálon egy fejlesztő arról számolt be, hogy összetett adatbázis-migrációk egyetlen munkamenetben befejeződtek ott, ahol az Opus ismételten megbukott.
Ez az igazi figyelmeztetés, és fontos: a Pro tervvel 30 perces ablakon belül elérheted a sebességkorlátokat, ami tönkreteszi a hosszú felügyelet nélküli futást, amitől épp fellelkesedtél. A szálban egy fejlesztő 30 perc ügynökmunka alatt elérte a felső határt. A képesség valódi. A Pro terv sebességkorlátja is valódi. Max az a hely, ahol ez valóban megszakítások nélkül működik.
A delegálás végre felügyelet nélkül is működik. Csak tudja: a Pro-szint rate-limite-et alkalmaz, mielőtt egy teljes futást befejezne, így ez valójában a Max-csomag nyertese.
A vizuális feladatok most más élményt nyújtanak
Egy kaotikus UI-komponens képernyőképét dobtam be a munkamenetbe, és megkérdeztem, mit csinál. Elolvasta az elrendezést és rekonstruálta a logikát anélkül, hogy egyetlen elemet is leírtam volna. Ez a harmadik változás: a Fable 5 olvassa a képernyőképeket és a kódbázis diagramjait, és a megszokottnál jóval kevesebb kézben tartással ad használható kimenetet. Egy HN-thread-beli fejlesztő, aki fél óráig stressztesztelte, «hihetetlenül jónak» nevezte az UI-tervezés vizuális aspektusaiban — ez egybevág azzal, amit én is láttam.
Ez a három változás közül a legkisebb. De ez az, amelyik csendesen eltávolít egy lépést, amelyről nem vettem észre, hogy belefáradtam.
Az egy dolog, ami frusztráló
Küldtem egy feladatot, amelynek egyszerűen kellett volna futnia, és visszajött, mint egy Opus elutasítás-alapú válasz. Ami a háttérben zajlik: egy biztonsági osztályozó aktiválódik a kiberbiztonsághoz kapcsolódó és néhány más érzékeny feladattípusnál, és Fable 5 válasz helyett Opus 4.8-ra irányítja a kérést. A válaszból értesül, nem az elküldés előtt, és Fable 5 helyett Opus-választ kap. Az Anthropic szerint a felhasználókat tájékoztatják, ha ez megtörténik, és technikailag a válasz valóban tájékoztat, de nincs előzetes figyelmeztetés, hogy a feladat az osztályozó hatókörébe esik.
A klasszifikátor hatóköre szintén széles. A HN-szálban az egyik fejlesztő üzleti prospecting eszközöknél ütközött falba; egy másik, aki egészségügyi adatokon végzett mintaelemzést, az ő esetükre használhatatlannak minősítette. Igazságosan szólva ez ritka: az Anthropic szerint a Fable-munkamenetek több mint 95%-a egyáltalán nem találkozik fallback-kel. Van ezen felül egy külön, sokkal szűkebb vita egy kulisszák mögötti finomhangolási módszerről, amely határterületi MI-kutatókat érint, nem átlagos fejlesztőket — ne keverd össze a kettőt. Ami igazán bántó lehet, az a látható Opus-fallback. Nem az a baj, hogy létezik a biztonsági útválasztás. Az a baj, hogy átlátszatlan: utólag megtudni, hogy Opus-választ kaptál, miközben Fable 5-öt vártál — az kellemetlen érzés.
Remek modell, átláthatatlan korlát. Az átláthatatlanság az, ami fáj, nem maga a biztonság.
Mit próbálj ki a következő órában
Állítsa be a Fable 5-t alapértelmezettként a Claude Code-ban, és futtassa a már megnyitott, több fájlt érintő refaktoráláson. Ez az egész kísérlet — és egy órán belül tudni fogja, hogy a 2x díjat megéri-e az Ön munkájánál. Tesztelje valami igazán nehézen, ne triviális feladaton: az adaptív gondolkodás mindig be van kapcsolva, tehát az egyszerű feladatok nem mutatják meg a különbséget, és csak többe kerülnek hiába. Ha Max vagy Team előfizetésen van, kapcsolja be a Dynamic Workflows-t, hogy a delegálási viselkedést lássa egyetlen munkamenet helyett. Adjon neki egy képernyőképet a saját felületéről, hogy saját maga figyelje meg a vision-változást.
A váltás maga /model fable or /model claude-fable-5 (szüksége lesz a Claude Code v2.1.170 vagy újabb verziójára). Futtassa a valódi munkáján, döntse el maga, és térjen vissza az Opushoz, ha a feladatai nem kapnak lendületet. Nem esik baj.
Gyakran ismételt kérdések
Hogyan válthatok Fable 5-re a Claude Code-ban?
Futtat /model fable or /model claude-fable-5 a Claude Code-ban, vagy adja meg --model claude-fable-5 az indításkor. A Fable 5 opcióként való megjelenéséhez Claude Code v2.1.170 vagy újabb verzió szükséges.
A biztonsági mechanizmusok blokkolják a munkámat a Claude Code-ban?
Többnyire nem. Az Anthropic szerint a Fable 5-sessionök több mint 95%-a soha nem ütközik fallbackbe. De a kiberbiztonsági szomszédos és egyes egészségügyi adatfeladatok az Opus 4.8-hoz irányíthatók. Értesítik Önt a válaszban, ha ez megtörténik, de nincs előzetes figyelmeztetés, tehát utólag tudja meg. Ha munkája érinti ezeket a területeket, tesztelje egy valódi feladaton, mielőtt a Fable 5-öt alapértelmezettnek állítja be.
A Dynamic Workflows különbözik a normál ügynök módtól?
Igen. A Dynamic Workflows az Anthropic párhuzamos al-ügynök-orchestrációs rétege, amelyet május vége óta általánosan elérhetővé tett, és alapértelmezés szerint engedélyezett a Max és Team terveken. Ez az a hely, ahol a Fable 5 felügyelet nélküli többlépéses delegációja teljes mértékben kifejezésre jut, és a standard egymenetes ügynök mód nem mutatja ugyanazt a hosszú távú viselkedést.