50% kedvezmény minden csomagra, korlátozott ideig. Már $2.48/mo
7 perc van hátra
AI és gépi tanulás

Fable 5 a Claude Code-ban: mi változott valójában (első napi benyomások)

R By Riley 7 perces olvasás
Széles sötét módú blogbanner narancssárga kiemelésekkel, amely egy Fable 5 fejlesztői irányítópultot mutat 3 lépéses munkafolyamat-befejezéssel, tesztellenőrzéssel és önellenőrzési megjegyzéssel a Claude Code-on belül.

Az első napon a Fable 5-t állítottam be alapértelmezettként a Claude Code-ban, és átadtam neki azt a fajta többfájlos feladatot, ami általában egész délutánomat megeszi. Mentem kávét csinálni. Mire visszaültem, elkészült — és csendben megjavított két szomszédos dolgot is, amelyekre nem is kértem.

Ez valódi váltás valódi munkán, nem egy benchmark eredmény. És 2x annyiba kerül, mint amennyit az Opus 4.8-ért fizettem, szóval az megéri-e valódi kérdés, nem retorikai. Három dolog tényleg megváltozott a munkamódszeremben. Egy dolog őszintén szólva frusztráló. Íme minden, plusz amit kevesebb mint egy óra alatt kipróbálhatsz.

A rövid verzió

Három valódi változás: az összetett, többfájlos refaktorálások kevesebb körben zárulnak, mert Fable 5 visszaadás előtt ellenőrzi a saját munkáját; az alárendelt ügynökök delegálása felügyelet nélkül fut; a vizuális feladatok képernyőképeket olvasnak, és sokkal kevesebb kézen fogással rekonstruálják a logikát. Az egyetlen csalódás: egy védelmi mechanizmus néha aktiválódik, és az Opus 4.8-ra irányít. A válaszban tudod meg, nem a küldés előtt, és Fable 5 helyett Opus-választ kapsz. Következtetésem: nehéz, hosszú távú munkán megéri. Tesztelje egy valódi feladaton, mielőtt elkötelezi magát az árak mellett — triviális munkán a 2x csak 2x.

Kevesebb kör, mert ellenőrzi a saját munkáját

Az említett refaktorálás: az Opus 4.8-on egy héttel korábban futtatott verziója nyolc-kilenc oda-vissza kört vett igénybe, amelyek közül kettőben én kaptam el a visszaadott, elromlott buildet. Fable 5 hármon belül lezárta, és már maga kereste a hibákat, ahelyett, hogy megvárt volna, amíg megtalálom. Az ok: Fable 5 több kontextust tartalmaz, és átadás előtt önmagát is ellenőrzi. Simon Willison ugyanezzel találkozott, de még erőteljesebben: in első napi benyomásai leírja, hogy a modell egy olyan feladatnál, amely csak egy könyvtárprobléma javítását kérte, több mögöttes könyvtárproblémát is megtalál és javít.

Tehát a különbség itt nem a sebesség. Arról van szó, hogy a Fable 5 ellenőrzi a saját munkáját, mielőtt visszaadja, így kevesebb hibás builddel találkozol, és kevesebb kört égetsz el az utána való takarítással. Egy fejlesztő a HN kiadásának szálában úgy fogalmazta meg, hogy a modell „mások által okozott hibákat talál meg“; egy Canva-mérnök ugyanabban a szálban „feleannyi tokenről jobb eredményekkel“ és kevesebb kódot tartalmazó pull requestekről számolt be. Ha az érzés mögötti egyetlen benchmark-számot keresi: az Anthropic a Fable 5-öt 80,3%-on helyezi el a SWE-Bench Pro-n az Opus 4.8 69,2%-ával szemben. A különbséget már a szám elolvasása előtt éreztem.

A változás nem a sebességben rejlik. Hanem abban, hogy kevesebb kimenete jön vissza hibásan.

Alügynök-delegálás állandó felügyelet nélkül

Átadtam neki egy háromszakaszos refaktort, és két szakaszt befejezett, mielőtt felnéztem. Ez a második változás, és az, amelyikre nem számítottam. A Fable 5 hosszú horizontú viselkedése azt jelenti, hogy delegálhat egy több szakaszból álló feladatot, és az elvégzi a szakaszokat egyedül, ahelyett hogy minden lépés után megállna ellenőrizni. A páros, amely ezt valóra váltja, Dynamic Workflows, az Anthropic párhuzamos alárendelt ügynök-vezénylésével (általánosan elérhető május végétől), és nem standard egyszeri munkamenet módban. A HN-szálon egy fejlesztő arról számolt be, hogy összetett adatbázis-migrációk egyetlen munkamenetben befejeződtek ott, ahol az Opus ismételten megbukott.

Ez az igazi figyelmeztetés, és fontos: a Pro tervvel 30 perces ablakon belül elérheted a sebességkorlátokat, ami tönkreteszi a hosszú felügyelet nélküli futást, amitől épp fellelkesedtél. A szálban egy fejlesztő 30 perc ügynökmunka alatt elérte a felső határt. A képesség valódi. A Pro terv sebességkorlátja is valódi. Max az a hely, ahol ez valóban megszakítások nélkül működik.

A delegálás végre felügyelet nélkül is működik. Csak tudja: a Pro-szint rate-limite-et alkalmaz, mielőtt egy teljes futást befejezne, így ez valójában a Max-csomag nyertese.

A vizuális feladatok most más élményt nyújtanak

Egy kaotikus UI-komponens képernyőképét dobtam be a munkamenetbe, és megkérdeztem, mit csinál. Elolvasta az elrendezést és rekonstruálta a logikát anélkül, hogy egyetlen elemet is leírtam volna. Ez a harmadik változás: a Fable 5 olvassa a képernyőképeket és a kódbázis diagramjait, és a megszokottnál jóval kevesebb kézben tartással ad használható kimenetet. Egy HN-thread-beli fejlesztő, aki fél óráig stressztesztelte, «hihetetlenül jónak» nevezte az UI-tervezés vizuális aspektusaiban — ez egybevág azzal, amit én is láttam.

Ez a három változás közül a legkisebb. De ez az, amelyik csendesen eltávolít egy lépést, amelyről nem vettem észre, hogy belefáradtam.

Az egy dolog, ami frusztráló

Küldtem egy feladatot, amelynek egyszerűen kellett volna futnia, és visszajött, mint egy Opus elutasítás-alapú válasz. Ami a háttérben zajlik: egy biztonsági osztályozó aktiválódik a kiberbiztonsághoz kapcsolódó és néhány más érzékeny feladattípusnál, és Fable 5 válasz helyett Opus 4.8-ra irányítja a kérést. A válaszból értesül, nem az elküldés előtt, és Fable 5 helyett Opus-választ kap. Az Anthropic szerint a felhasználókat tájékoztatják, ha ez megtörténik, és technikailag a válasz valóban tájékoztat, de nincs előzetes figyelmeztetés, hogy a feladat az osztályozó hatókörébe esik.

A klasszifikátor hatóköre szintén széles. A HN-szálban az egyik fejlesztő üzleti prospecting eszközöknél ütközött falba; egy másik, aki egészségügyi adatokon végzett mintaelemzést, az ő esetükre használhatatlannak minősítette. Igazságosan szólva ez ritka: az Anthropic szerint a Fable-munkamenetek több mint 95%-a egyáltalán nem találkozik fallback-kel. Van ezen felül egy külön, sokkal szűkebb vita egy kulisszák mögötti finomhangolási módszerről, amely határterületi MI-kutatókat érint, nem átlagos fejlesztőket — ne keverd össze a kettőt. Ami igazán bántó lehet, az a látható Opus-fallback. Nem az a baj, hogy létezik a biztonsági útválasztás. Az a baj, hogy átlátszatlan: utólag megtudni, hogy Opus-választ kaptál, miközben Fable 5-öt vártál — az kellemetlen érzés.

Remek modell, átláthatatlan korlát. Az átláthatatlanság az, ami fáj, nem maga a biztonság.

Mit próbálj ki a következő órában

Állítsa be a Fable 5-t alapértelmezettként a Claude Code-ban, és futtassa a már megnyitott, több fájlt érintő refaktoráláson. Ez az egész kísérlet — és egy órán belül tudni fogja, hogy a 2x díjat megéri-e az Ön munkájánál. Tesztelje valami igazán nehézen, ne triviális feladaton: az adaptív gondolkodás mindig be van kapcsolva, tehát az egyszerű feladatok nem mutatják meg a különbséget, és csak többe kerülnek hiába. Ha Max vagy Team előfizetésen van, kapcsolja be a Dynamic Workflows-t, hogy a delegálási viselkedést lássa egyetlen munkamenet helyett. Adjon neki egy képernyőképet a saját felületéről, hogy saját maga figyelje meg a vision-változást.

A váltás maga /model fable or /model claude-fable-5 (szüksége lesz a Claude Code v2.1.170 vagy újabb verziójára). Futtassa a valódi munkáján, döntse el maga, és térjen vissza az Opushoz, ha a feladatai nem kapnak lendületet. Nem esik baj.

Gyakran ismételt kérdések

Hogyan válthatok Fable 5-re a Claude Code-ban?

Futtat /model fable or /model claude-fable-5 a Claude Code-ban, vagy adja meg --model claude-fable-5 az indításkor. A Fable 5 opcióként való megjelenéséhez Claude Code v2.1.170 vagy újabb verzió szükséges.

A biztonsági mechanizmusok blokkolják a munkámat a Claude Code-ban?

Többnyire nem. Az Anthropic szerint a Fable 5-sessionök több mint 95%-a soha nem ütközik fallbackbe. De a kiberbiztonsági szomszédos és egyes egészségügyi adatfeladatok az Opus 4.8-hoz irányíthatók. Értesítik Önt a válaszban, ha ez megtörténik, de nincs előzetes figyelmeztetés, tehát utólag tudja meg. Ha munkája érinti ezeket a területeket, tesztelje egy valódi feladaton, mielőtt a Fable 5-öt alapértelmezettnek állítja be.

A Dynamic Workflows különbözik a normál ügynök módtól?

Igen. A Dynamic Workflows az Anthropic párhuzamos al-ügynök-orchestrációs rétege, amelyet május vége óta általánosan elérhetővé tett, és alapértelmezés szerint engedélyezett a Max és Team terveken. Ez az a hely, ahol a Fable 5 felügyelet nélküli többlépéses delegációja teljes mértékben kifejezésre jut, és a standard egymenetes ügynök mód nem mutatja ugyanazt a hosszú távú viselkedést.

Megosztás

Több a blogról

Folytassa az olvasást.

opencode vs openclaw funkció, amely egy repo AI kódoló ügynököt hasonlít össze egy OpenClaw autonóm AI ügynök átjáróval.
AI és gépi tanulás

OpenCode vs OpenClaw: Melyik önállóan üzemeltetett AI eszközt futtassa?

Az OpenCode vs OpenClaw főként választás egy kódoló ügynök között, amely a repon belül működik, és egy mindig bekapcsolt asszisztens átjáró között, amely chat alkalmazásokat, eszközöket és ütemezett műveleteket köt össze.

Nick SilverNick Silver 14 perces olvasás
opencode vs claude code borító helyi vs cloud AI kódoláshoz, amely az önállóan üzemeltetett irányítást hasonlítja össze a hosztolt kényelemmel.
AI és gépi tanulás

OpenCode vs Claude Code: Hosztolt kényelem vagy önállóan üzemeltetett irányítás?

Az OpenCode vs Claude Code lényegében választás egy menedzselt AI kódoló ügynök és egy olyan kódoló ügynök között, amelyet saját környezetében futtathat. A Claude Code-dal könnyebb kezdeni, mert

Nick SilverNick Silver 13 perces olvasás
claude code alternatívák borító legjobb AI eszközök fejlesztőknek terminálon, IDE-ben, cloudban és önállóan üzemeltetett munkafolyamatokon át.
AI és gépi tanulás

Claude Code alternatívák fejlesztőknek: A legjobbak terminálhoz, IDE-hez, önállóan üzemeltetett és cloud munkafolyamatokhoz

A Claude Code még mindig az egyik legerősebb kódoló ügynök, de sok fejlesztő ma már munkafolyamat, modellhozzáférés és hosszú távú költség alapján választ eszközt, nem pedig ragaszkodik

Nick SilverNick Silver 20 perces olvasás

Készen áll a telepítésre? Már 2,48 $/hó-tól.

Független felhő 2008 óta. AMD EPYC, NVMe, 40 Gbps. 14 napos pénzvisszafizetési garancia.