Pierwszego dnia ustawiłem Fable 5 jako domyślny w Claude Code i dałem mu zadanie z wieloma plikami, które normalnie pochłania mi całe popołudnie. Poszedłem zrobić kawę. Gdy wróciłem na miejsce, było gotowe — a po cichu naprawiło dwie sąsiednie rzeczy, o które nawet nie prosiłem.
To prawdziwa zmiana w prawdziwej pracy, nie odczyt benchmarku. I kosztuje 2x tyle, ile płaciłem za Opus 4.8, więc czy to warte swojej ceny to prawdziwe pytanie, nie retoryczne. Trzy rzeczy naprawdę się zmieniły w sposobie, w jaki pracuję. Jedna rzecz jest szczerze mówiąc frustrująca. Oto wszystko, plus co możesz sam wypróbować w mniej niż godzinę.
Wersja skrócona
Trzy realne zmiany: złożone refaktoringi wielu plików kończą się w mniejszej liczbie iteracji, bo Fable 5 sprawdza własną pracę przed oddaniem; delegowanie do pod-agentów działa bez ciągłego nadzoru; a zadania wizyjne odczytują zrzuty ekranu i odtwarzają logikę z dużo mniejszym prowadzeniem za rękę. Jedyne rozczarowanie: czasem włącza się mechanizm bezpieczeństwa i przekierowuje do Opus 4.8. Dowiadujesz się o tym z odpowiedzi, nie przed wysłaniem, i zamiast Fable 5 dostajesz Opusa. Mój wniosek: warto przy trudnej, długoterminowej pracy. Przetestuj na prawdziwym zadaniu zanim zatwierdzisz stawkę — przy banalnej pracy 2x to po prostu 2x.
Mniej iteracji, bo sprawdza własną pracę
Ten refaktoring, o którym wspomniałem: wersja uruchomiona na Opus 4.8 tydzień wcześniej zajęła osiem lub dziewięć iteracji, a w dwóch z nich ja łapałem zepsuty build, który mi oddał. Fable 5 zamknął to w trzech, i już sam szukał bugów zamiast czekać, aż je znajdę. Powód: Fable 5 przechowuje więcej kontekstu i samodzielnie weryfikuje się przed przekazaniem. Simon Willison trafił na to samo jeszcze wyraźniej: in jego pierwsze wrażenia opisuje model, który przy zadaniu proszącym jedynie o naprawienie jednej kwestii, sam odnajduje i naprawia kilka głębszych problemów biblioteki.
Więc różnica tutaj nie polega na prędkości. Polega na tym, że Fable 5 sprawdza swoją pracę przed jej zwróceniem, dzięki czemu napotykasz mniej uszkodzonych buildów i marnujesz mniej rund na sprzątanie po nim. Deweloper w wątku HN o wydaniu określił to jako model «hający błędy stworzone przez inne modele»; inżynier Canva w tym samym wątku zgłosił «połowę tokenów przy lepszych wynikach» i pull requesty z mniejszą ilością kodu do przejrzenia. Jeśli chcesz jednej liczby benchmarkowej stojącej za tym odczuciem: Anthropic plasuje Fable 5 na poziomie 80,3% w SWE-Bench Pro wobec 69,2% dla Opus 4.8. Poczułem tę różnicę, zanim przeczytałem liczbę.
Zmiana nie polega na tym, że jest szybszy. Chodzi o to, że mniej jego wyników wraca uszkodzonych.
Delegowanie do pod-agenta bez konieczności ciągłego nadzoru
Powierzyłem mu trzystopniowy refaktoring i ukończył dwa etapy, zanim zdążyłem podnieść wzrok. To jest druga zmiana i ta, której się nie spodziewałem. Długohoryzontalowe zachowanie Fable 5 oznacza, że możesz delegować wieloetapowe zadanie, a on przejdzie przez etapy samodzielnie, zamiast zatrzymywać się po każdym kroku. Parą, która to umożliwia, jest Dynamic Workflows, równoległa orkiestracja pod-agentów Anthropic (dostępna ogólnie od końca maja), a nie standardowy tryb pojedynczej sesji. W wątku HN jeden deweloper opisał ukończenie skomplikowanych migracji bazy danych w jednej sesji, gdzie Opus wielokrotnie zawodziło.
Oto prawdziwe zastrzeżenie, i ma ono znaczenie: w planie Pro możesz trafić na limity szybkości w ciągu 30-minutowego okna, co niszczy długie nienadzorowane działanie, które właśnie Cię podekscytowało. Jeden programista w wątku osiągnął limit w ciągu 30 minut pracy agenta. Możliwość jest realna. Pułap szybkości planu Pro też jest realny. Max to miejsce, gdzie to naprawdę działa bez ciągłych przerw.
Delegowanie wreszcie działa bez nadzoru. Wiedz tylko, że tier Pro nałoży na ciebie limit szybkości, zanim ukończysz pełne uruchomienie — więc to naprawdę zaleta planu Max.
Zadania wizyjne to teraz inne doświadczenie
Wrzuciłem do sesji zrzut ekranu chaotycznego komponentu UI i zapytałem, co robi. Odczytał układ i zrekonstruował logikę bez opisywania przeze mnie choćby jednego elementu. To trzecia zmiana: Fable 5 czyta zrzuty ekranu i diagramy kodu i dostarcza użytecznych wyników z o wiele mniejszym prowadzeniem za rękę, niż się przyzwyczaiłem. Deweloper w wątku HN, który spędził pół godziny na intensywnych testach, nazwał go «niesamowicie dobrym w wizualnych aspektach projektowania UI» — zgadza się to z tym, co sam widziałem.
To najlżejsza z trzech zmian. Ale to ta, która po cichu usuwa krok, z którego nie zdawałem sobie sprawy, że już mam go dość.
Jedyna frustrująca rzecz
Wysłałem mu zadanie, które po prostu miało się wykonać — wróciło jako odpowiedź Opusa przekierowana przez odmowę. Co dzieje się pod spodem: klasyfikator bezpieczeństwa odpala się na zadania związane z cyberbezpieczeństwem i kilka innych wrażliwych typów, i zamiast odpowiedzi Fable 5, kieruje żądanie do Opus 4.8. Dowiadujesz się o tym z odpowiedzi, bez żadnego ostrzeżenia przed wysłaniem. Anthropic twierdzi, że użytkownicy są informowani, gdy tak się dzieje — technicznie odpowiedź to komunikuje, ale nie ma żadnego uprzedzenia, że twoje zadanie jest w zasięgu klasyfikatora.
Zasięg klasyfikatora jest też szeroki. W wątku na HN jeden deweloper został zablokowany na narzędziach do pozyskiwania klientów; inny, pracujący z wzorcami w danych zdrowotnych, uznał go za nieużyteczny w swoim przypadku. Uczciwie mówiąc, to rzadkość: Anthropic twierdzi, że ponad 95% sesji Fable w ogóle nie napotyka fallbacku. Istnieje też osobna, znacznie węższa kontrowersja dotycząca metody strojenia za kulisami, która dotyczy badaczy z pogranicza AI, a nie typowych twórców — nie mylmy tych dwóch rzeczy. To, co może was faktycznie uderzyć, to widoczny fallback do Opus. Problem nie polega na tym, że safety routing istnieje. Chodzi o to, że jest nieprzejrzysty: odkrycie po fakcie, że dostałeś odpowiedź od Opus, gdy oczekiwałeś Fable 5, to niezbyt przyjemne uczucie.
Świetny model, nieprzejrzyste ograniczenie. Nieprzejrzystość boli, a nie samo bezpieczeństwo.
Co wypróbować w ciągu następnej godziny
Ustaw Fable 5 jako domyślny w Claude Code i uruchom go na refaktoringu wielu plików, który już masz otwarty. Na tym polega cały eksperyment — w mniej niż godzinę dowiesz się, czy zasługuje na stawkę 2x dla twojej pracy. Testuj na czymś naprawdę trudnym, nie trywialnym: adaptacyjne myślenie jest zawsze włączone, więc proste zadania nie pokażą różnicy i tylko będą kosztować więcej bez powodu. Jeśli korzystasz z Max lub Team, włącz Dynamic Workflows, żeby zobaczyć zachowanie delegacji zamiast trybu pojedynczej sesji. Daj mu też zrzut ekranu własnego interfejsu, żeby samemu obserwować zmianę w zakresie wizji.
Samo przełączenie to /model fable or /model claude-fable-5 (będziesz potrzebować Claude Code v2.1.170 lub nowszego). Uruchom go na swoją prawdziwą pracę, zdecyduj sam i wróć do Opus, jeśli twoje zadania nie zyskają na tym. Bez strat.
Często zadawane pytania
Jak przełączyć się na Fable 5 w Claude Code?
Uruchom /model fable or /model claude-fable-5 w Claude Code lub przekaż --model claude-fable-5 przy uruchamianiu. Potrzebujesz Claude Code v2.1.170 lub nowszego, aby Fable 5 pojawiło się jako opcja.
Czy zabezpieczenia zablokują moją pracę w Claude Code?
W większości nie. Anthropic mówi, że ponad 95% sesji Fable 5 nigdy nie natrafia na fallback. Ale zadania związane z cyberbezpieczeństwem i niektóre zadania dotyczące danych zdrowotnych mogą być przekierowane do Opus 4.8. Jesteś informowany w odpowiedzi, gdy to się dzieje, ale nie ma ostrzeżenia przed wysłaniem, więc dowiadujesz się po fakcie. Jeśli twoja praca dotyka tych obszarów, przetestuj prawdziwe zadanie przed ustawieniem Fable 5 jako domyślnego.
Czy Dynamic Workflows różni się od zwykłego trybu agenta?
Tak. Dynamic Workflows to warstwa orkiestracji równoległych sub-agentów Anthropic, ogólnie dostępna od końca maja i domyślnie włączona dla planów Max i Team. To tutaj w pełni wyraża się nienadzorowane, wieloetapowe delegowanie Fable 5, a standardowy tryb agenta jednesesyjnego nie pokaże ci tego samego zachowania długoterminowego.