Скидка 50% все планы, ограниченное время. Начиная от $2.48/mo
Осталось 7 мин
ИИ и машинное обучение

Fable 5 в Claude Code: что реально изменилось (впечатления первого дня)

R By Riley 7 мин чтения
Широкий баннер блога в тёмном режиме с оранжевыми акцентами, показывающий панель разработчика Fable 5 с завершением рабочего процесса в 3 хода, проверкой тестов и заметкой о самопроверке внутри Claude Code.

В первый же день я установил Fable 5 по умолчанию в Claude Code и передал ему задачу с несколькими файлами, которая обычно съедает у меня весь день. Пошёл варить кофе. Когда вернулся и сел, задача была выполнена — и тихо исправлены ещё две смежные вещи, о которых я даже не просил.

Это реальная смена инструмента в реальной работе, не чтение результатов бенчмарка. И это стоит в 2 раза дороже, чем я платил за Opus 4.8, поэтому «стоит ли оно того» — настоящий вопрос, а не риторический. Три вещи действительно изменились в моём рабочем процессе. Одна вещь честно раздражает. Вот всё, плюс что попробовать самостоятельно меньше чем за час.

Краткая версия

Три реальных изменения: сложные многофайловые рефакторинги завершаются за меньшее количество итераций, потому что Fable 5 проверяет свою работу перед тем, как вернуть её вам; делегирование подагентам работает без вашего постоянного надзора; а задачи машинного зрения читают скриншоты и восстанавливают вашу логику с гораздо меньшей опекой. Единственный минус: иногда срабатывает защитный механизм и перенаправляет вас к Opus 4.8. Об этом узнаёте из ответа, а не до отправки, и вместо Fable 5 получаете ответ от Opus. Мой итог: стоит того на сложных задачах с большим горизонтом. Протестируйте на реальной задаче, прежде чем фиксировать тариф, — на тривиальной работе двукратная цена остаётся просто двукратной.

Меньше итераций, потому что он проверяет свою работу

Тот рефакторинг, о котором я упоминал: версия, которую я запускал на Opus 4.8 неделей ранее, заняла восемь или девять итераций, в двух из которых я сам отлавливал сломанную сборку, которую он возвращал. Fable 5 закрыл его за три, причём уже искал баги сам, не дожидаясь, пока я их найду. Причина — Fable 5 удерживает больше контекста и самопроверяется перед передачей. Simon Willison столкнулся с тем же ещё нагляднее: in его впечатления первого дня он описывает, как модель находит и исправляет несколько базовых проблем библиотеки в задаче, которая требовала исправить только одну.

Так что разница здесь не в скорости. Она в том, что Fable 5 проверяет свою работу перед тем, как вернуть её, — поэтому вы реже сталкиваетесь со сломанными сборками и тратите меньше шагов на исправление его же ошибок. Разработчик в треде HN о релизе описал это как модель, «находящую баги, созданные другими»; инженер Canva в том же треде сообщил о «вдвое меньшем количестве токенов при лучших результатах» и pull request’ах с меньшим объёмом кода для ревью. Если хотите один эталонный показатель, стоящий за этим ощущением: Anthropic ставит Fable 5 на 80,3 % по SWE-Bench Pro против 69,2 % у Opus 4.8. Разрыв я почувствовал ещё до того, как прочитал цифру.

Дело не в том, что стало быстрее. Дело в том, что его результаты реже приходят сломанными.

Делегирование суб-агентам без постоянного надзора

Я поставил перед ним рефакторинг в три этапа — он завершил два из них прежде, чем я успел поднять глаза. Это второе изменение, и именно оно меня удивило. Поведение Fable 5 с длинным горизонтом означает, что вы можете делегировать многоэтапную задачу, и он пройдёт все этапы самостоятельно, не останавливаясь для сверки после каждого шага. Связка, которая делает это реальным, — Dynamic Workflows, параллельную оркестрацию подагентов от Anthropic (в общем доступе с конца мая), а не стандартный режим одной сессии. В обсуждении на HN один разработчик описал завершение сложных миграций баз данных за одну сессию там, где Opus неоднократно давал сбой.

Вот реальная оговорка, и она важна: в плане Pro можно упереться в ограничения скорости в течение 30-минутного окна, что убивает долгий автономный запуск, которым вы только что воодушевились. Один разработчик в треде достиг предела за 30 минут работы агента. Возможности реальны. Потолок скорости плана Pro тоже реален. Max — это место, где всё это действительно работает без постоянных прерываний.

Делегирование наконец работает без надзора. Просто имейте в виду, что тариф Pro ограничит вас по запросам прежде, чем вы завершите полный прогон, так что это реально выигрыш плана Max.

Визуальные задачи теперь стали другим опытом

Я загрузил скриншот запутанного UI-компонента в сессию и спросил, что он делает. Модель прочитала макет и восстановила логику, не получив от меня ни одного описания элементов. Это третье изменение: Fable 5 читает скриншоты и диаграммы кодовой базы и выдаёт пригодный к использованию результат с гораздо меньшей степенью ручного ведения, чем я привык. Разработчик в треде HN, потративший полчаса на стресс-тест, назвал модель «невероятно хорошей в визуальных аспектах UI-дизайна» — это совпадает с тем, что увидел я.

Это самое незначительное из трёх изменений. Но именно оно тихо убирает шаг, от которого я устал, даже не осознавая этого.

Одна раздражающая вещь

Я отправил задачу, которая должна была просто выполниться, — и получил ответ от Opus, перенаправленного через отказ. Что происходит под капотом: классификатор безопасности срабатывает на задачи, смежные с кибербезопасностью, и ещё несколько чувствительных типов, и вместо ответа Fable 5 направляет запрос к Opus 4.8. Вы узнаёте об этом из ответа, без какого-либо предупреждения до отправки. Anthropic утверждает, что пользователей уведомляют в таких случаях — технически ответ действительно это указывает, но никакого предупреждения перед отправкой о том, что ваша задача попадает в зону классификатора, нет.

Охват классификатора тоже весьма широк. В треде HN один разработчик столкнулся с блокировкой инструментов для бизнес-проспектинга; другой, работавший с паттернами в медицинских данных, назвал модель непригодной для своей задачи. Справедливости ради, это редкость: Anthropic утверждает, что более 95% сессий Fable вообще не доходят до fallback. Кроме того, есть отдельная, куда более узкая дискуссия о закулисном методе тонкой настройки, который касается исследователей фронтирных ИИ-систем, а не рядовых разработчиков — не смешивайте эти две темы. То, что реально может вас задеть, — это видимый fallback Opus. Проблема не в том, что существует защитная маршрутизация. Проблема в её непрозрачности: узнать постфактум, что получил ответ от Opus, ожидая Fable 5, — неприятное ощущение.

Отличная модель, непрозрачный ограничитель. Больно не из-за самой безопасности, а из-за непрозрачности.

Что попробовать в следующий час

Установите Fable 5 как модель по умолчанию в Claude Code и запустите его на многофайловом рефакторинге, который у вас уже открыт. Это весь эксперимент — и менее чем за час вы поймёте, оправдывает ли он двукратный тариф для вашей работы. Тестируйте на чём-то по-настоящему сложном, а не на пустяковых задачах: адаптивное мышление включено всегда, поэтому простые задания не покажут разницы и просто обойдутся дороже. Если у вас Max или Team, включите Dynamic Workflows, чтобы увидеть поведение при делегировании вместо режима одной сессии. И подайте ему скриншот своего интерфейса, чтобы убедиться в изменении возможностей зрения.

Сам переход осуществляется через /model fable or /model claude-fable-5 (потребуется Claude Code v2.1.170 или новее). Запусти на реальной задаче, реши сам — и откатись обратно к Opus, если твои задачи не получат прироста. Ничего страшного.

Часто задаваемые вопросы

Как переключиться на Fable 5 в Claude Code?

Выполните команду /model fable or /model claude-fable-5 в Claude Code, или передайте --model claude-fable-5 при запуске. Для отображения Fable 5 как варианта потребуется Claude Code v2.1.170 или новее.

Заблокируют ли защитные механизмы мою работу в Claude Code?

По большей части нет. Anthropic говорит, что более 95% сессий Fable 5 никогда не сталкиваются с фолбеком. Но задачи, смежные с кибербезопасностью, и некоторые задачи с медицинскими данными могут быть направлены к Opus 4.8. Тебя уведомят в ответе, когда это произойдёт, но предупреждения перед отправкой нет, поэтому узнаешь постфактум. Если твоя работа касается этих областей, протестируй реальную задачу, прежде чем делать Fable 5 моделью по умолчанию.

Отличается ли Dynamic Workflows от обычного режима агента?

Да. Dynamic Workflows — это слой оркестрации параллельных суб-агентов от Anthropic, доступный в общем доступе с конца мая и включённый по умолчанию для планов Max и Team. Именно здесь полностью реализуется несупервизируемое многоэтапное делегирование Fable 5, а стандартный однессессионный режим агента не покажет тебе то же долгосрочное поведение.

Поделиться

Ещё в блоге

Читайте дальше.

Главная иллюстрация opencode vs openclaw: сравнение ИИ-агента для кодинга в репозитории с автономным шлюзом ИИ-агента OpenClaw.
ИИ и машинное обучение

OpenCode vs OpenClaw: какой self-hosted ИИ-инструмент выбрать?

OpenCode vs OpenClaw, в основном выбор между агентом для кодинга, который работает внутри вашего репозитория, и постоянно работающим шлюзом-ассистентом, который объединяет чат-приложения, инструменты и запланированные действия.

Ник СильверНик Сильвер 14 мин чтения
Обложка opencode vs claude code для локального и облачного ИИ-кодинга: сравнение self-hosted контроля и хостингового удобства.
ИИ и машинное обучение

OpenCode vs Claude Code: хостинговое удобство или self-hosted контроль?

OpenCode vs Claude Code сводится к выбору между управляемым ИИ-агентом для кодинга и агентом, который можно запустить в собственной среде. Claude Code проще для старта, потому что

Ник СильверНик Сильвер 13 мин чтения
Обложка альтернатив claude code: лучшие ИИ-инструменты для разработчиков в терминале, IDE, облачных и self-hosted процессах.
ИИ и машинное обучение

Альтернативы Claude Code для разработчиков: лучшие для терминала, IDE, self-hosted и облачных процессов

Claude Code остаётся одним из самых сильных агентов для кодинга, но многие разработчики теперь выбирают инструменты исходя из рабочего процесса, доступа к моделям и долгосрочной стоимости, а не привязываясь

Ник СильверНик Сильвер 20 мин чтения

Готовы к развёртыванию? От $2,48/мес.

Независимое облако с 2008 года. AMD EPYC, NVMe, 40 Gbps. Возврат денег в течение 14 дней.