50% 할인 모든 플랜, 기간 한정. 시작 가격 $2.48/mo
7분 남음
AI 및 머신러닝

Claude Code의 Fable 5: 실제로 무엇이 바뀌었나 (첫날 소감)

R By Riley 7분 소요
Claude Code 내에 Fable 5 개발자 대시보드, 3턴 워크플로 완성, 테스트 검증 및 자기 검증 메모를 보여주는 주황색 포인트의 와이드 다크 모드 블로그 배너.

첫날 Claude Code 기본값을 Fable 5로 설정하고 보통 오후를 통째로 잡아먹는 멀티 파일 작업을 맡겼습니다. 커피를 내리러 갔습니다. 자리에 돌아왔을 때 이미 완료되어 있었고, 심지어 부탁하지도 않은 인접한 두 가지 문제까지 조용히 고쳐놓았습니다.

이건 실제 작업에서의 실제 전환이지, 벤치마크 수치가 아닙니다. Opus 4.8에 내던 비용의 2배가 들기 때문에 그만한 가치가 있냐는 진짜 질문이지 수사적인 말이 아닙니다. 내 작업 방식에서 진짜로 세 가지가 바뀌었습니다. 한 가지는 솔직히 불만스럽습니다. 모든 내용, 그리고 한 시간 이내에 직접 해볼 수 있는 것들을 정리했습니다.

간략 버전

세 가지 실제 변화: Fable 5가 반환 전에 자체 작업을 검토하기 때문에 복잡한 멀티 파일 리팩터가 더 적은 턴에 완료됩니다; 서브 에이전트 위임이 감시 없이 작동합니다; 비전 작업은 스크린샷을 읽고 훨씬 적은 안내로 로직을 재구성합니다. 유일한 아쉬운 점: 보호 장치가 때때로 작동하여 Opus 4.8로 라우팅합니다. 제출 전이 아닌 응답에서 알게 되며, Fable 5를 기대했는데 Opus 답변을 받습니다. 결론: 어렵고 장기적인 작업에 가치가 있습니다. 요금을 확정하기 전에 실제 작업으로 테스트하세요. 사소한 작업에서는 2배 비용이 그냥 2배일 뿐입니다.

더 적은 턴, 자체 작업을 검토하기 때문

제가 언급한 그 리팩터: 일주일 전에 Opus 4.8로 실행했던 버전은 8~9번의 왕복이 필요했고, 그 중 두 번은 제가 돌려받은 깨진 빌드를 직접 잡아야 했습니다. Fable 5는 세 번 만에 완료했으며, 제가 버그를 찾기를 기다리지 않고 이미 스스로 찾아나섰습니다. 이유는 Fable 5가 더 많은 컨텍스트를 유지하고 전달 전에 자체 검증하기 때문입니다. Simon Willison은 이를 더 강하게 경험했습니다: in 그의 첫날 인상 그는 하나만 수정하도록 요청받은 작업에서 모델이 여러 기반 라이브러리 문제를 찾아 수정하는 것을 설명합니다.

따라서 여기서의 차이는 속도가 아닙니다. Fable 5는 작업을 돌려주기 전에 스스로 검토하기 때문에 깨진 빌드를 덜 만나고 그 뒤처리에 소비하는 턴도 줄어듭니다. HN 릴리스 스레드의 한 개발자 모델을 「다른 모델들이 만들어낸 버그를 잡아내는」 것으로 표현했습니다; 같은 스레드의 Canva 엔지니어는 「더 나은 결과에 토큰은 절반」이고 검토할 코드가 더 적은 pull request를 받았다고 보고했습니다. 이 느낌의 배경이 되는 벤치마크 수치를 원한다면: Anthropic은 SWE-Bench Pro에서 Fable 5를 80.3%, Opus 4.8을 69.2%로 평가합니다. 숫자를 보기 전에 이미 차이를 느꼈습니다.

변화는 빠른 속도에 있는 것이 아닙니다. 출력이 깨져서 돌아오는 경우가 줄어든 것입니다.

상시 감독 없이도 작동하는 서브 에이전트 위임

3단계 리팩터링을 맡겼더니 내가 고개를 들기 전에 이미 두 단계를 마쳤습니다. 이것이 두 번째 변화이며, 제가 예상하지 못했던 것입니다. Fable 5의 장기 지향 동작은 다단계 작업을 위임하면 매 단계마다 확인하기 위해 멈추는 대신 스스로 단계를 진행해 나간다는 것을 의미합니다. 이를 현실로 만드는 조합은 Dynamic Workflows, Anthropic의 병렬 서브 에이전트 오케스트레이션(5월 말부터 일반 출시)이며 표준 단일 세션 모드가 아닙니다. HN 스레드에서 한 개발자는 Opus가 반복적으로 실패했던 복잡한 데이터베이스 마이그레이션이 단일 세션에서 완료되었다고 설명했습니다.

진짜 주의사항이 있는데, 중요합니다: Pro 플랜에서는 30분 창 안에 속도 제한에 걸릴 수 있어서, 방금 기대했던 긴 무감독 실행이 끊깁니다. 스레드의 한 개발자는 에이전트 작업 30분 만에 한계에 달했습니다. 기능은 실제입니다. Pro 플랜의 속도 상한도 실제입니다. Max가 바로 지속적인 중단 없이 실제로 작동하는 곳입니다.

위임이 마침내 감독 없이도 작동합니다. 단, Pro 티어는 전체 실행을 마치기 전에 속도 제한을 걸 수 있으니, 이는 실질적으로 Max 플랜의 이점입니다.

비전 태스크는 이제 완전히 다른 경험

지저분한 UI 컴포넌트의 스크린샷을 세션에 올리고 무엇을 하는지 물었습니다. 단 하나의 요소도 설명하지 않았는데도 레이아웃을 읽고 로직을 재구성해냈습니다. 이것이 세 번째 변화입니다. Fable 5는 스크린샷과 코드베이스 다이어그램을 읽어, 내가 익숙했던 것보다 훨씬 적은 안내로도 바로 쓸 수 있는 출력을 돌려줍니다. HN 스레드에서 30분을 들여 스트레스 테스트를 한 개발자는 이를 「UI 디자인의 시각적 측면에서 지해랝 만큼 뛰어나다」고 했는데, 제가 직접 본 것과 일치합니다.

세 가지 변화 중 가장 가벼운 것입니다. 하지만 내가 지쳐 있었는지도 몰랐던 한 단계를 조용히 제거해주는 것이 바로 이 변화입니다.

단 하나의 불만스러운 점

단순히 실행되어야 할 작업을 보냈는데, 거부 라우팅된 Opus 응답으로 돌아왔습니다. 내부에서 일어나는 일: 보안 분류기가 사이버 보안 관련 작업과 몇 가지 다른 민감한 작업 유형에 대해 작동하고, Fable 5 응답을 주는 대신 요청을 Opus 4.8로 라우팅합니다. 제출 전 경고 없이 응답에서 알게 됩니다. Anthropic은 이런 일이 발생할 때 사용자에게 알린다고 하며, 기술적으로 응답이 알려주긴 하지만, 작업이 분류기 범위에 있다는 사전 안내는 없습니다.

분류기의 범위도 넓습니다. HN 스레드에서 한 개발자는 비즈니스 잠재고객 발굴 도구에서 차단을 겪었고, 의료 데이터 패턴 작업을 하던 다른 개발자는 자신의 사례에서 사용 불가능하다고 평했습니다. 공평하게 말하면 이는 드문 일입니다. Anthropic에 따르면 Fable 세션의 95% 이상이 fallback을 전혀 경험하지 않습니다. 또한 일반 개발자가 아닌 첨단 AI 연구자에게 영향을 미치는 내부 튜닝 방식에 관한 별도의, 훨씬 좁은 논란도 있습니다. 이 두 가지를 혼동하지 마세요. 실제로 여러분에게 영향을 줄 수 있는 건 눈에 보이는 Opus fallback입니다. 문제는 안전 라우팅 자체가 존재한다는 게 아닙니다. 불투명하다는 게 문제입니다. Fable 5를 기대했는데 사후에 Opus 응답을 받았다는 걸 알게 되는 건 불쾌한 경험입니다.

훌륭한 모델, 불투명한 가드레일. 아픈 것은 안전 기능 자체가 아니라 불투명함입니다.

다음 한 시간 안에 시도할 것

Claude Code 기본값을 Fable 5로 전환하고 이미 열려 있는 멀티 파일 리팩터에 실행해 보세요. 이것이 전부입니다 — 한 시간 안에 당신의 작업에 2배 요금이 가치 있는지 알 수 있습니다. 간단한 작업이 아닌 진정으로 어려운 것으로 테스트하세요: 적응적 사고는 항상 켜져 있어서 단순한 작업은 차이를 보여주지 않고 비용만 더 들게 합니다. Max 또는 Team을 사용 중이라면 Dynamic Workflows를 켜서 단일 세션 모드 대신 위임 동작을 확인하세요. 그리고 자신의 UI 스크린샷을 넣어 비전 변화를 직접 확인하세요.

전환 자체는 /model fable or /model claude-fable-5 (Claude Code v2.1.170 이상이 필요합니다). 실제 작업에서 실행해보고 직접 판단하세요. 성능 향상이 없다면 Opus로 돌아가면 됩니다. 잃을 것은 없습니다.

자주 묻는 질문

Claude Code에서 Fable 5로 어떻게 전환하나요?

실행하세요 /model fable or /model claude-fable-5 Claude Code 내에서, 또는 전달 --model claude-fable-5 실행 시 전달합니다. Fable 5가 옵션으로 표시되려면 Claude Code v2.1.170 이상이 필요합니다.

안전장치가 Claude Code에서 내 작업을 차단하나요?

대부분 아닙니다. Anthropic은 Fable 5 세션의 95% 이상이 폴백에 걸리지 않는다고 합니다. 하지만 사이버보안 인접 작업과 일부 건강 데이터 작업은 Opus 4.8로 라우팅될 수 있습니다. 이 일이 발생하면 응답에서 알려드리지만, 제출 전 사전 경고는 없으므로 사후에 알게 됩니다. 해당 영역과 관련된 작업을 하신다면, Fable 5를 기본값으로 설정하기 전에 실제 작업으로 테스트해 보세요.

Dynamic Workflows는 일반 에이전트 모드와 다른가요?

네. Dynamic Workflows는 Anthropic의 병렬 하위 에이전트 오케스트레이션 레이어로, 5월 말부터 일반 제공되었으며 Max 및 Team 플랜에서 기본적으로 활성화됩니다. Fable 5의 비감독 다단계 위임이 완전히 발현되는 곳이 바로 여기이며, 표준 단일 세션 에이전트 모드에서는 동일한 장기적 동작을 볼 수 없습니다.

공유

블로그 더 보기

계속 읽기.

리포지토리 AI 코딩 에이전트와 OpenClaw 자율 AI 에이전트 게이트웨이를 비교하는 opencode vs openclaw 기능.
AI 및 머신러닝

OpenCode vs OpenClaw: 어떤 셀프 호스팅 AI 도구를 실행해야 하나?

OpenCode vs OpenClaw는 대부분 리포지토리 내에서 작동하는 코딩 에이전트와 채팅 앱, 도구, 예약 작업을 연결하는 상시 어시스턴트 게이트웨이 사이의 선택입니다.

Nick SilverNick Silver 14분 소요
로컬 vs 클라우드 AI 코딩을 위한 opencode vs claude code 커버. 셀프 호스팅 제어와 호스팅 편의성을 비교합니다.
AI 및 머신러닝

OpenCode vs Claude Code: 호스팅 편의성인가, 셀프 호스팅 제어인가?

OpenCode vs Claude Code는 매니지드 AI 코딩 에이전트와 자체 환경에서 실행할 수 있는 코딩 에이전트 사이의 선택으로 귀결됩니다. Claude Code는 시작하기가 더 쉽습니다

Nick SilverNick Silver 13분 소요
터미널, IDE, 클라우드, 셀프 호스팅 워크플로우 전반에 걸친 개발자를 위한 최고의 AI 도구를 다루는 claude code 대안.
AI 및 머신러닝

개발자를 위한 Claude Code 대안: 터미널, IDE, 셀프 호스팅, 클라우드 워크플로우에 최적

Claude Code는 여전히 가장 강력한 코딩 에이전트 중 하나이지만, 많은 개발자들이 이제 한 가지에 머물기보다 워크플로, 모델 접근성, 장기 비용을 기준으로 도구를 선택하고 있습니다

Nick SilverNick Silver 20분 소요

배포할 준비가 되셨나요? 월 $2.48부터.

2008년부터 독립 클라우드. AMD EPYC, NVMe, 40 Gbps. 14일 환불 보장.