diskon 50% semua paket, waktu terbatas. Mulai dari $2.48/mo
Sisa 7 menit
AI dan Machine Learning

Fable 5 di Claude Code: Apa yang Benar-Benar Berubah (Kesan Hari Pertama)

R By Riley Baca 7 menit
Banner blog lebar mode gelap dengan aksen oranye yang menampilkan dashboard pengembang Fable 5 dengan penyelesaian alur kerja 3 giliran, verifikasi pengujian, dan catatan verifikasi mandiri di dalam Claude Code.

Pada hari pertama saya mengatur Fable 5 sebagai default di Claude Code dan memberikannya jenis tugas multi-file yang biasanya menghabiskan seluruh sore hari saya. Saya pergi membuat kopi. Saat saya kembali duduk, tugasnya sudah selesai, dan ia telah diam-diam memperbaiki dua hal yang berdekatan yang bahkan tidak saya minta.

Ini adalah peralihan nyata pada pekerjaan nyata, bukan pembacaan benchmark. Dan harganya 2x dari yang saya bayar untuk Opus 4.8, jadi apakah itu sepadan adalah pertanyaan yang tulus, bukan retoris. Tiga hal benar-benar berubah dalam cara saya bekerja. Satu hal jujur membuat frustrasi. Inilah semuanya, ditambah apa yang bisa Anda coba sendiri dalam waktu kurang dari satu jam.

Versi Singkat

Tiga perubahan nyata: refaktor multi-file yang kompleks selesai dalam lebih sedikit giliran karena Fable 5 memeriksa pekerjaannya sendiri sebelum mengembalikannya; delegasi sub-agen berjalan tanpa perlu Anda pantau; dan tugas vision membaca tangkapan layar serta merekonstruksi logika Anda dengan bimbingan yang jauh lebih sedikit. Satu kekurangan: penjaga keamanan terkadang aktif dan mengarahkan Anda ke Opus 4.8. Anda mengetahuinya dari respons, bukan sebelum mengirim, dan mendapat jawaban Opus padahal mengharapkan Fable 5. Kesimpulan saya: sepadan untuk pekerjaan berat jangka panjang. Uji pada tugas nyata sebelum berkomitmen pada tarifnya, karena pada pekerjaan sepele, 2x hanyalah 2x.

Lebih Sedikit Giliran, Karena Memeriksa Pekerjaannya Sendiri

Refaktor yang saya sebutkan: versi yang saya jalankan di Opus 4.8 seminggu sebelumnya membutuhkan delapan atau sembilan giliran bolak-balik, dua di antaranya saya yang harus menangkap build rusak yang dikembalikannya. Fable 5 menutupnya dalam tiga giliran, dan sudah langsung mencari bug alih-alih menunggu saya menemukannya. Alasannya adalah Fable 5 menyimpan lebih banyak konteks dan melakukan verifikasi mandiri sebelum serah terima. Simon Willison mengalami hal yang sama dengan lebih kentara: in kesan hari pertamanya ia menggambarkan model yang menemukan dan memperbaiki beberapa masalah library mendasar pada tugas yang hanya memintanya memperbaiki satu.

Jadi perbedaannya di sini bukan soal kecepatan. Ini karena Fable 5 memeriksa karyanya sendiri sebelum mengembalikannya, sehingga Anda menemukan lebih sedikit build yang rusak dan menghabiskan lebih sedikit giliran untuk membersihkan setelahnya. Seorang developer di thread rilis HN menyebutnya sebagai model yang «menemukan bug yang dibuat oleh yang lain»; seorang engineer Canva di thread yang sama melaporkan «setengah token dengan hasil lebih baik» dan pull request dengan lebih sedikit kode untuk ditinjau. Jika Anda ingin satu angka benchmark di balik kesan tersebut: Anthropic menempatkan Fable 5 di 80,3% pada SWE-Bench Pro versus 69,2% milik Opus 4.8. Saya merasakan perbedaannya sebelum membaca angkanya.

Perubahannya bukan pada kecepatannya. Melainkan semakin sedikit output-nya yang kembali dalam kondisi rusak.

Delegasi Sub-Agen yang Tidak Butuh Pengawasan Terus-Menerus

Saya menyerahkan refactor tiga tahap dan ia menyelesaikan dua tahap sebelum saya sempat mendongak. Itulah perubahan kedua, dan yang tidak saya duga. Perilaku jangka panjang Fable 5 berarti Anda bisa mendelegasikan tugas multi-tahap dan ia akan mengerjakan tahap demi tahap sendiri daripada berhenti untuk mengecek setelah setiap langkah. Pasangan yang mewujudkan ini adalah Dynamic Workflows, orkestrasi sub-agen paralel Anthropic (tersedia umum sejak akhir Mei), dan bukan mode sesi tunggal standar. Di thread HN, seorang pengembang menggambarkan migrasi database kompleks yang selesai dalam satu sesi di mana Opus berulang kali gagal.

Inilah peringatan nyatanya, dan ini penting: pada paket Pro Anda bisa mencapai batas kecepatan dalam jendela 30 menit, yang menghancurkan sesi panjang tanpa pengawasan yang baru saja Anda sukai. Seorang pengembang di thread mencapai batasnya dalam 30 menit kerja agen. Kemampuannya nyata. Batas kecepatan paket Pro juga nyata. Max adalah tempat ini benar-benar berfungsi tanpa gangguan terus-menerus.

Delegasi akhirnya bekerja tanpa pengawasan. Hanya perlu diketahui bahwa tier Pro akan membatasi rate Anda sebelum Anda menyelesaikan satu run penuh, jadi ini benar-benar kemenangan bagi pengguna paket Max.

Tugas Visual Kini Adalah Pengalaman yang Berbeda

Saya menjatuhkan screenshot komponen UI yang berantakan ke sesi dan bertanya apa yang dilakukannya. Ia membaca tata letak dan merekonstruksi logikanya tanpa saya menjelaskan satu elemen pun. Itulah perubahan ketiga: Fable 5 membaca screenshot dan diagram codebase lalu memberikan output yang langsung dapat dipakai dengan jauh lebih sedikit bimbingan dari yang biasa saya butuhkan. Seorang developer di thread HN yang menghabiskan setengah jam untuk mengujinya menyebutnya «sangat bagus dalam aspek visual desain UI» — sesuai dengan yang saya lihat sendiri.

Ini adalah yang paling ringan dari ketiga perubahan. Namun ini adalah yang secara diam-diam menghilangkan sebuah langkah yang tidak kusadari sudah membuatku lelah.

Satu-satunya Hal yang Menjengkelkan

Saya mengirimkan tugas yang seharusnya langsung berjalan, dan kembali sebagai respons Opus yang dirutekan melalui penolakan. Yang terjadi di baliknya: pengklasifikasi keamanan aktif pada tugas yang berdekatan dengan keamanan siber dan beberapa jenis tugas sensitif lainnya, dan alih-alih memberi respons Fable 5, ia mengarahkan permintaan ke Opus 4.8. Anda mengetahuinya dari respons, tanpa peringatan sebelum mengirim. Anthropic mengatakan pengguna diberi tahu ketika ini terjadi, dan secara teknis respons memang memberitahu Anda, namun tidak ada pemberitahuan sebelum kirim bahwa tugas Anda masuk dalam cakupan pengklasifikasi.

Cakupan classifier juga luas. Dalam thread HN, satu developer diblokir pada alat prospek bisnis; developer lain yang mengerjakan pola data kesehatan menyebutnya tidak dapat digunakan untuk kasusnya. Jujur saja, ini jarang terjadi: Anthropic menyatakan lebih dari 95% sesi Fable tidak pernah mengalami fallback sama sekali. Ada juga kontroversi terpisah dan jauh lebih sempit tentang metode penyetelan di balik layar yang memengaruhi peneliti AI mutakhir, bukan pengembang biasa — jangan samakan keduanya. Yang benar-benar bisa berdampak pada Anda adalah fallback Opus yang terlihat. Bukan soal safety routing itu ada. Melainkan karena tidak transparan: mengetahui setelah fakta bahwa Anda mendapat jawaban Opus padahal mengharapkan Fable 5 adalah perasaan yang tidak menyenangkan.

Model yang bagus, batasan yang buram. Yang perih adalah kurangnya transparansi, bukan keamanannya sendiri.

Yang Perlu Dicoba dalam Satu Jam ke Depan

Ubah default Claude Code Anda ke Fable 5 dan jalankan pada refaktor multi-file yang sudah Anda buka. Itulah seluruh eksperimennya — dan dalam kurang dari satu jam Anda akan tahu apakah ia pantas mendapat tarif 2x untuk pekerjaan Anda. Uji pada sesuatu yang benar-benar sulit, bukan tugas sepele: pemikiran adaptif selalu aktif, sehingga pekerjaan sederhana tidak menunjukkan perbedaan dan hanya menghabiskan lebih banyak biaya. Jika Anda menggunakan Max atau Team, aktifkan Dynamic Workflows agar Anda melihat perilaku delegasi, bukan mode sesi tunggal. Dan beri ia screenshot UI Anda sendiri untuk menyaksikan perubahan visi secara langsung.

Cara beralihnya sendiri adalah /model fable or /model claude-fable-5 (Anda akan memerlukan Claude Code v2.1.170 atau yang lebih baru). Jalankan pada pekerjaan nyata Anda, putuskan sendiri, dan kembali ke Opus jika tugas Anda tidak mendapat peningkatan. Tidak apa-apa.

Pertanyaan yang sering diajukan

Bagaimana Cara Beralih ke Fable 5 di Claude Code?

Jalankan /model fable or /model claude-fable-5 di dalam Claude Code, atau berikan --model claude-fable-5 saat Anda meluncurkannya. Anda memerlukan Claude Code v2.1.170 atau yang lebih baru agar Fable 5 muncul sebagai opsi.

Apakah Fitur Perlindungan Akan Memblokir Pekerjaan Saya di Claude Code?

Sebagian besar tidak. Anthropic mengatakan lebih dari 95% sesi Fable 5 tidak pernah mencapai fallback. Namun tugas yang berdekatan dengan keamanan siber dan beberapa tugas data kesehatan dapat diarahkan ke Opus 4.8. Anda diberitahu dalam respons ketika ini terjadi, tetapi tidak ada peringatan sebelum pengiriman, sehingga Anda mengetahuinya setelah kejadian. Jika pekerjaan Anda menyentuh area tersebut, uji tugas nyata sebelum menjadikan Fable 5 sebagai default.

Apakah Dynamic Workflows Berbeda dari Mode Agen Biasa?

Ya. Dynamic Workflows adalah lapisan orkestrasi sub-agen paralel Anthropic, tersedia secara umum sejak akhir Mei dan diaktifkan secara default untuk paket Max dan Team. Di sinilah delegasi multi-tahap tanpa pengawasan Fable 5 sepenuhnya terekspresikan, dan mode agen sesi tunggal standar tidak akan menunjukkan perilaku jangka panjang yang sama.

Bagikan

Lebih banyak dari blog

Lanjutkan membaca.

fitur opencode vs openclaw membandingkan agen ai coding repo dengan gateway agen ai otonom OpenClaw.
AI dan Machine Learning

OpenCode vs OpenClaw: Tool AI Self-Hosted Mana yang Harus Kamu Jalankan?

OpenCode vs OpenClaw sebagian besar adalah pilihan antara agen coding yang bekerja di dalam repo kamu dan gateway asisten yang selalu aktif yang menghubungkan aplikasi chat, tool, dan aksi terjadwal.

Nick SilverNick Silver Baca 14 menit
sampul opencode vs claude code untuk coding ai lokal vs cloud, membandingkan kontrol self-hosted dengan kepraktisan terkelola.
AI dan Machine Learning

OpenCode vs Claude Code: Kepraktisan Terkelola atau Kontrol Self-Hosted?

OpenCode vs Claude Code intinya pilihan antara agen coding AI terkelola dan agen coding yang bisa kamu jalankan di lingkunganmu sendiri. Claude Code lebih mudah untuk memulai karena

Nick SilverNick Silver Baca 13 menit
sampul alternatif claude code mencakup tool ai terbaik untuk developer di workflow terminal, IDE, cloud, dan self-hosted.
AI dan Machine Learning

Alternatif Claude Code untuk Developer: Terbaik untuk Workflow Terminal, IDE, Self-Hosted, dan Cloud

Claude Code masih menjadi salah satu coding agent terkuat saat ini, tetapi banyak developer kini memilih tool berdasarkan workflow, akses model, dan biaya jangka panjang alih-alih bertahan

Nick SilverNick Silver Baca 20 menit

Siap deploy? Mulai $2,48/bln.

Cloud independen, sejak 2008. AMD EPYC, NVMe, 40 Gbps. Garansi uang kembali 14 hari.