ลด 50% ทุกแพลน เวลาจำกัด เริ่มต้นที่ $2.48/mo
เหลือ 7 นาที
AI และ Machine Learning

Fable 5 ใน Claude Code: สิ่งที่เปลี่ยนแปลงจริงๆ (ความเห็นวันแรก)

R By Riley อ่าน 7 นาที
แบนเนอร์บล็อก dark mode กว้างพร้อมสีส้มแสดง Fable 5 developer dashboard ที่มีการเสร็จสิ้น workflow 3 รอบ การตรวจสอบทดสอบ และบันทึกการตรวจสอบตนเองภายใน Claude Code

วันแรกฉันตั้งค่า Fable 5 เป็นค่าเริ่มต้นใน Claude Code และมอบงานแบบหลายไฟล์ที่ปกติกินเวลาทั้งบ่ายของฉัน ฉันไปชงกาแฟ พอกลับมานั่ง งานเสร็จแล้ว และมันแก้ไขสองสิ่งที่อยู่ใกล้เคียงอย่างเงียบๆ ทั้งที่ฉันไม่ได้ขอ

นี่คือการเปลี่ยนแปลงจริงในงานจริง ไม่ใช่การอ่านผล benchmark และมันมีค่าใช้จ่าย 2 เท่าของที่ฉันจ่ายสำหรับ Opus 4.8 ดังนั้น คุ้มค่าไหม เป็นคำถามที่แท้จริง ไม่ใช่แค่วาทกรรม สามสิ่งที่เปลี่ยนแปลงจริงๆ ในวิธีการทำงานของฉัน สิ่งหนึ่งน่าหงุดหน่ายอย่างตรงไปตรงมา นี่คือทุกอย่าง บวกกับสิ่งที่คุณลองด้วยตัวเองได้ในเวลาไม่ถึงชั่วโมง

เวอร์ชันสั้น

การเปลี่ยนแปลงจริงสามอย่าง: การ refactor ไฟล์หลายไฟล์ที่ซับซ้อนเสร็จในรอบที่น้อยกว่าเพราะ Fable 5 ตรวจสอบงานของตัวเองก่อนส่งคืน; การมอบหมายให้ sub-agent ทำงานได้โดยไม่ต้องคอยเฝ้าดู; และงาน vision อ่านสกรีนช็อตและสร้างตรรกะของคุณใหม่โดยต้องการการแนะนำน้อยกว่ามาก จุดเดียวที่น่าผิดหวัง: บางครั้งระบบป้องกันทำงานและส่งคุณไปที่ Opus 4.8 คุณรู้เรื่องนี้ในคำตอบ ไม่ใช่ก่อนส่ง และได้รับคำตอบของ Opus แทน Fable 5 ที่คาดหวัง สรุปของฉัน: คุ้มค่าสำหรับงานที่ยากและระยะยาว ทดสอบกับงานจริงก่อนตัดสินใจเรื่องราคา เพราะสำหรับงานธรรมดา ราคา 2x ก็แค่ 2x

รอบน้อยลง เพราะมันตรวจสอบงานของตัวเอง

การ refactor ที่ฉันพูดถึง: เวอร์ชันที่รันบน Opus 4.8 เมื่อสัปดาห์ก่อนใช้เวลาแปดหรือเก้ารอบโต้ตอบ สองในนั้นคือฉันต้องจับ build ที่พังที่มันส่งคืนมา Fable 5 ปิดมันในสามรอบ และได้ไปค้นหาบั๊กเองแทนที่จะรอให้ฉันหา เหตุผลคือ Fable 5 เก็บ context ได้มากกว่าและตรวจสอบตัวเองก่อนส่งมอบ Simon Willison พบเรื่องเดียวกันนี้หนักกว่า: in ความประทับใจแรกของเขาในวันแรก เขาอธิบายว่าโมเดลค้นหาและแก้ไขปัญหาไลบรารีพื้นฐานหลายอย่างในงานที่ขอให้แก้ไขเพียงอย่างเดียว

ความแตกต่างที่นี่ไม่ใช่เรื่องความเร็ว แต่เป็นเพราะ Fable 5 ตรวจสอบงานของตัวเองก่อนส่งคืน ทำให้คุณพบ build ที่เสียหายน้อยลงและเสียเทิร์นน้อยลงในการล้างข้อผิดพลาดของมัน นักพัฒนาในกระทู้ HN ที่พูดถึงการเปิดตัว อธิบายว่ามันคือโมเดลที่ «หาบั๊กที่โมเดลอื่นสร้างขึ้น» วิศวกรจาก Canva ในกระทู้เดียวกันรายงานว่าได้ «ครึ่ง token พร้อมผลลัพธ์ที่ดีกว่า» และ pull request ที่มีโค้ดให้รีวิวน้อยลง หากต้องการตัวเลข benchmark หนึ่งตัวที่อยู่เบื้องหลังความรู้สึกนี้: Anthropic วาง Fable 5 ไว้ที่ 80.3% ใน SWE-Bench Pro เทียบกับ 69.2% ของ Opus 4.8 ผมรู้สึกถึงความแตกต่างก่อนที่จะอ่านตัวเลข

การเปลี่ยนแปลงไม่ใช่ที่ความเร็ว แต่เป็นที่ผลลัพธ์ที่กลับมาพร้อมข้อผิดพลาดน้อยลง

การมอบหมายงานให้ Sub-Agent โดยไม่ต้องดูแลตลอด

ผมมอบหมายการ refactor สามขั้นตอนให้มัน และมันทำเสร็จสองขั้นตอนก่อนที่ผมจะเงยหน้าขึ้น นั่นคือการเปลี่ยนแปลงข้อที่สอง และเป็นสิ่งที่ผมไม่ได้คาดไว้ พฤติกรรมระยะยาวของ Fable 5 หมายความว่าคุณสามารถมอบหมายงานหลายขั้นตอนและมันจะทำงานผ่านแต่ละขั้นตอนด้วยตัวเองแทนที่จะหยุดเพื่อตรวจสอบหลังจากทุกการเคลื่อนไหว คู่ที่ทำให้สิ่งนี้เป็นจริงคือ Dynamic Workflows การประสาน sub-agent แบบขนานของ Anthropic (เปิดให้ใช้งานทั่วไปตั้งแต่ปลายเดือนพฤษภาคม) และไม่ใช่โหมดเซสชันเดียวมาตรฐาน ในกระทู้ HN นักพัฒนาหนึ่งคนอธิบายว่าการย้ายฐานข้อมูลที่ซับซ้อนเสร็จสมบูรณ์ในเซสชันเดียวที่ Opus ล้มเหลวซ้ำแล้วซ้ำเล่า

นี่คือข้อแม้ที่แท้จริง และมันสำคัญ: ในแผน Pro คุณอาจชนขีดจำกัดอัตราภายในหน้าต่าง 30 นาที ซึ่งทำลายการรันแบบไม่มีผู้ดูแลที่ยาวนานที่คุณเพิ่งตื่นเต้น นักพัฒนาคนหนึ่งในกระทู้ถึงเพดานภายใน 30 นาทีของงาน agent ความสามารถเป็นเรื่องจริง เพดานอัตราของแผน Pro ก็เป็นจริงเช่นกัน Max คือที่ที่ทำงานได้จริงโดยไม่ถูกขัดจังหวะตลอดเวลา

การมอบหมายงานในที่สุดก็ทำงานได้โดยไม่ต้องดูแล แค่รู้ไว้ว่าระดับ Pro จะ rate-limit คุณก่อนที่คุณจะได้ทดลองใช้งานเต็มรูปแบบ ดังนั้นนี่คือข้อได้เปรียบที่แท้จริงของแผน Max

งานวิชั่นเป็นประสบการณ์ที่แตกต่างออกไปแล้ว

ผมวางภาพหน้าจอของ UI component ที่ยุ่งเหยิงลงในเซสชัน แล้วถามว่ามันทำอะไรอยู่ มันอ่าน layout และสร้างตรรกะขึ้นใหม่โดยที่ผมไม่ได้อธิบายองค์ประกอบใดเลยแม้แต่ชิ้นเดียว นั่นคือการเปลี่ยนแปลงข้อที่สาม: Fable 5 อ่านภาพหน้าจอและไดอะแกรมของ codebase แล้วส่งคืนผลลัพธ์ที่ใช้งานได้จริงโดยต้องการการชี้นำน้อยกว่าที่ผมเคยชินมาก นักพัฒนารายหนึ่งในกระทู้ HN ที่ทดสอบอย่างหนักนานครึ่งชั่วโมงบอกว่ามัน «เก่งด้านภาพของ UI design อย่างไม่น่าเชื่อ» ซึ่งสอดคล้องกับสิ่งที่ผมสังเกตเห็น

นี่คือสิ่งที่เบาที่สุดในสามการเปลี่ยนแปลง แต่เป็นสิ่งที่ค่อยๆ ลบขั้นตอนที่ฉันไม่รู้ตัวว่าเหนื่อยหน่ายออกไปอย่างเงียบๆ

สิ่งเดียวที่น่าหงุดหงิด

ฉันส่งงานที่ควรจะรันได้เลย แต่กลับมาเป็นคำตอบ Opus ที่ถูกเส้นทางจากการปฏิเสธ สิ่งที่เกิดขึ้นข้างใต้: ตัวจำแนกระบบป้องกันทำงานกับงานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์และประเภทงานที่ละเอียดอ่อนอื่นๆ อีกสองสามอย่าง แทนที่จะให้คำตอบ Fable 5 มันส่งคำขอไปที่ Opus 4.8 คุณรู้เรื่องนี้ในคำตอบ โดยไม่มีคำเตือนก่อนส่ง Anthropic บอกว่าผู้ใช้จะได้รับแจ้งเมื่อเกิดเหตุการณ์นี้ และในทางเทคนิคคำตอบจะบอกคุณ แต่ไม่มีการแจ้งล่วงหน้าว่างานของคุณอยู่ในขอบเขตของตัวจำแนก

ขอบเขตของตัวจำแนกประเภทก็กว้างเช่นกัน ในกระทู้ HN นักพัฒนารายหนึ่งถูกบล็อกขณะใช้เครื่องมือหาลูกค้าธุรกิจ ส่วนอีกรายที่ทำงานกับรูปแบบข้อมูลสุขภาพระบุว่าไม่สามารถใช้งานได้ในกรณีของตน พูดตามความเป็นจริง กรณีแบบนี้เกิดขึ้นได้ยาก Anthropic ระบุว่ากว่า 95% ของเซสชัน Fable ไม่เคยพบ fallback เลยแม้แต่ครั้งเดียว นอกจากนี้ ยังมีข้อถกเถียงแยกต่างหากที่แคบกว่ามากเกี่ยวกับวิธีปรับแต่งเบื้องหลังที่ส่งผลต่อนักวิจัย AI ชั้นแนวหน้า ไม่ใช่นักพัฒนาทั่วไป อย่าสับสนทั้งสองประเด็น สิ่งที่อาจกระทบคุณจริงๆ คือ fallback ของ Opus ที่มองเห็นได้ ปัญหาไม่ใช่เรื่องที่ safety routing มีอยู่ แต่เป็นเรื่องความไม่โปร่งใส การรู้ทีหลังว่าได้รับคำตอบจาก Opus ทั้งที่คาดว่าจะเป็น Fable 5 นั้นเป็นความรู้สึกที่ไม่ดีเลย

โมเดลที่ยอดเยี่ยม แต่มีรั้วกั้นที่ไม่โปร่งใส ความไม่โปร่งใสคือสิ่งที่ทำให้เจ็บปวด ไม่ใช่ความปลอดภัยในตัวเอง

สิ่งที่ควรลองในชั่วโมงถัดไป

เปลี่ยนค่าเริ่มต้นใน Claude Code เป็น Fable 5 แล้วรันกับการ refactor ไฟล์หลายไฟล์ที่คุณเปิดอยู่แล้ว นั่นคือการทดลองทั้งหมด และคุณจะรู้ภายในชั่วโมงว่ามันคุ้มกับราคา 2x สำหรับงานของคุณหรือไม่ ทดสอบกับสิ่งที่ยากจริงๆ ไม่ใช่งานธรรมดา: การคิดแบบปรับตัวเปิดอยู่เสมอ ดังนั้นงานง่ายๆ จึงไม่แสดงความแตกต่างและเปลืองเงินโดยไม่จำเป็น หากคุณใช้ Max หรือ Team ให้เปิด Dynamic Workflows เพื่อดูพฤติกรรมการมอบหมายแทนโหมดเซสชันเดียว และป้อนสกรีนช็อต UI ของคุณเองเพื่อดูการเปลี่ยนแปลงด้านวิสัยทัศน์ด้วยตัวเอง

การสลับตัวเองคือ /model fable or /model claude-fable-5 (คุณจะต้องใช้ Claude Code v2.1.170 หรือใหม่กว่า) รันบนงานจริงของคุณ ตัดสินใจเอง และกลับไปใช้ Opus หากงานของคุณไม่ได้รับการปรับปรุง ไม่มีอะไรเสียหาย

คำถามที่พบบ่อย

จะเปลี่ยนไปใช้ Fable 5 ใน Claude Code ได้อย่างไร?

เรียกใช้ /model fable or /model claude-fable-5 ภายใน Claude Code หรือส่ง --model claude-fable-5 เมื่อคุณเปิดใช้งาน คุณจะต้องใช้ Claude Code v2.1.170 หรือใหม่กว่าเพื่อให้ Fable 5 ปรากฏเป็นตัวเลือก

มาตรการป้องกันจะบล็อกงานของฉันใน Claude Code หรือไม่?

ส่วนใหญ่ไม่ Anthropic กล่าวว่ามากกว่า 95% ของเซสชัน Fable 5 ไม่เคยเจอ fallback แต่งานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์และงานข้อมูลสุขภาพบางส่วนอาจถูกกำหนดเส้นทางไปยัง Opus 4.8 คุณจะได้รับแจ้งในการตอบสนองเมื่อสิ่งนี้เกิดขึ้น แต่ไม่มีการเตือนก่อนส่ง ดังนั้นคุณจะรู้หลังจากเหตุการณ์ หากงานของคุณสัมผัสพื้นที่เหล่านั้น ให้ทดสอบงานจริงก่อนที่จะกำหนด Fable 5 เป็นค่าเริ่มต้น

Dynamic Workflows แตกต่างจาก Agent Mode ปกติหรือไม่?

ใช่ Dynamic Workflows คือเลเยอร์การจัดการ sub-agent แบบคู่ขนานของ Anthropic ที่พร้อมใช้งานทั่วไปตั้งแต่ปลายเดือนพฤษภาคมและเปิดใช้งานโดยค่าเริ่มต้นสำหรับแผน Max และ Team นี่คือที่ที่การมอบหมายงานหลายขั้นตอนโดยไม่มีการควบคุมดูแลของ Fable 5 ได้รับการแสดงออกอย่างเต็มที่ และโหมด agent เซสชันเดียวมาตรฐานจะไม่แสดงพฤติกรรมระยะยาวแบบเดียวกัน

แชร์

บทความเพิ่มเติมจากบล็อก

อ่านต่อ

feature opencode vs openclaw เปรียบเทียบ repo ai coding agent กับ OpenClaw autonomous ai agent gateway
AI และ Machine Learning

OpenCode กับ OpenClaw: ควรรันเครื่องมือ Self-Hosted AI ตัวไหน?

OpenCode กับ OpenClaw ส่วนใหญ่เป็นทางเลือกระหว่าง coding agent ที่ทำงานใน repo ของคุณ และ assistant gateway ที่เปิดตลอดซึ่งเชื่อมต่อแอปแชท เครื่องมือ และการกระทำที่กำหนดเวลา

Nick SilverNick Silver อ่าน 14 นาที
ภาพปก opencode vs claude code สำหรับ local vs cloud ai coding เปรียบเทียบ self-hosted control กับความสะดวกแบบ hosted
AI และ Machine Learning

OpenCode กับ Claude Code: ความสะดวกแบบ Hosted หรือ Self-Hosted Control?

OpenCode กับ Claude Code สรุปคือทางเลือกระหว่าง AI coding agent แบบ managed กับ coding agent ที่คุณรันได้ในสภาพแวดล้อมของคุณเอง Claude Code เริ่มต้นได้ง่ายกว่าเพราะ

Nick SilverNick Silver อ่าน 13 นาที
ภาพปก claude code alternatives เครื่องมือ ai ที่ดีที่สุดสำหรับนักพัฒนาทั้ง terminal, IDE, cloud และ self-hosted workflows
AI และ Machine Learning

ทางเลือก Claude Code สำหรับนักพัฒนา: ดีที่สุดสำหรับ Terminal, IDE, Self-Hosted และ Cloud Workflows

Claude Code ยังเป็นหนึ่งในเอเจนต์โค้ดดิ้งที่แข็งแกร่งที่สุด แต่นักพัฒนาจำนวนมากเริ่มเลือกเครื่องมือตาม workflow, การเข้าถึงโมเดล และต้นทุนระยะยาว แทนที่จะยึดติด

Nick SilverNick Silver อ่าน 20 นาที

พร้อมติดตั้งหรือยัง? เริ่มต้น $2.48/เดือน

คลาวด์อิสระ ตั้งแต่ปี 2008 AMD EPYC, NVMe, 40 Gbps คืนเงินภายใน 14 วัน