วันแรกฉันตั้งค่า Fable 5 เป็นค่าเริ่มต้นใน Claude Code และมอบงานแบบหลายไฟล์ที่ปกติกินเวลาทั้งบ่ายของฉัน ฉันไปชงกาแฟ พอกลับมานั่ง งานเสร็จแล้ว และมันแก้ไขสองสิ่งที่อยู่ใกล้เคียงอย่างเงียบๆ ทั้งที่ฉันไม่ได้ขอ
นี่คือการเปลี่ยนแปลงจริงในงานจริง ไม่ใช่การอ่านผล benchmark และมันมีค่าใช้จ่าย 2 เท่าของที่ฉันจ่ายสำหรับ Opus 4.8 ดังนั้น คุ้มค่าไหม เป็นคำถามที่แท้จริง ไม่ใช่แค่วาทกรรม สามสิ่งที่เปลี่ยนแปลงจริงๆ ในวิธีการทำงานของฉัน สิ่งหนึ่งน่าหงุดหน่ายอย่างตรงไปตรงมา นี่คือทุกอย่าง บวกกับสิ่งที่คุณลองด้วยตัวเองได้ในเวลาไม่ถึงชั่วโมง
เวอร์ชันสั้น
การเปลี่ยนแปลงจริงสามอย่าง: การ refactor ไฟล์หลายไฟล์ที่ซับซ้อนเสร็จในรอบที่น้อยกว่าเพราะ Fable 5 ตรวจสอบงานของตัวเองก่อนส่งคืน; การมอบหมายให้ sub-agent ทำงานได้โดยไม่ต้องคอยเฝ้าดู; และงาน vision อ่านสกรีนช็อตและสร้างตรรกะของคุณใหม่โดยต้องการการแนะนำน้อยกว่ามาก จุดเดียวที่น่าผิดหวัง: บางครั้งระบบป้องกันทำงานและส่งคุณไปที่ Opus 4.8 คุณรู้เรื่องนี้ในคำตอบ ไม่ใช่ก่อนส่ง และได้รับคำตอบของ Opus แทน Fable 5 ที่คาดหวัง สรุปของฉัน: คุ้มค่าสำหรับงานที่ยากและระยะยาว ทดสอบกับงานจริงก่อนตัดสินใจเรื่องราคา เพราะสำหรับงานธรรมดา ราคา 2x ก็แค่ 2x
รอบน้อยลง เพราะมันตรวจสอบงานของตัวเอง
การ refactor ที่ฉันพูดถึง: เวอร์ชันที่รันบน Opus 4.8 เมื่อสัปดาห์ก่อนใช้เวลาแปดหรือเก้ารอบโต้ตอบ สองในนั้นคือฉันต้องจับ build ที่พังที่มันส่งคืนมา Fable 5 ปิดมันในสามรอบ และได้ไปค้นหาบั๊กเองแทนที่จะรอให้ฉันหา เหตุผลคือ Fable 5 เก็บ context ได้มากกว่าและตรวจสอบตัวเองก่อนส่งมอบ Simon Willison พบเรื่องเดียวกันนี้หนักกว่า: in ความประทับใจแรกของเขาในวันแรก เขาอธิบายว่าโมเดลค้นหาและแก้ไขปัญหาไลบรารีพื้นฐานหลายอย่างในงานที่ขอให้แก้ไขเพียงอย่างเดียว
ความแตกต่างที่นี่ไม่ใช่เรื่องความเร็ว แต่เป็นเพราะ Fable 5 ตรวจสอบงานของตัวเองก่อนส่งคืน ทำให้คุณพบ build ที่เสียหายน้อยลงและเสียเทิร์นน้อยลงในการล้างข้อผิดพลาดของมัน นักพัฒนาในกระทู้ HN ที่พูดถึงการเปิดตัว อธิบายว่ามันคือโมเดลที่ «หาบั๊กที่โมเดลอื่นสร้างขึ้น» วิศวกรจาก Canva ในกระทู้เดียวกันรายงานว่าได้ «ครึ่ง token พร้อมผลลัพธ์ที่ดีกว่า» และ pull request ที่มีโค้ดให้รีวิวน้อยลง หากต้องการตัวเลข benchmark หนึ่งตัวที่อยู่เบื้องหลังความรู้สึกนี้: Anthropic วาง Fable 5 ไว้ที่ 80.3% ใน SWE-Bench Pro เทียบกับ 69.2% ของ Opus 4.8 ผมรู้สึกถึงความแตกต่างก่อนที่จะอ่านตัวเลข
การเปลี่ยนแปลงไม่ใช่ที่ความเร็ว แต่เป็นที่ผลลัพธ์ที่กลับมาพร้อมข้อผิดพลาดน้อยลง
การมอบหมายงานให้ Sub-Agent โดยไม่ต้องดูแลตลอด
ผมมอบหมายการ refactor สามขั้นตอนให้มัน และมันทำเสร็จสองขั้นตอนก่อนที่ผมจะเงยหน้าขึ้น นั่นคือการเปลี่ยนแปลงข้อที่สอง และเป็นสิ่งที่ผมไม่ได้คาดไว้ พฤติกรรมระยะยาวของ Fable 5 หมายความว่าคุณสามารถมอบหมายงานหลายขั้นตอนและมันจะทำงานผ่านแต่ละขั้นตอนด้วยตัวเองแทนที่จะหยุดเพื่อตรวจสอบหลังจากทุกการเคลื่อนไหว คู่ที่ทำให้สิ่งนี้เป็นจริงคือ Dynamic Workflows การประสาน sub-agent แบบขนานของ Anthropic (เปิดให้ใช้งานทั่วไปตั้งแต่ปลายเดือนพฤษภาคม) และไม่ใช่โหมดเซสชันเดียวมาตรฐาน ในกระทู้ HN นักพัฒนาหนึ่งคนอธิบายว่าการย้ายฐานข้อมูลที่ซับซ้อนเสร็จสมบูรณ์ในเซสชันเดียวที่ Opus ล้มเหลวซ้ำแล้วซ้ำเล่า
นี่คือข้อแม้ที่แท้จริง และมันสำคัญ: ในแผน Pro คุณอาจชนขีดจำกัดอัตราภายในหน้าต่าง 30 นาที ซึ่งทำลายการรันแบบไม่มีผู้ดูแลที่ยาวนานที่คุณเพิ่งตื่นเต้น นักพัฒนาคนหนึ่งในกระทู้ถึงเพดานภายใน 30 นาทีของงาน agent ความสามารถเป็นเรื่องจริง เพดานอัตราของแผน Pro ก็เป็นจริงเช่นกัน Max คือที่ที่ทำงานได้จริงโดยไม่ถูกขัดจังหวะตลอดเวลา
การมอบหมายงานในที่สุดก็ทำงานได้โดยไม่ต้องดูแล แค่รู้ไว้ว่าระดับ Pro จะ rate-limit คุณก่อนที่คุณจะได้ทดลองใช้งานเต็มรูปแบบ ดังนั้นนี่คือข้อได้เปรียบที่แท้จริงของแผน Max
งานวิชั่นเป็นประสบการณ์ที่แตกต่างออกไปแล้ว
ผมวางภาพหน้าจอของ UI component ที่ยุ่งเหยิงลงในเซสชัน แล้วถามว่ามันทำอะไรอยู่ มันอ่าน layout และสร้างตรรกะขึ้นใหม่โดยที่ผมไม่ได้อธิบายองค์ประกอบใดเลยแม้แต่ชิ้นเดียว นั่นคือการเปลี่ยนแปลงข้อที่สาม: Fable 5 อ่านภาพหน้าจอและไดอะแกรมของ codebase แล้วส่งคืนผลลัพธ์ที่ใช้งานได้จริงโดยต้องการการชี้นำน้อยกว่าที่ผมเคยชินมาก นักพัฒนารายหนึ่งในกระทู้ HN ที่ทดสอบอย่างหนักนานครึ่งชั่วโมงบอกว่ามัน «เก่งด้านภาพของ UI design อย่างไม่น่าเชื่อ» ซึ่งสอดคล้องกับสิ่งที่ผมสังเกตเห็น
นี่คือสิ่งที่เบาที่สุดในสามการเปลี่ยนแปลง แต่เป็นสิ่งที่ค่อยๆ ลบขั้นตอนที่ฉันไม่รู้ตัวว่าเหนื่อยหน่ายออกไปอย่างเงียบๆ
สิ่งเดียวที่น่าหงุดหงิด
ฉันส่งงานที่ควรจะรันได้เลย แต่กลับมาเป็นคำตอบ Opus ที่ถูกเส้นทางจากการปฏิเสธ สิ่งที่เกิดขึ้นข้างใต้: ตัวจำแนกระบบป้องกันทำงานกับงานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์และประเภทงานที่ละเอียดอ่อนอื่นๆ อีกสองสามอย่าง แทนที่จะให้คำตอบ Fable 5 มันส่งคำขอไปที่ Opus 4.8 คุณรู้เรื่องนี้ในคำตอบ โดยไม่มีคำเตือนก่อนส่ง Anthropic บอกว่าผู้ใช้จะได้รับแจ้งเมื่อเกิดเหตุการณ์นี้ และในทางเทคนิคคำตอบจะบอกคุณ แต่ไม่มีการแจ้งล่วงหน้าว่างานของคุณอยู่ในขอบเขตของตัวจำแนก
ขอบเขตของตัวจำแนกประเภทก็กว้างเช่นกัน ในกระทู้ HN นักพัฒนารายหนึ่งถูกบล็อกขณะใช้เครื่องมือหาลูกค้าธุรกิจ ส่วนอีกรายที่ทำงานกับรูปแบบข้อมูลสุขภาพระบุว่าไม่สามารถใช้งานได้ในกรณีของตน พูดตามความเป็นจริง กรณีแบบนี้เกิดขึ้นได้ยาก Anthropic ระบุว่ากว่า 95% ของเซสชัน Fable ไม่เคยพบ fallback เลยแม้แต่ครั้งเดียว นอกจากนี้ ยังมีข้อถกเถียงแยกต่างหากที่แคบกว่ามากเกี่ยวกับวิธีปรับแต่งเบื้องหลังที่ส่งผลต่อนักวิจัย AI ชั้นแนวหน้า ไม่ใช่นักพัฒนาทั่วไป อย่าสับสนทั้งสองประเด็น สิ่งที่อาจกระทบคุณจริงๆ คือ fallback ของ Opus ที่มองเห็นได้ ปัญหาไม่ใช่เรื่องที่ safety routing มีอยู่ แต่เป็นเรื่องความไม่โปร่งใส การรู้ทีหลังว่าได้รับคำตอบจาก Opus ทั้งที่คาดว่าจะเป็น Fable 5 นั้นเป็นความรู้สึกที่ไม่ดีเลย
โมเดลที่ยอดเยี่ยม แต่มีรั้วกั้นที่ไม่โปร่งใส ความไม่โปร่งใสคือสิ่งที่ทำให้เจ็บปวด ไม่ใช่ความปลอดภัยในตัวเอง
สิ่งที่ควรลองในชั่วโมงถัดไป
เปลี่ยนค่าเริ่มต้นใน Claude Code เป็น Fable 5 แล้วรันกับการ refactor ไฟล์หลายไฟล์ที่คุณเปิดอยู่แล้ว นั่นคือการทดลองทั้งหมด และคุณจะรู้ภายในชั่วโมงว่ามันคุ้มกับราคา 2x สำหรับงานของคุณหรือไม่ ทดสอบกับสิ่งที่ยากจริงๆ ไม่ใช่งานธรรมดา: การคิดแบบปรับตัวเปิดอยู่เสมอ ดังนั้นงานง่ายๆ จึงไม่แสดงความแตกต่างและเปลืองเงินโดยไม่จำเป็น หากคุณใช้ Max หรือ Team ให้เปิด Dynamic Workflows เพื่อดูพฤติกรรมการมอบหมายแทนโหมดเซสชันเดียว และป้อนสกรีนช็อต UI ของคุณเองเพื่อดูการเปลี่ยนแปลงด้านวิสัยทัศน์ด้วยตัวเอง
การสลับตัวเองคือ /model fable or /model claude-fable-5 (คุณจะต้องใช้ Claude Code v2.1.170 หรือใหม่กว่า) รันบนงานจริงของคุณ ตัดสินใจเอง และกลับไปใช้ Opus หากงานของคุณไม่ได้รับการปรับปรุง ไม่มีอะไรเสียหาย
คำถามที่พบบ่อย
จะเปลี่ยนไปใช้ Fable 5 ใน Claude Code ได้อย่างไร?
เรียกใช้ /model fable or /model claude-fable-5 ภายใน Claude Code หรือส่ง --model claude-fable-5 เมื่อคุณเปิดใช้งาน คุณจะต้องใช้ Claude Code v2.1.170 หรือใหม่กว่าเพื่อให้ Fable 5 ปรากฏเป็นตัวเลือก
มาตรการป้องกันจะบล็อกงานของฉันใน Claude Code หรือไม่?
ส่วนใหญ่ไม่ Anthropic กล่าวว่ามากกว่า 95% ของเซสชัน Fable 5 ไม่เคยเจอ fallback แต่งานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์และงานข้อมูลสุขภาพบางส่วนอาจถูกกำหนดเส้นทางไปยัง Opus 4.8 คุณจะได้รับแจ้งในการตอบสนองเมื่อสิ่งนี้เกิดขึ้น แต่ไม่มีการเตือนก่อนส่ง ดังนั้นคุณจะรู้หลังจากเหตุการณ์ หากงานของคุณสัมผัสพื้นที่เหล่านั้น ให้ทดสอบงานจริงก่อนที่จะกำหนด Fable 5 เป็นค่าเริ่มต้น
Dynamic Workflows แตกต่างจาก Agent Mode ปกติหรือไม่?
ใช่ Dynamic Workflows คือเลเยอร์การจัดการ sub-agent แบบคู่ขนานของ Anthropic ที่พร้อมใช้งานทั่วไปตั้งแต่ปลายเดือนพฤษภาคมและเปิดใช้งานโดยค่าเริ่มต้นสำหรับแผน Max และ Team นี่คือที่ที่การมอบหมายงานหลายขั้นตอนโดยไม่มีการควบคุมดูแลของ Fable 5 ได้รับการแสดงออกอย่างเต็มที่ และโหมด agent เซสชันเดียวมาตรฐานจะไม่แสดงพฤติกรรมระยะยาวแบบเดียวกัน