ข้ามไปยังเนื้อหาหลัก
ลด 50% ทุกแพลน เวลาจำกัด เริ่มต้นที่ $2.48/mo
7 min left
AI และ Machine Learning

Fable 5 ใน Claude Code: สิ่งที่เปลี่ยนแปลงจริงๆ (ความเห็นวันแรก)

R โดย Riley 7 นาทีในการอ่าน
Wide dark-mode blog banner with orange accents showing a Fable 5 developer dashboard with a 3-turn workflow completion, test verification, and self-verification note inside Claude Code.

วันแรกฉันตั้งค่า Fable 5 เป็นค่าเริ่มต้นใน Claude Code และมอบงานแบบหลายไฟล์ที่ปกติกินเวลาทั้งบ่ายของฉัน ฉันไปชงกาแฟ พอกลับมานั่ง งานเสร็จแล้ว และมันแก้ไขสองสิ่งที่อยู่ใกล้เคียงอย่างเงียบๆ ทั้งที่ฉันไม่ได้ขอ

นี่คือการเปลี่ยนแปลงจริงในงานจริง ไม่ใช่การอ่านผล benchmark และมันมีค่าใช้จ่าย 2 เท่าของที่ฉันจ่ายสำหรับ Opus 4.8 ดังนั้น คุ้มค่าไหม เป็นคำถามที่แท้จริง ไม่ใช่แค่วาทกรรม สามสิ่งที่เปลี่ยนแปลงจริงๆ ในวิธีการทำงานของฉัน สิ่งหนึ่งน่าหงุดหน่ายอย่างตรงไปตรงมา นี่คือทุกอย่าง บวกกับสิ่งที่คุณลองด้วยตัวเองได้ในเวลาไม่ถึงชั่วโมง

เวอร์ชันสั้น

การเปลี่ยนแปลงจริงสามอย่าง: การ refactor ไฟล์หลายไฟล์ที่ซับซ้อนเสร็จในรอบที่น้อยกว่าเพราะ Fable 5 ตรวจสอบงานของตัวเองก่อนส่งคืน; การมอบหมายให้ sub-agent ทำงานได้โดยไม่ต้องคอยเฝ้าดู; และงาน vision อ่านสกรีนช็อตและสร้างตรรกะของคุณใหม่โดยต้องการการแนะนำน้อยกว่ามาก จุดเดียวที่น่าผิดหวัง: บางครั้งระบบป้องกันทำงานและส่งคุณไปที่ Opus 4.8 คุณรู้เรื่องนี้ในคำตอบ ไม่ใช่ก่อนส่ง และได้รับคำตอบของ Opus แทน Fable 5 ที่คาดหวัง สรุปของฉัน: คุ้มค่าสำหรับงานที่ยากและระยะยาว ทดสอบกับงานจริงก่อนตัดสินใจเรื่องราคา เพราะสำหรับงานธรรมดา ราคา 2x ก็แค่ 2x

รอบน้อยลง เพราะมันตรวจสอบงานของตัวเอง

การ refactor ที่ฉันพูดถึง: เวอร์ชันที่รันบน Opus 4.8 เมื่อสัปดาห์ก่อนใช้เวลาแปดหรือเก้ารอบโต้ตอบ สองในนั้นคือฉันต้องจับ build ที่พังที่มันส่งคืนมา Fable 5 ปิดมันในสามรอบ และได้ไปค้นหาบั๊กเองแทนที่จะรอให้ฉันหา เหตุผลคือ Fable 5 เก็บ context ได้มากกว่าและตรวจสอบตัวเองก่อนส่งมอบ Simon Willison พบเรื่องเดียวกันนี้หนักกว่า: in ความประทับใจแรกของเขาในวันแรก เขาอธิบายว่าโมเดลค้นหาและแก้ไขปัญหาไลบรารีพื้นฐานหลายอย่างในงานที่ขอให้แก้ไขเพียงอย่างเดียว

ความแตกต่างที่นี่ไม่ใช่เรื่องความเร็ว แต่เป็นเพราะ Fable 5 ตรวจสอบงานของตัวเองก่อนส่งคืน ทำให้คุณพบ build ที่เสียหายน้อยลงและเสียเทิร์นน้อยลงในการล้างข้อผิดพลาดของมัน นักพัฒนาในกระทู้ HN ที่พูดถึงการเปิดตัว อธิบายว่ามันคือโมเดลที่ «หาบั๊กที่โมเดลอื่นสร้างขึ้น» วิศวกรจาก Canva ในกระทู้เดียวกันรายงานว่าได้ «ครึ่ง token พร้อมผลลัพธ์ที่ดีกว่า» และ pull request ที่มีโค้ดให้รีวิวน้อยลง หากต้องการตัวเลข benchmark หนึ่งตัวที่อยู่เบื้องหลังความรู้สึกนี้: Anthropic วาง Fable 5 ไว้ที่ 80.3% ใน SWE-Bench Pro เทียบกับ 69.2% ของ Opus 4.8 ผมรู้สึกถึงความแตกต่างก่อนที่จะอ่านตัวเลข

การเปลี่ยนแปลงไม่ใช่ที่ความเร็ว แต่เป็นที่ผลลัพธ์ที่กลับมาพร้อมข้อผิดพลาดน้อยลง

การมอบหมายงานให้ Sub-Agent โดยไม่ต้องดูแลตลอด

ผมมอบหมายการ refactor สามขั้นตอนให้มัน และมันทำเสร็จสองขั้นตอนก่อนที่ผมจะเงยหน้าขึ้น นั่นคือการเปลี่ยนแปลงข้อที่สอง และเป็นสิ่งที่ผมไม่ได้คาดไว้ พฤติกรรมระยะยาวของ Fable 5 หมายความว่าคุณสามารถมอบหมายงานหลายขั้นตอนและมันจะทำงานผ่านแต่ละขั้นตอนด้วยตัวเองแทนที่จะหยุดเพื่อตรวจสอบหลังจากทุกการเคลื่อนไหว คู่ที่ทำให้สิ่งนี้เป็นจริงคือ Dynamic Workflows การประสาน sub-agent แบบขนานของ Anthropic (เปิดให้ใช้งานทั่วไปตั้งแต่ปลายเดือนพฤษภาคม) และไม่ใช่โหมดเซสชันเดียวมาตรฐาน ในกระทู้ HN นักพัฒนาหนึ่งคนอธิบายว่าการย้ายฐานข้อมูลที่ซับซ้อนเสร็จสมบูรณ์ในเซสชันเดียวที่ Opus ล้มเหลวซ้ำแล้วซ้ำเล่า

นี่คือข้อแม้ที่แท้จริง และมันสำคัญ: ในแผน Pro คุณอาจชนขีดจำกัดอัตราภายในหน้าต่าง 30 นาที ซึ่งทำลายการรันแบบไม่มีผู้ดูแลที่ยาวนานที่คุณเพิ่งตื่นเต้น นักพัฒนาคนหนึ่งในกระทู้ถึงเพดานภายใน 30 นาทีของงาน agent ความสามารถเป็นเรื่องจริง เพดานอัตราของแผน Pro ก็เป็นจริงเช่นกัน Max คือที่ที่ทำงานได้จริงโดยไม่ถูกขัดจังหวะตลอดเวลา

การมอบหมายงานในที่สุดก็ทำงานได้โดยไม่ต้องดูแล แค่รู้ไว้ว่าระดับ Pro จะ rate-limit คุณก่อนที่คุณจะได้ทดลองใช้งานเต็มรูปแบบ ดังนั้นนี่คือข้อได้เปรียบที่แท้จริงของแผน Max

งานวิชั่นเป็นประสบการณ์ที่แตกต่างออกไปแล้ว

ผมวางภาพหน้าจอของ UI component ที่ยุ่งเหยิงลงในเซสชัน แล้วถามว่ามันทำอะไรอยู่ มันอ่าน layout และสร้างตรรกะขึ้นใหม่โดยที่ผมไม่ได้อธิบายองค์ประกอบใดเลยแม้แต่ชิ้นเดียว นั่นคือการเปลี่ยนแปลงข้อที่สาม: Fable 5 อ่านภาพหน้าจอและไดอะแกรมของ codebase แล้วส่งคืนผลลัพธ์ที่ใช้งานได้จริงโดยต้องการการชี้นำน้อยกว่าที่ผมเคยชินมาก นักพัฒนารายหนึ่งในกระทู้ HN ที่ทดสอบอย่างหนักนานครึ่งชั่วโมงบอกว่ามัน «เก่งด้านภาพของ UI design อย่างไม่น่าเชื่อ» ซึ่งสอดคล้องกับสิ่งที่ผมสังเกตเห็น

นี่คือสิ่งที่เบาที่สุดในสามการเปลี่ยนแปลง แต่เป็นสิ่งที่ค่อยๆ ลบขั้นตอนที่ฉันไม่รู้ตัวว่าเหนื่อยหน่ายออกไปอย่างเงียบๆ

สิ่งเดียวที่น่าหงุดหงิด

ฉันส่งงานที่ควรจะรันได้เลย แต่กลับมาเป็นคำตอบ Opus ที่ถูกเส้นทางจากการปฏิเสธ สิ่งที่เกิดขึ้นข้างใต้: ตัวจำแนกระบบป้องกันทำงานกับงานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์และประเภทงานที่ละเอียดอ่อนอื่นๆ อีกสองสามอย่าง แทนที่จะให้คำตอบ Fable 5 มันส่งคำขอไปที่ Opus 4.8 คุณรู้เรื่องนี้ในคำตอบ โดยไม่มีคำเตือนก่อนส่ง Anthropic บอกว่าผู้ใช้จะได้รับแจ้งเมื่อเกิดเหตุการณ์นี้ และในทางเทคนิคคำตอบจะบอกคุณ แต่ไม่มีการแจ้งล่วงหน้าว่างานของคุณอยู่ในขอบเขตของตัวจำแนก

ขอบเขตของตัวจำแนกประเภทก็กว้างเช่นกัน ในกระทู้ HN นักพัฒนารายหนึ่งถูกบล็อกขณะใช้เครื่องมือหาลูกค้าธุรกิจ ส่วนอีกรายที่ทำงานกับรูปแบบข้อมูลสุขภาพระบุว่าไม่สามารถใช้งานได้ในกรณีของตน พูดตามความเป็นจริง กรณีแบบนี้เกิดขึ้นได้ยาก Anthropic ระบุว่ากว่า 95% ของเซสชัน Fable ไม่เคยพบ fallback เลยแม้แต่ครั้งเดียว นอกจากนี้ ยังมีข้อถกเถียงแยกต่างหากที่แคบกว่ามากเกี่ยวกับวิธีปรับแต่งเบื้องหลังที่ส่งผลต่อนักวิจัย AI ชั้นแนวหน้า ไม่ใช่นักพัฒนาทั่วไป อย่าสับสนทั้งสองประเด็น สิ่งที่อาจกระทบคุณจริงๆ คือ fallback ของ Opus ที่มองเห็นได้ ปัญหาไม่ใช่เรื่องที่ safety routing มีอยู่ แต่เป็นเรื่องความไม่โปร่งใส การรู้ทีหลังว่าได้รับคำตอบจาก Opus ทั้งที่คาดว่าจะเป็น Fable 5 นั้นเป็นความรู้สึกที่ไม่ดีเลย

โมเดลที่ยอดเยี่ยม แต่มีรั้วกั้นที่ไม่โปร่งใส ความไม่โปร่งใสคือสิ่งที่ทำให้เจ็บปวด ไม่ใช่ความปลอดภัยในตัวเอง

สิ่งที่ควรลองในชั่วโมงถัดไป

เปลี่ยนค่าเริ่มต้นใน Claude Code เป็น Fable 5 แล้วรันกับการ refactor ไฟล์หลายไฟล์ที่คุณเปิดอยู่แล้ว นั่นคือการทดลองทั้งหมด และคุณจะรู้ภายในชั่วโมงว่ามันคุ้มกับราคา 2x สำหรับงานของคุณหรือไม่ ทดสอบกับสิ่งที่ยากจริงๆ ไม่ใช่งานธรรมดา: การคิดแบบปรับตัวเปิดอยู่เสมอ ดังนั้นงานง่ายๆ จึงไม่แสดงความแตกต่างและเปลืองเงินโดยไม่จำเป็น หากคุณใช้ Max หรือ Team ให้เปิด Dynamic Workflows เพื่อดูพฤติกรรมการมอบหมายแทนโหมดเซสชันเดียว และป้อนสกรีนช็อต UI ของคุณเองเพื่อดูการเปลี่ยนแปลงด้านวิสัยทัศน์ด้วยตัวเอง

การสลับตัวเองคือ /model fable or /model claude-fable-5 (คุณจะต้องใช้ Claude Code v2.1.170 หรือใหม่กว่า) รันบนงานจริงของคุณ ตัดสินใจเอง และกลับไปใช้ Opus หากงานของคุณไม่ได้รับการปรับปรุง ไม่มีอะไรเสียหาย

คำถามที่พบบ่อย

จะเปลี่ยนไปใช้ Fable 5 ใน Claude Code ได้อย่างไร?

เรียกใช้ /model fable or /model claude-fable-5 ภายใน Claude Code หรือส่ง --model claude-fable-5 เมื่อคุณเปิดใช้งาน คุณจะต้องใช้ Claude Code v2.1.170 หรือใหม่กว่าเพื่อให้ Fable 5 ปรากฏเป็นตัวเลือก

มาตรการป้องกันจะบล็อกงานของฉันใน Claude Code หรือไม่?

ส่วนใหญ่ไม่ Anthropic กล่าวว่ามากกว่า 95% ของเซสชัน Fable 5 ไม่เคยเจอ fallback แต่งานที่เกี่ยวข้องกับความปลอดภัยทางไซเบอร์และงานข้อมูลสุขภาพบางส่วนอาจถูกกำหนดเส้นทางไปยัง Opus 4.8 คุณจะได้รับแจ้งในการตอบสนองเมื่อสิ่งนี้เกิดขึ้น แต่ไม่มีการเตือนก่อนส่ง ดังนั้นคุณจะรู้หลังจากเหตุการณ์ หากงานของคุณสัมผัสพื้นที่เหล่านั้น ให้ทดสอบงานจริงก่อนที่จะกำหนด Fable 5 เป็นค่าเริ่มต้น

Dynamic Workflows แตกต่างจาก Agent Mode ปกติหรือไม่?

ใช่ Dynamic Workflows คือเลเยอร์การจัดการ sub-agent แบบคู่ขนานของ Anthropic ที่พร้อมใช้งานทั่วไปตั้งแต่ปลายเดือนพฤษภาคมและเปิดใช้งานโดยค่าเริ่มต้นสำหรับแผน Max และ Team นี่คือที่ที่การมอบหมายงานหลายขั้นตอนโดยไม่มีการควบคุมดูแลของ Fable 5 ได้รับการแสดงออกอย่างเต็มที่ และโหมด agent เซสชันเดียวมาตรฐานจะไม่แสดงพฤติกรรมระยะยาวแบบเดียวกัน

Share

บทความเพิ่มเติมจากบล็อก

อ่านต่อ

GGUF, GPTQ, AWQ, EXL2 quantization formats compared: how model weights, runtime overhead, and KV cache stack up in memory
AI และ Machine Learning

GGUF, GPTQ, AWQ, EXL2: รูปแบบการควอนไทซ์ LLM ใช้หน่วยความจำจริงๆ อย่างไร

เปรียบเทียบการใช้หน่วยความจำของ GGUF, GPTQ, AWQ และ EXL2 ตั้งแต่ขนาดไฟล์ Q4_K_M ไปจนถึงการเติบโตของ KV cache และโอเวอร์เฮดของรันไทม์

Brian 12 นาทีในการอ่าน
Unified memory explained: discrete GPU memory requires a copy across PCIe between system RAM and VRAM, while unified memory is one shared pool the CPU and GPU both access directly
AI และ Machine Learning

หน่วยความจำรวม (Unified Memory) คืออะไร และทำไมมันถึงทำให้มินิพีซีรันโมเดล 235B ได้?

หน่วยความจำรวมทำให้พีซี AI ขนาดกะทัดรัดโหลดโมเดลระดับ 235B ที่ GPU 24-32GB เพียงตัวเดียวไม่สามารถรองรับได้ มันคืออะไร ทำไมถึงใช้ได้ผล และทำไมใหญ่กว่าไม่ได้แปลว่าเร็วกว่า

Brian 11 นาทีในการอ่าน
AMD trillion-parameter mini PC cluster: four Framework Desktop nodes with Ryzen AI Max+ 395 and unified memory cabled together, running Kimi K2.5 for local inference
AI และ Machine Learning

AMD สร้างซูเปอร์คอมพิวเตอร์ AI ล้านล้านพารามิเตอร์จากมินิพีซี

AMD รันโมเดลขนาด 1 ล้านล้านพารามิเตอร์บนมินิพีซีสี่เครื่อง เรื่องจริงคือกลลวงทางสถาปัตยกรรมที่ทำให้มันเป็นจริง และการรอ 40 วินาทีถึง 4 นาทีที่สเปคชีตข้ามไป

Steve 11 นาทีในการอ่าน

พร้อมติดตั้งหรือยัง? เริ่มต้น $2.48/เดือน

คลาวด์อิสระ ตั้งแต่ปี 2008 AMD EPYC, NVMe, 40 Gbps คืนเงินภายใน 14 วัน