ตระกูล Claude 4.5 ของ Anthropic (โดยเฉพาะ Sonnet 4.5 และ Opus 4.5) นำเสนอกลไก “การคิด” แบบขยาย/เหตุผลภายในสไตล์สมุดบันทึก (scratchpad) มาสู่สายผลิตภัณฑ์ Claude 4 โดย Messages API เปิดเผยความสามารถนี้ผ่านวัตถุ thinking (เปิด/ปิด + การจัดสรร budget_tokens), ตัวเลือกการสตรีม และการจัดการพิเศษสำหรับบล็อกเนื้อหา “thinking” (รวมถึงลายเซ็นและการปกปิดข้อมูล) Sonnet 4.5 มุ่งเป้าสำหรับงานโค้ดและงานแบบตัวแทน (agentic) และได้ประโยชน์อย่างมากจากการคิดแบบขยาย; Opus 4.5 เพิ่มบล็อกการคิดที่เก็บรักษาไว้และการปรับแต่งอื่นๆ
Claude 4.5 คืออะไร?
Claude 4.5 (เผยแพร่ในตระกูลโมเดล Claude ของ Anthropic เป็นรุ่น Sonnet 4.5 และ Opus 4.5) คือเจเนอเรชันล่าสุดของโมเดลภาษาขนาดใหญ่ของบริษัทที่ปรับจูนเพื่อการให้เหตุผลที่ลึกขึ้น บริบทระยะยาว และการโค้ด/เวิร์กโฟลว์แบบตัวแทนระดับพร้อมใช้งานจริง ตามประกาศและหน้าโปรดักต์ของ Anthropic, Sonnet 4.5 ถูกอธิบายว่าเป็นก้าวกระโดดสำคัญสำหรับการโค้ด การสร้างเอเจนต์ และ “การใช้คอมพิวเตอร์” (เช่น เวิร์กโฟลว์ที่ใช้เครื่องมือช่วยและระบบอัตโนมัติหลายขั้น) โดยมีพัฒนาการที่วัดผลได้ในเรื่องการให้เหตุผล คณิตศาสตร์ และงานบริบทยาว
ไลน์อัพตระกูล 4.5
- Claude Sonnet 4.5 (เปิดตัว 29 ก.ย. 2025): “ม้าใช้งานหนัก” ของตระกูล ปัจจุบันได้รับการจัดอันดับว่าเป็นโมเดลโค้ดที่ดีที่สุดของโลก สามารถโฟกัสกับงานอัตโนมัติได้ยาวนานกว่า 30 ชั่วโมง สมดุลระหว่างความเร็ว ต้นทุน และการให้เหตุผลระดับสูง ทำให้เป็นตัวเลือกค่าเริ่มต้นสำหรับแอปองค์กรส่วนใหญ่
- Claude Haiku 4.5 (เปิดตัว 15 ต.ค. 2025): โมเดลที่ปรับเพื่อความเร็ว น่าประหลาดใจที่ตอนนี้รองรับ Extended Thinking กลายเป็นโมเดล “ขนาดเล็ก” ตัวแรกที่มีความสามารถการให้เหตุผลเชิงลึกซึ่งก่อนหน้านี้จำกัดอยู่กับโมเดลระดับแนวหน้า เหมาะสำหรับงานความถี่สูงที่สำคัญต่อเวลาแฝง แต่ไม่อาจแลกด้วยความแม่นยำ
- Claude Opus 4.5 (เปิดตัว 24 พ.ย. 2025): โมเดลอัจฉริยะระดับแนวหน้า Opus 4.5 ถูกออกแบบมาสำหรับงานที่ซับซ้อนและคลุมเครือที่สุด—เช่น งานวิจัยวิทยาศาสตร์ การออกแบบสถาปัตยกรรมใหม่ และการวิเคราะห์การเงินที่มีความเสี่ยงสูง มีความจุ “งบประมาณการคิด” สูงสุดและโดดเด่นด้านการแก้ไขตัวเอง
ความสามารถหลักโดยสรุป
- หน้าต่างบริบทที่ใช้งานได้ใหญ่ขึ้นและพฤติกรรมที่ดีขึ้นในงานระยะยาว (เวิร์กโฟลว์เอเจนต์ การดีบักทีละขั้น การแก้ไขโค้ดเบส)
- ประสิทธิภาพที่ดีขึ้นบนเบนช์มาร์กด้านการโค้ด การรีแฟกเตอร์ และงานใช้เครื่องมือหลายขั้น (ตระกูล Sonnet และ Opus)
- ฟีเจอร์ “การคิด” ขั้นสูง (ที่ Anthropic เรียกว่า extended thinking / thinking mode) ที่เปิดเผย—แบบเลือกได้—ส่วนหนึ่งของเหตุผลทีละขั้นของโมเดลแก่ผู้พัฒนา หรืออนุญาตให้โมเดลใช้ “งบประมาณ” โทเค็นในการคิดก่อนจะให้คำตอบสุดท้าย
ใช้งาน Claude 4.5 ได้ที่ไหน
Claude 4.5 (Sonnet/Opus) ให้บริการผ่าน API ของ Anthropic และถูกรวมเข้ากับ CometAPI (ราคา API กำลังจัดโปรโมชั่น ประมาณ 20% ของราคาของ Anthropic) ดังนั้นคุณสามารถใช้งานโมเดลเหล่านี้ผ่านแพลตฟอร์มของ Anthropic หรือผ่านผู้ให้บริการคลาวด์บุคคลที่สามที่โฮสต์โมเดล
โหมด THINKING ใหม่ใน Claude Code และ Claude 4.5 คืออะไร?
ฟีเจอร์ extended thinking (หรือ “thinking mode,” “thinking blocks,” หรือ “thinking tokens”) ของ Anthropic ช่วยให้โมเดลทำขั้นตอนการสุ่มตัวอย่างภายในเพิ่มเติมเพื่อไตร่ตรองอย่างถี่ถ้วนก่อนให้คำตอบสุดท้าย คุณเปิดใช้งานได้ด้วยการเพิ่มการกำหนดค่า thinking ลงในคำขอ Messages API ของคุณ (ตัวอย่าง: { "thinking": { "type": "enabled", "budget_tokens": 4096 } }) หรือใช้ตัวช่วยใน Anthropic SDK เมื่อเปิดใช้งาน API จะ (ขึ้นกับรุ่นโมเดล) ส่งคืนเหตุผลภายในในรูปแบบสรุป หรือส่งคืนเหตุผลฉบับเต็ม (อาจมีการปกปิดเพื่อความปลอดภัย)
เพื่อเข้าใจว่าทำไม “Thinking Mode” จึงปฏิวัติวงการ เราต้องมองกลับไปที่วิธีการทำงานของโมเดลภาษาขนาดใหญ่ (LLMs) แบบดั้งเดิม โมเดลมาตรฐานคือ “ตัวสร้างข้อความแบบความน่าจะเป็น” — คาดการณ์โทเค็นถัดไปทันทีหลังได้รับพรอมป์ต พวกมันไม่ “หยุดคิด”; มันเริ่ม “พูด” (สร้างข้อความ) ทันที
การเปลี่ยนสู่ “Extended Thinking”
Thinking Mode เปลี่ยนกระบวนทัศน์นี้ เมื่อเปิดใช้งาน Claude 4.5 จะสร้างสตรีมที่ซ่อนอยู่ของ “thinking tokens” ก่อนที่จะแสดงอักขระที่ผู้ใช้มองเห็นแม้แต่ตัวเดียว
การให้เหตุผลที่มองเห็นได้ (ตัวเลือก): ในบางอินเทอร์เฟซ เช่น Claude.ai คุณสามารถเห็นเมนูแบบดรอปดาวน์ “Thinking” ที่แสดงกระบวนการคิดภายในของโมเดล
การให้เหตุผลที่ถูกซ่อน (API): ใน API สิ่งเหล่านี้เป็น thinking blocks ที่แยกจากกัน โมเดลใช้พื้นที่นี้เพื่อ:
- แยกย่อยพรอมป์ต: แตกข้อกำหนดที่ซับซ้อน
- วางแผนกลยุทธ์: ร่างตรรกะทีละขั้น
- ร่างและวิจารณ์: ลองคำตอบในใจ ค้นหาข้อบกพร่อง แล้วแก้ไขก่อนจะนำเสนอบทสรุป
การคิดแบบสลับ (Interleaved Thinking)
นวัตกรรมสำคัญใน Sonnet 4.5 คือ Interleaved Thinking ในเวิร์กโฟลว์แบบเอเจนต์ (ที่ AI ใช้เครื่องมือ เช่น เครื่องคิดเลข อินเทอร์พรีเตอร์โค้ด หรือเว็บบราวเซอร์) โมเดลมาตรฐานจะเรียกใช้เครื่องมือ รับผลลัพธ์ แล้วเรียกเครื่องมือต่อไปทันที
ด้วย Interleaved Thinking, Claude 4.5 สามารถ:
- คิด เกี่ยวกับคำขอของผู้ใช้
- เรียกใช้เครื่องมือ A (เช่น ค้นหาเว็บ)
- คิด เกี่ยวกับผลการค้นหา (“ผลนี้ล้าสมัย ควรลองคำค้นหาแบบอื่น”)
- เรียกใช้เครื่องมือ B (เช่น ค้นหาอีกครั้ง)
- คิด ว่าจะสังเคราะห์ข้อมูลอย่างไร
- คำตอบสุดท้าย
ลูป “คิด-กระทำ-คิด-กระทำ” นี้ช่วยลดอาการเพ้อและการสะสมข้อผิดพลาดในงานโค้ดยาวหลายขั้นได้อย่างมาก
Claude Code เปิดเผยการคิดในเครื่องมือสำหรับนักพัฒนาอย่างไร
ใน Claude Code (ประสบการณ์ CLI/เอดิเตอร์) Anthropic ได้เพิ่มองค์ประกอบ UI เพื่อสลับโหมดการคิดสำหรับเซสชันโต้ตอบ (รูปแบบ UX ที่พบได้บ่อยคือกด Tab เพื่อสลับการคิดเปิด/ปิด) และแสดงตัวชี้วัดงบประมาณการคิด ตัวคีย์เวิร์ดเก่า (เช่น think, think hard) เคยถูกใช้เพื่อควบคุมความลึกของการคิด; เวอร์ชันสมัยใหม่อาศัยตัวสลับและพารามิเตอร์งบประมาณโดยตรง โดย ultrathink ยังคงมีอยู่ในบางบริบท การกำหนดค่าอาจเป็นแบบโกลบอลใน ~/.claude/settings.json หรือ override ต่อคำขอ
จะใช้งาน Thinking Mode ของ Claude 4.5 อย่างไร?
สำหรับนักพัฒนา การเปลี่ยนไปใช้ Claude 4.5 ต้องปรับวิธีจัดโครงสร้างคำขอ API คุณไม่ได้แค่ส่งพรอมป์ตอีกต่อไป แต่กำลังบริหาร “งบประมาณการคิด”
การตั้งค่า Thinking Budget
พารามิเตอร์ thinking กลายเป็นองค์ประกอบขั้นแรกใน API ของ Anthropic คุณต้องเปิดใช้งานอย่างชัดเจนและกำหนดค่า budget_tokens ค่านี้คือตัวแทนจำนวนคอมพิวต์สูงสุดที่โมเดลสามารถใช้กับเหตุผลภายในของมัน
ตัวอย่างการใช้งานด้วย Python
import anthropic
# Initialize the Gemini Enterprise perspective on Claude 4.5 integration
client = anthropic.Anthropic(api_key="your_api_key")
def get_reasoned_response(user_query):
# We set a high max_tokens to accommodate both thinking and the final answer
# The budget_tokens must be less than max_tokens
response = client.messages.create(
model="claude-4-5-sonnet-202512",
max_tokens=20000,
thinking={
"type": "enabled",
"budget_tokens": 12000 # Allocating 12k tokens for 'thinking'
},
messages=[
{"role": "user", "content": user_query}
]
)
# Extracting the two distinct parts of the response
thinking_content = ""
final_output = ""
for block in response.content:
if block.type == "thinking":
thinking_content = block.thinking
elif block.type == "text":
final_output = block.text
return thinking_content, final_output
# Example complex query
query = "Design a zero-knowledge proof system for a decentralized voting app using Circom."
thoughts, answer = get_reasoned_response(query)
print("--- CLAUDE'S INTERNAL REASONING ---")
print(thoughts)
print("\n--- FINAL TECHNICAL ARCHITECTURE ---")
print(answer)
ประเด็นทางเทคนิคสำคัญ
- การใช้โทเค็นรวม: การใช้งานรวมของคุณคือ
thinking_tokens+output_tokensหากคุณตั้งงบประมาณไว้ 10,000 โทเค็น และโมเดลใช้ 8,000 สำหรับการคิดและ 2,000 สำหรับคำตอบ คุณจะถูกคิดค่าบริการรวม 10,000 โทเค็นเอาต์พุต - การบังคับให้คิด: หากงานง่ายเกินไป โมเดลอาจยังใช้โทเค็นการคิดขั้นต่ำจำนวนหนึ่งเพื่อตรวจสอบความง่ายของคำขอ
Thinking Mode ช่วยพัฒนาการสร้างโค้ดอย่างไร?
หนึ่งในการอัปเกรดสำคัญใน Claude 4.5 คือประสิทธิภาพใน Claude Code CLI เมื่อ Claude 4.5 “คิด” เกี่ยวกับโค้ด มันจะทำหลายการกระทำที่ซ่อนอยู่ซึ่งโมเดลมาตรฐานมองข้าม
1. การทำแผนที่การพึ่งพา (Dependency Mapping)
ก่อนจะเขียนบรรทัดแก้ไขแรก Claude 4.5 จะไล่ดูรีโพของคุณเพื่อเข้าใจว่าการเปลี่ยนใน utils/auth.ts อาจทำให้คอมโพเนนต์ใน views/Profile.tsx พังได้อย่างไร
2. การรันในใจ (Mental Execution)
โมเดล “รัน” โค้ดในบล็อกเหตุผลของมัน จำลองการไหลของตรรกะและระบุเงื่อนไขแข่ง (race conditions) หรือข้อผิดพลาด off-by-one ที่อาจเกิดขึ้น
3. การตรวจสอบข้อจำกัด
หากคุณขอวิธีแก้ที่ “มีประสิทธิภาพและไม่ใช้ไลบรารีภายนอก” โหมดคิดจะทำหน้าที่เป็นด่านตรวจ หากสัญชาตญาณแรกของโมเดลคือแนะนำแพ็กเกจ NPM กระบวนการคิดจะจับการละเมิดนั้นและบังคับให้โมเดลทบทวนแนวทางเป็น JavaScript ล้วน
Thinking Mode เทียบกับการพรมต์แบบดั้งเดิมอย่างไร?
หลายคนคุ้นเคยกับการพรมต์แบบ “Chain of Thought” (CoT) ที่คุณบอกโมเดลว่า “คิดทีละขั้น” แม้จะได้ผล แต่ไม่เหมือนกับ Thinking Mode แบบเนทีฟของ Claude 4.5
| คุณลักษณะ | Chain of Thought (กำกับด้วยผู้ใช้) | Extended Thinking (แบบเนทีฟ) |
|---|---|---|
| กลไก | คำสั่งที่ผู้ใช้พรมต์ | ฝังอยู่ในสถาปัตยกรรมของโมเดล |
| พื้นที่โทเค็น | ใช้พื้นที่เอาต์พุตที่มองเห็นได้ | ใช้บล็อกภายในเฉพาะ |
| การแก้ไขตนเอง | จำกัด; มัก “ยืนยัน” ความผิดพลาดตั้งแต่ต้น | สูง; สามารถทิ้งเส้นทางเหตุผลทั้งชุดและเริ่มใหม่ได้ |
| ความเชื่อถือได้ | แปรผันตามคุณภาพพรมต์ | สม่ำเสมอสูงในโดเมนที่ซับซ้อน |
| การจัดการ API | ต้องพาร์สข้อความด้วยตนเอง | บล็อก JSON แบบมีโครงสร้างสำหรับ "thinking" และ "text" |
Thinking mode ทำงานอย่างไรใน Claude 4.5?
เวิร์กโฟลว์ภายใน (แนวคิด)
- คำขอของผู้ใช้: แอปของคุณส่งคำขอ Messages API โดยระบุรุ่นโมเดล พรอมป์ต
max_tokensและอาจมีthinking: { type: "enabled", budget_tokens: N } - การให้เหตุผลภายใน: Claude ทำ “การคิด” ภายในตามงบประมาณ มันบันทึกผลเหตุผลเป็น
thinkingblocks (ซึ่งอาจถูกรวมสรุปให้ผู้ใช้) - การประกอบผลลัพธ์: API ส่งคืนอาร์เรย์ของบล็อกเนื้อหา โดยลำดับทั่วไปคือ
thinkingblock(s) แล้วจึงtextblock(s) (คำตอบสุดท้าย) หากสตรีมมิง คุณจะได้รับอีเวนต์thinking_deltaตามด้วยtext_delta - การอนุรักษ์บริบท: เมื่อใช้เครื่องมือหรือโฟลว์หลายเทิร์น คุณอาจส่งซ้ำบล็อกการคิดก่อนหน้า (แบบไม่แก้ไข) เพื่อให้ Claude ดำเนินสายโซ่ความคิดต่อไป Opus 4.5 ได้แนะนำพฤติกรรมในการเก็บรักษาบล็อกการคิดโดยค่าเริ่มต้นเพื่อประโยชน์ด้านแคช/ประสิทธิภาพ
ในเชิงเทคนิค Thinking Mode อาศัยการกำหนดค่าพารามิเตอร์ API เฉพาะที่จัดสรร “งบประมาณ” โทเค็นสำหรับเหตุผล
แนวคิดเรื่องงบประมาณโทเค็น
เมื่อคุณทำคำขอไปยัง Claude 4.5 คุณต้องระบุพารามิเตอร์ budget_tokens นี่คือจำนวนโทเค็นสูงสุดที่โมเดลได้รับอนุญาตให้ใช้กับการพูดคุยภายใน
- งบประมาณต่ำ (<2,000 โทเค็น): เหมาะสำหรับการตรวจสอบคร่าวๆ หรือปริศนาตรรกะง่ายๆ
- งบประมาณสูง (10,000+ โทเค็น): จำเป็นสำหรับสถาปัตยกรรมซอฟต์แวร์ที่ซับซ้อน บทพิสูจน์ทางคณิตศาสตร์ หรือการร่างเอกสารกฎหมายอย่างครอบคลุม
โมเดลได้รับการฝึกให้ “บริหาร” งบประมาณนี้ หากตรวจพบว่าใกล้ใช้งบหมด มันจะพยายามสรุปเหตุผลและให้คำตอบที่ดีที่สุดเท่าที่ทำได้
วงจรกระบวนการ “Thinking”
เมื่อผู้ใช้ถาม: “เขียนสคริปต์ Python เพื่อสแกปเว็บไซต์นี้ แต่ต้องเคารพ robots.txt และรองรับการโหลดแบบไดนามิก”
- รับเข้า: Claude อ่านพรอมป์ต
- ช่วงคิด (ซ่อน):
- การแก้ไขตนเอง: “ฉันต้องใช้ Selenium หรือ Playwright สำหรับการโหลดแบบไดนามิก
requestsไม่เวิร์ก” - การตรวจสอบความปลอดภัย: “ต้องยืนยันว่าผู้ใช้มีสิทธิ์สแกป จะใส่คำเตือน”
- สถาปัตยกรรม: “จะจัดโครงสร้างโค้ดแบบคลาสเพื่อความเป็นโมดูลาร์”
- การแก้ไขตนเอง: “ฉันต้องใช้ Selenium หรือ Playwright สำหรับการโหลดแบบไดนามิก
- ช่วงเอาต์พุต (มองเห็น): Claude สร้างโค้ด Python
ในโมเดลก่อนหน้า AI อาจเริ่มเขียนโค้ดด้วย requests ทันที แล้วค่อยรู้ครึ่งทางว่าไม่รองรับคอนเทนต์ไดนามิก และอาจเพ้อหรือส่งโค้ดที่พังได้ Thinking mode ป้องกันสถานการณ์ “จนมุม” นี้
ควรเปิดใช้งาน thinking mode เมื่อใด — กรณีใช้งานและฮิวริสติก?
กรณีใช้งานที่ได้ประโยชน์มากที่สุด
- การโค้ดซับซ้อน (การเปลี่ยนสถาปัตยกรรม การรีแฟกเตอร์หลายไฟล์ เซสชันดีบักยาว) Sonnet 4.5 ถูกวางตำแหน่งอย่างชัดเจนว่าเป็นผู้นำด้านการโค้ดและเอเจนต์เมื่อเปิดใช้การคิด
- เวิร์กโฟลว์แบบตัวแทน ที่ใช้เครื่องมือซ้ำๆ และต้องเก็บบริบทภายในไว้ตลอดหลายขั้น การคิดแบบสลับ + การใช้เครื่องมือคือสถานการณ์หลัก
- การวิจัยหรือการวิเคราะห์เชิงลึก (การวิเคราะห์สถิติ การจัดโครงสร้างการเงิน การให้เหตุผลทางกฎหมาย) ที่ขั้นตอนเหตุผลระหว่างทางมีคุณค่าในการตรวจสอบหรือยืนยัน
เมื่อใดไม่ควรเปิด
- การสร้างคำตอบสั้นหรือ API แบบ throughput สูงที่ต้องการเวลาแฝงต่ำมาก (เช่น UI แชตที่ต้องการการตอบสนองระดับมิลลิวินาที)
- งานที่ต้องลดต้นทุนโทเค็นต่อคำขอให้ต่ำที่สุดและงานมีข้อกำหนดที่เรียบง่ายหรือชัดเจน
ฮิวริสติกเชิงปฏิบัติ
เริ่มจาก งบประมาณการคิดขั้นต่ำ (≈ 1,024 โทเค็น) แล้วค่อยเพิ่มสำหรับงานที่ต้องการความลึกมากขึ้น; วัดความแม่นยำของงานแบบ end-to-end เทียบกับเวลาแฝงและจำนวนโทเค็น สำหรับงานเอเจนต์หลายขั้น ลองใช้การคิดแบบสลับและจุดแคชในพรอมป์ตเพื่อหาจุดลงตัว
สรุป
Thinking Mode ของ Claude 4.5 ไม่ได้เป็นเพียงฟีเจอร์ แต่เป็นวิธีใหม่ในการโต้ตอบกับปัญญาประดิษฐ์ โดยแยก “กระบวนการคิด” ออกจาก “ผลผลิตของความคิด” Anthropic มอบเครื่องมือที่น่าเชื่อถือ โปร่งใส และสามารถจัดการความซับซ้อนของงานองค์กรสมัยใหม่ได้ดีขึ้น
ไม่ว่าคุณจะใช้ Claude Code CLI เพื่อดูแลงานไมเกรชันขนาดมหึมา หรือใช้ API เพื่อสร้างเอเจนต์อัตโนมัติยุคถัดไป การเชี่ยวชาญ “งบประมาณการคิด” คือกุญแจสู่ความสำเร็จ
นักพัฒนาสามารถเข้าถึงโมเดล Claude 4.5 ได้ผ่าน CometAPI เริ่มต้นด้วยการสำรวจความสามารถของโมเดลบน CometAPI ใน Playground และดูคู่มือ API เพื่อรับคำแนะนำโดยละเอียด ก่อนเข้าถึง โปรดตรวจสอบให้แน่ใจว่าคุณได้เข้าสู่ระบบ CometAPI และได้รับกุญแจ API แล้ว CometAPI มีราคาต่ำกว่าราคาอย่างเป็นทางการอย่างมากเพื่อช่วยให้คุณบูรณาการได้สะดวก
พร้อมเริ่มหรือยัง?→ ทดลองใช้ฟรี Claude 4.5!
