"Thinking mode" (เรียกอีกอย่างว่า extended thinking, thinking หรือ thinking blocks) ใน Claude 4.5 เป็นโหมดการทำงานแบบชัดเจนและปรับแต่งได้ ที่สั่งให้โมเดลใช้โทเค็นงบประมาณแยกต่างหากเพื่อสร้างการให้เหตุผลภายในแบบทีละขั้นตอน (“chain-of-thought”) ก่อนส่งคำตอบสุดท้าย โหมดนี้ถูกออกแบบมาเพื่อยกระดับประสิทธิภาพในงานให้เหตุผลหลายขั้นตอน งานโค้ดที่ซับซ้อนและเวิร์กโฟลว์เชิงเอเจนต์ ตลอดจนงานวิจัย ด้วยการแลกเวลาแฝงและค่าโทเค็นกับการไตร่ตรองภายในที่ลึกขึ้น Claude 4.5 เปิดเผยความสามารถนี้ในระดับ Messages API ผ่านพารามิเตอร์แบบชัดเจน (เช่น thinking / budget_tokens หรือเฮดเดอร์ effort/“interleaved-thinking”) รักษาและเลือกที่จะเข้ารหัส thinking blocks เพื่อใช้ตรวจสอบภายหลังหรือใช้กับเครื่องมือ และแนะนำพฤติกรรมด้านแคชและการคำนวณโทเค็นที่คุณต้องจัดการเมื่อสร้างเวิร์กโหลดระดับ production
Claude 4.5 คืออะไร? (และควรสนใจโมเดลใดบ้าง?)
Claude 4.5 คือชุดโมเดล Claude รุ่นล่าสุดของ Anthropic ที่ออกมาเป็นอัปเดตแบบเพิ่มระดับ “4.5” (เช่น Sonnet 4.5 และ Opus 4.5) Sonnet 4.5 ถูกวางตำแหน่งให้เป็นสมดุลที่ดีที่สุดระหว่างความฉลาด ความสามารถด้านโค้ด และประสิทธิภาพเชิงเอเจนต์สำหรับนักพัฒนาส่วนใหญ่ ส่วน Opus 4.5 มุ่งเน้นการให้เหตุผลระดับทุ่มเทสูงมาก และคงรักษา thinking blocks เพื่อเพิ่มความต่อเนื่องข้ามหลายเทิร์น ทั้งสองโมเดลรองรับความสามารถ extended thinking ของ Claude แม้พฤติกรรมบางอย่าง (เช่น การสรุป vs แสดงคิดเต็ม) จะต่างกันตามโมเดล
ความก้าวหน้าด้านประสิทธิภาพใน Claude 4.5 โดยเฉพาะใน Sonnet 4.5 เห็นชัดที่สุดในเบนช์มาร์ก SWE-bench Verified ซึ่งวัดความสามารถของ AI ในการแก้ปัญหา GitHub issues โลกจริง
| โมเดล | คะแนน SWE-bench Verified | OSWorld (การใช้งานคอมพิวเตอร์) |
|---|---|---|
| Claude 3.5 Sonnet | 49.0% | 42.2% |
| Claude 4.1 Opus | 67.6% | 55.0% |
| Claude 4.5 Sonnet (Thinking On) | 77.2% | 61.4% |
| GPT-5 (Medium Reasoning) | 65.0% | 52.0% |
ตัวเลขเหล่านี้บ่งชี้ว่า Claude 4.5 ไม่ได้เก่งแค่การเขียนสคริปต์สั้นๆ เท่านั้น แต่ยังมีความสามารถอย่างมีนัยสำคัญในการนำทางทั้งระบบไฟล์และดำเนินงานอัตโนมัติได้โดยไม่ต้องมีมนุษย์แทรกแซง
ทำไมเรื่องนี้จึงสำคัญ
- การเขียนโค้ดและเอเจนต์: Sonnet 4.5 แสดงผลลัพธ์ที่แข็งแกร่งในงานซอฟต์แวร์โลกจริงและงานโค้ดระยะยาว ทำให้เหมาะอย่างยิ่งสำหรับการสร้างโค้ด การแก้ไขโค้ด และโฟลว์เอเจนต์อัตโนมัติ
- Extended thinking และบริบท: โมเดลตระกูล Claude 4.5 ถูกสร้างมาเพื่อให้เหตุผลด้วย scratchpad ภายในขนาดใหญ่ (ระดับหลายหมื่นโทเค็นหรือมากกว่า) ทำให้เกิดการให้เหตุผลหลายขั้นตอนที่ลึกขึ้น ซึ่งเปลี่ยนวิธีที่คุณออกแบบพรอมป์ งบประมาณโทเค็น และปฏิสัมพันธ์กับเครื่องมือ
Thinking Mode ใน Claude 4.5 คืออะไร?
Thinking Mode (เรียกอย่างเป็นทางการว่า "Extended Thinking") เป็นความสามารถที่ทำให้โมเดล “แสดงวิธีคิด” ต่อหน้าตัวเองก่อนจะให้เอาต์พุตสุดท้าย แตกต่างจากโมเดลมาตรฐานที่รีบให้คำตอบทันที Claude 4.5 ใช้พื้นที่ให้เหตุผลเฉพาะเพื่อสำรวจสมมติฐานหลายทาง ระบุข้อผิดพลาดที่อาจเกิดในตรรกะ และปรับยุทธศาสตร์ให้ดีขึ้น
โครงสร้างของการตอบกลับ
ในการโต้ตอบแบบปกติ โมเดลจะรับพรอมป์แล้วเริ่มสร้างคำตอบ ใน Thinking Mode การตอบกลับจะแบ่งเป็นสองบล็อกที่แตกต่างกัน:
| ประเภทบล็อก | การมองเห็น | วัตถุประสงค์ |
|---|---|---|
| Thinking Block | ซ่อน (ผ่าน API) หรือย่อ (ใน UI) | บันทึกความคิดภายใน การวางแผน และการวิพากษ์ตนเองของโมเดล |
| Text Block | มองเห็นได้ | คำตอบสุดท้ายที่ผ่านการกลั่นกรองเพื่อผู้ใช้ |
คุณสมบัติสำคัญของ Thinking Mode
- เปิดใช้งานตามคำขอ: ส่งอ็อบเจ็กต์
thinkingในการเรียก API เช่น{"type":"enabled","budget_tokens":10000}เพื่อเปิดใช้งานและกำหนดงบโทเค็นภายในสำหรับการให้เหตุผล - การตั้งงบ:
budget_tokensกำหนดขีดจำกัดโทเค็นที่ใช้ให้เหตุผลภายใน งบยิ่งมาก => ศักยภาพการให้เหตุผลยิ่งลึก แต่มีค่าใช้จ่ายและเวลาแฝงสูงขึ้น ในโมเดล Claude 4 โทเค็นที่ใช้สำหรับ thinking จะถูกคิดค่าบริการแม้ว่าคุณจะได้รับเพียงมุมมองแบบสรุปก็ตาม - การสรุปและการปกปิด: สำหรับโมเดล Claude 4 หลายรุ่น ผู้ใช้จะเห็นเวอร์ชันสรุปของเนื้อหา thinking; การให้เหตุผลภายในบางส่วนอาจถูกปกปิด (เข้ารหัส) และส่งกลับมาเป็น
redacted_thinking - ลายเซ็นและการตรวจสอบ: Thinking blocks จะมี
signatureที่ใช้ยืนยันความถูกต้องเมื่อส่ง thinking blocks กลับไปยัง API (โดยเฉพาะเมื่อใช้เครื่องมือ) ควรปฏิบัติต่อ signature นี้เป็นข้อมูลทึบ—อย่าพยายามแยกวิเคราะห์ - Interleaved thinking กับเครื่องมือ: Claude 4 รองรับการสอดแทรก thinking blocks สลับกับการเรียกใช้เครื่องมือ (อยู่ในสถานะเบต้าและต้องใช้แฟล็กในบางกรณี) ซึ่งทรงพลังมากสำหรับงานเชิงเอเจนต์ (เรียกเครื่องมือ คิด แล้วเรียกเครื่องมืออีกครั้ง เป็นต้น)
สำหรับตัวอย่างปฏิบัติและพารามิเตอร์ล่าสุด โปรดดูเอกสาร Messages/Extended Thinking ของ Anthropic ซึ่งเป็นแหล่งอ้างอิงหลัก
Messages API ส่งคืนเนื้อหา thinking อย่างไร
แบบสรุป vs แบบเต็ม; การเข้ารหัสและลายเซ็น
เวอร์ชันโมเดล Claude ต่างกันจะจัดการ thinking ต่างกัน: รุ่นใหม่กว่า (เช่น Sonnet/Opus 4.5) มักส่งคืนมุมมองสาธารณะของการให้เหตุผลแบบ “สรุป” ขณะที่ scratchpad ฉบับเต็มอาจถูกเข้ารหัสและเข้าถึงได้เฉพาะผ่านฟิลด์ signature (หรือบล็อกที่ถูกปกปิด) เมื่อมีการใช้เครื่องมือ (หรือคุณต้องการรักษาสถานะภายในข้ามการเรียกเครื่องมือ) คุณต้องส่ง thinking blocks กลับไปยัง API หรือใช้กลไก signature ตามที่เอกสารระบุ กลไกนี้ช่วยปกป้องการให้เหตุผลภายในที่อ่อนไหว พร้อมเปิดทางให้สานต่อกระบวนการคิดได้อย่างปลอดภัยเมื่อจำเป็น
รูปแบบการจัดการเชิงปฏิบัติ
การใช้เครื่องมือ/การสานต่อ: หากคำขอถัดไปต้องการสานต่อสถานะภายในเดิม (เช่น มีการรันเครื่องมือบนพื้นฐานของ thinking) ให้แนบ thinking block ที่ได้รับคืนหรือ signature เมื่อติดต่อ API อีกครั้ง เพื่อให้โมเดลถอดรหัสและดำเนินต่อจากจุดเดิม
คำขอ: ส่ง thinking: {type: "enabled", budget_tokens: N}
การตอบกลับ: คุณอาจได้รับ (a) เอาต์พุตสาธารณะฉบับสรุป, (b) signature ที่เข้ารหัสหรือ redacted_thinking, หรือ (c) ทั้งสองอย่าง
CometAPI ให้บริการ API ของ Claude 4.5 ในราคาประมาณ 20% ของราคาทางการ และยังสามารถเรียกใช้งานผ่าน Anthropic Messages ได้ คุณจำเป็นต้องขอรับคีย์ API ก่อนเริ่มต้น
ตัวอย่างที่ 1 — curl แบบง่าย (ไม่สตรีม) เปิดใช้งาน thinking
curl https://api.cometapi.com/v1/messages \
-H "x-api-key: $CometAPI_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "Content-Type: application/json" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {
"type": "enabled",
"budget_tokens": 10000
},
"messages": [
{"role": "user", "content": "Design a robust data validation strategy for CSV imports, show tests + code."}
]
}'
การตอบกลับจะมี content blocks ตรวจสอบแต่ละบล็อกและให้ความสำคัญกับบล็อก text สำหรับเอาต์พุตสุดท้าย; บล็อก thinking จะมีสรุปการวิเคราะห์ภายในของโมเดล
ตัวอย่างที่ 2 — Python: ส่งคำขอและแยกวิเคราะห์บล็อก thinking และ text
import os, requests
API_KEY = os.environ["CometAPI_API_KEY"]
URL = "https://api.cometapi.com/v1/messages"
HEADERS = {
"x-api-key": API_KEY,
"anthropic-version": "2023-06-01",
"content-type": "application/json"
}
payload = {
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"thinking": {"type": "enabled", "budget_tokens": 8000},
"messages": [{"role": "user", "content": "Explain how to do property-based testing in Python; include example code."}]
}
r = requests.post(URL, headers=HEADERS, json=payload)
r.raise_for_status()
resp = r.json()
# Parse blocks
for block in resp.get("content", []):
if block.get("type") == "thinking":
thinking_summary = block.get("thinking")
print("=== THINKING (summary) ===")
print(thinking_summary[:1000]) # truncate for logs
print("signature:", block.get("signature")[:64], "...")
elif block.get("type") == "text":
print("=== FINAL TEXT ===")
print(block.get("text"))
โค้ดนี้ดึงและพิมพ์ thinking แบบสรุปและคำตอบสุดท้าย หากต้องการคงความต่อเนื่องในโฟลว์เอเจนต์หลายเทิร์น ให้แนบ thinking blocks แบบไม่แก้ไขในคำขอถัดไปภายในอาร์เรย์ messages (ดูตัวอย่างถัดไป)
ตัวอย่างที่ 3 — นำ thinking blocks กลับมาใช้ในโฟลว์หลายเทิร์น (Python pseudo)
# After initial response (resp above):
# Add the assistant message including the thinking block back into the conversation
assistant_message = {
"role": "assistant",
"content": resp["content"] # include raw content array (contains thinking + text blocks)
}
# Next user turn: ask follow-up and include previous assistant message
payload2 = {
"model": "claude-opus-4-5", # Opus preserves thinking blocks better across turns
"max_tokens": 20000,
"thinking": {"type": "enabled", "budget_tokens": 12000},
"messages": [
{"role": "user", "content": "Now adapt the validation logic for an avro pipeline."},
assistant_message
]
}
r2 = requests.post(URL, headers=HEADERS, json=payload2)
การเก็บรักษา thinking blocks แบบเดิมทุกประการโดยไม่แก้ไขมีความสำคัญอย่างยิ่งเมื่อทำงานรวมเครื่องมือหรือเวิร์กโฟลว์เอเจนต์ระยะยาว Opus 4.5 มีค่าเริ่มต้นที่ดีขึ้นสำหรับการรักษา thinking blocks และการแคช
จะสตรีมเอาต์พุต thinking และแสดงความคืบหน้าใน UI ได้อย่างไร?
แนวทางปฏิบัติที่ดีสำหรับการสตรีม
- ใช้เอ็นด์พอยต์สตรีมของ SDK (SDK ภาษา Python/TypeScript มีตัวช่วยสำหรับสตรีม) สำหรับงานให้เหตุผลที่รันนานหรือมีงบประมาณสูง การสตรีมช่วยหลีกเลี่ยง HTTP timeout และให้คุณได้รับข้อความบางส่วนขณะโมเดลคำนวณ โค้ดทั่วไปจะใช้อิตเทอเรเตอร์เหนือ
text_stream(Python) หรือการพาร์เซอีเวนต์ (JS) - คาดหวังสตรีมสองเฟสในบางครั้ง: โมเดลอาจสร้างชิ้นส่วน reasoning ที่มองเห็นได้ก่อน จากนั้นจึงสรุปด้วยคำตอบสุดท้าย สร้าง UI ให้รองรับคอนเทนต์แบบ chunk และแยกสถานะ “กำลังคิด…” กับคำตอบสุดท้าย
- หาก API ส่งคืน
signature_deltaหรือcontent_block_deltaระหว่างสตรีม ให้บันทึกและแนบไปกับคำขอครั้งถัดไปตามสเปค
หากต้องการแสดงความคืบหน้าการให้เหตุผลแบบกลางคันใน UI ให้สตรีมการตอบกลับ เซิร์ฟเวอร์จะปล่อยอีเวนต์ thinking_delta ตามด้วย text_delta
curl https://api.cometapi.com/v1/messages \
--header "x-api-key: $CometAPI_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-4-5",
"max_tokens": 16000,
"stream": true,
"thinking": { "type": "enabled", "budget_tokens": 8000 },
"messages": [ { "role": "user", "content": "Walk me through debugging this failing unit test and propose fixes." } ]
}'
เมื่อสตรีม ให้จัดการอีเวนต์ content_block_start, content_block_delta (ซึ่งรวม thinking_delta และ text_delta) และ content_block_stop ตามลำดับ วิธีนี้ช่วยให้คุณแสดงการให้เหตุผลทีละขั้นของโมเดลแบบเรียลไทม์
Claude Code โต้ตอบกับ Thinking Mode อย่างไร (เทอร์มินัล + VS Code)
Claude Code คือเทอร์มินัลโค้ดแบบอินเทอร์แอคทีฟเชิงเอเจนต์ที่ผสาน Messages API และตัวเรียกใช้เครื่องมือ ประสบการณ์ใน CLI/IDE เปิดเผย thinking สองรูปแบบ:
- การตั้งค่าระดับทั่วระบบ/ต่อเซสชัน: Claude Code มีแผงตั้งค่า
/configสำหรับปรับพฤติกรรม (วิธีขอสิทธิ์จากผู้ใช้ ว่าจะเก็บรักษา thinking blocks หรือไม่ เป็นต้น) หากต้องการเปลี่ยนพฤติกรรมอย่างถาวร ให้ใช้ UI นี้แทนการพิมพ์ JSON ดิบซ้ำๆ - การเลือกโมเดลและคำสั่ง CLI: คุณสามารถเลือก
claude-sonnet-4-5หรือclaude-opus-4-5ให้เป็นโมเดลที่ใช้งานใน REPL; เครื่องมือและพฤติกรรมของ thinking จะเป็นไปตามสเปคของ Messages API ตามบันทึก CHANGELOG และ release notes ตอนนี้มีการเปิด thinking เป็นค่าเริ่มต้นสำหรับการดีพลอยบางแบบของ Opus 4.5 และมีตัวเลือกการตั้งค่า thinking ผ่าน/config
ขั้นตอนปฏิบัติใน Claude Code:
- เริ่มโปรเจกต์ใน REPL
- ใช้
/configเพื่อตรวจสอบแฟล็กที่เกี่ยวข้องกับ thinking (การเก็บรักษา ระดับความละเอียด เป็นต้น) - สั่งเอเจนต์ให้รันงานยาว—เอเจนต์จะสร้างเนื้อหา thinking และหากจำเป็น จะขออนุญาตรันคำสั่ง bash บางรายการ เก็บรักษา thinking blocks เมื่อคุณต้องการตรวจสอบหรือเรียกตัดสินใจเดิมซ้ำภายหลัง
การติดตั้งและตั้งค่า
# Install Claude Code CLI
npm install -g @anthropic/claude-code
# Authenticate
claude-code --init
การเปิดใช้งาน Thinking ในเทอร์มินัล
Claude Code รองรับแฟล็กและทริกเกอร์ภาษาธรรมชาติเพื่อควบคุมความลึกของการให้เหตุผล
| คำสั่ง/ทริกเกอร์ | คำอธิบาย |
|---|---|
| claude-code --think | เริ่มเซสชันโดยเปิดใช้งาน extended thinking เป็นค่าเริ่มต้น |
| claude-code --model sonnet-4.5 | ระบุให้ใช้โมเดลรุ่นล่าสุดระดับแนวหน้า |
| /think | คำสั่งสแลชภายใน CLI เพื่อเรียกงานที่ต้องใช้การคิดอย่างหนัก |
| "ultrathink" | คีย์เวิร์ดภาษาธรรมชาติที่สั่งให้ Claude ใช้งบประมาณการให้เหตุผลสูงสุดเท่าที่เป็นไปได้ |
เคล็ดลับ:
- ใช้ “think”/“think harder” เมื่อคุณต้องการให้เอเจนต์สำรวจทางเลือกการทำงานที่แตกต่างกัน
- เมื่อ Claude Code เรียกใช้เครื่องมือ (รันทดสอบ ทำงานกับ git) ให้เก็บรักษา
thinkingblocks หาก CLI/เอเจนต์ส่งกลับมา มิฉะนั้นเอเจนต์อาจสูญเสียบริบทระหว่างขั้นตอน
ประโยชน์ของ Interleaved Thinking และการเก็บรักษาบล็อก
Interleaved Thinking (เบต้า)
โดยปกติการให้เหตุผลจะเกิดขึ้นครั้งเดียวก่อนเอาต์พุต แต่ “Interleaved Thinking” (เปิดใช้งานผ่านเฮดเดอร์ interleaved-thinking-2025-05-14) อนุญาตให้ Claude “คิด” คั่นระหว่างการเรียกใช้เครื่องมือได้
ลองนึกภาพ Claude กำลังดีบักเซิร์ฟเวอร์:
- คิด: "ฉันควรตรวจสอบล็อกก่อน."
- เรียกเครื่องมือ:
read_file(logs.txt) - คิด: "ล็อกแสดงว่าเกิดการหมดเวลาเชื่อมต่อฐานข้อมูล ตอนนี้ต้องตรวจการตั้งค่า connection pool."
- เรียกเครื่องมือ:
read_file(db_config.yml)
การสะท้อนคิดต่อเนื่องแบบนี้ทำให้โมเดลปรับกลยุทธ์ตามข้อมูลที่ได้รับจากเครื่องมือ แทนที่จะยึดตามแผนที่ตายตัว
การเก็บรักษา Thinking Block
ในการสนทนาหลายเทิร์น โดยเฉพาะเมื่อมีการใช้เครื่องมือ จำเป็นอย่างยิ่งที่จะต้องส่ง thinking blocks ก่อนหน้าแนบกลับไปยัง API
- ความต่อเนื่องของการให้เหตุผล: เมื่อได้รับความคิดก่อนหน้า Claude จะคงบริบทเชิงตรรกะของกระบวนการไว้ได้
- การเพิ่มประสิทธิภาพใน Opus 4.5: ใน Claude Opus 4.5 พฤติกรรมนี้ถูกทำให้เป็นอัตโนมัติ โมเดลจะเก็บรักษา thinking blocks ก่อนหน้าทั้งหมดไว้ในบริบทโดยค่าเริ่มต้น ทำให้แม้ในเซสชันที่ยาวเกิน 30 ชั่วโมง โมเดลก็ไม่ “ลืม” ว่าทำไมจึงตัดสินใจเชิงสถาปัตยกรรมบางอย่างในสิบเทิร์นก่อนหน้า
แนวปฏิบัติที่ดีที่สุดสำหรับการใช้โหมด THINKING กับ Claude 4.5
เลือกโมเดลและงบประมาณให้เหมาะกับงาน:
ใช้ Sonnet 4.5 สำหรับงานโค้ดและเวิร์กโฟลว์เอเจนต์ที่ต้องการสมดุลของความเร็ว ต้นทุน และความสามารถด้านโค้ดที่แข็งแกร่ง; ใช้ Opus 4.5 สำหรับการให้เหตุผลเชิงลึกที่สุดและหน้าต่างบริบทที่ใหญ่ที่สุด หรือเมื่อวางแผนรันเซสชันอัตโนมัติยาว ทั้งสองรองรับ extended thinking เลือก budget_tokens ให้สัดส่วนกับความซับซ้อนของงาน (เริ่มจากน้อยเพื่อทดลอง; เพิ่มงบเฉพาะเมื่อเห็นการพัฒนาเชิงคุณภาพที่ชัดเจน)
เฝ้าดูและควบคุมต้นทุนและเวลาแฝง
คุณจะถูกคิดค่าบริการตามจำนวนโทเค็นที่ใช้สำหรับ thinking ทั้งหมด ไม่ใช่ตามความยาวของสรุปที่ได้รับ นั่นหมายความว่าการไตร่ตรองภายในที่ยาวขึ้นจะเพิ่มต้นทุน แม้ว่าคุณจะเห็นเพียงสรุปสั้นๆ ก็ตาม ติดตามการใช้โทเค็นและปรับแต่งแบบค่อยเป็นค่อยไป (เช่น 2k → 8k → 32k) เมื่อย้ายจากขั้นทดลองไปสู่ production
เก็บรักษา thinking blocks เฉพาะเมื่อจำเป็น
Thinking blocks สามารถลงลายเซ็นเชิงคริปโตและเก็บรักษาเพื่อการตรวจสอบภายหลังและใช้กับการทำงานสอดแทรกเครื่องมือได้ หลีกเลี่ยงการส่งซ้ำ thinking blocks ในทุกคำขอต่อไป เว้นแต่ว่าเวิร์กโฟลว์ของคุณต้องการให้โมเดลคงการไตร่ตรองก่อนหน้า (เช่น เมื่อเอเจนต์จะรันขั้นตอนเดิมอีกครั้งและต้องการเหตุผลที่เคยบันทึกไว้) การเก็บรักษาตลอดเวลาจะเพิ่มปริมาณบริบทและทำให้การคำนวณโทเค็นซับซ้อนขึ้น
ควรสตรีม thinking ให้ผู้ใช้เมื่อใด
การสตรีม thinking เหมาะมากสำหรับเครื่องมือสำหรับนักพัฒนาและ UI เชิงการศึกษา (แสดง “กำลังทำงาน” ระหว่างที่โมเดลไตร่ตรอง) ห้ามสตรีม thinking ดิบให้ผู้ใช้ปลายทางของแอประดับผู้บริโภคโดยไม่พิจารณาด้านความปลอดภัยและการปกปิด: การสรุป thinking ถูกออกแบบมาเพื่อสิ่งนี้โดยเฉพาะ หากสตรีม ให้จัดเตรียม UI ที่ระบุชัดว่าเป็นการให้เหตุผลภายใน (เช่น “Assistant reasoning — internal”) และควบคุมว่าผู้ใช้สุดท้ายจะเห็นแบบสรุปหรือเต็ม
การใช้เครื่องมือและการสอดแทรก
เมื่อผสาน thinking กับเครื่องมือ (รันโค้ด ดึงเว็บ กระบวนการท้องถิ่น) ให้ใช้ดีไซน์แบบ “interleaved thinking” เมื่อคุณต้องการให้โมเดลเลือกเครื่องมือ รัน แล้วให้เหตุผลจากผลลัพธ์ภายในเทิร์นเดียว การสอดแทรกเพิ่มความซับซ้อน (และอาจต้องใช้แฟล็กคุณลักษณะ) แต่ทรงพลังสำหรับระบบอัตโนมัติแบบเอเจนต์ ระบุให้ชัดว่าจะเก็บรักษา thinking ส่วนใด และทดสอบวิธีที่โมเดลเลือกเครื่องมือภายใต้การเปิดใช้งาน thinking
การแก้ปัญหาเชิงปฏิบัติและโน้ตเชิงปฏิบัติการ
ข้อผิดพลาดที่พบบ่อยและความหมาย
- การตั้งค่า thinking ไม่ถูกต้องร่วมกับการบังคับเลือกเครื่องมือ: หากคุณร้องขอ thinking แต่บังคับโหมดการใช้เครื่องมือที่ไม่เข้ากัน API จะส่งข้อผิดพลาดกลับมา—อย่าผสม
tool_choice: {"type":"tool","name":"..."}กับ thinking - งบประมาณ >
max_tokens: สำหรับสถานการณ์ interleaved thinking กฎโทเค็นที่มีผลอาจต่างออกไป—แพลตฟอร์มมีคำอธิบายว่าเมื่อใดbudget_tokensสามารถเกินmax_tokensได้ โปรดอ่านส่วน “interleaved thinking” ให้ถี่ถ้วนก่อนทดสอบงบประมาณขนาดใหญ่ - การตรวจสอบลายเซ็น: หากคุณเก็บ thinking blocks ไว้ใช้ในคำขอภายหลัง ให้รวม
signatureที่ส่งกลับมาด้วยเพื่อให้ API ตรวจสอบได้ว่ามาจาก Claude จริง ช่วยป้องกันการดัดแปลงและรักษาห่วงโซ่ที่ตรวจสอบได้
การสังเกตการณ์และการอินสทรูเมนต์
บันทึก: (1) การเลือก model, (2) ค่า thinking.budget_tokens, (3) ปริมาณโทเค็นที่ใช้สำหรับ thinking จริง (เป็นส่วนที่ถูกคิดค่าใช้จ่าย), (4) เวลาแฝงในการสตรีม (เวลาถึง thinking_delta ครั้งแรก), และ (5) โทเค็นของข้อความสุดท้าย ใช้มาตรวัดเหล่านี้เพื่อกำหนดงบประมาณและ SLO สำหรับโฟลว์ที่หันหน้าเข้าหาผู้ใช้
การปล่อยใช้งานแบบค่อยเป็นค่อยไปและการมีมนุษย์ร่วมวง
ปล่อยใช้โมเดลที่เปิด thinking หลังแฟล็กคุณลักษณะ เริ่มจากส่วนของทราฟฟิกนักพัฒนาหรือภายใน เก็บกรณีล้มเหลวหรือการปกปิด แล้วไล่ปรับพรอมป์และงบประมาณ สำหรับโดเมนที่อ่อนไหว ให้มีการตรวจทานโดยมนุษย์สำหรับเอาต์พุตที่มีการให้เหตุผลภายในจำนวนมากก่อนเผยแพร่
เคล็ดลับการดีบัก
- เริ่มจากเล็ก: เปิด
budget_tokensต่ำๆ แล้วค่อยขยายเพื่อทำความเข้าใจการพัฒนาทีละขั้น - เปิดการสตรีมและบันทึกอีเวนต์
content_block_delta/signature เพื่อเข้าใจว่าโมเดลผลิต thinking blocks เมื่อใด - หากใช้ Claude Code: ตรวจสอบ
/configและการตั้งค่าระดับโปรเจกต์; ดู changelog ของ Claude Code หากพฤติกรรมไม่ตรงกับค่าเริ่มต้นที่คาดหวัง
บทสรุป:
Claude 4.5 เมื่อผสานพลัง Extended Thinking และ Claude Code CLI ถือเป็นก้าวกระโดดด้านผลิตภาพนักพัฒนาที่สำคัญที่สุดนับตั้งแต่กำเนิด IDE การเปิดโอกาสให้โมเดล “แสดงวิธีคิด” และไตร่ตรองปัญหาซับซ้อน ทำให้ Anthropic ก้าวข้ามยุค “แช็ตบอต” สู่ “ยุคเอเจนต์”
ไม่ว่าคุณจะผสาน Messages API เข้ากับเครื่องมือสำหรับนักพัฒนาที่ปรับแต่งเอง หรือใช้ Claude Code จัดการ PR รายวัน การชำนาญ Thinking Mode เป็นสิ่งจำเป็น มันให้ทั้งความโปร่งใสที่สร้างความเชื่อมั่นและความลึกในการให้เหตุผลที่นำไปสู่ความเป็นเลิศ
นักพัฒนาสามารถเข้าถึงโมเดล Claude 4.5 (Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.5) ผ่าน CometAPI เพื่อเริ่มต้น สำรวจความสามารถของโมเดลบน CometAPI ใน Playground และดูคู่มือ API สำหรับคำแนะนำโดยละเอียด ก่อนใช้งาน โปรดตรวจสอบว่าคุณได้ล็อกอิน CometAPI และได้รับคีย์ API แล้ว CometAPI มีราคาที่ต่ำกว่าราคาทางการอย่างมากเพื่อช่วยคุณในการผสานระบบ
พร้อมเริ่มหรือยัง? → ทดลองใช้ฟรี Claude 4.5!
