OpenAI กำลังเปิดตัวผลิตภัณฑ์ใหม่หลายรายการ ได้แก่ Responses API เครื่องมือในตัวสำหรับการค้นหาเว็บและไฟล์ เครื่องมือใช้งานคอมพิวเตอร์ และ Agents SDK โอเพนซอร์ส ในขณะที่ Responses API ช่วยให้นักพัฒนาสามารถสร้างเอเจนต์บนเทคโนโลยีของตนได้ Agents SDK สามารถช่วยเชื่อมโยงเอเจนต์กับเครื่องมือและกระบวนการเว็บอื่นๆ โดยดำเนินการ "เวิร์กโฟลว์" ที่ทำในสิ่งที่ผู้ใช้หรือธุรกิจต้องการโดยอัตโนมัติ
ปี 2025 มักได้รับการยกย่องว่าเป็น “ปีแห่งเอเจนต์” และการดำเนินการของ OpenAI ถือเป็นก้าวสำคัญสำหรับอุตสาหกรรม Agents SDK ช่วยให้นักพัฒนาสามารถใช้ประโยชน์จากความก้าวหน้าล่าสุดของ OpenAI ได้อย่างง่ายดาย (เช่น การใช้เหตุผลที่ดีขึ้น การโต้ตอบแบบหลายโหมด และเทคนิคด้านความปลอดภัยใหม่ๆ) ในสถานการณ์จริงที่มีหลายขั้นตอน สำหรับนักพัฒนา LLM และผู้สร้างเอเจนต์ AI นั้น Agents SDK มอบชุด “องค์ประกอบพื้นฐาน” เพื่อสร้างและจัดการระบบ AI อัตโนมัติของตนเอง
ความสำคัญของ Agents SDK อยู่ที่ความสามารถในการรับมือกับความท้าทายในการปรับใช้เอเจนต์ AI ในสภาพแวดล้อมการผลิต โดยทั่วไปแล้ว การแปลความสามารถ LLM ที่ทรงพลังให้เป็นเวิร์กโฟลว์หลายขั้นตอนนั้นต้องใช้แรงงานมาก ต้องมีการเขียนกฎที่กำหนดเองจำนวนมาก การออกแบบคำสั่งตามลำดับ และการลองผิดลองถูกโดยไม่มีเครื่องมือการสังเกตที่เหมาะสม ด้วย Agents SDK และเครื่องมือ API ใหม่ที่เกี่ยวข้อง เช่น Responses API OpenAI มุ่งหวังที่จะลดความซับซ้อนของกระบวนการนี้อย่างมาก ช่วยให้นักพัฒนาสามารถสร้างเอเจนต์ที่ซับซ้อนและเชื่อถือได้มากขึ้นด้วยความพยายามน้อยลง

Agents SDK คืออะไร
OpenAI กำลังกลับมาสู่โอเพ่นซอร์สอีกครั้งอย่างยิ่งใหญ่ด้วยการเปิดตัว Agents SDK ซึ่งเป็นชุดเครื่องมือที่ออกแบบมาเพื่อช่วยให้นักพัฒนาสามารถจัดการ ประสานงาน และเพิ่มประสิทธิภาพเวิร์กโฟลว์ของตัวแทน รวมถึงสร้างตัวแทนที่ขับเคลื่อนด้วยโมเดลอื่นที่ไม่ใช่ OpenAI เช่น โมเดลจากคู่แข่งอย่าง Anthropic และ Google หรือโมเดลโอเพ่นซอร์สจาก DeepSeek, Qwen, Mistral และตระกูล Llama ของ Meta
เหตุใดจึงต้องใช้ Agents SDK
SDK มีหลักการออกแบบการขับเคลื่อนสองประการ:
- มีคุณสมบัติมากพอที่จะคุ้มค่าที่จะใช้ แต่ส่วนพื้นฐานไม่เพียงพอที่จะให้เรียนรู้ได้รวดเร็ว
- ทำงานได้ดีทันที แต่คุณสามารถปรับแต่งสิ่งที่จะเกิดขึ้นได้เอง
ต่อไปนี้เป็นคุณสมบัติหลักของ SDK:
- ลูปตัวแทน: ลูปตัวแทนในตัวที่จัดการเครื่องมือการเรียก การส่งผลลัพธ์ไปยัง LLM และวนซ้ำจนกว่า LLM จะเสร็จสิ้น
- Python เป็นอันดับแรก: ใช้คุณลักษณะภาษาในตัวเพื่อประสานงานและเชื่อมโยงตัวแทน แทนที่จะต้องเรียนรู้การแยกย่อยใหม่ ๆ
- การส่งต่อ: คุณลักษณะอันทรงพลังในการประสานงานและมอบหมายระหว่างตัวแทนหลายราย
- รางป้องกัน: รันการตรวจสอบอินพุตและการตรวจสอบแบบคู่ขนานกับตัวแทนของคุณ และหยุดทำงานก่อนกำหนดหากการตรวจสอบล้มเหลว
- เครื่องมือฟังก์ชัน: เปลี่ยนฟังก์ชัน Python ใดๆ ก็ตามให้กลายเป็นเครื่องมือด้วยการสร้างรูปแบบอัตโนมัติและการตรวจสอบที่ขับเคลื่อนโดย Pydantic
- การติดตาม: การติดตามในตัวที่ช่วยให้คุณมองเห็น แก้ไข และตรวจสอบเวิร์กโฟลว์ของคุณ รวมถึงใช้ชุดเครื่องมือการประเมิน ปรับแต่ง และกลั่นกรองของ OpenAI
วิธีใช้ SDK ตัวแทน Openai
- ตั้งค่าสภาพแวดล้อม Python ของคุณ
python -m venv env
source env/bin/activate
- ติดตั้ง SDK ของตัวแทน
pip install openai-agents
- ตั้ง
OPENAI_API_KEYตัวแปรสภาพแวดล้อม
อิสระ ตั้ง OPENAI_API_KEY API จาก CometAPI
- ล็อกอิน ไปยัง โคเมตาปิดอทคอม. หากคุณยังไม่ได้เป็นผู้ใช้ของเรา กรุณาลงทะเบียนก่อน
- รับรหัส API ของข้อมูลรับรองการเข้าถึง ของอินเทอร์เฟซ คลิก "เพิ่มโทเค็น" ที่โทเค็น API ในศูนย์ส่วนบุคคล รับคีย์โทเค็น: sk-xxxxx และส่ง
- รับ url ของเว็บไซต์นี้: https://api.cometapi.com/
- เลือก
OPENAI_API_KEYจุดสิ้นสุดในการส่งคำขอ API และกำหนดเนื้อหาคำขอ วิธีการคำขอและเนื้อหาคำขอจะได้รับจาก เอกสาร API ของเว็บไซต์ของเราเว็บไซต์ของเรายังให้บริการทดสอบ Apifox เพื่อความสะดวกของคุณอีกด้วย
- ตั้งค่าตัวแทนของคุณ
กำหนดเครื่องมือที่ AI ของคุณสามารถใช้ได้ สมมติว่าเราต้องการเปิดใช้งาน ค้นหาเว็บ และ การเรียกค้นไฟล์:
from agent_sdk import Agent, WebSearchTool, FileRetrievalTool
search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()
agent = Agent(tools=)
ตอนนี้ตัวแทนของคุณรู้วิธีค้นหาทางเว็บและดึงเอกสารแล้ว
5. วิ่ง
แตกต่างจากแชทบอทแบบดั้งเดิม AI นี้ ตัดสินใจว่าจะใช้เครื่องมือใดตามข้อมูลจากผู้ใช้:
def agent_task(query):
result = agent.use_tool("web_search", query)
return result
response = agent_task("Latest AI research papers")
print(response)
ไม่ต้องมีการแทรกแซงด้วยมือ—เพียงแค่ การดำเนินการอัตโนมัติ.
วงจรตัวแทน
เมื่อคุณโทร Runner.run()SDK จะรันลูปจนกว่าจะได้ผลลัพธ์สุดท้าย:
- เรียกใช้ LLM โดยใช้โมเดลและการตั้งค่าบนตัวแทน พร้อมด้วยประวัติข้อความ
- LLM คืนการตอบสนอง ซึ่งอาจรวมถึงการเรียกใช้เครื่องมือ
- หากการตอบสนองมีเอาต์พุตสุดท้าย ลูปจะสิ้นสุดและส่งคืน
- หากการตอบกลับมีการส่งมอบ ตัวแทนจะถูกตั้งค่าเป็นตัวแทนใหม่ และลูปจะดำเนินต่อไปจากขั้นตอนที่ 1
- ดำเนินการเรียกเครื่องมือ (หากมี) และข้อความตอบกลับของเครื่องมือจะถูกผนวกเข้าไป จากนั้นลูปจะดำเนินต่อไปจากขั้นตอนที่ 1
คุณสามารถใช้ max_turns พารามิเตอร์เพื่อจำกัดจำนวนการดำเนินการลูป
†<ผลลัพธ์สุดท้าย
เอาต์พุตสุดท้ายคือสิ่งสุดท้ายที่ตัวแทนสร้างในลูป:
- หากคุณตั้งค่า
output_typeบนตัวแทน เอาต์พุตสุดท้ายจะเป็นเมื่อ LLM ส่งคืนบางสิ่งบางอย่างที่เป็นประเภทนั้นโดยใช้เอาต์พุตแบบมีโครงสร้าง - ถ้าไม่มี
output_type(เช่น ตอบกลับเป็นข้อความธรรมดา) ดังนั้น ตอบกลับ LLM แรกโดยไม่เรียกใช้เครื่องมือหรือการส่งต่อใดๆ จะถือเป็นผลลัพธ์สุดท้าย
ตัวอย่าง สวัสดีโลก
from agents import Agent, Runner
agent = Agent(name="Assistant", instructions="You are a helpful assistant")
result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

โครงสร้างทางเทคนิค
“OpenAI Agents SDK มีเป้าหมายที่จะเป็นกรอบแนวคิดที่แสดงให้เห็นว่าตัวแทนต่างๆ เช่น 'Triage Agent' หรือ 'CRM Agent' สามารถร่วมมือกันทำงานให้สำเร็จลุล่วงผ่านการโต้ตอบระหว่างเครื่องมือและกลไกการมอบหมายงานได้อย่างไร”
ส่วนประกอบหลักและสถาปัตยกรรมของ SDK ตัวแทน
OpenAI Agents SDK ถูกสร้างขึ้นจากหลักการที่กระชับแต่แข็งแกร่ง โดยแกนหลักคือแนวคิดของ ตัวแทนซึ่งแสดงถึงตัวอย่างของโมเดลภาษาที่ปรับแต่งด้วยคำสั่งเฉพาะและติดตั้งไว้เพื่อใช้เครื่องมือต่างๆ ตัวแทนเริ่มต้นด้วยการรับคำขอของผู้ใช้ เช่น คำถามหรือคำจำกัดความของงาน จากนั้นแบ่งงานเหล่านี้ออกเป็นงานย่อยที่อาจเกี่ยวข้องกับการใช้เครื่องมือที่กำหนดไว้ล่วงหน้า และในที่สุดก็ส่งมอบการตอบสนองที่สมบูรณ์ เครื่องมือ อธิบายได้ในลักษณะของฟังก์ชันที่เรียกได้ โดยใช้ Agents SDK ฟังก์ชัน Python ใดๆ ก็สามารถใช้เป็นเครื่องมือได้อย่างราบรื่น โดยมีการตรวจสอบรูปแบบอัตโนมัติสำหรับอินพุตและเอาต์พุตที่จัดทำโดย Pydantic ตัวอย่างเช่น ฟังก์ชัน Python ที่แสดงเครื่องมือค้นหาฐานข้อมูลหรือเครื่องมือค้นหาเว็บสามารถรวมเข้ากับชุดเครื่องมือของตัวแทนได้โดยตรง
ชิ้นส่วนหลักอีกชิ้นหนึ่งของ Agents SDK คือ ตัวแทนลูปซึ่งกำหนดกระบวนการแบบวนซ้ำของการแก้ไขงาน โดยเริ่มจากความพยายามครั้งแรกในการตอบคำถาม ตัวแทนจะประเมินว่ามีข้อมูลเพียงพอหรือจำเป็นต้องดำเนินการภายนอกหรือไม่ เมื่อจำเป็น ตัวแทนจะเรียกใช้เครื่องมือที่เกี่ยวข้อง ประมวลผลผลลัพธ์ และประเมินงานอีกครั้ง วงจรนี้จะทำซ้ำจนกว่าตัวแทนจะระบุว่างานเสร็จสมบูรณ์ด้วยคำตอบว่า "เสร็จแล้ว" SDK ของตัวแทนจะจัดการกระบวนการนี้โดยอัตโนมัติ ทำให้กระบวนการพัฒนาง่ายขึ้นด้วยการทำให้การทำงานที่เกิดซ้ำ เช่น การเรียกใช้เครื่องมือ การจัดการผลลัพธ์ และการลองซ้ำแบบวนซ้ำเป็นอัตโนมัติ วิธีนี้ช่วยให้นักพัฒนาสามารถมุ่งเน้นไปที่การกำหนดเวิร์กโฟลว์และความสามารถของตัวแทนได้มากขึ้นโดยไม่ต้องกังวลเกี่ยวกับกลไกพื้นฐาน OpenAI อธิบายแนวทางนี้ว่า Python เป็นอันดับแรกโดยเน้นการใช้โครงสร้าง Python ที่คุ้นเคย เช่น ลูป เงื่อนไข และการเรียกใช้ฟังก์ชัน มากกว่าภาษาเฉพาะโดเมน (DSL) ด้วยความยืดหยุ่นนี้ นักพัฒนาสามารถจัดการตัวแทนที่เชื่อมต่อกันในขณะที่ยังต้องพึ่งพาไวยากรณ์ Python ดั้งเดิม
สถาปัตยกรรมการส่งต่อและมัลติเอเจนต์
ความสามารถของ SDK นั้นมีมากกว่าตัวแทนแต่ละตัว ผ่านคุณสมบัติที่เรียกว่า แฮนด์ออฟงานสามารถถ่ายโอนระหว่างตัวแทนหลายตัวได้ ทำให้สามารถทำงานร่วมกันได้อย่างราบรื่น ตัวอย่างเช่น “ตัวแทนการแบ่งประเภท” อาจกำหนดลักษณะของแบบสอบถามขาเข้า มอบหมายให้ตัวแทนเฉพาะทางอื่น หรือเอาต์พุตของตัวแทนตัวหนึ่งอาจทำหน้าที่เป็นอินพุตสำหรับตัวแทนอื่น ระบบนี้รองรับเวิร์กโฟลว์ที่ตัวแทนเฉพาะทางจะดำเนินการส่วนต่างๆ ที่แตกต่างกันของงานที่กว้างขึ้น เพิ่มประสิทธิภาพให้กับสถาปัตยกรรมตัวแทนหลายตัวที่ซับซ้อน OpenAI ได้ออกแบบชุดเครื่องมือสำหรับแอปพลิเคชันที่ปรับขนาดได้ เช่น การทำงานอัตโนมัติของฝ่ายสนับสนุนลูกค้า กระบวนการวิจัย โปรเจ็กต์หลายขั้นตอน การสร้างเนื้อหา การดำเนินการขาย หรือแม้แต่การตรวจสอบโค้ด นอกจากนี้ guardrails เพิ่มความน่าเชื่อถือโดยกำหนดกฎการตรวจสอบความถูกต้องกับอินพุตหรือเอาต์พุตของตัวแทน ตัวอย่างเช่น รางป้องกันสามารถบังคับใช้รูปแบบพารามิเตอร์ให้สอดคล้องหรือยุติลูปได้เร็วเมื่อตรวจพบความผิดปกติ ซึ่งจะช่วยลดความเสี่ยง เช่น การดำเนินการที่ไม่มีประสิทธิภาพหรือพฤติกรรมที่ไม่พึงประสงค์ในการดำเนินการในโลกแห่งความเป็นจริง
การประสานงานและการตรวจสอบ
นอกเหนือจากการดำเนินการงานแล้ว SDK ของตัวแทนยังรวมถึงความแข็งแกร่ง ประสาน ฟีเจอร์ต่างๆ เช่น การควบคุมการทำงานของเครื่องมือ การไหลของข้อมูล และการจัดการวงจร แม้จะมีการทำงานอัตโนมัติในระดับสูง OpenAI ก็ให้ความสำคัญกับความโปร่งใส โดยจัดเตรียมเครื่องมือสำหรับนักพัฒนาเพื่อตรวจสอบกิจกรรมของตัวแทนแบบเรียลไทม์ ผ่านฟีเจอร์ในตัว การติดตาม ฟีเจอร์ที่เข้าถึงได้ในแดชบอร์ด OpenAI ช่วยให้นักพัฒนามองเห็นเวิร์กโฟลว์แบบทีละขั้นตอน สังเกตเมื่อเรียกใช้เครื่องมือ อินพุตที่ใช้ และเอาต์พุตที่ส่งคืน แพลตฟอร์มใช้โครงสร้างพื้นฐานการตรวจสอบของ OpenAI เพื่อแบ่งการดำเนินการของลอจิกของตัวแทนออกเป็นร่องรอยและช่วง ซึ่งให้ข้อมูลเชิงลึกเกี่ยวกับพฤติกรรมของตัวแทนแบบละเอียด ซึ่งช่วยให้นักพัฒนาสามารถวินิจฉัยคอขวด แก้ไขปัญหา เพิ่มประสิทธิภาพเวิร์กโฟลว์ และติดตามประสิทธิภาพ นอกจากนี้ สถาปัตยกรรมการติดตามยังรองรับการประเมินที่ซับซ้อน ช่วยให้ปรับแต่งและปรับปรุงประสิทธิภาพของตัวแทนได้ตามระยะเวลา
ข้อดี
OpenAI Agents SDK ไม่เพียงแต่มีไว้สำหรับนักพัฒนาแต่ละรายเท่านั้น แต่ยังมอบข้อได้เปรียบที่สำคัญให้กับบริษัทที่สร้างผลิตภัณฑ์ที่ใช้ตัวแทน AI อีกด้วย มาเริ่มด้วยข้อได้เปรียบกันก่อน:
การสร้างต้นแบบและการผลิตที่รวดเร็ว: SDK ของตัวแทนนำพฤติกรรมของตัวแทนที่ซับซ้อนมาใช้งานด้วยโค้ดและการกำหนดค่าขั้นต่ำ ทำให้วงจรจากแนวคิดไปสู่ผลิตภัณฑ์สั้นลง ตัวอย่างเช่น แพลตฟอร์มคริปโตกระแสหลักอย่าง Coinbase ใช้ SDK เพื่อสร้างต้นแบบและปรับใช้ระบบรองรับหลายตัวแทนอย่างรวดเร็ว ในทำนองเดียวกัน ในพื้นที่เช่นตัวช่วยการค้นหาระดับองค์กร บริษัทต่างๆ สามารถผสานเครื่องมือค้นหาเว็บและไฟล์ของ SDK เพื่อส่งมอบคุณค่าได้อย่างรวดเร็ว โดยการถ่ายเทรายละเอียดการประสานงานออกไป นักพัฒนาสามารถมุ่งเน้นไปที่คุณสมบัติเฉพาะของผลิตภัณฑ์ได้
ลดต้นทุนการพัฒนา: การสร้างระบบตัวแทนตั้งแต่ต้นนั้นต้องใช้การลงทุนด้านวิศวกรรมอย่างมาก Agents SDK ช่วยลดต้นทุนโดยนำเสนอโซลูชันสำเร็จรูปสำหรับความต้องการทั่วไป เช่น การจัดการลูป การซิงโครไนซ์การเรียก API การจัดการข้อผิดพลาด และเอาต์พุตเครื่องมือที่จัดรูปแบบสำหรับ LLM เนื่องจากเป็นโอเพ่นซอร์ส จึงสามารถปรับแต่งได้ตามความต้องการของบริษัท ซึ่งถือเป็นประโยชน์ต่อบริษัทสตาร์ทอัพ เนื่องจากสามารถสร้างผลิตภัณฑ์ที่ขับเคลื่อนด้วยตัวแทนอันทรงพลังด้วยทรัพยากรที่จำกัดได้
การตรวจสอบย้อนกลับและการดีบัก: แดชบอร์ดการติดตามแบบบูรณาการของ SDK ช่วยเปลี่ยนแปลงแอปพลิเคชันทางธุรกิจ ความกังวลของอุตสาหกรรมเกี่ยวกับ AI ที่เป็น "กล่องดำ" ทำให้สามารถบันทึกและตรวจสอบขั้นตอนของตัวแทนทุกขั้นตอนได้ หากตัวแทนฝ่ายสนับสนุนลูกค้าให้คำตอบที่ผิด ร่องรอยจะแสดงว่าการเรียกใช้เครื่องมือหรือขั้นตอนใดล้มเหลว หน้าจอบันทึก/ร่องรอยของ OpenAI Platform ช่วยปรับปรุงความสามารถในการตรวจสอบของตัวแทน ซึ่งมีความสำคัญในอุตสาหกรรมที่อยู่ภายใต้กฎระเบียบหรือการตรวจสอบภายใน ซึ่งช่วยให้บริษัทต่างๆ สามารถผสานรวม AI ได้อย่างมั่นใจมากขึ้น เนื่องจากทราบว่าสามารถอธิบายผลลัพธ์ได้เมื่อจำเป็น
เข้าถึงโมเดลและเครื่องมือล่าสุดของ OpenAI: การใช้ Agents SDK หมายถึงการใช้ประโยชน์จากโมเดลยอดนิยมของ OpenAI (เช่น GPT-4) และเครื่องมือปัจจุบัน (การค้นหาบนเว็บ การดำเนินการโค้ด) ซึ่งทำให้ได้เปรียบในด้านคุณภาพเหนือการสร้างทางเลือกอื่นที่อาจต้องพึ่งพาโมเดลที่อ่อนแอกว่า สำหรับแอปพลิเคชันที่ต้องการความแม่นยำสูงหรือข้อมูลที่ทันสมัย (เช่น ผู้ช่วยวิจัย ตัวแทนวิเคราะห์ทางการเงิน) ประสิทธิภาพของโมเดลของ OpenAI ถือเป็นข้อได้เปรียบที่สำคัญ เมื่อ OpenAI เพิ่มเครื่องมือ (ซึ่งบ่งชี้ว่าจะมีการบูรณาการเพิ่มเติมในอนาคต) ผู้ใช้ SDK สามารถนำเครื่องมือเหล่านั้นไปปรับใช้ได้อย่างง่ายดาย
CometAPI เข้ากันได้อย่างสมบูรณ์กับโปรโตคอลอินเทอร์เฟซ OpenAI เพื่อให้มั่นใจว่าบูรณาการได้อย่างราบรื่น คุณสามารถหลีกเลี่ยงการพึ่งพาโมเดลและบริการ (ความเสี่ยงจากการล็อกอิน) ลดความเป็นส่วนตัวและความปลอดภัยของข้อมูล และลดต้นทุน การใช้ประโยชน์จากโมเดลและเครื่องมืออันทรงพลังของ OpenAI อาจมีราคาแพงและบางครั้งอาจจำกัดประสิทธิภาพการทำงาน CometAPI มีราคาที่ถูกกว่า
หัวข้อที่เกี่ยวข้อง CometAPI: แพลตฟอร์มบูรณาการโมเดล AI ขั้นสูงสุด
สรุป
OpenAI มุ่งมั่นที่จะพัฒนาความสามารถของ AI ด้วยการนำเสนอนวัตกรรมใหม่ๆ เช่น Responses API การแนะนำเครื่องมือเหล่านี้จะช่วยให้ธุรกิจและนักพัฒนาซอฟต์แวร์มีโอกาสสร้างโซลูชัน AI ที่ชาญฉลาดขึ้น ปรับตัวได้มากขึ้น และเชื่อถือได้มากขึ้น การพัฒนาดังกล่าวชี้ให้เห็นถึงอนาคตที่ปัญญาประดิษฐ์จะขับเคลื่อนการเปลี่ยนแปลงที่มีผลกระทบและปลดล็อกความเป็นไปได้ใหม่ๆ ในทุกอุตสาหกรรม



