OpenAI memperkenalkan beberapa tawaran baharu: Responses API, alat terbina dalam untuk carian web dan fail, alat penggunaan komputer serta Agents SDK sumber terbuka. Walaupun Responses API membolehkan pembangun membina ejen di atas teknologinya, Agents SDK boleh membantu mereka memautkan ejen kepada alat dan proses web lain, melaksanakan “aliran kerja” yang melakukan apa yang pengguna atau perniagaan mahukan, secara autonomi.
2025 sering digelar “Tahun Ejen” dan langkah OpenAI dilihat sebagai langkah penting untuk industri. Agents SDK membolehkan pembangun memanfaatkan dengan mudah kemajuan terkini OpenAI (seperti penaakulan yang dipertingkat, interaksi multimodal, dan teknik keselamatan baharu) dalam senario dunia sebenar berbilang langkah. Bagi pembangun LLM dan pembina ejen AI, Agents SDK menyediakan satu set “blok binaan” untuk mencipta dan mengurus sistem AI autonomi mereka sendiri.
Kepentingan Agents SDK terletak pada keupayaannya menangani cabaran mengerahkan ejen AI dalam persekitaran produksi. Secara tradisional, menterjemahkan keupayaan LLM yang berkuasa kepada aliran kerja berbilang langkah sangat intensif dari segi tenaga kerja, memerlukan banyak penulisan peraturan tersuai, reka bentuk prompt berjujukan, serta cubaan dan ralat tanpa alatan pemerhatian yang sesuai. Dengan Agents SDK dan alat API baharu berkaitan seperti Responses API, OpenAI bertujuan untuk mempermudah proses ini dengan ketara, membolehkan pembangun membina ejen yang lebih kompleks dan boleh dipercayai dengan usaha yang lebih sedikit.

What is Agents SDK
OpenAI kembali terlibat secara besar-besaran dalam sumber terbuka dengan pelepasan Agents SDK, satu kit alat yang direka untuk membantu pembangun mengurus, menyelaras dan mengoptimumkan aliran kerja ejen — malah membina ejen yang dikuasakan oleh model lain yang bukan OpenAI seperti pesaing Anthropic dan Google, atau model sumber terbuka daripada DeepSeek, Qwen, Mistral dan keluarga Llama oleh Meta.
Why use the Agents SDK
SDK ini mempunyai dua prinsip reka bentuk teras:
- Cukup banyak ciri untuk berbaloi digunakan, tetapi bilangan primitif yang sedikit agar cepat dipelajari.
- Berfungsi dengan baik tanpa konfigurasi, namun anda boleh menyesuaikan dengan tepat apa yang berlaku.
Berikut ialah ciri utama SDK:
- Gelung ejen: Gelung ejen terbina dalam yang mengendalikan pemanggilan alat, menghantar hasil kepada LLM, dan mengulang sehingga LLM selesai.
- Python-first: Gunakan ciri bahasa terbina dalam untuk mengorkestrasi dan merantaikan ejen, bukannya perlu mempelajari abstraksi baharu.
- Handoffs: Ciri berkuasa untuk menyelaras dan mendelegasi antara berbilang ejen.
- Guardrails: Jalankan pengesahan dan semakan input selari dengan ejen anda, hentikan awal jika semakan gagal.
- Function tools: Tukarkan mana-mana fungsi Python kepada alat, dengan penjanaan skema automatik dan pengesahan berkuasa Pydantic.
- Tracing: Penjejakan terbina dalam yang membolehkan anda memvisualkan, menyahpepijat dan memantau aliran kerja anda, serta menggunakan rangkaian alat penilaian, penalaan halus dan penyulingan OpenAI.
How to use Openai Agents SDK
- Sediakan persekitaran Python anda
python -m venv env
source env/bin/activate
- Pasang Agents SDK
pip install openai-agents
- tetapkan pembolehubah persekitaran
OPENAI_API_KEY
Tetapkan API OPENAI_API_KEY secara bebas daripada CometAPI
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar terlebih dahulu
- Dapatkan kunci API kelayakan capaian bagi antara muka. Klik “Add Token” pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
- Dapatkan URL laman ini: https://api.cometapi.com/
- Pilih endpoint
OPENAI_API_KEYuntuk menghantar permintaan API dan tetapkan jasad permintaan. Kaedah permintaan dan jasad permintaan diperoleh daripada dokumen API laman kami. Laman kami juga menyediakan ujian Apifox untuk kemudahan anda.
- Tetapkan Ejen Anda
Tentukan alat yang boleh digunakan oleh AI anda. Katakan kita mahu mendayakan carian web dan pengambilan fail:
from agent_sdk import Agent, WebSearchTool, FileRetrievalTool
search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()
agent = Agent(tools=)
Kini ejen anda tahu cara mencari di web dan mendapatkan dokumen.
5. jalankan
Tidak seperti chatbot tradisional, AI ini memutuskan alat mana yang hendak digunakan berdasarkan input pengguna:
def agent_task(query):
result = agent.use_tool("web_search", query)
return result
response = agent_task("Latest AI research papers")
print(response)
Tiada campur tangan manual—hanya pelaksanaan autonomi.
Gelung Ejen
Apabila anda memanggil Runner.run(), SDK menjalankan gelung sehingga ia memperoleh output akhir:
- LLM dipanggil menggunakan model dan tetapan pada ejen, bersama sejarah mesej.
- LLM memulangkan respons, yang mungkin termasuk panggilan alat.
- Jika respons mempunyai output akhir, gelung tamat dan mengembalikannya.
- Jika respons mempunyai handoff, ejen ditetapkan kepada ejen baharu dan gelung bersambung dari langkah 1.
- Panggilan alat diproses (jika ada) dan mesej respons alat ditambah. Kemudian gelung bersambung dari langkah 1.
Anda boleh menggunakan parameter max_turns untuk mengehadkan bilangan pelaksanaan gelung.
Output Akhir
Output akhir ialah perkara terakhir yang dihasilkan ejen dalam gelung:
- Jika anda menetapkan
output_typepada ejen, output akhir ialah apabila LLM memulangkan sesuatu daripada jenis itu menggunakan output berstruktur. - Jika tiada
output_type(iaitu, respons teks biasa), maka respons LLM pertama tanpa sebarang panggilan alat atau handoff dianggap sebagai output akhir.
Contoh Hello world
from agents import Agent, Runner
agent = Agent(name="Assistant", instructions="You are a helpful assistant")
result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)
# Code within the code,
# Functions calling themselves,
# Infinite loop's dance.

Struktur Teknikal
“OpenAI Agents SDK bertujuan menjadi rangka kerja konseptual yang menunjukkan bagaimana ejen berbeza, seperti ‘Triage Agent’ atau ‘CRM Agent,’ boleh bekerjasama untuk menyiapkan tugasan melalui interaksi alat dan mekanisme pendelegasian.”
Komponen Teras dan Seni Bina Agents SDK
OpenAI Agents SDK dibina berasaskan set prinsip yang ringkas namun teguh. Pada terasnya ialah konsep Ejen, yang mewakili satu instans model bahasa yang disesuaikan dengan arahan khusus dan dilengkapi untuk menggunakan pelbagai alat. Ejen bermula dengan menerima permintaan pengguna — seperti soalan atau definisi tugasan — kemudian menghuraikan tugasan ini kepada subtugasan yang mungkin melibatkan penggunaan alat pratakrif, dan akhirnya memberikan respons lengkap. Alat dihuraikan secara fungsian sebagai fungsi yang boleh dipanggil; dengan memanfaatkan Agents SDK, mana-mana fungsi Python boleh berfungsi sebagai alat, dengan pengesahan skema input dan output automatik melalui Pydantic. Sebagai contoh, fungsi Python yang mewakili alat pertanyaan pangkalan data atau alat carian web boleh diintegrasikan terus ke dalam set alat ejen.
Satu lagi komponen teras Agents SDK ialah Gelung Ejen, yang mentakrifkan proses berulang penyelesaian tugasan. Bermula dengan percubaan awal untuk menjawab pertanyaan, ejen menilai sama ada ia mempunyai maklumat yang mencukupi atau perlu melakukan tindakan luaran. Apabila diperlukan, ejen memanggil alat yang berkaitan, memproses outputnya, dan menilai semula tugasan. Kitaran ini berulang sehingga ejen menandakan tamat tugasan dengan respons “Saya selesai”. Agents SDK mengurus proses ini secara autonomi, mempermudah pembangunan dengan mengautomasi tugasan berulang seperti pemanggilan alat, pengendalian hasil, dan percubaan berulang. Ini membolehkan pembangun memberi tumpuan kepada mentakrifkan aliran kerja dan keupayaan ejen tanpa bimbang tentang mekanik asas. OpenAI menggambarkan pendekatan ini sebagai Python-first, menekankan penggunaan konstruk Python yang biasa — seperti gelung, bersyarat, dan panggilan fungsi — berbanding bahasa khusus domain (DSL). Dengan fleksibiliti ini, pembangun boleh mengorkestrasi ejen yang saling berkaitan sambil bergantung pada sintaks Python asli.
Handoff dan Seni Bina Berbilang Ejen
Keupayaan SDK melangkaui ejen individu. Melalui ciri yang dikenali sebagai Handoff, tugasan boleh dipindahkan antara berbilang ejen, membolehkan mereka bekerjasama dengan lancar. Contohnya, “Triage Agent” mungkin menentukan sifat pertanyaan yang masuk, mendelegasikannya kepada ejen khusus lain, atau output satu ejen mungkin menjadi input bagi ejen lain. Sistem ini menyokong aliran kerja di mana ejen khusus melaksanakan bahagian tertentu daripada tugasan yang lebih luas, memperkasa seni bina berbilang ejen yang kompleks. Selain itu, Guardrails meningkatkan kebolehpercayaan dengan mengenakan peraturan pengesahan pada input atau output ejen. Sebagai contoh, guardrails boleh menguatkuasakan pematuhan format parameter atau menamatkan gelung lebih awal apabila anomali dikesan, mengurangkan risiko seperti pelaksanaan tidak cekap atau tingkah laku yang tidak diingini dalam operasi dunia sebenar.
Orkestrasi dan Pemantauan
Di luar pelaksanaan tugasan, Agents SDK merangkumi ciri orkestrasi yang teguh, mengendalikan pelaksanaan alat, aliran data, dan pengurusan gelung. Walaupun tahap automasi yang tinggi, OpenAI mengutamakan ketelusan, melengkapkan pembangun dengan alat untuk memantau aktiviti ejen dalam masa nyata. Melalui ciri Tracing terbina dalam yang boleh diakses di papan pemuka OpenAI, pembangun boleh memvisualkan aliran kerja, langkah demi langkah, memerhati bila alat dipanggil, input yang digunakan, dan output yang dipulangkan. Platform ini menggunakan infrastruktur pemantauan OpenAI untuk menghuraikan pelaksanaan logik ejen kepada jejak dan rentang, menawarkan cerapan mendalam tentang tingkah laku ejen. Ini memperkasa pembangun untuk mendiagnosis kesesakan, menyahpepijat isu, mengoptimumkan aliran kerja, dan menjejak prestasi. Tambahan pula, seni bina penjejakan menyokong penilaian yang canggih, membolehkan penalaan halus dan penambahbaikan prestasi ejen dari masa ke masa.
Kelebihan
OpenAI Agents SDK bukan sahaja untuk pembangun individu, ia juga memberikan kelebihan ketara kepada syarikat yang membina produk berasaskan ejen AI. Mari mulakan dengan kelebihan:
Prototip Pantas dan Produksi: Agents SDK melaksanakan tingkah laku ejen yang kompleks dengan kod dan konfigurasi minimum, memendekkan kitaran daripada idea kepada produk. Sebagai contoh, platform kripto arus perdana Coinbase menggunakan SDK untuk memprototip dan menggunakan sistem sokongan berbilang ejen dengan cepat. Begitu juga, dalam bidang seperti pembantu carian perusahaan, syarikat boleh mengintegrasikan alat carian web dan fail SDK untuk menyampaikan nilai dengan pantas. Dengan mengalihkan butiran orkestrasi, pembangun boleh menumpukan pada ciri khusus produk.
Kos Pembangunan Berkurang: Membina sistem ejen dari awal memerlukan pelaburan kejuruteraan yang signifikan. Agents SDK mengurangkan kos dengan menyediakan penyelesaian siap sedia untuk keperluan umum — pengurusan gelung, penyegerakan panggilan API, pengendalian ralat, dan output alat berformat untuk LLM. Memandangkan ia sumber terbuka, ia juga membenarkan penyesuaian bagi memenuhi keperluan syarikat. Ini merupakan rahmat bagi syarikat pemula, membolehkan mereka mencipta produk dipacu ejen yang berkuasa dengan sumber terhad.
Kebolehkesanan dan Penyahpepijatan: Papan pemuka penjejakan bersepadu SDK mentransformasikan aplikasi perniagaan. Kebimbangan industri tentang AI sebagai “kotak hitam” kini membolehkan setiap langkah ejen dilog dan diaudit. Jika ejen sokongan pelanggan memberikan jawapan yang salah, jejak menunjukkan panggilan alat atau langkah mana yang gagal. Skrin log/jejak pada OpenAI Platform meningkatkan keboleh-auditan ejen — penting dalam industri tertakluk kepada peraturan atau audit dalaman. Ini membolehkan syarikat mengintegrasikan AI dengan lebih yakin, mengetahui mereka boleh menerangkan hasil apabila diperlukan.
Akses kepada model dan alat terkini OpenAI: Menggunakan Agents SDK bermakna memanfaatkan model teratas OpenAI (cth. GPT-4) dan alat semasa (carian web, pelaksanaan kod). Ini memberikan kelebihan kualiti berbanding membina alternatif yang mungkin bergantung pada model yang lebih lemah. Untuk aplikasi yang memerlukan ketepatan tinggi atau maklumat terkini (cth. pembantu penyelidikan, ejen analisis kewangan), prestasi model OpenAI merupakan kelebihan besar. Apabila OpenAI menambah alat (membayangkan lebih banyak integrasi akan datang), pengguna SDK boleh mengadaptasikannya dengan mudah.
CometAPI serasi sepenuhnya dengan protokol antara muka OpenAI untuk memastikan integrasi yang lancar. Anda boleh mengelakkan pergantungan model dan perkhidmatan (risiko terkunci), mengurangkan kebimbangan privasi dan keselamatan data, serta mengurangkan kos. Memanfaatkan model dan alat berkuasa OpenAI boleh menjadi mahal dan kadangkala mengehadkan prestasi. CometAPI menawarkan harga yang lebih murah.
Kesimpulan
OpenAI komited untuk memajukan keupayaan AI dengan tawaran inovatif seperti Responses API. Dengan memperkenalkan alat ini, perniagaan dan pembangun berpeluang membina penyelesaian AI yang lebih pintar, lebih mudah menyesuaikan diri, dan sangat boleh dipercayai. Perkembangan ini menunjukkan masa depan di mana kecerdasan buatan terus mendorong perubahan berimpak dan membuka kemungkinan baharu merentasi industri.
