Membongkar SDK Agen OpenAI: Panduan

CometAPI
AnnaMar 12, 2025
Membongkar SDK Agen OpenAI: Panduan

OpenAI memperkenalkan beberapa tawaran baharu: API Respons, alatan terbina dalam untuk carian web dan fail, alat penggunaan komputer dan SDK Agen sumber terbuka. Walaupun API Respons membenarkan pembangun membina ejen di atas teknologinya, Agen SDK boleh membantu mereka memautkan ejen kepada alatan dan proses web lain, melaksanakan "aliran kerja" yang melakukan perkara yang pengguna atau perniagaan mahu, secara autonomi.

2025 sering dipuji sebagai "Tahun Ejen" dan langkah OpenAI dilihat sebagai langkah penting untuk industri. SDK Agen membolehkan pembangun memanfaatkan kemajuan terkini OpenAI dengan mudah (seperti penaakulan yang lebih baik, interaksi pelbagai mod dan teknik keselamatan baharu) dalam senario berbilang langkah dunia sebenar. Untuk pembangun LLM dan pembina ejen AI, Agents SDK menyediakan satu set "blok binaan" untuk mencipta dan mengurus sistem AI autonomi mereka sendiri.

Kepentingan Agents SDK terletak pada keupayaannya untuk menangani cabaran menggunakan ejen AI dalam persekitaran pengeluaran. Secara tradisinya, menterjemah keupayaan LLM yang berkuasa ke dalam aliran kerja berbilang langkah adalah intensif buruh, memerlukan banyak penulisan peraturan tersuai, reka bentuk segera berurutan, dan percubaan dan kesilapan tanpa alat pemerhatian yang betul. Dengan Agents SDK dan alatan API baharu yang berkaitan seperti API Respons, OpenAI menyasarkan untuk memudahkan proses ini dengan ketara, membolehkan pembangun membina ejen yang lebih kompleks dan boleh dipercayai dengan usaha yang lebih sedikit.

Ejen SDK

Apakah itu Agen SDK

OpenAI kembali menjadi sumber terbuka secara besar-besaran dengan mengeluarkan Agents SDKnya, kit alat yang direka untuk membantu pembangun mengurus, menyelaras dan mengoptimumkan aliran kerja ejen — malah membina ejen yang dikuasakan oleh model bukan OpenAI yang lain seperti yang dibuat oleh pesaing Anthropic dan Google, atau model sumber terbuka daripada keluarga DeepSeek, Qwen, Mistral dan Meta.

Mengapa menggunakan SDK Agen

SDK mempunyai dua prinsip reka bentuk pemanduan:

  1. Ciri yang mencukupi untuk digunakan, tetapi sedikit primitif yang cukup untuk menjadikannya cepat dipelajari.
  2. Berfungsi dengan baik di luar kotak, tetapi anda boleh menyesuaikan dengan tepat apa yang berlaku.

Berikut ialah ciri utama SDK:

  • Gelung ejen: Gelung ejen terbina dalam yang mengendalikan alat panggilan, menghantar hasil ke LLM dan gelung sehingga LLM selesai.
  • Python-first: Gunakan ciri bahasa terbina dalam untuk mengatur dan merantai ejen, dan bukannya perlu mempelajari abstraksi baharu.
  • Handoffs: Ciri berkuasa untuk menyelaras dan mewakilkan antara berbilang ejen.
  • Pengawal: Jalankan pengesahan input dan semakan selari dengan ejen anda, berbuka awal jika semakan gagal.
  • Alat fungsi: Tukar mana-mana fungsi Python menjadi alat, dengan penjanaan skema automatik dan pengesahan berkuasa Pydantic.
  • Pengesanan: Pengesanan terbina dalam yang membolehkan anda memvisualisasikan, nyahpepijat dan memantau aliran kerja anda, serta menggunakan set OpenAI bagi penilaian, penalaan halus dan alat penyulingan.

Bagaimana untuk menggunakan SDK Agen Openai

  1. Sediakan persekitaran Python anda
python -m venv env
source env/bin/activate
  1. Pasang Ejen SDK
pip install openai-agents
  1. menetapkan OPENAI_API_KEY pembolehubah persekitaran

Secara bebas menetapkan OPENAI_API_KEY API daripada CometAPI

  • Log masuk kepada cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu
  • Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.
  • Dapatkan url tapak ini: https://api.cometapi.com/
  • Pilih OPENAI_API_KEY titik akhir untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda.
  1. Sediakan Ejen Anda

Tentukan alat yang boleh digunakan oleh AI anda. Katakan kita mahu mendayakan carian sesawang and pengambilan fail:

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=)

Kini ejen anda tahu cara mencari di web dan mengambil dokumen.

5. berlari

Tidak seperti chatbots tradisional, AI ini memutuskan alat yang akan digunakan berdasarkan input pengguna:

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("Latest AI research papers")
print(response)

Tiada campur tangan manual—hanya pelaksanaan autonomi.

Gelung Agen

Semasa anda memanggil Runner.run(), SDK menjalankan gelung sehingga ia mendapat output akhir:

  1. LLM dipanggil menggunakan model dan tetapan pada ejen, bersama-sama dengan sejarah mesej.
  2. LLM mengembalikan respons, yang mungkin termasuk panggilan alat.
  3. Jika respons mempunyai output akhir, gelung berakhir dan mengembalikannya.
  4. Jika respons mempunyai serahan, ejen ditetapkan kepada ejen baharu dan gelung diteruskan dari langkah 1.
  5. Panggilan alat diproses (jika ada) dan mesej respons alat dilampirkan. Kemudian gelung diteruskan dari langkah 1.

Anda boleh menggunakan max_turns parameter untuk mengehadkan bilangan pelaksanaan gelung.

Output akhir

Output akhir ialah perkara terakhir yang dihasilkan oleh ejen dalam gelung:

  • Jika anda menetapkan satu output_type pada ejen, output akhir ialah apabila LLM mengembalikan sesuatu jenis itu menggunakan output berstruktur.
  • Sekiranya tidak ada output_type (iaitu, respons teks biasa), maka respons LLM pertama tanpa sebarang panggilan alat atau serahan dianggap sebagai output akhir.

Hello contoh dunia

from agents import Agent, Runner

agent = Agent(name="Assistant", instructions="You are a helpful assistant")

result = Runner.run_sync(agent, "Write a haiku about recursion in programming.")
print(result.final_output)

# Code within the code,

# Functions calling themselves,
# Infinite loop's dance.

Membongkar SDK Agen OpenAI: Panduan

Struktur Teknikal

“SDK Agen OpenAI menyasarkan untuk menjadi rangka kerja konseptual yang menunjukkan bagaimana ejen yang berbeza, seperti 'Ejen Triage' atau 'Ejen CRM,' boleh bekerjasama untuk menyelesaikan tugas melalui interaksi alat dan mekanisme delegasi."

Komponen Teras dan Seni Bina Agen SDK

SDK Ejen OpenAI dibina di atas set prinsip yang ringkas namun teguh. Pada terasnya ialah konsep Agent, yang mewakili contoh model bahasa yang disesuaikan dengan arahan khusus dan dilengkapi untuk menggunakan pelbagai alatan. Ejen bermula dengan menerima permintaan pengguna — seperti soalan atau takrifan tugas — kemudian pecahkan tugas ini kepada subtugas yang mungkin melibatkan penggunaan alat yang dipratentukan, akhirnya memberikan respons yang lengkap. Ini Alatan secara fungsional digambarkan sebagai fungsi boleh panggil; memanfaatkan Agents SDK, mana-mana fungsi Python boleh berfungsi dengan lancar sebagai alat, dengan pengesahan skema automatik untuk input dan output yang disediakan melalui Pydantic. Sebagai contoh, fungsi Python yang mewakili alat pertanyaan pangkalan data atau alat carian web boleh disepadukan terus ke dalam kit alat ejen.

Satu lagi bahagian utama Agents SDK ialah Gelung Agen, yang mentakrifkan proses lelaran penyelesaian tugas. Bermula dengan percubaan awal untuk menjawab pertanyaan, ejen menilai sama ada ia mempunyai maklumat yang mencukupi atau perlu melakukan tindakan luar. Apabila diperlukan, ejen menggunakan alat yang berkaitan, memproses output, dan menilai semula tugas. Kitaran ini berulang sehingga ejen menandakan selesai tugas dengan respons "Saya sudah selesai". Agents SDK mengurus proses ini secara autonomi, memudahkan proses pembangunan dengan mengautomasikan tugasan berulang seperti permohonan alat, pengendalian hasil dan percubaan semula berulang. Ini membolehkan pembangun menumpukan lebih pada penentuan aliran kerja dan keupayaan ejen tanpa perlu risau tentang mekanik asas. OpenAI menerangkan pendekatan ini sebagai Python-dahulukan, menekankan penggunaan binaan Python yang biasa — seperti gelung, bersyarat dan panggilan fungsi — melalui bahasa khusus domain (DSL). Dengan fleksibiliti ini, pembangun boleh mengatur ejen yang saling berkaitan sambil bergantung pada sintaks Python asli.

Handoff dan Seni Bina Berbilang Ejen

Keupayaan SDK melangkaui ejen individu. Melalui ciri yang dikenali sebagai Menyerahkan, tugas boleh dipindahkan antara berbilang ejen, membolehkan mereka bekerjasama dengan lancar. Sebagai contoh, "Ejen Triage" mungkin menentukan sifat pertanyaan masuk, mewakilkannya kepada ejen khusus lain, atau output seorang ejen mungkin bertindak sebagai input untuk yang lain. Sistem ini menyokong aliran kerja di mana ejen khusus melaksanakan bahagian yang berbeza dari tugas yang lebih luas, memperkasakan seni bina berbilang ejen yang kompleks. OpenAI telah mereka kit alat untuk aplikasi berskala, seperti automasi sokongan pelanggan, proses penyelidikan, projek berbilang langkah, penciptaan kandungan, operasi jualan, atau semakan kod. Selain itu, Guardrails meningkatkan kebolehpercayaan dengan mengenakan peraturan pengesahan pada input atau output ejen. Sebagai contoh, pagar boleh menguatkuasakan pematuhan format parameter atau menamatkan gelung lebih awal apabila anomali dikesan, mengurangkan risiko seperti pelaksanaan yang tidak cekap atau gelagat yang tidak diingini dalam operasi dunia sebenar.

Orkestrasi dan Pemantauan

Di luar pelaksanaan tugas, SDK Agen termasuk teguh teknik mengarang musik ciri, bertanggungjawab ke atas pelaksanaan alat, aliran data dan pengurusan gelung. Walaupun tahap automasi yang tinggi, OpenAI mengutamakan ketelusan, melengkapkan pembangun dengan alat untuk memantau aktiviti ejen dalam masa nyata. Melalui terbina dalam Penjejakan ciri yang boleh diakses dalam papan pemuka OpenAI, pembangun boleh menggambarkan aliran kerja, langkah demi langkah, memerhati apabila alat dipanggil, input yang mereka gunakan dan output yang mereka kembalikan. Platform ini menggunakan infrastruktur pemantauan OpenAI untuk memecahkan pelaksanaan logik ejen kepada jejak dan rentang, menawarkan cerapan terperinci tentang tingkah laku ejen. Ini memberi kuasa kepada pembangun untuk mendiagnosis kesesakan, isu nyahpepijat, mengoptimumkan aliran kerja dan menjejak prestasi. Selain itu, seni bina pengesanan menyokong penilaian yang canggih, membolehkan penalaan halus dan peningkatan prestasi ejen dari semasa ke semasa.

kelebihan

OpenAI Agents SDK bukan sahaja untuk pembangun individu, ia juga memberikan kelebihan yang ketara kepada syarikat yang membina produk berasaskan ejen AI. Mari kita mulakan dengan kelebihan:

Prototaip dan Pengeluaran Pantas: SDK Agen melaksanakan gelagat ejen yang kompleks dengan kod dan konfigurasi yang minimum, memendekkan kitaran daripada idea kepada produk. Sebagai contoh, platform kripto arus perdana Coinbase menggunakan SDK untuk membuat prototaip dengan cepat dan menggunakan sistem sokongan berbilang ejen. Begitu juga, dalam bidang seperti pembantu carian perusahaan, syarikat boleh menyepadukan alat carian web dan fail SDK untuk menyampaikan nilai dengan cepat. Dengan memuat turun butiran orkestra, pembangun boleh menumpukan pada ciri khusus produk.

Mengurangkan Kos Pembangunan: Membina sistem ejen dari awal memerlukan pelaburan kejuruteraan yang besar. Agen SDK mengurangkan kos dengan menyediakan penyelesaian sedia untuk keperluan biasa – pengurusan gelung, penyegerakan panggilan API, pengendalian ralat dan output alat yang diformatkan untuk LLM. Sebagai sumber terbuka, ia juga membenarkan penyesuaian untuk memenuhi keperluan syarikat. Ini adalah rahmat kepada syarikat pemula, membolehkan mereka mencipta produk yang didorong oleh ejen yang berkuasa dengan sumber yang terhad.

Kebolehkesanan dan Nyahpepijat: Papan pemuka penjejakan bersepadu SDK mengubah aplikasi perniagaan. Kebimbangan industri tentang AI sebagai "kotak hitam" kini membenarkan setiap langkah ejen dilog dan diaudit. Jika ejen sokongan pelanggan memberikan jawapan yang salah, jejak menunjukkan panggilan atau langkah alat yang gagal. Skrin log/jejak Platform OpenAI meningkatkan kebolehauditan ejen — kritikal dalam industri tertakluk kepada peraturan atau audit dalaman. Ini membolehkan syarikat untuk menyepadukan AI dengan lebih yakin, mengetahui mereka boleh menerangkan keputusan apabila diperlukan.

Akses kepada model dan alatan terkini OpenAI: Menggunakan Agents SDK bermakna mengambil kesempatan daripada model teratas OpenAI (cth GPT-4) dan alatan semasa (carian web, pelaksanaan kod). Ini memberikan kelebihan kualiti berbanding membina alternatif yang mungkin bergantung pada model yang lebih lemah. Untuk aplikasi yang memerlukan ketepatan tinggi atau maklumat terkini (cth. pembantu penyelidik, ejen analisis kewangan), prestasi model OpenAI adalah kelebihan yang besar. Memandangkan OpenAI menambah alatan (menunjukkan lebih banyak penyepaduan akan datang), pengguna SDK boleh menggunakan alat tersebut dengan mudah.

CometAPI serasi sepenuhnya dengan protokol antara muka OpenAI untuk memastikan integrasi yang lancar. Anda boleh mengelakkan kebergantungan model dan perkhidmatan (risiko terkunci), mengurangkan privasi data dan kebimbangan keselamatan serta mengurangkan kos. Memanfaatkan model dan alatan OpenAI yang berkuasa boleh menjadi mahal dan kadangkala mengehadkan prestasi. CometAPI menawarkan harga yang lebih murah.

Topik yang berkaitan CometAPI: Platform Penyepaduan Model AI Terunggul

Kesimpulan

OpenAI berdedikasi untuk memajukan keupayaan AI dengan tawaran inovatif seperti API Respons. Dengan memperkenalkan alatan ini, perniagaan dan pembangun mendapat peluang untuk membina penyelesaian AI yang lebih bijak, lebih mudah disesuaikan dan sangat dipercayai. Perkembangan ini menunjukkan masa depan di mana kecerdasan buatan terus memacu perubahan yang memberi kesan dan membuka kemungkinan baharu merentas industri.

SHARE THIS BLOG

500+ Model dalam Satu API

Sehingga 20% Diskaun