Agenter, der transformerer AI-udvikling: OpenAIs seneste opdateringer

CometAPI
AnnaJun 3, 2025
Agenter, der transformerer AI-udvikling: OpenAIs seneste opdateringer

4. Juni, 2025 — OpenAI har udgivet en kraftfuld pakke af opdateringer, der har til formål at revolutionere, hvordan udviklere bygger AI-agenter, især dem med stemmebaserede interaktionsfunktioner. Opdateringerne spænder over flere fronter: fuld TypeScript-understøttelse i Agents SDK, en human-in-the-loop-interventionsmekanisme, debuten af ​​RealtimeAgent til realtids-stemmeapps og betydelige forbedringer af OpenAIs tale-til-tale-model.

Kombineret gør disse opdateringer det mere tilgængeligt end nogensinde før at bygge sikre, kontrollerbare og engagerende AI-agenter.


TypeScript kommer til Agents SDK

Styrkelse af udviklere i webøkosystemet

OpenAIs populære Agents SDK understøtter nu TypeScript – hvilket giver robuste værktøjer til udviklere, der bygger AI-applikationer i JavaScript- og Node.js-miljøer. TypeScript-versionen giver funktionsparitet med sin Python-modpart og understøtter alle essentielle agentopbygningsprimitiver:

  • Overdragelser – Problemfri opgaveoverførsel på tværs af flere agenter
  • rækværk – Adfærdsmæssige begrænsninger og sikkerhedsmekanismer
  • Sporing – Finkornet logging og diagnosticering
  • MCP (Multikomponentmønster) – Understøttelse af modulære, distribuerede agenter

Hvorfor det betyder noget:

Webudviklere kan nu problemfrit integrere AI-agenter i browsere, webapps og Node.js-miljøer, hvilket muliggør oplevelser som stemmeassistenter, chatbots i realtid og copiloter i browseren.


HITL-gennemgangsmekanisme (Human-in-the-Loop)

Introduktion af menneskeligt tilsyn for mere sikker agentadfærd

For at styrke sikkerhed og ansvarlighed introducerer OpenAI en funktion til menneskelig godkendelse i agentarbejdsgange. Før en agent kan udføre bestemte eksterne værktøjskald eller API-handlinger, kan et menneske gribe ind for at godkende, afvise eller justere adfærden.

Kernearbejdsgang:

  1. Pause værktøjsudførelse
  2. Serialiser og gem den aktuelle agenttilstand
  3. Anmod om menneskelig gennemgang og godkendelse
  4. Genoptag arbejdsgangen efter bekræftelse

Ideel til:

Brugsscenarier med store indsatser, såsom finansielle transaktioner, analyse af medicinske data eller følsomme kundeserviceopgaver. Denne mekanisme forbedrer gennemsigtighed, compliance og etiske sikkerhedsforanstaltninger i forbindelse med AI-beslutningstagning.


RealtimeAgent: Det har aldrig været nemmere at opbygge stemmeagenter

OpenAIs nye Realtidsagent Funktionen udnytter Realtime API'en til at lade udviklere bygge robuste stemmeagenter, der fungerer enten på klient- eller serversiden.

Nøglefunktioner:

  • Taleinput og -output i realtid
  • Integreret funktions-/værktøjskald
  • Understøttelse af afbrydelser og dynamisk lydafspilning
  • Kompatibilitet med overdragelser og autoværn

Hvorfor det er transformerende:
Nu kan stemmeagenter udvikles ligesom tekstagenter – med fuld adgang til AI-værktøjer og -logik. Dette åbner døren for avancerede applikationer som:

  • AI-drevne stemmestøttesystemer
  • Værktøjer til oversættelse eller diktering i realtid
  • Interaktive, taleaktiverede rollespil

Traces Dashboard får en stemmecentreret opgradering

Visualisering af hvert trin i en stemmeinteraktion

Spor Fejlfindings- og overvågningsværktøjet er blevet opdateret for at understøtte omfattende visualisering af stemmeagentsessioner i realtid.

Nye dashboardfunktioner:

  • Visning af lydbølgeformer for både bruger- og agentsvar
  • Logføringsværktøjets opkaldshistorik og deres parametre
  • Fremhævelse af afbrydelsespunkter (f.eks. når en bruger afbryder midt i en sætning)

Fordele for udviklere: Tydeligere fejlfinding, hurtigere iteration og bedre optimering af brugeroplevelser med fokus på stemmen.


GPT-4o tale-til-tale-model: Mere intelligent, mere naturlig

Smartere stemme, forbedret udførelse

GPT-4o-talemodellen har gennemgået omfattende forbedringer for at øge dens effektivitet i taleopgaver i realtid:

  • Bedre opfølgning på instruktioner – Udfører kommandoer med højere nøjagtighed
  • Mere konsekvent brug af værktøj – Reducerer variation i værktøjsaktivering
  • Forbedret håndtering af afbrydelser – Smartere justeringer midt i dialogen
  • Justerbar talehastighed - Nyt speed parameter for fleksibel stemmeoutput-pacing

Tilgængelige modeller:

  • gpt-4o-realtime-preview-2025-06-03 – Optimeret til realtids-API
  • gpt-4o-audio-preview-2025-06-03 – Designet til chatafslutninger med lyd

Disse opdateringer gør AI-stemmer mere naturlige, mere responsive og nemmere at dirigere – uanset om det er til hurtige nyhedsbriefinger eller langsom, instruktionsrig dialog.

Afsluttende tanker: En ny æra for stemme-AI-agenter

Med disse fire opdateringer fortsætter OpenAI med at udvide grænserne for udvikling af AI-agenter – hvilket gør det nemmere, sikrere og mere fleksibelt for udviklere at skabe menneskelignende digitale assistenter.

Integrationen af ​​TypeScript-understøttelse, human-in-the-loop-godkendelser, stemmeagentframeworks og opgraderede talemodeller giver et komplet værktøjssæt til design af intelligente, interaktive og kontekstbevidste agenter på tværs af platforme og brancher.

Uanset om du bygger en stemmeaktiveret kundeassistent, en spilfigur eller en virtuel tutor, giver OpenAIs nyeste værktøjer dig muligheden for at gøre det hurtigere – og smartere – end nogensinde før.

Kom godt i gang

CometAPI leverer en samlet REST-grænseflade, der samler hundredvis af AI-modeller – inklusive ChatGPT-familien – under et ensartet slutpunkt med indbygget API-nøglestyring, brugskvoter og faktureringsdashboards. I stedet for at jonglere med flere leverandør-URL'er og legitimationsoplysninger.

Til at begynde med, udforsk modellens muligheder i Legeplads og konsulter API guide for detaljerede instruktioner. Før du får adgang, skal du sørge for at være logget ind på CometAPI og have fået API-nøglen.

GPT-4o tale-til-tale-model i CometAPI er blevet udgivet, som er gpt-4o-realtime-preview-2025-06-03 og gpt-4o-audio-preview-2025-06-03,Velkommen til at ringe!

Se også GPT-4.1 API

Læs mere

500+ modeller i én API

Op til 20% rabat