O

gpt-audio-1.5

Giriş:$2/M
Çıktı:$8/M
Chat Completions ile ses girişi ve ses çıkışı için en iyi ses modeli.
Yeni
Ticari kullanım

gpt-audio-1.5'in teknik özellikleri

Öğegpt-audio-1.5 (kamuya açık özellikler)
Model ailesiGPT Audio ailesi (ses-öncelikli varyant)
Girdi türleriMetin, ses (konuşma girişi)
Çıktı türleriMetin, ses (konuşma çıkışı), yapılandırılmış çıktılar (işlev çağrıları desteklenir)
Bağlam penceresi128,000 token.
Maksimum çıktı token'ı16,384 (ilgili gpt-audio listelemesinde belgelendi).
Performans katmanıDaha yüksek zekâ; Orta hız (dengeli).
Gecikme profiliSesli etkileşimler için optimize edilmiştir (uç noktaya bağlı olarak orta/düşük gecikme).
KullanılabilirlikChat Completions API (ses girişi/çıkışı) ve platform playground'ları; gerçek zamanlı/ses yüzeyleri genelinde entegredir.
Güvenlik / kullanım notlarıSesli içerik için koruma mekanizmaları; üretim ses ajanlarında model çıktısını olağan güvenlik ve doğrulama süreçleriyle ele alın.

Not: gpt-realtime-1.5, daha düşük gecikme ve gerçek zamanlı oturumlar için optimize edilmiş, yakından ilişkili gerçek zamanlı ses/ses-öncelikli bir varyanttır; aşağıda karşılaştırın.


gpt-audio-1.5 nedir?

gpt-audio-1.5, Chat Completions ve ilgili ses destekli API'ler üzerinden hem konuşma girişi hem de konuşma çıkışını destekleyen, ses yetenekli bir GPT modelidir. Kalite ve hızı dengeleyerek, ses ajanları ve konuşma-öncelikli deneyimler geliştirmek için genel erişime açık başlıca ses modeli olarak konumlandırılmıştır.


Başlıca özellikler

  1. Konuşma girişi / konuşma çıkışı desteği: Konuşulan girdiyi işler ve doğal ses akışları için sesli veya metinsel yanıtlar döndürür.
  2. Ses iş akışları için geniş bağlam: Çok büyük bağlamı (belgelendiği üzere 128k token) destekler; çok turlu, uzun sohbet geçmişi veya büyük çok modlu oturumlar sağlar.
  3. Akış ve Chat Completions uyumluluğu: Akış halinde sesli yanıtlar ve işlev çağrısı yapısal çıktılarıyla Chat Completions içinde çalışır.
  4. Dengeli performans/gecikme: Orta verimde yüksek kaliteli sesli yanıtlar sunacak şekilde ayarlanmıştır—kalitenin önemli olduğu sohbet botları ve sesli asistanlar için uygundur.
  5. Ekosistem ve entegrasyonlar: Platformun playground'larında desteklenir ve resmi gerçek zamanlı/ses uç noktaları ile iş ortağı entegrasyonları genelinde kullanılabilir (Azure/Microsoft Foundry notları benzer ses modellerine atıfta bulunur).

gpt-audio-1.5 ve ilgili ses modelleri

Özellikgpt-audio-1.5gpt-realtime-1.5
Birincil odakChat Completions ve konuşmaya dayalı akışlar için yüksek kaliteli ses girişi/çıkışı.Canlı ses ajanları ve akış senaryoları için daha düşük gecikmeli gerçek zamanlı S2S (konuştan konuşmaya).
Bağlam penceresi128k token.32k token (gerçek zamanlı varyantta belgelendi).
Maksimum çıktı token'ı16,384 (belgelendi).Genellikle daha kısa gerçek zamanlı yanıtlara göre yapılandırılır (belgelerde daha küçük maksimum token listelenir).
En iyi kullanım alanıSohbet botları, tam sohbet semantiği + ses gereken ses özellikli asistanlar.Canlı ses ajanları, kiosklar ve düşük gecikmeli konuşmalı arayüzler.

Temsilî kullanım örnekleri

  • Müşteri desteği ve dahili yardım masaları için konuşmaya dayalı ses ajanları.
  • Uygulamalara, cihazlara ve kiosklara gömülü ses özellikli asistanlar.
  • Eller serbest iş akışları (dikte, sesli arama, erişilebilirlik).
  • Chat Completions aracılığıyla sesi metin/görsellerle harmanlayan çok modlu deneyimler.

Sınırlamalar ve operasyonel hususlar

  • İnsan QA için birebir ikame değildir: Üretim akışlarında ses çıktıları ve müteakip eylemleri her zaman insan incelemesiyle doğrulayın.
  • Kaynak planlaması: Büyük bağlam ve ses G/Ç'si işlem yükünü ve gecikmeyi artırabilir—uzun oturumlar için akış/bölütleme stratejileri tasarlayın.
  • Güvenlik ve politika kısıtları: Ses çıktıları ikna edici güç taşıyabilir; ölçekli dağıtımlarda platform güvenlik yönergeleri ve korumalarına uyun.
  • GPT Audio 1.5 API'ye nasıl erişilir

Adım 1: API Anahtarı için Kaydolun

cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun. CometAPI konsoluna giriş yapın. Arayüz için erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token bölümünde “Add Token”a tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.

CometAPI anahtarı

Adım 2: GPT Audio 1.5 API'sine İstek Gönderin

API isteğini göndermek için “gpt-audio-1.5” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API belgelerinden alınır. Kolaylık için web sitemiz Apifox testi de sağlar. Hesabınızdaki gerçek CometAPI anahtarınızla <YOUR_API_KEY> öğesini değiştirin. temel URL Chat Completions

Sorunuzu veya isteğinizi content alanına ekleyin—modelin yanıtlayacağı içerik budur. Oluşturulan yanıtı almak için API yanıtını işleyin.

Adım 3: Sonuçları Alın ve Doğrulayın

Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemenin ardından API, görev durumunu ve çıktı verilerini döndürür.

SSS