O

gpt-audio-1.5

Giriş:$2/M
Çıktı:$8/M
Chat Completions ile ses girişi ve ses çıkışı için en iyi ses modeli.
Yeni
Ticari kullanım

gpt-audio-1.5'in teknik özellikleri

Öğegpt-audio-1.5 (halka açık özellikler)
Model ailesiGPT Audio ailesi (ses-öncelikli varyant)
Girdi türleriMetin, ses (konuşma girişi)
Çıktı türleriMetin, ses (konuşma çıkışı), yapılandırılmış çıktılar (fonksiyon çağrıları desteklenir)
Bağlam penceresi128,000 belirteç.
Maksimum çıktı belirteci sayısı16,384 (ilgili gpt-audio listesinde belgelenmiştir).
Performans seviyesiDaha yüksek zekâ; Orta hız (dengeli).
Gecikme profiliSes etkileşimleri için optimize edilmiştir (uç noktaya bağlı olarak orta/düşük gecikme).
KullanılabilirlikChat Completions API’sı (ses girişi/çıkışı) ve platform playground’ları; gerçek zamanlı/ses kanalları genelinde entegre edilmiştir.
Güvenlik / kullanım notlarıSes içerikleri için koruma önlemleri; üretimdeki sesli ajanlar için model çıktıları üzerinde alışıldık güvenlik ve doğrulamayı uygulayın.

Not: gpt-realtime-1.5, daha düşük gecikme ve gerçek zamanlı oturumlar için optimize edilmiş, yakından ilgili gerçek zamanlı ses/ses-öncelikli bir varyanttır; aşağıda karşılaştırın.


gpt-audio-1.5 nedir?

gpt-audio-1.5, Chat Completions ve ilgili ses destekli API’ler aracılığıyla hem konuşma girişi hem konuşma çıkışını destekleyen ses yetenekli bir GPT modelidir. Kalite ve hızı dengeleyerek sesli ajanlar ve ses-öncelikli deneyimler oluşturmak için genel erişilebilir ana ses modeli olarak konumlandırılmıştır.


Başlıca özellikler

  1. Konuşma girişi / konuşma çıkışı desteği: Doğal ses akışları için konuşulan girdiyle çalışır ve konuşma veya metin yanıtları döndürür.
  2. Ses iş akışları için geniş bağlam: Çok büyük bağlamı (belgelenen 128k belirteç) destekleyerek çoklu tur, uzun sohbet geçmişi veya büyük çok modlu oturumlara imkân tanır.
  3. Akış ve Chat Completions uyumluluğu: Akışlı ses yanıtları ve fonksiyon çağrılı yapılandırılmış çıktılarla Chat Completions içinde çalışır.
  4. Dengeli performans/gecikme: Orta verimde yüksek kaliteli ses yanıtları sağlamak üzere ayarlanmıştır—kalitenin önemli olduğu sohbet botları ve sesli asistanlar için uygundur.
  5. Ekosistem ve entegrasyonlar: Platformun playground’larında desteklenir ve resmi gerçek zamanlı/ses uç noktaları ile iş ortaklarının entegrasyonlarında mevcuttur (Azure/Microsoft Foundry notları benzer ses modellerine atıf yapar).

gpt-audio-1.5 ile ilgili ses modelleri karşılaştırması

Özellikgpt-audio-1.5gpt-realtime-1.5
Birincil odakChat Completions ve sohbet akışları için yüksek kaliteli ses girişi/çıkışı.Canlı sesli ajanlar ve akış senaryoları için daha düşük gecikmeli gerçek zamanlı S2S (konuşmadan konuşmaya).
Bağlam penceresi128k belirteç.32k belirteç (gerçek zamanlı varyant olarak belgelenmiştir).
Maksimum çıktı belirteci16,384 (belgelendi).Genellikle daha kısa gerçek zamanlı yanıtlar için yapılandırılır (dokümanlar daha küçük maksimum belirteç sınırı listeler).
En uygun kullanımTam sohbet semantiği + sesin gerektiği sohbet botları, ses destekli asistanlar.Canlı sesli ajanlar, kiosklar ve düşük gecikmeli konuşma arayüzleri.

Örnek kullanım senaryoları

  • Müşteri destek ve dahili yardım masaları için sohbet odaklı sesli ajanlar.
  • Uygulamalara, cihazlara ve kiosk’lara gömülü ses destekli asistanlar.
  • Eller serbest iş akışları (dikte, sesli arama, erişilebilirlik).
  • Chat Completions aracılığıyla sesi metin/görsellerle harmanlayan çok modlu deneyimler.

Sınırlamalar ve operasyonel hususlar

  • İnsan QA’nin doğrudan ikamesi değildir: Üretim akışlarında konuşma çıktıları ve aşağı akış eylemlerini her zaman insan incelemesiyle doğrulayın.
  • Kaynak planlaması: Büyük bağlam ve ses G/Ç, hesaplama ve gecikmeyi artırabilir—uzun oturumlar için akış/bölütleme stratejileri tasarlayın.
  • Güvenlik ve politika kısıtları: Sesli çıktılar ikna gücü taşıyabilir; ölçekli dağıtımlarda platform güvenlik yönergeleri ve korumalarını izleyin.
  • GPT Audio 1.5 API'ye nasıl erişilir

Adım 1: API Anahtarına Kaydolun

cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz, lütfen önce kayıt olun. CometAPI konsolunuza giriş yapın. Arayüzün erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token bölümünde “Add Token”a tıklayın, belirteç anahtarını alın: sk-xxxxx ve gönderin.

cometapi-key

Adım 2: GPT Audio 1.5 API’sine İstek Gönderin

API isteğini göndermek için “gpt-audio-1.5” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümantasyonundan elde edilir. Kolaylık olması için web sitemiz Apifox testi de sağlar. <YOUR_API_KEY> değerini hesabınızdaki gerçek CometAPI anahtarınızla değiştirin. temel URL Chat Completions

Sorunuzu veya isteğinizi content alanına ekleyin—model bu alana yanıt verecektir. Oluşturulan yanıtı almak için API yanıtını işleyin.

Adım 3: Sonuçları Alın ve Doğrulayın

Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemenin ardından, API görev durumunu ve çıktı verilerini döndürür.

SSS

Daha Fazla Model