What are the official context and output token limits for gpt-audio-1.5 API?

gpt-audio-1.5, 128,000 belirteçlik bir bağlam penceresini destekler ve belgelerde yaklaşık 16,384 azami çıktı belirteci yapılandırması listelenir; kesin sınırları uç nokta bazında geliştirici belgelerinde doğrulayın. :contentReference[oaicite:44]{index=44}

Can gpt-audio-1.5 handle both speech-to-text and text-to-speech in the API?

Evet — ses girdilerini kabul eder ve Chat Completions/audio uç noktaları üzerinden ses çıktıları veya metinsel yanıtlar döndürebilir. :contentReference[oaicite:45]{index=45}

When should I use gpt-audio-1.5 vs gpt-realtime-1.5 for a voice agent?

Daha büyük bağlam gerektiren Chat Completions akışlarında daha yüksek kaliteli ses için gpt-audio-1.5’i seçin; düşük gecikmeli, canlı akışlı sesli etkileşimler için gpt-realtime-1.5’i seçin. :contentReference[oaicite:46]{index=46}

Does gpt-audio-1.5 support streaming and function calling for tool integrations?

Evet — model, harici araçlar ve iş akışlarıyla entegrasyon için akışlı ses yanıtlarını ve yapılandırılmış çıktıları/fonksiyon çağrılarını destekler. :contentReference[oaicite:47]{index=47}

Is gpt-audio-1.5 suitable for production customer support voice agents?

Evet — ses asistanları ve sohbet ajanları için tasarlanmıştır, ancak üretim ortamına almadan önce insan gözden geçirmesi/QA, günlükleme ve güvenlik kontrolleri eklemelisiniz. :contentReference[oaicite:48]{index=48}

What are the main limitations to consider when deploying gpt-audio-1.5?

Başlıca hususlar, büyük bağlamlı ses oturumları için hesaplama/gecikme ödünleşimleri, ses içeriği için güvenlik önlemleri ve alanınızda ASR/TTS çıktılarının doğrulanması gerekliliğidir. :contentReference[oaicite:49]{index=49}

O

gpt-audio-1.5

Giriş:$2/M

Çıktı:$8/M

Yayınlandı:Feb 24, 2026

Yeni

Ticari kullanım

gpt-audio-1.5’in teknik özellikleri

Öğe	gpt-audio-1.5 (genel kamuya açık spesifikasyonlar)
Model ailesi	GPT Audio ailesi (önceliği ses olan varyant)
Girdi türleri	Metin, ses (konuşma girişi)
Çıktı türleri	Metin, ses (konuşma çıkışı), yapılandırılmış çıktılar (fonksiyon çağrıları desteklenir)
Bağlam penceresi	128,000 token.
Maksimum çıktı token	16,384 (ilgili gpt-audio listesinde belgelenmiştir).
Performans katmanı	Daha yüksek zeka; Orta hız (dengeli).
Gecikme profili	Ses etkileşimleri için optimize edilmiştir (uç noktaya bağlı olarak orta/düşük gecikme).
Kullanılabilirlik	Chat Completions API (ses girdi/çıktı) ve platform playground’ları; gerçek zamanlı/ses yüzeyleri genelinde entegre.
Güvenlik/kullanım notları	Ses içeriği için koruma önlemleri; üretim ses aracıları için model çıktıları alışıldık güvenlik ve doğrulama süreçleriyle ele alınmalıdır.

Not: gpt-realtime-1.5, daha düşük gecikme ve gerçek zamanlı oturumlar için optimize edilmiş, yakından ilişkili gerçek zamanlı ses/önceliği ses olan bir varyanttır; aşağıda karşılaştırın.

gpt-audio-1.5 nedir?

gpt-audio-1.5, Chat Completions ve ilgili ses yetenekli API’ler üzerinden hem konuşma girişi hem de konuşma çıkışı destekleyen ses yetenekli bir GPT modelidir. Kalite ve hız arasında denge kurarak, sesli aracıların ve ses-öncelikli deneyimlerin oluşturulmasına yönelik genel olarak erişilebilir başlıca ses modeli olarak konumlandırılmıştır.

Ana özellikler

Konuşma girişi/konuşma çıkışı desteği: Konuşma girdisini işleyip doğal ses akışları için konuşma veya metin yanıtları döndürür.
Ses iş akışları için geniş bağlam: Çok büyük bağlamı (belgelenen 128k token) destekler; çok turlu, uzun sohbet geçmişi veya büyük çoklu modal oturumları etkinleştirir.
Akış ve Chat Completions uyumluluğu: Akış halinde ses yanıtları ve fonksiyon çağrılarıyla yapılandırılmış çıktılarla Chat Completions içinde çalışır.
Dengeli performans/gecikme: Orta verimlilikte yüksek kaliteli ses yanıtları sunacak şekilde ayarlanmıştır—kalitenin önemli olduğu sohbet botları ve sesli asistanlar için uygundur.
Ekosistem ve entegrasyonlar: Platformun playground’larında desteklenir ve resmi gerçek zamanlı/ses uç noktaları ile iş ortağı entegrasyonları genelinde kullanılabilir (Azure/Microsoft Foundry notları benzer ses modellerine referans verir).

gpt-audio-1.5 ve ilgili ses modelleri karşılaştırması

Özellik	gpt-audio-1.5	gpt-realtime-1.5
Birincil odak	Chat Completions ve sohbet akışları için yüksek kaliteli ses girdi/çıktı.	Canlı sesli aracı ve akış senaryoları için daha düşük gecikmeli gerçek zamanlı S2S (speech-to-speech).
Bağlam penceresi	128k token.	32k token (gerçek zamanlı varyantta belgelenmiştir).
Maks çıktı token	16,384 (belgelenmiştir).	Genellikle daha kısa gerçek zamanlı yanıtlar için yapılandırılır (dokümanlar daha küçük maksimumu listeler).
En iyi kullanım	Tam sohbet semantiği + sesin gerektiği sohbet botları ve ses-etkin asistanlar.	Canlı sesli aracıları, kiosklar ve düşük gecikmeli sohbet arayüzleri.

Temsili kullanım örnekleri

Müşteri desteği ve dahili yardım masaları için konuşmaya dayalı sesli aracıları.
Uygulamalara, cihazlara ve kiosk’lara gömülü sesli asistanlar.
Elleri serbest iş akışları (dikte, sesli arama, erişilebilirlik).
Chat Completions üzerinden sesin metin/görsellerle harmanlandığı çoklu modal deneyimler.

Sınırlamalar ve operasyonel hususlar

İnsan QA’nin bire bir ikamesi değildir: Üretim akışlarında ses çıktıları ve aşağı akıştaki eylemleri her zaman insan incelemesiyle doğrulayın.
Kaynak planlaması: Geniş bağlam ve ses girdi/çıktısı hesaplama maliyeti ve gecikmeyi artırabilir—uzun oturumlar için akış/bölütleme stratejileri tasarlayın.
Güvenlik ve politika kısıtlamaları: Ses çıktıları ikna edici güç taşıyabilir; geniş ölçekte dağıtırken platform güvenlik yönergeleri ve koruma önlemlerine uyun.
GPT Audio 1.5 API’ye nasıl erişilir

Adım 1: API Anahtarı için Kaydolun

cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kaydolun. CometAPI console hesabınıza giriş yapın. Arayüz için erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token bölümünde “Add Token”ı tıklayın, belirteç anahtarını alın: sk-xxxxx ve gönderin.

cometapi-key

Adım 2: GPT Audio 1.5 API’sine İstek Gönderin

API isteğini göndermek için “gpt-audio-1.5” uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Web sitemiz kolaylığınız için Apifox testi de sağlar. <YOUR_API_KEY> değerini hesabınızdaki gerçek CometAPI anahtarıyla değiştirin. temel URL Chat Completions

Sorunuzu veya isteğinizi content alanına ekleyin—modelin yanıtlayacağı kısım budur. Oluşturulan yanıtı almak için API yanıtını işleyin.

Adım 3: Sonuçları Alın ve Doğrulayın

Oluşturulan yanıtı almak için API yanıtını işleyin. İşleme tamamlandıktan sonra API, görev durumunu ve çıktı verilerini döndürür.

SSS

gpt-audio-1.5 için Fiyatlandırma

gpt-audio-1.5 için çeşitli bütçelere ve kullanım ihtiyaçlarına uygun rekabetçi fiyatlandırmayı keşfedin. Esnek planlarımız sadece kullandığınız kadar ödeme yapmanızı sağlar ve ihtiyaçlarınız büyüdükçe kolayca ölçeklendirme imkanı sunar. gpt-audio-1.5'in maliyetleri yönetilebilir tutarken projelerinizi nasıl geliştirebileceğini keşfedin.

Comet Fiyatı (USD / M Tokens)	Resmi Fiyat (USD / M Tokens)	İndirim
Giriş:$2/M Çıktı:$8/M	Giriş:$2.5/M Çıktı:$10/M	-20%

gpt-audio-1.5 için örnek kod ve API

gpt-audio-1.5 için kapsamlı örnek kodlara ve API kaynaklarına erişerek entegrasyon sürecinizi kolaylaştırın. Ayrıntılı dokümantasyonumuz adım adım rehberlik sağlayarak projelerinizde gpt-audio-1.5'in tüm potansiyelinden yararlanmanıza yardımcı olur.

POST

/v1/chat/completions

from openai import OpenAI
import os
import base64

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="gpt-audio-1.5",
    modalities=["text", "audio"],
    audio={"voice": "alloy", "format": "wav"},
    messages=[
        {
            "role": "user",
            "content": "Is a golden retriever a good family dog?"
        }
    ],
)

# Print the text response
print(completion.choices[0].message.audio.transcript)

# Save the audio response to a file
wav_bytes = base64.b64decode(completion.choices[0].message.audio.data)
output_path = "gpt-audio-1.5-output.wav"
with open(output_path, "wb") as f:
    f.write(wav_bytes)
print(f"Audio saved to {output_path}")

Python Code Example

from openai import OpenAI
import os
import base64

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)

completion = client.chat.completions.create(
    model="gpt-audio-1.5",
    modalities=["text", "audio"],
    audio={"voice": "alloy", "format": "wav"},
    messages=[
        {
            "role": "user",
            "content": "Is a golden retriever a good family dog?"
        }
    ],
)

# Print the text response
print(completion.choices[0].message.audio.transcript)

# Save the audio response to a file
wav_bytes = base64.b64decode(completion.choices[0].message.audio.data)
output_path = "gpt-audio-1.5-output.wav"
with open(output_path, "wb") as f:
    f.write(wav_bytes)
print(f"Audio saved to {output_path}")

JavaScript Code Example

import OpenAI from "openai";
import fs from "fs";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({ apiKey: api_key, baseURL: base_url });

const completion = await openai.chat.completions.create({
  model: "gpt-audio-1.5",
  modalities: ["text", "audio"],
  audio: { voice: "alloy", format: "wav" },
  messages: [
    {
      role: "user",
      content: "Is a golden retriever a good family dog?",
    },
  ],
});

// Print the text transcript
console.log(completion.choices[0].message.audio.transcript);

// Save the audio response to a file
const wavBytes = Buffer.from(completion.choices[0].message.audio.data, "base64");
const outputPath = "gpt-audio-1.5-output.wav";
fs.writeFileSync(outputPath, wavBytes);
console.log(`Audio saved to ${outputPath}`);

Curl Code Example

# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

RESPONSE=$(curl https://api.cometapi.com/v1/chat/completions \
  -s \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-audio-1.5",
    "modalities": ["text", "audio"],
    "audio": {
      "voice": "alloy",
      "format": "wav"
    },
    "messages": [
      {
        "role": "user",
        "content": "Is a golden retriever a good family dog?"
      }
    ]
  }')

# Print the text transcript
echo "$RESPONSE" | python3 -c "import sys, json; r=json.load(sys.stdin); print(r['choices'][0]['message']['audio']['transcript'])"

# Save the audio to a WAV file
echo "$RESPONSE" | python3 -c "
import sys, json, base64
r = json.load(sys.stdin)
audio_data = r['choices'][0]['message']['audio']['data']
with open('gpt-audio-1.5-output.wav', 'wb') as f:
    f.write(base64.b64decode(audio_data))
print('Audio saved to gpt-audio-1.5-output.wav')
"