ModellerDestekKurumsalBlog
500+ Yapay Zeka Modeli API'si, Hepsi Tek Bir API'de. Sadece CometAPI'de
Modeller API
Geliştirici
Hızlı BaşlangıçDokümantasyonAPI Kontrol Paneli
Kaynaklar
Yapay Zeka ModelleriBlogKurumsalDeğişiklik GünlüğüHakkında
2025 CometAPI. Tüm hakları saklıdır.Gizlilik PolitikasıHizmet Şartları
Home/Models/OpenAI/gpt-realtime-1.5
O

gpt-realtime-1.5

Giriş:$3.2/M
Çıktı:$12.8/M
Bağlam:32,000
Maksimum Çıktı:4,096
Ses girişi ve ses çıkışı için en iyi ses modeli.
Yeni
Ticari kullanım
Genel Bakış
Özellikler
Fiyatlandırma
API

gpt-realtime-1.5 Teknik Özellikleri

Öğegpt-realtime-1.5 (genel konumlandırma)
Model ailesiGPT Realtime 1.5 (ses için optimize edilmiş varyant)
Birincil kipKonuşmadan konuşmaya (S2S)
Girdi türleriSes (akış), metin
Çıktı türleriSes (akış), metin, yapılandırılmış araç çağrıları
APIRealtime API (WebRTC / kalıcı akış oturumları)
Gecikme profiliDüşük gecikmeli, canlı konuşma etkileşimi için optimize edilmiş
Oturum modeliDurum bilgili akış oturumları
Araç kullanımıFonksiyon çağırma ve araç entegrasyonları desteklenir
Hedef kullanım senaryosuCanlı sesli ajanlar, asistanlar, etkileşimli sistemler

Not: Kesin token sınırları ve bağlam penceresi boyutları, herkese açık özetlerde belirgin şekilde belgelenmemiştir; model, son derece uzun bağlam oturumlarından ziyade gerçek zamanlı yanıt verebilirlik için konumlandırılmıştır.


gpt-realtime-1.5 nedir?

gpt-realtime-1.5, canlı konuşma sistemleri için tasarlanmış, düşük gecikmeli, konuşmadan konuşmaya optimize edilmiş bir modeldir. Geleneksel istek-yanıt modellerinden farklı olarak kalıcı akış oturumları üzerinden çalışır; bu da doğal sıra alma, kesinti yönetimi ve dinamik sesli etkileşim sağlar.

Maksimum bağlam uzunluğundan çok konuşma akış hızının önemli olduğu uygulamalar için özel olarak geliştirilmiştir.


Temel Özellikler

  1. Gerçek konuşmadan konuşmaya etkileşim — Canlı ses girdisini kabul eder ve konuşulan yanıtları gerçek zamanlı olarak akıtır.
  2. Düşük gecikmeli mimari — Sesli ajanlarda bir saniyenin altındaki konuşma yanıt verebilirliği için tasarlanmıştır.
  3. Önce akış tasarımı — Kalıcı oturumlar (WebRTC veya akış protokolleri) aracılığıyla çalışır.
  4. Doğal sıra alma — Kesinti yönetimini ve dinamik konuşma akışını destekler.
  5. Araç çağırma desteği — Gerçek zamanlı bir oturum sırasında yapılandırılmış fonksiyon çağrılarını tetikleyebilir.
  6. Üretime hazır sesli ajan temeli — Özellikle etkileşimli asistanlar, kiosklar ve gömülü cihazlar için oluşturulmuştur.

Benchmark ve Performans Konumlandırması

OpenAI, gpt-realtime-1.5 modelini daha önceki gerçek zamanlı modellerin bir evrimi olarak konumlandırır; önceki sürümlere kıyasla daha iyi talimat takibi, uzun sesli oturumlarda daha yüksek kararlılık ve daha doğal prozodi sunar.

Kodlama odaklı modellerin (ör. Codex varyantları) aksine, performans liderlik tablosu tarzı benchmark’lardan çok konuşma gecikmesi, ses doğallığı ve oturum kararlılığı ile ölçülür.


gpt-realtime-1.5 ve İlgili Modeller

Özellikgpt-realtime-1.5gpt-audio-1.5
Birincil amaçCanlı sesli etkileşimSes özellikli sohbet iş akışları
GecikmeMinimum gecikme için optimizeDengeli kalite/hız
Oturum türüKalıcı akış oturumuStandart Chat Completions akışı
Bağlam boyutuYanıt verebilirlik için optimizeDaha büyük bağlam desteği
En iyi kullanım senaryosuGerçek zamanlı sesli ajanlarSesli konuşma asistanları

Ne Zaman Hangisi Seçilmeli

  • Çağrı merkezleri, kiosklar, AI resepsiyonistleri veya canlı gömülü asistanlar için gpt-realtime-1.5 seçin.
  • Daha uzun konuşma belleği veya çok kipli iş akışları gerektiren ses özellikli sohbet uygulamaları için gpt-audio-1.5 seçin.

Temsili Kullanım Senaryoları

  • AI çağrı merkezi ajanları
  • Akıllı cihaz asistanları
  • Etkileşimli kiosklar
  • Canlı özel ders sistemleri
  • Gerçek zamanlı dil pratiği araçları
  • Ses kontrollü uygulamalar
  • GPT realtime 1.5 API’sine nasıl erişilir

Adım 1: API Anahtarı için Kaydolun

cometapi.com hesabınıza giriş yapın. Henüz kullanıcımız değilseniz lütfen önce kayıt olun. CometAPI konsolunuza giriş yapın. Arayüzün erişim kimlik bilgisi olan API anahtarını alın. Kişisel merkezde API token bölümünde “Add Token” seçeneğine tıklayın, token anahtarını alın: sk-xxxxx ve gönderin.

cometapi-key

Adım 2: GPT realtime 1.5 API’ye İstek Gönderin

API isteğini göndermek için “gpt-realtime-1.5” endpoint’ini seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanlarından alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar. <YOUR_API_KEY> yer tutucusunu hesabınızdaki gerçek CometAPI anahtarınızla değiştirin. base url Chat Completions adresidir.

Sorunuzu veya isteğinizi content alanına ekleyin — modelin yanıt vereceği içerik budur. Oluşturulan yanıtı almak için API yanıtını işleyin.

Adım 3: Sonuçları Alın ve Doğrulayın

Oluşturulan yanıtı almak için API yanıtını işleyin. İşlemeden sonra API, görev durumunu ve çıktı verilerini döndürür.

SSS

What is gpt-realtime-1.5 used for in the Realtime API?

gpt-realtime-1.5, kalıcı akış oturumları kullanarak düşük gecikmeli konuşmadan konuşmaya etkileşimler için tasarlanmıştır; bu da onu canlı sesli temsilciler ve etkileşimli asistanlar için ideal kılar.

How is gpt-realtime-1.5 different from gpt-audio-1.5 API?

gpt-realtime-1.5, minimum gecikmeyle gerçek zamanlı akışlı sesli konuşmalara odaklanırken, gpt-audio-1.5 daha yüksek bağlamlı, ses özellikli sohbet iş akışları için optimize edilmiştir.

Does gpt-realtime-1.5 API support function calling during live sessions?

Evet, gpt-realtime-1.5 etkin bir gerçek zamanlı oturum içinde yapılandırılmış araç çağrılarını destekler ve harici sistemlerle entegrasyona olanak tanır.

Is gpt-realtime-1.5 suitable for customer support voice bots?

Evet, çağrı merkezi temsilcileri ve sanal resepsiyonistler gibi etkileşimli, düşük gecikmeli konuşma sistemleri için özel olarak optimize edilmiştir.

Can gpt-realtime-1.5 handle interruptions during conversation?

Evet, model doğal konuşma sırası alışverişi için tasarlanmıştır ve akışlı bir ses oturumu sırasında kesintileri yönetebilir.

Does gpt-realtime-1.5 prioritize latency or long context memory?

gpt-realtime-1.5, son derece büyük bağlam pencerelerinden ziyade konuşma tepkiselliğine ve düşük gecikmeye öncelik verir.

What infrastructure is required to integrate gpt-realtime-1.5 API?

Geliştiriciler, gpt-realtime-1.5 API'sini entegre ederken kalıcı ses oturumlarını sürdürmek için genellikle WebRTC veya akış tabanlı bağlantılar kullanır.

gpt-realtime-1.5 için Özellikler

gpt-realtime-1.5'in performansı ve kullanılabilirliği artırmak için tasarlanmış temel özelliklerini keşfedin. Bu yeteneklerin projelerinize nasıl fayda sağlayabileceğini ve kullanıcı deneyimini nasıl geliştirebileceğini öğrenin.

gpt-realtime-1.5 için Fiyatlandırma

gpt-realtime-1.5 için çeşitli bütçelere ve kullanım ihtiyaçlarına uygun rekabetçi fiyatlandırmayı keşfedin. Esnek planlarımız sadece kullandığınız kadar ödeme yapmanızı sağlar ve ihtiyaçlarınız büyüdükçe kolayca ölçeklendirme imkanı sunar. gpt-realtime-1.5'in maliyetleri yönetilebilir tutarken projelerinizi nasıl geliştirebileceğini keşfedin.
Comet Fiyatı (USD / M Tokens)Resmi Fiyat (USD / M Tokens)İndirim
Giriş:$3.2/M
Çıktı:$12.8/M
Giriş:$4/M
Çıktı:$16/M
-20%

gpt-realtime-1.5 için örnek kod ve API

gpt-realtime-1.5 için kapsamlı örnek kodlara ve API kaynaklarına erişerek entegrasyon sürecinizi kolaylaştırın. Ayrıntılı dokümantasyonumuz adım adım rehberlik sağlayarak projelerinizde gpt-realtime-1.5'in tüm potansiyelinden yararlanmanıza yardımcı olur.

Daha Fazla Model

O

gpt-audio-1.5

Giriş:$2/M
Çıktı:$8/M
Chat Completions ile ses girişi ve ses çıkışı için en iyi ses modeli.
O

Whisper-1

Giriş:$24/M
Çıktı:$24/M
请提供需要处理的音频或文本,并说明: - 源语言 - 目标语言(默认土耳其语) - 是否需要保留原格式(如 HTML/Markdown/JSON) - 术语或风格要求(如正式/口语) 我将先进行语音转写(如为音频),再在严格保留结构的前提下进行精准翻译。
O

TTS

Giriş:$12/M
Çıktı:$12/M
OpenAI Metinden Konuşmaya
K

Kling TTS

İstek Başına:$0.006608
[Konuşma Sentezi] Yeni kullanıma sunuldu: önizleme özelliğine sahip çevrimiçi metinden yayın kalitesinde ses ● Aynı anda audio_id oluşturabilir, herhangi bir Keling API'siyle kullanılabilir
K

Kling video-to-audio

K

Kling video-to-audio

İstek Başına:$0.03304
Kling videodan sese
K

Kling text-to-audio

K

Kling text-to-audio

İstek Başına:$0.03304
Kling text-to-audio