Thông số kỹ thuật của gpt-realtime-1.5

Hạng mục	gpt-realtime-1.5 (định vị công khai)
Họ mô hình	GPT Realtime 1.5 (biến thể tối ưu cho giọng nói)
Phương thức chính	Giọng nói sang giọng nói (S2S)
Loại đầu vào	Âm thanh (truyền phát), văn bản
Loại đầu ra	Âm thanh (truyền phát), văn bản, lời gọi công cụ có cấu trúc
API	Realtime API (WebRTC / các phiên truyền phát duy trì)
Đặc tính độ trễ	Tối ưu cho độ trễ thấp, tương tác hội thoại trực tiếp
Mô hình phiên	Các phiên truyền phát có trạng thái
Sử dụng công cụ	Hỗ trợ gọi hàm và tích hợp công cụ
Trường hợp sử dụng mục tiêu	Tác nhân giọng nói trực tiếp, trợ lý, hệ thống tương tác

Lưu ý: Giới hạn token và kích thước cửa sổ ngữ cảnh chính xác không được nêu bật trong các tóm tắt công khai; mô hình được định vị cho khả năng phản hồi thời gian thực thay vì các phiên ngữ cảnh cực dài.

gpt-realtime-1.5 là gì?

gpt-realtime-1.5 là mô hình tối ưu hóa cho giọng nói sang giọng nói với độ trễ thấp, được thiết kế cho các hệ thống hội thoại trực tiếp. Khác với các mô hình yêu cầu-phản hồi truyền thống, nó hoạt động thông qua các phiên truyền phát duy trì, cho phép luân phiên lượt nói tự nhiên, xử lý ngắt lời và tương tác giọng nói linh hoạt.

Nó được xây dựng có chủ đích cho các ứng dụng mà tốc độ luồng hội thoại quan trọng hơn độ dài ngữ cảnh tối đa.

Các tính năng chính

Tương tác giọng nói sang giọng nói thực sự — Nhận đầu vào âm thanh trực tiếp và truyền phát phản hồi bằng giọng nói theo thời gian thực.
Kiến trúc độ trễ thấp — Được thiết kế cho khả năng phản hồi hội thoại dưới một giây trong các tác nhân giọng nói.
Thiết kế ưu tiên truyền phát — Hoạt động qua các phiên duy trì (WebRTC hoặc các giao thức truyền phát).
Luân phiên lượt nói tự nhiên — Hỗ trợ xử lý ngắt lời và luồng hội thoại linh hoạt.
Hỗ trợ gọi công cụ — Có thể kích hoạt các lời gọi hàm có cấu trúc trong một phiên thời gian thực.
Nền tảng tác nhân giọng nói sẵn sàng cho sản xuất — Được xây dựng riêng cho trợ lý tương tác, ki-ốt và thiết bị nhúng.

Benchmark & định vị hiệu năng

OpenAI định vị gpt-realtime-1.5 là sự phát triển so với các mô hình thời gian thực trước đó với khả năng tuân thủ chỉ dẫn được cải thiện, ổn định hơn trong các phiên thoại kéo dài và ngữ điệu tự nhiên hơn so với các bản phát hành trước.

Khác với các mô hình tập trung vào lập trình (ví dụ các biến thể Codex), hiệu năng được đo lường nhiều hơn bằng độ trễ hội thoại, độ tự nhiên của giọng nói và độ ổn định phiên thay vì các benchmark kiểu bảng xếp hạng.

gpt-realtime-1.5 so với các mô hình liên quan

Tính năng	gpt-realtime-1.5	gpt-audio-1.5
Mục tiêu chính	Tương tác giọng nói trực tiếp	Quy trình trò chuyện có hỗ trợ âm thanh
Độ trễ	Tối ưu cho độ trễ tối thiểu	Cân bằng giữa chất lượng/tốc độ
Loại phiên	Phiên truyền phát duy trì	Luồng Chat Completions tiêu chuẩn
Kích thước ngữ cảnh	Tối ưu cho khả năng phản hồi	Hỗ trợ ngữ cảnh lớn hơn
Trường hợp sử dụng tốt nhất	Tác nhân giọng nói thời gian thực	Trợ lý hội thoại có âm thanh

Khi nào chọn từng mô hình

Chọn gpt-realtime-1.5 cho tổng đài, ki-ốt, lễ tân AI hoặc trợ lý nhúng trực tiếp.
Chọn gpt-audio-1.5 cho các ứng dụng chat hỗ trợ giọng nói cần bộ nhớ hội thoại dài hơn hoặc quy trình đa phương thức.

Trường hợp sử dụng tiêu biểu

Tác nhân tổng đài AI
Trợ lý thiết bị thông minh
Ki-ốt tương tác
Hệ thống gia sư trực tiếp
Công cụ luyện ngôn ngữ thời gian thực
Ứng dụng điều khiển bằng giọng nói
Cách truy cập GPT realtime 1.5 API

Bước 1: Đăng ký API key

Đăng nhập vào cometapi.com. Nếu bạn chưa là người dùng của chúng tôi, vui lòng đăng ký trước. Đăng nhập vào CometAPI console. Lấy API key thông tin xác thực của giao diện. Nhấp “Add Token” tại mục API token trong trung tâm cá nhân, nhận khóa token: sk-xxxxx và gửi.

cometapi-key

Bước 2: Gửi yêu cầu tới GPT realtime 1.5 API

Chọn endpoint “gpt-realtime-1.5” để gửi yêu cầu API và thiết lập phần thân yêu cầu. Phương thức yêu cầu và phần thân yêu cầu được lấy từ tài liệu API trên website của chúng tôi. Website của chúng tôi cũng cung cấp kiểm thử Apifox để bạn tiện sử dụng. Thay thế <YOUR_API_KEY> bằng CometAPI key thực tế từ tài khoản của bạn. URL cơ sở là Chat Completions

Chèn câu hỏi hoặc yêu cầu của bạn vào trường content — đây là nội dung mà mô hình sẽ phản hồi. Xử lý phản hồi API để lấy câu trả lời đã tạo.

Bước 3: Truy xuất và xác minh kết quả

Xử lý phản hồi API để lấy câu trả lời đã tạo. Sau khi xử lý, API phản hồi với trạng thái tác vụ và dữ liệu đầu ra.

gpt-realtime-1.5

Thông số kỹ thuật của gpt-realtime-1.5

gpt-realtime-1.5 là gì?

Các tính năng chính

Benchmark & định vị hiệu năng

gpt-realtime-1.5 so với các mô hình liên quan

Khi nào chọn từng mô hình

Trường hợp sử dụng tiêu biểu

Bước 1: Đăng ký API key

Bước 2: Gửi yêu cầu tới GPT realtime 1.5 API

Bước 3: Truy xuất và xác minh kết quả

Câu hỏi thường gặp

What is gpt-realtime-1.5 used for in the Realtime API?

How is gpt-realtime-1.5 different from gpt-audio-1.5 API?

Does gpt-realtime-1.5 API support function calling during live sessions?

Is gpt-realtime-1.5 suitable for customer support voice bots?

Can gpt-realtime-1.5 handle interruptions during conversation?

Does gpt-realtime-1.5 prioritize latency or long context memory?

What infrastructure is required to integrate gpt-realtime-1.5 API?

Tính năng cho gpt-realtime-1.5

Giá cả cho gpt-realtime-1.5

Mã mẫu và API cho gpt-realtime-1.5

Thêm mô hình