ข้อมูลจำเพาะทาง技术ของ `tts-1`

สเปก	รายละเอียด
ID ของโมเดล	`tts-1`
ผู้ให้บริการ	OpenAI
ประเภทโมเดล	โมเดลแปลงข้อความเป็นคำพูด (TTS) สำหรับแปลงข้อความอินพุตให้เป็นเสียงพูด
การเพิ่มประสิทธิภาพหลัก	ปรับให้เหมาะกับความเร็วและความหน่วงต่ำ โดยเฉพาะการสร้างเสียงแบบเรียลไทม์หรือใกล้เรียลไทม์
โปรไฟล์คุณภาพ	ความหน่วงต่ำกว่า `tts-1-hd` แต่คุณภาพเสียงต่ำกว่ารุ่น HD
รูปแบบอินพุต	ข้อความเท่านั้น
รูปแบบเอาต์พุต	เสียงเท่านั้น
ปลายทาง API	ปลายทางการสร้างเสียงของ OpenAI Audio API: `/v1/audio/speech`
ความยาวอินพุตสูงสุด	สูงสุด 4096 อักขระต่อคำขอ
รูปแบบการตอบสนองที่รองรับ	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`
การควบคุมความเร็ว	รองรับตั้งแต่ `0.25` ถึง `4.0` โดยมีค่าเริ่มต้นเป็น `1.0`
ตัวเลือกเสียงสำหรับ `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`
การรองรับการสตรีม	Speech API รองรับการสตรีมเอาต์พุตเสียง แต่ `tts-1` ไม่รองรับการสตรีมแบบ SSE และการควบคุมเสียงโดยอิงคำสั่ง
ราคา	OpenAI ระบุราคา `tts-1` ที่ $15 ต่อ 1M โทเค็นสำหรับการสร้างเสียงพูด

`tts-1` คืออะไร?

tts-1 คือโมเดลแปลงข้อความเป็นคำพูดของ OpenAI ที่ออกแบบมาเพื่อเปลี่ยนข้อความเขียนให้เป็นเสียงพูดที่ฟังเป็นธรรมชาติ โดยถูกวางตำแหน่งให้เป็นตัวเลือกที่เร็วกว่าและมีความหน่วงต่ำกว่าในบรรดาโมเดล TTS แบบคลาสสิกของ OpenAI จึงเหมาะสำหรับงานที่ต้องการสังเคราะห์เสียงอย่างรวดเร็วมากกว่าความเที่ยงตรงของเสียงในระดับสูงสุด

นักพัฒนามักใช้ tts-1 ผ่านปลายทางสำหรับสร้างเสียงของ Audio API เมื่อต้องการแปลงข้อความของแอป พรอมป์ การแจ้งเตือน บทพากย์ หรือคำตอบของผู้ช่วย ให้เป็นไฟล์เสียงที่เล่นได้ เอกสารของ OpenAI ระบุว่าโมเดลนี้ได้รับการปรับให้เหมาะกับกรณีใช้งาน TTS แบบเรียลไทม์

ในการใช้งานจริง tts-1 เหมาะกับประสบการณ์เสียงที่เบา ระบบตอบสนองรวดเร็ว ต้นแบบแบบโต้ตอบ และผลิตภัณฑ์ที่ให้ความสำคัญกับความไวในการตอบสนองมากกว่าคุณภาพเสียงระดับพรีเมียม หากต้องการคุณภาพสูงสุด OpenAI แนะนำให้ใช้ tts-1-hd ขณะที่กรณีใช้งานด้านความแสดงออกของเสียงที่ใหม่กว่าอาจเลือกใช้โมเดล TTS รุ่นใหม่แทน

คุณสมบัติหลักของ `tts-1`

การสร้างเสียงความหน่วงต่ำ: tts-1 ถูกปรับให้เหมาะกับความเร็ว ทำให้เหมาะสำหรับแอปที่ต้องการเอาต์พุตเสียงอย่างรวดเร็ว
การแปลงข้อความเป็นคำพูดที่ฟังเป็นธรรมชาติ: โมเดลแปลงข้อความธรรมดาเป็นเสียงพูด เหมาะกับการบรรยาย คำตอบของผู้ช่วย และอินเทอร์เฟซเสียง
มีเสียงในตัวหลายแบบ: รองรับชุดเสียงในตัว ได้แก่ alloy, ash, coral, echo, fable, onyx, nova, sage และ shimmer
รองรับรูปแบบเอาต์พุตเสียงที่ยืดหยุ่น: นักพัฒนาสามารถขอเอาต์พุตเป็น MP3, WAV, FLAC, AAC, Opus และ PCM ตามความต้องการด้านการเล่นหรือการประมวลผล
ปรับความเร็วการเล่นได้: API อนุญาตให้ปรับความเร็วตั้งแต่ 0.25x ถึง 4.0x เพื่อการบรรยายที่ช้าลงหรือการเล่นที่เร็วขึ้นตามความเหมาะสม
ผสานการทำงานผ่าน API ได้ง่าย: tts-1 ใช้งานผ่าน API การสร้างเสียงมาตรฐาน จึงผสานเข้ากับเวิร์กโฟลว์เว็บ มือถือ หรือแบ็กเอนด์ได้ไม่ยาก
เหมาะสำหรับแอปที่เน้นการทำงานแบบเรียลไทม์: OpenAI ระบุชัดว่า tts-1 ถูกออกแบบมาสำหรับกรณีใช้งาน TTS แบบเรียลไทม์ เหมาะกับผู้ช่วย การแจ้งเตือน และระบบโต้ตอบที่เร็ว
ทางเลือกโมเดลที่เน้นการแลกเปลี่ยนระหว่างความเร็วกับคุณภาพ: เมื่อเทียบกับ tts-1-hd โมเดลนี้ให้ความสำคัญกับความเร็วมากกว่าความเที่ยงตรงของเสียง ช่วยให้เลือกได้ชัดเจนระหว่างความหน่วงกับคุณภาพ

วิธีเข้าถึงและผสานการทำงานกับ `tts-1`

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

หากต้องการเข้าถึง API ของ tts-1 ให้สมัครที่ CometAPI และสร้างคีย์ API จากแดชบอร์ด หลังจากเข้าสู่ระบบ ให้สร้างคีย์ใหม่ คัดลอกอย่างปลอดภัย และเก็บไว้ในตัวแปรสภาพแวดล้อมของแอปพลิเคชัน คุณจะใช้คีย์นี้ในการยืนยันตัวตนของคำขอทั้งหมดไปยัง API ของ tts-1

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ `tts-1`

เมื่อคุณมีคีย์ API แล้ว ให้ส่งคำขอ POST ไปยังปลายทาง CometAPI สำหรับ tts-1 พร้อมเพย์โหลดอินพุต ระบุคีย์ API ในส่วนหัว Authorization และกำหนด tts-1 เป็นโมเดล โดยคำขอทั่วไปจะมีข้อความอินพุตและพารามิเตอร์ TTS เช่น เสียงและรูปแบบการตอบกลับ

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

หลังจากส่งคำขอแล้ว หากการเรียกสำเร็จ API ของ tts-1 จะส่งคืนเนื้อหาเสียงที่สร้างขึ้น ให้บันทึกไฟล์หรือสตรีมที่ได้รับ ตรวจสอบว่าเล่นได้ถูกต้อง และยืนยันว่าเสียง ความเร็ว และรูปแบบที่เลือกตรงตามความต้องการของแอปพลิเคชันของคุณ หากจำเป็น ให้ลองอีกครั้งโดยปรับพารามิเตอร์เพื่อปรับปรุงผลลัพธ์สุดท้าย

ข้อมูลจำเพาะทาง技术ของ `tts-1`

สเปก	รายละเอียด
ID ของโมเดล	`tts-1`
ผู้ให้บริการ	OpenAI
ประเภทโมเดล	โมเดลแปลงข้อความเป็นคำพูด (TTS) สำหรับแปลงข้อความอินพุตให้เป็นเสียงพูด
การเพิ่มประสิทธิภาพหลัก	ปรับให้เหมาะกับความเร็วและความหน่วงต่ำ โดยเฉพาะการสร้างเสียงแบบเรียลไทม์หรือใกล้เรียลไทม์
โปรไฟล์คุณภาพ	ความหน่วงต่ำกว่า `tts-1-hd` แต่คุณภาพเสียงต่ำกว่ารุ่น HD
รูปแบบอินพุต	ข้อความเท่านั้น
รูปแบบเอาต์พุต	เสียงเท่านั้น
ปลายทาง API	ปลายทางการสร้างเสียงของ OpenAI Audio API: `/v1/audio/speech`
ความยาวอินพุตสูงสุด	สูงสุด 4096 อักขระต่อคำขอ
รูปแบบการตอบสนองที่รองรับ	`mp3`, `opus`, `aac`, `flac`, `wav`, `pcm`
การควบคุมความเร็ว	รองรับตั้งแต่ `0.25` ถึง `4.0` โดยมีค่าเริ่มต้นเป็น `1.0`
ตัวเลือกเสียงสำหรับ `tts-1`	`alloy`, `ash`, `coral`, `echo`, `fable`, `onyx`, `nova`, `sage`, `shimmer`
การรองรับการสตรีม	Speech API รองรับการสตรีมเอาต์พุตเสียง แต่ `tts-1` ไม่รองรับการสตรีมแบบ SSE และการควบคุมเสียงโดยอิงคำสั่ง
ราคา	OpenAI ระบุราคา `tts-1` ที่ $15 ต่อ 1M โทเค็นสำหรับการสร้างเสียงพูด

`tts-1` คืออะไร?

คุณสมบัติหลักของ `tts-1`

การสร้างเสียงความหน่วงต่ำ: tts-1 ถูกปรับให้เหมาะกับความเร็ว ทำให้เหมาะสำหรับแอปที่ต้องการเอาต์พุตเสียงอย่างรวดเร็ว
การแปลงข้อความเป็นคำพูดที่ฟังเป็นธรรมชาติ: โมเดลแปลงข้อความธรรมดาเป็นเสียงพูด เหมาะกับการบรรยาย คำตอบของผู้ช่วย และอินเทอร์เฟซเสียง
มีเสียงในตัวหลายแบบ: รองรับชุดเสียงในตัว ได้แก่ alloy, ash, coral, echo, fable, onyx, nova, sage และ shimmer
รองรับรูปแบบเอาต์พุตเสียงที่ยืดหยุ่น: นักพัฒนาสามารถขอเอาต์พุตเป็น MP3, WAV, FLAC, AAC, Opus และ PCM ตามความต้องการด้านการเล่นหรือการประมวลผล
ปรับความเร็วการเล่นได้: API อนุญาตให้ปรับความเร็วตั้งแต่ 0.25x ถึง 4.0x เพื่อการบรรยายที่ช้าลงหรือการเล่นที่เร็วขึ้นตามความเหมาะสม
ผสานการทำงานผ่าน API ได้ง่าย: tts-1 ใช้งานผ่าน API การสร้างเสียงมาตรฐาน จึงผสานเข้ากับเวิร์กโฟลว์เว็บ มือถือ หรือแบ็กเอนด์ได้ไม่ยาก
เหมาะสำหรับแอปที่เน้นการทำงานแบบเรียลไทม์: OpenAI ระบุชัดว่า tts-1 ถูกออกแบบมาสำหรับกรณีใช้งาน TTS แบบเรียลไทม์ เหมาะกับผู้ช่วย การแจ้งเตือน และระบบโต้ตอบที่เร็ว
ทางเลือกโมเดลที่เน้นการแลกเปลี่ยนระหว่างความเร็วกับคุณภาพ: เมื่อเทียบกับ tts-1-hd โมเดลนี้ให้ความสำคัญกับความเร็วมากกว่าความเที่ยงตรงของเสียง ช่วยให้เลือกได้ชัดเจนระหว่างความหน่วงกับคุณภาพ

วิธีเข้าถึงและผสานการทำงานกับ `tts-1`

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ `tts-1`

curl https://api.cometapi.com/v1/audio/speech \
  -H "Authorization: Bearer $COMETAPI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1",
    "input": "Welcome to CometAPI text to speech.",
    "voice": "alloy",
    "response_format": "mp3"
  }' \
  --output speech.mp3

tts-1

ข้อมูลจำเพาะทาง技术ของ `tts-1`

`tts-1` คืออะไร?

คุณสมบัติหลักของ `tts-1`

วิธีเข้าถึงและผสานการทำงานกับ `tts-1`

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ `tts-1`

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ราคาสำหรับ tts-1

โค้ดตัวอย่างและ API สำหรับ tts-1

tts-1

ข้อมูลจำเพาะทาง技术ของ `tts-1`

`tts-1` คืออะไร?

คุณสมบัติหลักของ `tts-1`

วิธีเข้าถึงและผสานการทำงานกับ `tts-1`

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ `tts-1`

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ราคาสำหรับ tts-1

โค้ดตัวอย่างและ API สำหรับ tts-1

tts-1

ข้อมูลจำเพาะทาง技术ของ tts-1

tts-1 คืออะไร?

คุณสมบัติหลักของ tts-1

วิธีเข้าถึงและผสานการทำงานกับ tts-1

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ tts-1

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ราคาสำหรับ tts-1

โค้ดตัวอย่างและ API สำหรับ tts-1

tts-1

ข้อมูลจำเพาะทาง技术ของ tts-1

tts-1 คืออะไร?

คุณสมบัติหลักของ tts-1

วิธีเข้าถึงและผสานการทำงานกับ tts-1

ขั้นตอนที่ 1: สมัครเพื่อรับ API Key

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ tts-1

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ราคาสำหรับ tts-1

โค้ดตัวอย่างและ API สำหรับ tts-1

ข้อมูลจำเพาะทาง技术ของ `tts-1`

`tts-1` คืออะไร?

คุณสมบัติหลักของ `tts-1`

วิธีเข้าถึงและผสานการทำงานกับ `tts-1`

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ `tts-1`

ข้อมูลจำเพาะทาง技术ของ `tts-1`

`tts-1` คืออะไร?

คุณสมบัติหลักของ `tts-1`

วิธีเข้าถึงและผสานการทำงานกับ `tts-1`

ขั้นตอนที่ 2: ส่งคำขอไปยัง API ของ `tts-1`