📘 ข้อมูลจำเพาะทางเทคนิคของ Grok Imagine Video
| Specification | Details |
|---|---|
| Model ID | grok-imagine-video |
| Provider | xAI |
| Type | โมเดล AI สร้างและแก้ไขวิดีโอ |
| Input Types | ข้อความ (พรอมต์); ตัวเลือกภาพหรือวิดีโอ พรอมต์ข้อความ (ภาษาธรรมชาติ); ตัวเลือกใส่ภาพ (ภาพ→วิดีโอ); ตัวเลือก video_url สำหรับแก้ไขคลิปที่มีอยู่ ความยาวสูงสุดของวิดีโอสำหรับการแก้ไขแตกต่างกันตาม endpoint — มีรายงาน ~8.7s สำหรับบางโฟลว์การแก้ไข |
| Output Types | วิดีโอ .mp4 ผ่าน URL ชั่วคราว |
| Duration Range (generate) | 1–15 วินาที |
| Resolution | 480p, 720p (กำหนดค่าได้) |
| Aspect Ratios | 1:1, 16:9, 9:16 |
| Edit Support | มี — ทำให้วิดีโอเคลื่อนไหว & แก้ไขได้สูงสุด 8.7s |
| Moderation | มีการกลั่นกรองเนื้อหาในตัว |
| Pricing | คิดค่าบริการตามวินาที แตกต่างตามความละเอียด |
🚀 Grok Imagine Video คืออะไร?
Grok Imagine Video คือโมเดล AI ขั้นสูงของ xAI สำหรับการสร้างและแก้ไขวิดีโอที่เปิดให้ใช้งานผ่าน CometAPI ช่วยให้นักพัฒนาสามารถสร้างวิดีโอสั้นแบบกำหนดเองจากพรอมต์ภาษาธรรมชาติ และสามารถทำให้ภาพนิ่งเคลื่อนไหวหรือแก้ไขคลิปที่มีอยู่ได้ตามต้องการ โมเดลรองรับการกำหนดความยาวเอาต์พุต ความละเอียด และอัตราส่วนภาพ พร้อมระบบกลั่นกรองเนื้อหาในตัวเพื่อให้สอดคล้องกับนโยบาย
🧠คุณสมบัติหลัก (จุดที่แตกต่างของ Grok Imagine)
- เสียงในตัว + ลิปซิงค์: สร้างเสียงบรรยากาศ เอฟเฟ็กต์ และคำพูด/บรรยายสั้นๆ พร้อมการลิปซิงค์โดยประมาณ
- ภาพ→วิดีโอ / การแก้ไขด้วยพรอมต์: ทำให้ภาพนิ่งเคลื่อนไหวหรือแก้ไขฟุตเทจที่มีอยู่ผ่านพรอมต์ข้อความ (ลบ/แทนที่วัตถุ ปรับเวลา เปลี่ยนสไตล์)
- วนซ้ำรวดเร็ว & หน่วงต่ำ: ออกแบบเพื่อวงจรตรวจสอบผลลัพธ์อย่างรวดเร็ว เหมาะกับงานครีเอทีฟและการทำโปรโตไทป์
- Production API: Imagine API เปิดให้เรียกใช้แบบโปรแกรม สำหรับการสร้างงานแบบชุด การผสานในพายนไลน์แก้ไข และการควบคุมระดับองค์กร
- หลาย “โหมด” / สไตล์: โหมดสำหรับผู้ใช้ (ตัวอย่างที่มีรายงาน: Normal / Fun / Spicy หรือพรีเซ็ตคล้ายกัน) เพื่อชี้นำผลลัพธ์ตามสไตล์หรือระดับความยืดหยุ่น (หมายเหตุ: โหมด “Spicy” เคยเปิดใช้งาน NSFW ในอดีต)
| Model (company) | Max res (public) | Max clip len (public) | Native audio? | Strengths | Caveats |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Yes | วนซ้ำเร็ว ต้นทุน/หน่วงดี ผสานการแก้ไขในตัว เสียงในตัว | จำกัดที่ 720p; กังวลเรื่องการกลั่นกรอง; ความสมจริงในโลกจริงแปรผัน |
| Sora (OpenAI) | 720p–1080p (ขึ้นกับระดับ) | สั้น (6–15s) | Yes | ความเที่ยงตรงภาพสูง; บูรณาการกับสแตกของ OpenAI อย่างแน่นแฟ้น | ราคาแพงกว่า; การกลั่นกรอง/การควบคุมเข้ม |
| Veo (Google DeepMind) | สูงสุดถึง 1080p+ | สั้น (แปรผัน) | Yes | โฟโตเรียลสมจริงสูง การเคลื่อนไหวเสถียร | ต้นทุนสูงกว่า; มีการทดลองสาธารณะน้อยกว่า |
| Runway Gen-4.5 | 1080p+ | สั้น (แปรผัน) | Yes | ได้รับการยอมรับในงานครีเอทีฟ ความเที่ยงตรงสูง | ราคาแพงกว่า; โฟกัสที่เครื่องมือครีเอทีฟ |
| Vidu / Kling / Pika (various specialists) | สูงสุดถึง 1080p | สั้น (แปรผัน) | Mixed | บางรายมีฟีเจอร์เฉพาะทาง (Smart Cuts, multi-shot chaining) | การรองรับเสียงแตกต่าง; ความพร้อมของ API ต่างกัน |
⚠️ ข้อจำกัด
- ความยาววิดีโอสูงสุดจำกัดที่ 15 วินาที
- การแก้ไขจะคงความยาววิดีโอต้นฉบับ (≤ 8.7s)
- URL ที่สร้างขึ้นเป็นแบบชั่วคราว — ควรดาวน์โหลดทันที
วิธีเข้าถึงและผสาน Grok Imagine Video
Step 1: Sign Up for API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ CometAPI console รับคีย์ API สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ในโทเค็น API ที่ศูนย์ส่วนบุคคล รับโทเค็นคีย์: sk-xxxxx และส่ง
Step 2: Send Requests to Grok Imagine Video API
เลือก endpoint “grok-imagine-video” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมี Apifox สำหรับทดสอบเพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ จุดที่เรียกใช้งาน: GROK การสร้างวิดีโอ และ แก้ไขวิดีโอ
Step 3: Send Requests to Grok Imagine Video API
ป้อนข้อความหรืออัปโหลดภาพ (คุณสามารถเลือกให้ภาพต้นทางเพื่อทำให้เคลื่อนไหวได้) Grok Imagine AI API จะวิเคราะห์อินพุตของคุณและเตรียมเนื้อหาสำหรับ URL รองรับทั้งการแปลงข้อความเป็นวิดีโอและภาพเป็นวิดีโอ
แหล่งภาพสามารถให้เป็น:
- URL สาธารณะที่ชี้ไปยังรูปภาพ
- data URI แบบ base64-encoded (เช่น
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Step 4: Retrieve and Verify Results
ประมวลผลการตอบสนองของ API เพื่อรับผลลัพธ์ที่สร้างขึ้น หลังการประมวลผล API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต ระบบจะส่งคืน request_id ทันทีเมื่อส่งคำขอ; ใช้ endpoint แบบ GET เพื่อตรวจสอบสถานะและดึงวิดีโอที่สร้างขึ้น การแก้ไขวิดีโอเป็นแบบอะซิงโครนัส คุณอาจต้องโพลล์ endpoint นี้หลายครั้งจนกว่างานจะเสร็จสิ้น โปรดดาวน์โหลดโดยเร็ว