📘 ข้อมูลจำเพาะทางเทคนิคของ Grok Imagine Video
| Specification | Details |
|---|---|
| Model ID | grok-imagine-video |
| Provider | xAI |
| Type | AI สำหรับสร้างและตัดต่อวิดีโอ |
| Input Types | ข้อความ (พรอมต์); รูปภาพหรือวิดีโอเป็นตัวเลือก พรอมต์ข้อความ (ภาษาธรรมชาติ); อินพุตรูปภาพเป็นตัวเลือก (image→video); หรือ video_url เป็นตัวเลือกสำหรับแก้ไขคลิปที่มีอยู่แล้ว ระยะเวลาสูงสุดของวิดีโออินพุตสำหรับการตัดต่อจะแตกต่างกันไปตาม endpoint — มีรายงานว่าประมาณ ~8.7 วินาทีสำหรับบาง workflow การตัดต่อ |
| Output Types | วิดีโอ .mp4 ผ่าน URL ชั่วคราว |
| Duration Range (generate) | 1–15 วินาที |
| Resolution | 480p, 720p (กำหนดค่าได้) |
| Aspect Ratios | 1:1, 16:9, 9:16 |
| Edit Support | รองรับ — ทำให้วิดีโอเคลื่อนไหวและแก้ไขวิดีโอได้สูงสุด 8.7 วินาที |
| Moderation | มีการกลั่นกรองเนื้อหาในตัว |
| Pricing | คิดค่าบริการตามจำนวนวินาที โดยแตกต่างกันตามความละเอียด |
🚀 Grok Imagine Video คืออะไร?
Grok Imagine Video คือโมเดล AI ขั้นสูงสำหรับการสร้างและตัดต่อวิดีโอของ xAI ที่เปิดให้ใช้งานผ่าน CometAPI ช่วยให้นักพัฒนาสามารถสร้างวิดีโอสั้นแบบกำหนดเองจากพรอมต์ภาษาธรรมชาติ และสามารถเลือกทำให้ภาพนิ่งเคลื่อนไหวหรือแก้ไขคลิปที่มีอยู่แล้วได้ โมเดลนี้รองรับการกำหนดความยาวเอาต์พุต ความละเอียด และอัตราส่วนภาพ พร้อมระบบกลั่นกรองเนื้อหาในตัวเพื่อให้เป็นไปตามนโยบาย
🧠ฟีเจอร์หลัก (สิ่งที่ทำให้ Grok Imagine แตกต่าง)
- เสียงเนทีฟ + ลิปซิงก์: สร้างเสียงบรรยากาศ เอฟเฟกต์ และเสียงพูด / คำบรรยายสั้น ๆ ที่ซิงก์กัน พร้อมการขยับปากที่สอดคล้องโดยประมาณ
- Image→Video / การแก้ไขด้วยพรอมต์: ทำให้ภาพนิ่งเคลื่อนไหวหรือแก้ไขฟุตเทจที่มีอยู่ผ่านพรอมต์ข้อความ (ลบ/แทนที่วัตถุ ปรับจังหวะเวลา ปรับสไตล์)
- วนซ้ำได้รวดเร็วและมีความหน่วงต่ำ: ออกแบบมาสำหรับวงจรการตอบกลับที่รวดเร็ว เหมาะกับ workflow เชิงสร้างสรรค์และการทำต้นแบบผลิตภัณฑ์
- Production API: Imagine API มี endpoint แบบโปรแกรมสำหรับการสร้างแบบแบตช์ การผสานรวมเข้ากับ pipeline การตัดต่อ และการควบคุมระดับองค์กร
- “โหมด” / สไตล์หลายแบบ: โหมดที่ผู้ใช้มองเห็นได้ (ตัวอย่างที่มีรายงาน: Normal / Fun / Spicy หรือพรีเซ็ตที่คล้ายกัน) เพื่อโน้มเอียงผลลัพธ์ด้านสไตล์หรือระดับความผ่อนปรน (หมายเหตุ: ในอดีตโหมด “Spicy” เปิดใช้ NSFW)
| Model (company) | Max res (public) | Max clip len (public) | Native audio? | Strengths | Caveats |
|---|---|---|---|---|---|
| Grok Imagine (xAI) | 720p | 6–15s | Yes | วนซ้ำได้รวดเร็ว คุ้มค่าด้านต้นทุน/ความหน่วง มีการตัดต่อในตัว รองรับเสียงเนทีฟ | จำกัดที่ 720p; มีข้อกังวลด้าน moderation; ความสมจริงในการใช้งานจริงแปรผัน |
| Sora (OpenAI) | 720p–1080p (depends on tier) | short (6–15s) | Yes | คุณภาพภาพสูง; ผสานรวมกับ OpenAI stack ได้ดี | ราคาแพงกว่า; มีข้อจำกัดด้าน moderation/controls |
| Veo (Google DeepMind) | Up to 1080p+ | short (varies) | Yes | โฟโตเรียลลิสม์สูง การเคลื่อนไหวเสถียร | ต้นทุนสูงกว่า; การทดลองสาธารณะน้อยกว่า |
| Runway Gen-4.5 | 1080p+ | short (varies) | Yes | ได้รับการยอมรับในอุตสาหกรรมสำหรับ workflow เชิงสร้างสรรค์ คุณภาพสูง | มีค่าใช้จ่ายสูงกว่า; เน้นเครื่องมือสร้างสรรค์ |
| Vidu / Kling / Pika (various specialists) | up to 1080p | short (varies) | Mixed | บางรายมีฟีเจอร์เฉพาะทาง (Smart Cuts, multi-shot chaining) | การรองรับเสียงแตกต่างกัน; ความพร้อมของ API ต่างกัน |
⚠️ ข้อจำกัด
- ความยาววิดีโอสูงสุดถูกจำกัดไว้ที่ 15 วินาที
- การตัดต่อจะคงความยาววิดีโออินพุตเดิมไว้ (≤ 8.7 วินาที)
- URL ที่สร้างขึ้นมีอายุชั่วคราว — โปรดดาวน์โหลดโดยเร็ว
วิธีเข้าถึงและผสานรวม Grok Imagine Video
Step 1: สมัคร API Key
เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่ได้เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน จากนั้นเข้าสู่ระบบใน CometAPI console ของคุณ รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ในส่วน API token ที่ศูนย์ส่วนบุคคล รับ token key: sk-xxxxx แล้วส่งคำขอ
Step 2: ส่งคำขอไปยัง API Grok Imagine Video
เลือก endpoint “grok-imagine-video” เพื่อส่งคำขอ API และกำหนด request body วิธีการส่งคำขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ของเรายังมีการทดสอบด้วย Apifox เพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ ตำแหน่งสำหรับเรียกใช้: GROKVideo Generation and Video Edit.
Step 3: ส่งคำขอไปยัง API Grok Imagine Video
ป้อนข้อความหรืออัปโหลดรูปภาพ(คุณสามารถใส่รูปภาพต้นทางเพื่อทำให้เคลื่อนไหวได้ตามต้องการ) Grok Imagine AI API จะวิเคราะห์อินพุตของคุณและเตรียมเนื้อหาสำหรับ url รองรับทั้งการแปลงข้อความเป็นวิดีโอและการแปลงรูปภาพเป็นวิดีโอ
รูปภาพต้นทางสามารถระบุได้เป็น:
- URL สาธารณะที่ชี้ไปยังรูปภาพ
- data URI ที่เข้ารหัสแบบ base64 (เช่น
data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)
Step 4: ดึงและตรวจสอบผลลัพธ์
ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังจากประมวลผลแล้ว API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต โดยจะส่งคืน request_id ทันทีหลังการส่งคำขอ; ใช้ GET endpoint เพื่อตรวจสอบสถานะและดึงวิดีโอที่สร้างขึ้น การตัดต่อวิดีโอเป็นแบบ asynchronous ดังนั้นคุณอาจต้อง poll endpoint นี้หลายครั้งจนกว่างานจะเสร็จสมบูรณ์ โปรดดาวน์โหลดโดยเร็ว




