📘 ข้อมูลจำเพาะทางเทคนิคของ Grok Imagine Video

Specification	Details
Model ID	grok-imagine-video
Provider	xAI
Type	โมเดล AI สร้างและแก้ไขวิดีโอ
Input Types	ข้อความ (พรอมต์); ตัวเลือกภาพหรือวิดีโอ พรอมต์ข้อความ (ภาษาธรรมชาติ); ตัวเลือกใส่ภาพ (ภาพ→วิดีโอ); ตัวเลือก video_url สำหรับแก้ไขคลิปที่มีอยู่ ความยาวสูงสุดของวิดีโอสำหรับการแก้ไขแตกต่างกันตาม endpoint — มีรายงาน ~8.7s สำหรับบางโฟลว์การแก้ไข
Output Types	วิดีโอ .mp4 ผ่าน URL ชั่วคราว
Duration Range (generate)	1–15 วินาที
Resolution	480p, 720p (กำหนดค่าได้)
Aspect Ratios	1:1, 16:9, 9:16
Edit Support	มี — ทำให้วิดีโอเคลื่อนไหว & แก้ไขได้สูงสุด 8.7s
Moderation	มีการกลั่นกรองเนื้อหาในตัว
Pricing	คิดค่าบริการตามวินาที แตกต่างตามความละเอียด

🚀 Grok Imagine Video คืออะไร?

Grok Imagine Video คือโมเดล AI ขั้นสูงของ xAI สำหรับการสร้างและแก้ไขวิดีโอที่เปิดให้ใช้งานผ่าน CometAPI ช่วยให้นักพัฒนาสามารถสร้างวิดีโอสั้นแบบกำหนดเองจากพรอมต์ภาษาธรรมชาติ และสามารถทำให้ภาพนิ่งเคลื่อนไหวหรือแก้ไขคลิปที่มีอยู่ได้ตามต้องการ โมเดลรองรับการกำหนดความยาวเอาต์พุต ความละเอียด และอัตราส่วนภาพ พร้อมระบบกลั่นกรองเนื้อหาในตัวเพื่อให้สอดคล้องกับนโยบาย

🧠คุณสมบัติหลัก (จุดที่แตกต่างของ Grok Imagine)

เสียงในตัว + ลิปซิงค์: สร้างเสียงบรรยากาศ เอฟเฟ็กต์ และคำพูด/บรรยายสั้นๆ พร้อมการลิปซิงค์โดยประมาณ
ภาพ→วิดีโอ / การแก้ไขด้วยพรอมต์: ทำให้ภาพนิ่งเคลื่อนไหวหรือแก้ไขฟุตเทจที่มีอยู่ผ่านพรอมต์ข้อความ (ลบ/แทนที่วัตถุ ปรับเวลา เปลี่ยนสไตล์)
วนซ้ำรวดเร็ว & หน่วงต่ำ: ออกแบบเพื่อวงจรตรวจสอบผลลัพธ์อย่างรวดเร็ว เหมาะกับงานครีเอทีฟและการทำโปรโตไทป์
Production API: Imagine API เปิดให้เรียกใช้แบบโปรแกรม สำหรับการสร้างงานแบบชุด การผสานในพายนไลน์แก้ไข และการควบคุมระดับองค์กร
หลาย “โหมด” / สไตล์: โหมดสำหรับผู้ใช้ (ตัวอย่างที่มีรายงาน: Normal / Fun / Spicy หรือพรีเซ็ตคล้ายกัน) เพื่อชี้นำผลลัพธ์ตามสไตล์หรือระดับความยืดหยุ่น (หมายเหตุ: โหมด “Spicy” เคยเปิดใช้งาน NSFW ในอดีต)

Model (company)	Max res (public)	Max clip len (public)	Native audio?	Strengths	Caveats
Grok Imagine (xAI)	720p	6–15s	Yes	วนซ้ำเร็ว ต้นทุน/หน่วงดี ผสานการแก้ไขในตัว เสียงในตัว	จำกัดที่ 720p; กังวลเรื่องการกลั่นกรอง; ความสมจริงในโลกจริงแปรผัน
Sora (OpenAI)	720p–1080p (ขึ้นกับระดับ)	สั้น (6–15s)	Yes	ความเที่ยงตรงภาพสูง; บูรณาการกับสแตกของ OpenAI อย่างแน่นแฟ้น	ราคาแพงกว่า; การกลั่นกรอง/การควบคุมเข้ม
Veo (Google DeepMind)	สูงสุดถึง 1080p+	สั้น (แปรผัน)	Yes	โฟโตเรียลสมจริงสูง การเคลื่อนไหวเสถียร	ต้นทุนสูงกว่า; มีการทดลองสาธารณะน้อยกว่า
Runway Gen-4.5	1080p+	สั้น (แปรผัน)	Yes	ได้รับการยอมรับในงานครีเอทีฟ ความเที่ยงตรงสูง	ราคาแพงกว่า; โฟกัสที่เครื่องมือครีเอทีฟ
Vidu / Kling / Pika (various specialists)	สูงสุดถึง 1080p	สั้น (แปรผัน)	Mixed	บางรายมีฟีเจอร์เฉพาะทาง (Smart Cuts, multi-shot chaining)	การรองรับเสียงแตกต่าง; ความพร้อมของ API ต่างกัน

⚠️ ข้อจำกัด

ความยาววิดีโอสูงสุดจำกัดที่ 15 วินาที
การแก้ไขจะคงความยาววิดีโอต้นฉบับ (≤ 8.7s)
URL ที่สร้างขึ้นเป็นแบบชั่วคราว — ควรดาวน์โหลดทันที

วิธีเข้าถึงและผสาน Grok Imagine Video

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน เข้าสู่ CometAPI console รับคีย์ API สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ในโทเค็น API ที่ศูนย์ส่วนบุคคล รับโทเค็นคีย์: sk-xxxxx และส่ง

Step 2: Send Requests to `Grok Imagine Video` API

เลือก endpoint “grok-imagine-video” เพื่อส่งคำขอ API และตั้งค่า request body วิธีการและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมี Apifox สำหรับทดสอบเพื่อความสะดวกของคุณ แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ จุดที่เรียกใช้งาน: GROK การสร้างวิดีโอ และ แก้ไขวิดีโอ

Step 3: Send Requests to `Grok Imagine Video` API

ป้อนข้อความหรืออัปโหลดภาพ (คุณสามารถเลือกให้ภาพต้นทางเพื่อทำให้เคลื่อนไหวได้) Grok Imagine AI API จะวิเคราะห์อินพุตของคุณและเตรียมเนื้อหาสำหรับ URL รองรับทั้งการแปลงข้อความเป็นวิดีโอและภาพเป็นวิดีโอ

แหล่งภาพสามารถให้เป็น:

URL สาธารณะที่ชี้ไปยังรูปภาพ
data URI แบบ base64-encoded (เช่น data:image/jpeg;base64,<YOUR_BASE64_IMAGE>)

Step 4: Retrieve and Verify Results

ประมวลผลการตอบสนองของ API เพื่อรับผลลัพธ์ที่สร้างขึ้น หลังการประมวลผล API จะตอบกลับด้วยสถานะงานและข้อมูลเอาต์พุต ระบบจะส่งคืน request_id ทันทีเมื่อส่งคำขอ; ใช้ endpoint แบบ GET เพื่อตรวจสอบสถานะและดึงวิดีโอที่สร้างขึ้น การแก้ไขวิดีโอเป็นแบบอะซิงโครนัส คุณอาจต้องโพลล์ endpoint นี้หลายครั้งจนกว่างานจะเสร็จสิ้น โปรดดาวน์โหลดโดยเร็ว

Category	Item	Price
Input Pricing	Text	N/A (Free)
	Image	$0.0016
	Video per second	$0.008
Output Pricing	480p	$0.04
(Per second by resolution)	720p	$0.056

Grok Imagine Video

📘 ข้อมูลจำเพาะทางเทคนิคของ Grok Imagine Video