X

mimo-v2-omni

อินพุต:$0.32/M
เอาต์พุต:$1.6/M
MiMo-V2-Omni เป็นโมเดลออมนีโมดัลระดับแนวหน้าที่สามารถประมวลผลอินพุตภาพ วิดีโอ และเสียงได้โดยตรงภายใต้สถาปัตยกรรมแบบรวมหนึ่งเดียว It ผสานความสามารถด้านการรับรู้แบบหลายโมดัลที่ทรงพลังเข้ากับความสามารถแบบเอเจนต์ - visual grounding, การวางแผนหลายขั้นตอน, การใช้เครื่องมือ และการรันโค้ด - ทำให้เหมาะอย่างยิ่งสำหรับงานในโลกจริงที่ซับซ้อนซึ่งครอบคลุมหลายโมดัล หน้าต่างบริบท 256K.
ใหม่
ใช้งานเชิงพาณิชย์