MiniMax 今日发布了 Music 1.5(在公司部分渠道被标记为 Conch music model),这是其生成式音频套件的一次重大升级。官方称其延长了生成时长、提升了人声真实感,并为创作者加入了更细粒度的语言与风格控制。此次发布使 MiniMax 能够将 AI 音乐从短片段推进到完整歌曲的制作流程。
关键能力
- 完整长度生成(最长约 4 分钟): 旨在产出可直接用于多种创作场景的成品歌曲时长。
- 自然人声: 伴奏与演唱人声同步生成,音色更清晰、表现力更强。
- 细粒度控制: 用户可指定或微调风格、情绪、场景,甚至是分段级结构(例如:用这些歌词写一段主歌,并以那种情绪写一段副歌)。
- 广泛的曲风与乐器支持: 从流行、摇滚、爵士到古典与民族乐器——MiniMax 称该模型还覆盖小众音色与非西方乐器。
- 覆盖多种语言与文化,可生成多元文化风格的音乐。
- 结构清晰:模型按照典型歌曲结构输出音乐,例如 Intro – Verse – Chorus – Bridge – Outro,避免重复段落或单调旋律。
- 面向开发者开放 API,可直接接入与使用
这些突破背后,是 MiniMax 在多模态处理(涵盖文本、语音与视觉)方面的积累。Music 1.5 利用文本模型的能力,更深入地理解与控制文本描述。这不仅允许对歌曲风格、情感基调与适用场景进行全面把控,也能对人声特性进行细粒度控制,生成具备多样特征的人声音色。
MiniMax Music 1.5 可广泛应用于音乐创作、影视配乐、游戏音效、广告营销、教育培训与企业场景。不仅帮助音乐人和制作人快速生成含人声的完整 demo,也能为影视、游戏与广告提供契合情感与语境的配乐。同时支持教育平台与创作者进行风格化练习与内容定制,为企业活动、品牌传播与互动体验提供高效、低成本的音乐解决方案。
Music 1.5 的发布不仅降低了音乐创作的门槛,也回归聆听本质,让“好”的音乐自然流淌。
快速开始
CometAPI 是一个统一的 API 平台,将来自领先提供商(如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等)超过 500 个 AI 模型聚合到单一且对开发者友好的接口中。通过提供一致的身份验证、请求格式与响应处理,CometAPI 显著简化了将 AI 能力集成到您的应用中的流程。无论您在构建聊天机器人、图像生成器、音乐创作工具,还是数据驱动的分析流水线,CometAPI 都能帮助您更快迭代、控制成本,并保持供应商无关性,同时获取整个 AI 生态的最新突破。
最新集成 Minimax Music 1.5 将很快登陆 CometAPI,敬请期待!在我们完成 Minimax Music 1.5 模型上传期间,欢迎在 Models 页面探索其他音乐模型(如 Suno Music),或在 AI Playground 中试用。
