MiniMax 发布 Music 1.5 — 四分钟完整歌曲、自然人声与细粒度控制 - CometAPI

MiniMax 今日发布了 Music 1.5（在公司部分渠道被标记为 Conch music model），这是其生成式音频套件的一次重大升级。官方称其延长了生成时长、提升了人声真实感，并为创作者加入了更细粒度的语言与风格控制。此次发布使 MiniMax 能够将 AI 音乐从短片段推进到完整歌曲的制作流程。

关键能力

完整长度生成（最长约 4 分钟）： 旨在产出可直接用于多种创作场景的成品歌曲时长。
自然人声： 伴奏与演唱人声同步生成，音色更清晰、表现力更强。
细粒度控制： 用户可指定或微调风格、情绪、场景，甚至是分段级结构（例如：用这些歌词写一段主歌，并以那种情绪写一段副歌）。
广泛的曲风与乐器支持： 从流行、摇滚、爵士到古典与民族乐器——MiniMax 称该模型还覆盖小众音色与非西方乐器。
覆盖多种语言与文化，可生成多元文化风格的音乐。
结构清晰：模型按照典型歌曲结构输出音乐，例如 Intro – Verse – Chorus – Bridge – Outro，避免重复段落或单调旋律。
面向开发者开放 API，可直接接入与使用

这些突破背后，是 MiniMax 在多模态处理（涵盖文本、语音与视觉）方面的积累。Music 1.5 利用文本模型的能力，更深入地理解与控制文本描述。这不仅允许对歌曲风格、情感基调与适用场景进行全面把控，也能对人声特性进行细粒度控制，生成具备多样特征的人声音色。

MiniMax Music 1.5 可广泛应用于音乐创作、影视配乐、游戏音效、广告营销、教育培训与企业场景。不仅帮助音乐人和制作人快速生成含人声的完整 demo，也能为影视、游戏与广告提供契合情感与语境的配乐。同时支持教育平台与创作者进行风格化练习与内容定制，为企业活动、品牌传播与互动体验提供高效、低成本的音乐解决方案。

Music 1.5 的发布不仅降低了音乐创作的门槛，也回归聆听本质，让“好”的音乐自然流淌。

快速开始

CometAPI 是一个统一的 API 平台，将来自领先提供商（如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude、Midjourney、Suno 等）超过 500 个 AI 模型聚合到单一且对开发者友好的接口中。通过提供一致的身份验证、请求格式与响应处理，CometAPI 显著简化了将 AI 能力集成到您的应用中的流程。无论您在构建聊天机器人、图像生成器、音乐创作工具，还是数据驱动的分析流水线，CometAPI 都能帮助您更快迭代、控制成本，并保持供应商无关性，同时获取整个 AI 生态的最新突破。

最新集成 Minimax Music 1.5 将很快登陆 CometAPI，敬请期待！在我们完成 Minimax Music 1.5 模型上传期间，欢迎在 Models 页面探索其他音乐模型（如 Suno Music），或在 AI Playground 中试用。

MiniMax 发布 Music 1.5 — 四分钟完整歌曲、自然人声与细粒度控制

关键能力

快速开始

阅读更多

一个 API 中超 500 个模型