kimi-k2 博客
kimi-k2 博客
Apr 2, 2026
ChatGPT 能进行文本转语音吗?2026 年最新语音与 TTS 模型指南
ChatGPT 可以进行文本转语音,不过答案取决于你所指的具体含义。在 ChatGPT 应用中,Voice 让 ChatGPT 能够语音朗读,并且近期已更新,使其更好地遵循指令并更有效地使用诸如网页搜索之类的工具。对于开发者,OpenAI 还通过 audio/speech 端点提供专用的文本转语音 API,包含的模型有 gpt-4o-mini-tts、tts-1 和 tts-1-hd。OpenAI 称,其最新的 TTS 快照在 Common Voice 和 FLEURS 上的词错误率相比上一代降低了约 35%。
Apr 2, 2026
ChatGPT 能在2026年生成音乐吗?终极指南
在 2026 年,ChatGPT 无法直接生成音频文件、人声或可播放的音乐曲目。它在歌词、歌曲结构、和弦进行以及优化的提示词方面,表现为出色的创意协作伙伴。然而,通过将 ChatGPT + Suno v5.5 + CometAPI 结合使用,任何人都能在几分钟内创作出带有逼真人声的专业级完整歌曲。
Apr 1, 2026
Veo 3.1
什么是 Google Veo 3.1 Lite?
Veo 3.1 Lite 是什么?Veo 3.1 Lite 是 Google 面向开发者推出的最新具成本效益的视频生成模型,于 2026 年 3 月 31 日发布。它支持文本生成视频和图像生成视频,可输出带音频的视频,并面向大规模应用设计。Google 称,在保持相同速度的同时,其成本不到 Veo 3.1 Fast 的一半,并支持 16:9 和 9:16 输出格式以及 720p/1080p 分辨率。
Apr 1, 2026
claude code
Claude Code 中的 Auto Compact 是什么?
Claude Code 中的 Auto Compact 是 Anthropic 的智能上下文管理功能,会在接近 ~200k token 上下文窗口限制时自动总结并压缩较长的会话历史,分析关键决策、代码更改和项目状态,用精简摘要替换较早的消息,让你无缝继续编码—在长时间的开发会话中防止崩溃、token 浪费和上下文丢失。自 2.0.64 版本(2026 年初)起,压缩几乎可瞬间完成,并为高级用户提供手动的 `/compact` 命令和可配置的 API 选项。
Mar 31, 2026
Suno v5.5 vs Lyria 3 Pro vs Udio 在 2026 年:哪款 AI 音乐生成器最好?
在 2026 年,Suno v5.5 是面向消费者、在成品歌曲与个性化方面综合实力最强的 AI 音乐生成器,Lyria 3 Pro Preview 是需要 API 访问以及水印功能的开发者的最佳选择,而 Udio 仍然对混音风格创作具有吸引力,但目前受公开不提供 API 的政策和禁用下载功能的限制较多。
Mar 30, 2026
claude code
我可以在 2026 年在 VSCode 中使用 Claude Code 吗?
你可以在 VS Code 中使用 Claude Code。Anthropic 当前的文档指出,在编辑器中使用 Claude Code 的推荐方式是 VS Code 扩展,它支持内联差异、@ 提及、计划评审和会话历史。你也可以在 VS Code 的集成终端中运行 Claude Code CLI,以用于高级工作流和仅限 CLI 的功能。
Mar 30, 2026
Lyria 3 Pro 是什么?
Lyria 3 Pro 是 Google DeepMind 的旗舰级音乐 AI 模型,可生成带人声的完整、结构化歌曲(最长 3 分钟),支持自定义段落(前奏/主歌/副歌/桥段),并支持文本或图像提示词。 它可通过 Gemini 应用(付费层级)、Gemini API、Vertex AI、Google AI Studio、Google Vids 和 ProducerAI 使用。 通过 API 的定价起步为每首完整歌曲 $0.08。 它在音乐连贯性和生态系统集成方面表现出色,但与 Suno v5 相比不具备分轨功能。
Mar 29, 2026
Claude Mythos
Claude Mythos(Opus 5)泄露:发生了什么以及可以期待什么
Claude Mythos,内部代号为 Capybara,定位在 Claude Opus 之上(可能相当于 Opus 5 等级),是 Anthropic 尚未发布的旗舰 AI 模型。泄露的草稿文件显示,它在软件编码、学术推理和网络安全方面的得分“显著更高”,超过 Claude Opus 4.6。它代表了能力上的一次“阶跃式提升”,目前由于前所未有的网络安全风险,仅在有限的早期访问测试中进行。