MusicGen 技术路线回顾:YuE、DiffRhythm、ACE-Step 1.5、LeVo 与 Muse
这一波开源 musicgen / lyrics2song 系统,已经不再停留在 “能不能生成出声音” 这个层面,而是开始沿着几条相当清晰的技术路线分化: 一条是 大语言模型式的自回归路线,重点放在歌词对齐、段落结构和可控性上; 一条是 潜空间扩散路线,更强调速度、端到端生成和简洁的推理接口; 还有一条越来越主流的 混合路线,让 LM 负责规划,让 diffusion 或 DiT 负责高保