Freestyler

简介：Freestyler是一款由多机构合作开发的AI工具，专注于说唱音乐的自动化生成。它通过结合语言模型、条件流匹配技术和神经声码器，实现了从歌词和伴奏到高质量说唱音频的全流程转化。Freestyler还推出了RapBank数据集，并支持零样本音色控制，广泛应用于音乐创作、现场表演、游戏音效及教育等领域。

AI小编 731 阅读 0 评论 17 点赞

项目地址

Freestyler是由西北工业大学计算机科学学院的音频、语音与语言处理小组（ASLP@NPU）、微软以及香港中文大学深圳研究院大数据研究所联合研发的说唱音乐生成模型。该模型能够根据歌词和伴奏自动生成说唱音乐。Freestyler的工作流程首先通过语言模型生成语义标记，接着利用条件流匹配模型将这些标记转化为频谱图，最后借助神经声码器生成高质量的音频输出。此外，该项目推出了RapBank数据集，用于支持模型的训练与开发，并实现了零样本音色控制功能，使用户能够生成具有特定音色的说唱声乐。

本文分类：AI项目与工具
本文标签：AI 音乐生成说唱零样本学习数据集神经网络声码器自然语言处理语音合成创意工具
浏览次数：731 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/9889.html

评论列表共有 0 条评论

暂无评论

Freestyler

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复