GTSinger是由浙江大学研究团队推出的一项开源高质量歌声数据集,旨在支持多样化的歌声相关任务。该数据集包含80.59小时的专业录音棚录制的歌声,涵盖了九种语言(汉语、英语、日语、韩语、俄语、西班牙语、法语、德语和意大利语),并由20位专业歌手演绎,展现出丰富的音色和风格多样性。GTSinger特别注重歌唱技巧的控制与建模,提供了六种常用歌唱技巧的对照组及音素级标注。此外,数据集还包含了真实乐谱,为实际音乐创作提供支持,并通过人工音素对齐、全局风格标签以及配对朗读数据等特性,满足多种歌声任务的需求。
发表评论 取消回复