Runway Gen Runway Gen-4 是一款由 Runway 公司推出的高保真 AI 视频生成模型,能够跨场景保持人物、物体和环境的一致性,无需额外训练。用户仅需提供一张参考图和文字指令,即可生成具有真实物理效果和高质量视觉风格的视频内容。支持多种应用场景,如影视制作、动画创作、音乐视频、游戏开发和广告营销,有效提升创作效率并降低成本。 AI项目与工具 2025年06月12日 61 点赞 0 评论 307 浏览
Mureka V6 Mureka V6是昆仑万维推出的AI音乐创作平台基座模型,支持多语言音乐生成及纯音乐创作。采用自研ICL技术,提升音乐结构连贯性与情感表达。用户可通过文本、音频或音色参考进行个性化创作,适用于多种音乐风格与情绪。支持从简单模式到高级模式的灵活操作,广泛应用于音乐爱好者、专业音乐人及内容创作等领域。 AI项目与工具 2025年06月12日 37 点赞 0 评论 240 浏览
Mureka O1 Mureka O1是昆仑万维推出的全球首款音乐推理大模型,采用“思维链”技术提升音乐生成质量与创作效率。支持多语言AI音乐创作,涵盖多种风格与情感表达,具备歌词生成、风格控制、音色克隆等功能。提供API接口与模型微调能力,适用于广告、影视、游戏、教育等多个场景,助力创作者高效完成音乐创作任务。 AI项目与工具 2025年06月12日 39 点赞 0 评论 382 浏览
AudioX AudioX 是一种基于多模态输入的音频生成模型,支持文本、视频、图像等多种输入方式,能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略,提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力,适用于视频配乐、动画音效、音乐创作等多个场景。 AI项目与工具 2025年06月12日 68 点赞 0 评论 150 浏览
GCDance GCDance是一款由英国萨里大学与江南大学联合开发的3D舞蹈生成框架,可根据音乐和文本提示生成风格可控的全身舞蹈序列。它结合多粒度音乐特征融合与CLIP模型文本嵌入技术,实现舞蹈动作与音乐节奏的高度同步。支持多种舞蹈风格生成、局部编辑及高质量全身动作输出,适用于VR、游戏开发、舞蹈教学等场景。 AI项目与工具 2025年06月12日 36 点赞 0 评论 422 浏览
谛韵DiffRhythm DiffRhythm(谛韵)是一款由西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型技术,能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示,即可快速获得高质量音乐作品。其支持多语言输入,具备歌词对齐、风格定制、非自回归生成等技术优势,广泛应用于音乐创作、影视配乐、教育及个人创作等领域。 AI项目与工具 2025年06月12日 70 点赞 0 评论 390 浏览
NotaGen NotaGen 是由多所高校联合研发的音乐生成模型,基于预训练、微调和强化学习技术,可生成高质量古典乐谱。支持通过“时期-作曲家-乐器”等条件控制音乐风格,具备高度音乐性与可控性。采用 CLaMP-DPO 方法优化生成质量,无需人工标注。适用于音乐创作、教育、影视配乐等多种场景,提供多种模型规模选择,满足不同需求。 AI项目与工具 2025年06月12日 66 点赞 0 评论 446 浏览
MakeBestMusic MakeBestMusic 是一款基于AI技术的音乐创作工具,支持通过文本生成音乐、音频分离、混音与重制等功能,覆盖多种音乐风格。提供多种付费计划,满足不同用户需求,适用于音乐制作、视频创作、游戏开发等场景,提升创作效率与质量。 AI项目与工具 2025年06月12日 21 点赞 0 评论 175 浏览
SongGen SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型,能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出,可分别生成人声与伴奏,便于后期编辑。SongGen通过创新的音频标记化和训练策略,显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准,适用于音乐创作、视频配乐、教育辅助等多个领域。 AI项目与工具 2025年06月12日 78 点赞 0 评论 300 浏览
CLaMP 3 CLaMP 3是由清华大学朱文武教授团队开发的多模态、多语言音乐信息检索框架,支持文本、图像、音频和乐谱等多种模态之间的跨模态检索。其基于对比学习技术,将不同模态数据与多语言文本对齐至统一语义空间,适用于文本到音乐、图像到音乐检索、零样本分类及音乐推荐等任务。支持27种语言,可扩展至100种,广泛应用于音乐创作、教育、分析及多媒体内容制作。 AI项目与工具 2025年06月12日 86 点赞 0 评论 173 浏览