SpeechEasy SpeechEasy是一种合成语音解决方案,可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台,支持桌面和移动设备,有近12种高质量的合成声音可供选择。它使用简单... Ai语音工具 1970年01月01日 0 点赞 0 评论 343 浏览
GenSFX GenSFX 是一款基于 AI 的在线音效生成工具,可根据文本描述快速生成高质量音效,支持环境音、自然声、动物叫声、机械声、科幻音效等多种类型。用户可自定义参数并下载多种格式的音频文件,适用于视频制作、游戏开发、播客和广告等多个领域,提升内容创作效率与表现力。 AI项目与工具 2025年06月12日 94 点赞 0 评论 330 浏览
SongGen SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型,能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出,可分别生成人声与伴奏,便于后期编辑。SongGen通过创新的音频标记化和训练策略,显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准,适用于音乐创作、视频配乐、教育辅助等多个领域。 AI项目与工具 2025年06月12日 78 点赞 0 评论 327 浏览
Replay Replay是一款基于AI技术的音频处理工具,可精准分离音乐中的主唱、人声和伴奏等音轨。支持多种音频格式,具备高质量输出、实时预览、参数调整和自动化处理等功能,适用于音乐制作、KTV伴奏、教学及内容创作等领域。操作简便,兼容多平台,为音乐创作和分析提供高效解决方案。 AI项目与工具 2025年03月22日 72 点赞 0 评论 325 浏览
QuickRecorder 一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。 Ai开源项目 2025年06月05日 59 点赞 0 评论 323 浏览
Altered AI Altered Studio Voice Editor允许用户通过将他们的声音更改为任何精心策划的组合声音或自定义声音来创建专业的声音表演。它还允许用户创建引人入胜的多角色表演和克隆他们的声音。... 创作工具 1970年01月01日 0 点赞 0 评论 323 浏览
CoGenAV CoGenAV是一种先进的多模态学习模型,专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练,利用同步音频、视频和文本数据,学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能,适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。 AI项目与工具 2025年06月11日 80 点赞 0 评论 323 浏览
通义万相AI视频 通义万相AI视频是一款基于人工智能的视频生成工具,支持文生视频和图生视频两种模式。用户可输入文字描述或上传图片生成高质量视频,支持多语言、多种艺术风格及音频生成功能,优化中式元素表现,广泛应用于影视、广告、动画设计等多个领域。 AI项目与工具 2025年06月12日 82 点赞 0 评论 323 浏览
Songtell Songtell是第一个人工智能生成的歌曲含义库,生成了超过20000首歌曲的含义。你也可以订购一张印有你最喜欢的歌曲含义的海报。 创作工具 1970年01月01日 0 点赞 0 评论 319 浏览