Orpheus TTS Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统,支持自然、富有情感的语音生成。具备零样本语音克隆能力,无需预训练即可模仿特定语音,延迟低至 200 毫秒,适合实时应用。支持多种语音风格和情感控制,适用于有声读物、虚拟助手、游戏、教育等多个领域。 AI项目与工具 2025年06月12日 26 点赞 0 评论 353 浏览
UniAct UniAct是一款面向具身智能的通用行为建模框架,旨在解决机器人行为异构性问题。通过向量量化构建通用动作空间,UniAct将不同机器人的原子行为统一表示,实现跨平台共享。其轻量架构(如0.5B模型)具备高效性能与快速适应能力,仅需少量数据即可微调,并通过异构解码器适配多种机器人。适用于自动驾驶、医疗、工业及家庭服务等多个领域,提供一致且高效的控制方案。 AI项目与工具 2025年06月12日 14 点赞 0 评论 316 浏览
Noiz AI Noiz AI 是一款基于自研大模型的 AI 语音合成与克隆工具,支持 3-10 秒音频快速生成逼真语音模型,适用于 TTS、视频配音和多语言翻译。具备情感化语音输出与一键语言转换功能,广泛应用于内容创作、教育、商业及娱乐等领域,提升内容表达效果与国际化传播能力。 AI项目与工具 2025年06月12日 47 点赞 0 评论 313 浏览
Heygem Heygem是一款由硅基智能推出的开源数字人模型,支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音,30秒内完成克隆,60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势,适用于内容创作、教育、直播、影视及客服等多个领域,提供高效、低成本的数字人解决方案。 AI项目与工具 2025年06月12日 18 点赞 0 评论 499 浏览
TicVoice 7.0 TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎,采用 BiCodec 技术实现音色与语义的精准控制,支持 3 秒语音克隆、多角色、多情绪表达及中英切换,语音自然流畅,接近广播级水平,适用于智能客服、有声书、影视配音等场景。 AI项目与工具 2025年06月12日 29 点赞 0 评论 205 浏览
Asyncflow v1.0 Asyncflow v1.0 是一款基于 AI 的文本转语音工具,支持超过 450 种语音选项,涵盖多种语言和风格。通过 Magic Dust AI 技术,实现快速语音克隆与高质量输出,降低训练成本。提供 API 接口,便于开发集成,适用于播客、广告、教育等多种场景,具备高效、易用和高性价比的特点。 AI项目与工具 2025年06月12日 72 点赞 0 评论 267 浏览
Spark Spark-TTS是一款基于大型语言模型的高效文本转语音工具,支持中英文双语及跨语言合成。它无需额外生成模型,通过LLM预测编码直接生成音频,实现零样本语音克隆。用户可自定义语音参数,如音色、语速等,适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。 AI项目与工具 2025年06月12日 47 点赞 0 评论 148 浏览
Videco Videco 是一款基于 AI 技术的视频生成平台,支持语音克隆、动态变量和互动元素集成,适用于销售与市场营销场景。平台可生成个性化视频内容,提升用户参与度和转化率,并支持与 CRM 和邮件工具的集成。提供多语言支持与数据分析功能,助力企业优化营销策略,提高效率。 AI项目与工具 2025年06月12日 24 点赞 0 评论 425 浏览
SongGen SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型,能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出,可分别生成人声与伴奏,便于后期编辑。SongGen通过创新的音频标记化和训练策略,显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准,适用于音乐创作、视频配乐、教育辅助等多个领域。 AI项目与工具 2025年06月12日 78 点赞 0 评论 300 浏览
All Voice Lab All Voice Lab是一款基于AI技术的语音创作平台,提供文本转语音、声音克隆、视频翻译、变声等多种功能,支持多语言及多音色转换。平台具备高精度的语音生成能力,可应用于内容创作、视频制作、教育及娱乐等领域,提升内容表现力与国际化传播效率。 AI项目与工具 2025年06月12日 14 点赞 0 评论 367 浏览