克隆 - 智狐AI导航

Orpheus TTS

Orpheus TTS 是一款基于 Llama-3b 架构的开源文本到语音系统，支持自然、富有情感的语音生成。具备零样本语音克隆能力，无需预训练即可模仿特定语音，延迟低至 200 毫秒，适合实时应用。支持多种语音风格和情感控制，适用于有声读物、虚拟助手、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 772 浏览

UniAct

UniAct是一款面向具身智能的通用行为建模框架，旨在解决机器人行为异构性问题。通过向量量化构建通用动作空间，UniAct将不同机器人的原子行为统一表示，实现跨平台共享。其轻量架构（如0.5B模型）具备高效性能与快速适应能力，仅需少量数据即可微调，并通过异构解码器适配多种机器人。适用于自动驾驶、医疗、工业及家庭服务等多个领域，提供一致且高效的控制方案。

AI项目与工具 2025年06月12日 14 点赞 0 评论 716 浏览

Noiz AI

Noiz AI 是一款基于自研大模型的 AI 语音合成与克隆工具，支持 3-10 秒音频快速生成逼真语音模型，适用于 TTS、视频配音和多语言翻译。具备情感化语音输出与一键语言转换功能，广泛应用于内容创作、教育、商业及娱乐等领域，提升内容表达效果与国际化传播能力。

AI项目与工具 2025年06月12日 47 点赞 0 评论 670 浏览

Heygem

Heygem是一款由硅基智能推出的开源数字人模型，支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音，30秒内完成克隆，60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势，适用于内容创作、教育、直播、影视及客服等多个领域，提供高效、低成本的数字人解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 863 浏览

TicVoice 7.0

TicVoice 7.0 是一款基于 Spark-TTS 的语音合成引擎，采用 BiCodec 技术实现音色与语义的精准控制，支持 3 秒语音克隆、多角色、多情绪表达及中英切换，语音自然流畅，接近广播级水平，适用于智能客服、有声书、影视配音等场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 574 浏览

Asyncflow v1.0

Asyncflow v1.0 是一款基于 AI 的文本转语音工具，支持超过 450 种语音选项，涵盖多种语言和风格。通过 Magic Dust AI 技术，实现快速语音克隆与高质量输出，降低训练成本。提供 API 接口，便于开发集成，适用于播客、广告、教育等多种场景，具备高效、易用和高性价比的特点。

AI项目与工具 2025年06月12日 72 点赞 0 评论 675 浏览

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具，支持中英文双语及跨语言合成。它无需额外生成模型，通过LLM预测编码直接生成音频，实现零样本语音克隆。用户可自定义语音参数，如音色、语速等，适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 583 浏览

Videco

Videco 是一款基于 AI 技术的视频生成平台，支持语音克隆、动态变量和互动元素集成，适用于销售与市场营销场景。平台可生成个性化视频内容，提升用户参与度和转化率，并支持与 CRM 和邮件工具的集成。提供多语言支持与数据分析功能，助力企业优化营销策略，提高效率。

AI项目与工具 2025年06月12日 24 点赞 0 评论 816 浏览

SongGen

SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型，能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出，可分别生成人声与伴奏，便于后期编辑。SongGen通过创新的音频标记化和训练策略，显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准，适用于音乐创作、视频配乐、教育辅助等多个领域。

AI项目与工具 2025年06月12日 78 点赞 0 评论 728 浏览

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 733 浏览

克隆

首页

克隆

列表

默认

浏览次数

发布日期