语音生成 - 智狐AI导航

AI Voice Cloning

一个提供超真实的AI语音克隆生成器，只需要3秒的音频样本就可以克隆英语、普通话、日语、韩语等语言的声音，生成与真人无异的逼真语音。

Ai语音工具 2025年06月05日 17 点赞 0 评论 806 浏览

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型，具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互，适用于智能客服、教育、医疗等多个领域，提升人机对话的自然度与效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 816 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 841 浏览

Mini-Omni 是一个开源的端到端语音对话模型，具备实时语音输入和输出的能力，能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别（ASR）或文本到语音（TTS）系统，直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法，通过批量并行策略提高性能，同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能，适用于智能助手、客户服务

AI项目与工具 2025年06月12日 93 点赞 0 评论 885 浏览

语音生成

首页

语音生成

列表

默认

浏览次数

发布日期

AI Voice Cloning

MinMo

VITA

Mini

语音生成 首页 语音生成

列表 默认 浏览次数 发布日期

AI Voice Cloning

MinMo

VITA

Mini

语音生成

首页

语音生成

列表

默认

浏览次数

发布日期