语音生成 - 智狐AI导航

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具，其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色，生成自然流畅的语音，并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行，也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

AI项目与工具 2025年06月12日 49 点赞 0 评论 708 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 711 浏览

Mini-Omni 是一个开源的端到端语音对话模型，具备实时语音输入和输出的能力，能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别（ASR）或文本到语音（TTS）系统，直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法，通过批量并行策略提高性能，同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能，适用于智能助手、客户服务

AI项目与工具 2025年06月12日 93 点赞 0 评论 966 浏览

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具，通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言，适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景，为内容创作者提供高效且多样化的语音解决方案。

AI项目与工具 2025年06月12日 95 点赞 0 评论 633 浏览

SlideSpeak

SlideSpeak是一款基于AI技术的多功能工具，支持用户上传多种文档格式并生成演示文稿或摘要。其主要功能包括AI生成的演示文稿、文档总结、交互式聊天机器人、视觉内容分析及语音旁白生成。此外，SlideSpeak强调数据安全性，适用于学术研究、商业演示、教育培训等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 708 浏览

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具，支持多语言、多情感及声音克隆功能，可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性，适用于视频配音、播客制作、游戏配音等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 677 浏览

Voxify

Voxify是一款利用AI技术将文本转化为自然语音的专业工具，具备超过450种声音选择，支持140多种语言和方言。用户可自定义音调、语速及情感表达，满足多样化的应用场景。此外，Voxify支持多格式输出并提供API接口，便于集成至其他系统中。

AI项目与工具 2025年06月12日 82 点赞 0 评论 566 浏览

Slides Orator

Slides Orator是一款基于AI技术的演示工具，支持用户通过创建虚拟形象实现幻灯片的实时解说。其核心功能包括语音旁白生成、实时聊天互动及模拟演示场景，广泛应用于企业培训、产品推介、在线教育和会议演讲等领域，旨在提升信息传递效率和观众参与度。通过简化操作流程，该工具帮助用户高效完成高质量演示内容的准备。

AI项目与工具 2025年06月12日 69 点赞 0 评论 552 浏览

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具，支持超过30种性别和语言的声音选择，用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件，适用于产品演示、教育培训、营销推广等多种场景，助力高效生成高质量语音内容。

AI项目与工具 2025年06月12日 52 点赞 0 评论 648 浏览

MinMo

MinMo是阿里巴巴通义实验室推出的多模态语音交互大模型，具备高精度语音识别与生成能力。支持情感表达、方言转换、音色模仿及全双工交互，适用于智能客服、教育、医疗等多个领域，提升人机对话的自然度与效率。

AI项目与工具 2025年06月12日 59 点赞 0 评论 899 浏览

语音生成

首页

语音生成

列表

默认

浏览次数

发布日期