语音 - 智狐AI导航

摩笔天书

摩笔天书是一款由摩尔线程研发的AI辅助绘本创作工具，它结合了故事生成、图像生成、语音合成及音乐创作等多种AI技术，为用户提供从文字到完整绘本的全流程自动化创作服务。用户可轻松调整生成内容，满足个性化需求。该工具以其卓越的图文一致性、易读性及自动生成的音乐和旁白，成为无设计经验者快速产出高质量绘本的理想选择。

AI项目与工具 2025年06月12日 26 点赞 0 评论 621 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 635 浏览

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 713 浏览

Copilot Vision

Copilot Vision是一款由微软开发的人工智能辅助工具，专为Microsoft Edge浏览器设计，处于预览阶段。它能够理解网页内容，通过语音交互为用户提供实时分析和见解，帮助用户进行活动规划、购物决策和学习辅助，同时确保用户隐私安全。

AI项目与工具 2025年06月12日 79 点赞 0 评论 677 浏览

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具，支持多语言、多情感及声音克隆功能，可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性，适用于视频配音、播客制作、游戏配音等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 605 浏览

clone

Clone-Voice是一款基于深度学习的声音克隆工具，支持16种语言的文本转语音及声音风格转换，具有友好的操作界面和较低的硬件要求。它被广泛应用于视频制作、语言学习、有声出版物创作、广告宣传及游戏开发等领域，为用户提供多样化的个性化声音解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 753 浏览

SOLAMI

SOLAMI是一款基于VR环境的3D角色扮演AI系统，支持用户通过语音和肢体语言与虚拟角色进行沉浸式互动。系统采用社交视觉-语言-行为模型（Social VLA），可识别用户的多模态输入并生成相应响应，涵盖多种角色类型及互动场景，如游戏、舞蹈等。其核心技术涉及多任务预训练和指令微调，适用于虚拟社交、教育、心理治疗及娱乐等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 686 浏览

Voxify

Voxify是一款利用AI技术将文本转化为自然语音的专业工具，具备超过450种声音选择，支持140多种语言和方言。用户可自定义音调、语速及情感表达，满足多样化的应用场景。此外，Voxify支持多格式输出并提供API接口，便于集成至其他系统中。

AI项目与工具 2025年06月12日 82 点赞 0 评论 493 浏览

Amurex

Amurex是一款基于AI技术的会议助手，支持实时建议、智能摘要生成、关键要点提取及会议记录功能。它通过自然语言处理、机器学习和语音识别等技术，实现会议内容的高效管理和总结。适用于企业会议、远程协作、教育培训及项目管理等多种场景，帮助企业提升会议效率并保障数据安全。

AI项目与工具 2025年06月12日 93 点赞 0 评论 570 浏览

文小言电脑版

文小言电脑版是一款功能全面的桌面级智能助手，通过自然语言处理技术为用户提供文档解析、智能搜索、写作辅助等功能。它支持多格式文件的一键解析，提供个性化推荐和跨平台同步，能够有效提升办公、学习和生活的效率，适用于撰写报告、制作PPT、备考复习等多种场景。

AI项目与工具 2025年06月12日 30 点赞 0 评论 758 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期