语音 - 智狐AI导航

Glimmer AI

一款使用GPT-3和DALL·E 2进行AI支持的ppt演示工具，根据用户的文本和语音指令生成视觉非常出色的PPT演示文稿。

PPT资源 2025年06月05日 96 点赞 0 评论 688 浏览

Vozard

一款由iMobie开发的AI驱动的实时语音变声软件，提供超过100种逼真的语音效果。用户可以在在线聊天、游戏等场景中使用。

Ai语音工具 2025年06月05日 94 点赞 0 评论 688 浏览

DeepL

DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务，可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

Ai语音工具 2026年06月14日 0 点赞 0 评论 687 浏览

Ola

Ola是一款由多机构联合开发的全模态语言模型，支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略，逐步扩展模型的多模态理解能力，同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器，结合局部-全局注意力机制，实现高效多模态处理，在多项任务中表现优异。

AI项目与工具 2025年06月12日 98 点赞 0 评论 687 浏览

Murf AI

Murf AI 是一款文本转语音软件，它能够将真实声音与免版税音乐和视频相结合。

Ai语音工具 2025年06月05日 27 点赞 0 评论 687 浏览

OCTAVE

OCTAVE是一款由Hume AI研发的语音语言处理工具，融合了多种领先AI技术，具备强大的个性化语音生成能力，支持从文字到语音的即时转化，并能精准模仿不同说话者的声线与情感表达。其主要功能包括多角色对话生成、复杂指令理解与响应，以及实时语音处理等。此外，OCTAVE可应用于客户服务、虚拟助手、教育培训、娱乐游戏等多个领域，为用户带来更加自然、生动的交互体验。

AI项目与工具 2025年06月12日 14 点赞 0 评论 685 浏览

Westlake

Westlake-Omni是西湖心辰推出的一款开源中文情感端到端语音交互大模型，融合了语音识别、自然语言处理、情感理解和对话管理等功能，具备实时性和端到端交互特性。它通过深度学习技术和离散表示法，实现从语音输入到语音输出的全流程自动化，生成自然流畅的语音回应，并广泛应用于智能助手、客户服务、教育辅助、健康医疗等领域。

AI项目与工具 2025年06月12日 91 点赞 0 评论 685 浏览

SpeechEasy

SpeechEasy是一种合成语音解决方案，可以让用户从文本生成高质量、易于理解的音频。它适用于各种设备和平台，支持桌面和移动设备，有近12种高质量的合成声音可供选择。它使用简单...

Ai语音工具 2026年06月14日 0 点赞 0 评论 684 浏览

VideoCaptioner

VideoCaptioner是一款基于大语言模型的智能字幕处理工具，支持语音识别、字幕优化、翻译、样式调整及视频合成等功能。无需GPU即可运行，兼容多语言和多种字幕格式，适用于视频创作者、教育工作者及字幕翻译团队，提升字幕制作效率与质量。

AI项目与工具 2025年06月12日 50 点赞 0 评论 683 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 683 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期