语音 - 智狐AI导航

墨问便签

墨问便签是一款专为创作者设计的AI便签工具，提供长达10分钟的语音录制和实时转录功能。用户可以即时查看并编辑语音转录的文字内容，享受AI自动润色服务，包括分段、纠正错别字及删除重复词等。该工具还具备笔记私密或公开选项，方便用户记录灵感，激发创作思维，其轻量级设计使用户能够随时随地捕捉灵感，成为创作者的理想助手。

AI项目与工具 2025年06月12日 41 点赞 0 评论 884 浏览

SpicyChat

SpicyChat是一款面向成人用户的AI聊天应用，提供角色扮演聊天功能，支持用户与超过150,000个聊天机器人互动，并可创建个性化虚拟角色。该平台强调隐私保护，提供安全、无偏见的环境，支持多语言交流，具备AI语音回应及基于对话的图像生成功能，旨在为用户提供深入的情感体验和创意灵感。

AI项目与工具 2025年06月12日 37 点赞 0 评论 888 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 889 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 905 浏览

Media2Face

一款革命性的语音面部动画生成工具，借助 Media2Face，现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。

Ai开源项目 2025年06月05日 56 点赞 0 评论 911 浏览

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具，能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤，无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南，并支持多种应用场景，包括教育、新闻、企业培训和有声书制作等。

AI项目与工具 2025年06月12日 29 点赞 0 评论 914 浏览

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型，具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色，适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理，旨在提供高质量的语音交互体验。

AI项目与工具 2025年06月12日 22 点赞 0 评论 916 浏览

MooER

MooER是一款基于国产全功能GPU训练的开源音频理解大模型，由摩尔线程推出。它能够进行中文和英文的语音识别，并具备中译英的语音翻译能力。MooER在Covost2中译英测试集中取得25.2的BLEU分数，接近工业级标准。其主要功能包括语音识别、语音翻译、高效率训练以及开源模型。该模型采用深度学习架构和端到端训练模式，具有强大的多语言处理能力和广泛的适用性。

AI项目与工具 2025年06月12日 41 点赞 0 评论 923 浏览

Steve AI

Steve AI 是一款基于人工智能技术的云端视频生成平台，支持文本、博客、网页或音频内容转化为高质量视频和动画。它提供文本到视频、AI语音到视频、动画AI头像视频等多种功能，拥有超过300个AI头像及庞大的媒体库，同时配备40多种视频编辑工具。用户无需专业技能即可快速制作出专业级视频内容，广泛适用于社交媒体营销、教育培训、企业培训、内容营销和个人品牌建设等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 925 浏览

Mini-Omni 是一个开源的端到端语音对话模型，具备实时语音输入和输出的能力，能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别（ASR）或文本到语音（TTS）系统，直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法，通过批量并行策略提高性能，同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能，适用于智能助手、客户服务

AI项目与工具 2025年06月12日 93 点赞 0 评论 926 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期