语音识别 - 智狐AI导航

MiniMax 大语言模型

它基于海量中文数据训练而成，拥有超过1000亿个参数，能够处理上百TB的文本数据。

创作工具 1970年01月01日 0 点赞 0 评论 755 浏览

魔撰写作

全新的AI写作工具，拥有智能润色、实时纠错、全能词典、修辞、翻译等众多辅助创作功能，让您手握灵感、敲出不凡。

AI写作对话 1970年01月01日 0 点赞 0 评论 281 浏览

腾讯AI实验室

共同打造产学研用一体的 AI 生态

Ai科技公司 1970年01月01日 0 点赞 0 评论 328 浏览

滴滴人工智能实验室

全球智能交通的前沿科技实验室

Ai科技公司 1970年01月01日 0 点赞 0 评论 294 浏览

FunClip

FunClip是一款由阿里巴巴达摩院通义实验室开发的开源、本地部署的视频剪辑工具。它主要通过自动化语音识别技术，帮助用户基于语音转文字的结果，选择特定文本片段或说话人进行视频剪辑。其特点包括高精度的中文ASR模型、热词定制化、说话人识别功能、Gradio交互界面，以及支持多段剪辑和自动生成SRT字幕文件。

AI项目与工具 2024年07月01日 55 点赞 0 评论 640 浏览

Universal

Universal-1是一款由AssemblyAI开发的多语言语音识别和转录模型，经过大量多语种音频数据训练，支持英语、西班牙语、法语和德语等。该模型在各种复杂环境中提供高精度的语音转文字服务，具备快速响应能力和改进的时间戳准确性。Universal-1在准确率、响应时间、时间戳估计和用户偏好等方面表现优异，适用于对话智能平台、AI记事本、创作者工具和远程医疗平台等多个应用场景。

AI项目与工具 2024年01月01日 88 点赞 0 评论 750 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 791 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 626 浏览

Miley AI

Miley AI 是一款基于人工智能的生活助手，主要功能包括智能语音记录、情绪识别、自动记账、日程管理以及与苹果健康数据连接的运动监督。这款工具特别适用于忙碌的职场人士、创意工作者、学生、健身爱好者及理财者，帮助他们更高效地管理日常生活和工作任务。

AI项目与工具 2025年06月12日 42 点赞 0 评论 769 浏览

Tailor

Tailor是一款免费开源的AI视频编辑工具，提供视频编辑、生成和优化三大功能。它能够实现人脸剪辑、语音剪辑、口播生成、字幕生成、色彩生成等功能，并支持背景更换及流畅度和清晰度优化。最新版本增加了语音驱动的口播生成和模型自检修复机制，进一步提升了用户体验。

AI项目与工具 2025年06月12日 79 点赞 0 评论 451 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期