语音转文字

首页

语音转文字

列表

默认

浏览次数

发布日期

Parakeet TDT 0.6B

Parakeet TDT 0.6B

Parakeet TDT 0.6B 是一款由英伟达开发的开源自动语音识别（ASR）模型，采用 FastConformer 和 TDT 架构，具备高速转录、高精度识别、歌词转录、文本格式化等功能。模型在 Hugging Face Open ASR Leaderboard 中表现优异，实时因子高达 3386，适用于会议记录、法律医疗、字幕生成及音乐索引等多种场景。

AI项目与工具 2025年06月11日 36 点赞 0 评论 832 浏览

FireRedASR

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别（ASR）模型系列，支持普通话、中文方言和英语，具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本，分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色，且已开源，推动语音识别技术的发展。

AI项目与工具 2025年06月12日 82 点赞 0 评论 818 浏览

Voice

Voice

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能，支持超过100种语言，广泛应用于教育、娱乐和商业领域，显著提升音频处理效率和便捷性。

AI项目与工具 2025年06月12日 33 点赞 0 评论 813 浏览

简单听记

简单听记

简单听记

百度网盘推出的一款AI语音转文字工具，简单听记能够帮你将音频内容转化为文字，还能进一步把这些文字提炼总结，帮你节省很多时间。

Ai语音工具 2025年06月05日 94 点赞 0 评论 810 浏览

WhisperKeyboard

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 806 浏览

WorkOnGPT

WorkOnGPT

WorkOnGPT

一站式AI办公平台，集成多种AI模型，提供免费的ChatGPT等AI模型服务，涵盖ChatGPT,文档翻译、问答互动、语言转文字等功能，适合各类办公需求，助力为您实现高效办公。

Ai办公效率 2025年06月05日 100 点赞 0 评论 806 浏览

WhisperChain

WhisperChain

WhisperChain 是一款开源语音识别工具，支持实时语音转文本并提供文本优化功能，可去除填充词、优化语法。用户可通过全局热键快速启动语音输入，处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构，适用于会议记录、写作辅助等场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 750 浏览

Notato

Notato

Notato 是一款基于 AI 的笔记应用，支持音频、视频、文档及网页内容的自动转录与结构化整理，生成摘要、闪卡和测验，适用于学习、会议、资料整理等多种场景。其具备多语言翻译、错题分析、后台录音等功能，提升信息处理与知识管理效率。

AI项目与工具 2025年06月11日 74 点赞 0 评论 735 浏览

AstrBot

AstrBot

AstrBot是一款多功能聊天机器人及开发框架，支持多种大语言模型和消息平台，具备多轮对话、语音转文字、网页搜索等功能。它采用模块化设计，支持插件开发和多平台部署，适用于企业客服、个人助手、教育辅导等多个场景，提供高效的智能交互体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 709 浏览

话袋AI笔记

话袋AI笔记

话袋AI笔记

新一代AI卡片笔记产品，具备随时记录、多端同步、资源收藏、笔记串联等多种功能，话袋AI笔记是你生活、学习、工作中好帮手。

Ai办公效率 2025年06月05日 80 点赞 0 评论 700 浏览

微信公众账号

微信扫一扫加关注