语音转文字

Buzz

Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具，支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能，支持多种格式导出，并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。

AI项目与工具 2025年06月12日 10 点赞 0 评论 526 浏览

Speechnotes

Speechnotes是一款基于AI的语音转文字工具，提供高精度语音识别、实时语音输入、语音命令支持、自动大写处理等功能，支持多平台操作（Chrome扩展、Android、iOS、API等）。它强调隐私保护，录音不经过人工处理且自动删除，适合快速转录、会议记录、写作、医疗记录等多种应用场景，是提升工作效率的理想选择。

AI项目与工具 2025年06月12日 68 点赞 0 评论 619 浏览

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具，支持实时语音转文字功能，具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型，可处理中英文混合语音，并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景，同时确保用户数据的安全与隐私。 ---

AI项目与工具 2025年06月12日 38 点赞 0 评论 647 浏览

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具，支持多种音频格式的转换，生成SRT和TXT字幕文件，适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档，旨在为用户提供便捷、准确的语音转文字解决方案。

AI项目与工具 2025年06月12日 40 点赞 0 评论 848 浏览

Cleanvoice

Cleanvoice是一款利用AI技术优化音频和视频编辑的工具，适用于播客制作、视频内容编辑、企业培训、教育讲座及采访等多种场景。其核心功能包括填充词移除、背景噪音过滤、播客摘要生成、语音转录、多轨混音等，旨在提升音频质量并节省编辑时间。无论是个人创作者还是团队用户，均可通过Cleanvoice轻松实现高效的内容整理与发布。

AI项目与工具 2025年06月12日 100 点赞 0 评论 518 浏览

Voice

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能，支持超过100种语言，广泛应用于教育、娱乐和商业领域，显著提升音频处理效率和便捷性。

AI项目与工具 2025年06月12日 33 点赞 0 评论 759 浏览

MarkItDown

MarkItDown是一款由微软推出的开源文档转换工具，支持多种文件格式（如PDF、Office文档、图像、音频等）转换为Markdown格式。它具备OCR文字识别、语音转文字、元数据提取等功能，适用于文档归档、内容发布、数据挖掘、学术研究等多个场景，旨在简化文件处理流程，提升工作效率。通过提供简单易用的API接口，MarkItDown成为开发者友好型工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 884 浏览

Fineshare FineVoice

Fineshare FineVoice 是一款多功能 AI 配音生成工具，支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项，适用于视频制作、播客、教育、营销等多种场景，助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作，适合个人与企业用户使用。

AI项目与工具 2025年06月12日 87 点赞 0 评论 857 浏览

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 759 浏览

AstrBot

AstrBot是一款多功能聊天机器人及开发框架，支持多种大语言模型和消息平台，具备多轮对话、语音转文字、网页搜索等功能。它采用模块化设计，支持插件开发和多平台部署，适用于企业客服、个人助手、教育辅导等多个场景，提供高效的智能交互体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 658 浏览

语音转文字

首页

语音转文字

列表

默认

浏览次数

发布日期