FireRedASR FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。 AI项目与工具 2025年06月12日 82 点赞 0 评论 421 浏览
AiSofiya Sofiya是一款由人工智能驱动的文本到语音转换器,可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率,并有一个强大的声音工作室,以合并和增强... Ai语音工具 1970年01月01日 0 点赞 0 评论 417 浏览
Chirp 3 Chirp 3 是谷歌云推出的高清语音合成工具,支持 31 种语言和 248 种声音,能生成自然流畅的语音。具备多语言支持、自定义语音、流式合成等功能,适用于智能助手、有声读物、视频配音等场景。支持多种音频格式,注重数据安全与合规性。 AI项目与工具 2025年06月12日 16 点赞 0 评论 414 浏览
Azure AI Azure AI 语音服务为用户提供了一套全面的语音处理解决方案,支持多种语言,具备高度的自定义能力,适用于各种规模的公司和多样化的应用场景。 创作工具 1970年01月01日 0 点赞 0 评论 413 浏览
Vid.AI 一个爆款短视频生成AI工具并优化这些视频以提高在社交媒体上的传播率,提供提示生成视频、AI 脚本生成、AI 声音、短视频创作和内置的素材库。 Ai视频生成 2025年06月05日 71 点赞 0 评论 411 浏览
WhisperKeyboard WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具,支持多语言实时语音转文字,适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能,兼容多平台,提升输入效率与文本质量。 AI项目与工具 2025年06月12日 76 点赞 0 评论 405 浏览
MagicMic MagicMic是一个功能强大的声音变换工具,适用于游戏玩家、主播和内容创作者。它通过提供丰富的声音过滤器和音效,以及实时声音变换技术,使用户能够在游戏中或在线聊天中保护隐私... 创作工具 1970年01月01日 0 点赞 0 评论 405 浏览
ChatTTS ChatTTS是一个开源的专为对话场景设计的语音生成模型,特别适用于大语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文,英文也能 hold 住... 创作工具 1970年01月01日 0 点赞 0 评论 400 浏览