语音识别 - 智狐AI导航

AI酱

AI酱是一款结合二次元元素与AI技术的多语言智能聊天工具，支持多种语言交流，具备语音识别和即时反馈功能。它通过生动的角色形象和标准化发音，帮助用户练习外语口语，并能在情绪疏导、旅行规划等方面提供个性化服务。此外，其多角色设定和场景切换功能进一步增强了用户体验。

AI项目与工具 2025年06月12日 37 点赞 0 评论 543 浏览

白瓜面试

白瓜面试是一款集智能回答、代码解析、语音与图像识别于一体的AI面试辅助工具。它通过实时语音转录、图片分析及物理隔离功能，帮助求职者在技术面试和技术岗位应聘中保持高效表现。此外，它还支持在线面试、笔试优化及简历定制服务，旨在全面提升用户的面试体验。

AI项目与工具 2025年06月12日 53 点赞 0 评论 668 浏览

Timtalk

Timtalk是一款基于人工智能技术的英语口语学习工具，集成了文本和语音对话功能，提供即时反馈、语法检查、词汇扩展及语音识别服务。它能够模拟真实交流场景，满足不同水平用户的需求，并支持多平台使用。无论是日常对话、旅行场景还是专业领域如商务和学术交流，Timtalk都可作为高效的辅助工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 807 浏览

OfferinAI

OfferinAI是一款面向求职者和招聘者的智能工具，集成了实时语音识别、快速响应、网络搜索及代码生成等功能，旨在提升用户在面试和笔试中的表现。它支持多种模式，适用于在线面试、笔试辅助、技能测试及模拟面试等场景，帮助用户在多轮面试中获得竞争优势。

AI项目与工具 2025年06月12日 100 点赞 0 评论 666 浏览

本文介绍了15款基于人工智能技术的视频翻译工具，这些工具能够实现精准的语音识别、自然语言处理和机器学习，从而将视频内容从一种语言翻译成另一种语言，为全球观众提供无缝的语言转换体验。这些工具涵盖了多语言支持、精准翻译与文化适配、字幕与音频同步、自动对口型和重新配音、智能视频去文字、翻译视频文字、视频翻译精校版、支持多种语言、字幕调整和声音克隆等多个功能和特点，极大地提升了视频内容的本地化质量和传播效

AI项目与工具 2025年06月12日 52 点赞 0 评论 914 浏览

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型，专注于低延迟实时对话AI。它具备强大的音频生成与处理能力，能够处理和生成高质量的音频信号，并支持多任务微调，适用于语音识别、语音合成等多种应用场景。此外，Hertz-Dev还提供了音频自动编码、流式生成等功能，广泛应用于智能助手、客户服务、语音识别及合成等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 508 浏览

星辰大模型

星辰大模型是中国电信研发的AI工具集，涵盖语义、视觉、语音等多模态领域，支持长文本处理、多语种语音识别和多任务视觉处理。平台提供多种模型选择，包括星辰语义模型、星辰语音大模型及星辰多模态大模型，适用于智能客服、内容审核、智能写作、语音识别与合成、图像识别与分析等多种应用场景。

AI项目与工具 2025年06月12日 86 点赞 0 评论 557 浏览

创音岛

创音岛是一款集录音转文字、配音、AI写歌及音频编辑于一体的综合性音乐创作与音频处理平台。它采用先进语音识别技术，支持多场景下的文字转录需求；提供多样化的配音选项和智能化音乐编曲功能，帮助用户轻松创作音乐；并配备音频编辑工具，满足用户对音频文件的精细化处理需求。该平台界面友好，操作便捷，适合音乐爱好者、创作者及专业人士使用。

AI项目与工具 2025年06月12日 42 点赞 0 评论 797 浏览

Whispo

Whispo是一款AI驱动的语音转录工具，支持用户通过快捷键快速录制语音并将其转写为文本，同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景，旨在提升工作效率和用户体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 606 浏览

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型，支持实时语音转文本，具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术，适应不同长度的音频输入，计算需求随音频长度变化而调整，适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 701 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期

AI酱