语音 - 智狐AI导航

Jellypod

Jellypod 是一款基于 AI 的播客制作工具，支持从网页、PDF 等多种格式自动生成脚本并转为音频，涵盖 30 多种语言和口音。用户可自定义 AI 主持人，编辑脚本并一键发布到主流平台，具备高质量音频生成与内容管理功能，适用于企业、教育和个人品牌建设等场景。

AI项目与工具 2025年06月12日 80 点赞 0 评论 605 浏览

Talk to Ash

Talk to Ash 是一款基于人工智能的心理健康支持平台，通过语音对话技术提供全天候的情感支持与心理辅导服务。平台结合认知行为疗法（CBT）和辩证行为疗法（DBT）等专业方法，能根据用户对话生成个性化建议。具备语音交互、情绪倾听、目标追踪、隐私保护等功能，适用于压力管理、人际关系改善和个人成长等场景。

AI项目与工具 2025年06月12日 83 点赞 0 评论 486 浏览

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 713 浏览

BoldVoice

BoldVoice 是一款专注于英语发音训练的工具，结合专业口音课程与AI语音分析技术，帮助非英语母语者提升发音准确性和口语自信。用户可通过录音获得实时反馈与改进建议，并根据个人母语背景定制学习计划。应用还提供发音测试、口音对比和多场景练习功能，适用于职场、考试、日常交流及表演等领域，有效提升英语口语能力。

AI项目与工具 2025年06月12日 100 点赞 0 评论 639 浏览

FilmAgent

FilmAgent是一款由哈尔滨工业大学（深圳）研发的虚拟电影制作工具，基于多智能体协作框架，实现从剧本创作到镜头拍摄的全流程自动化。支持剧本生成、多智能体协作、镜头规划、语音合成等功能，适用于创意视频制作、影视教学及虚拟场景应用。系统在Unity 3D环境中运行，提升电影制作效率与创意表达能力。

AI项目与工具 2025年06月12日 31 点赞 0 评论 687 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 817 浏览

SpeechGPT 2.0

SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统，基于大量中文语音数据训练，支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能，适用于智能助手、内容创作及无障碍通信等场景，技术上融合了语音-文本联合建模与多阶段训练策略，提升语音表现力与智能化水平。

AI项目与工具 2025年06月12日 23 点赞 0 评论 595 浏览

Martin

Martin是一款由大学生团队开发的人工智能助手，支持语音交互与多平台通信，具备日程管理、邮件处理、任务跟踪、文件管理等功能。它通过自定义记忆架构理解用户偏好，提供个性化服务，适用于日常办公和生活管理，提升工作效率与便利性。

AI项目与工具 2025年06月12日 25 点赞 0 评论 813 浏览

NewsBang

NewsBang是一款基于AI技术的新闻应用，提供无偏见、深度的新闻洞察。通过整合多源信息生成简洁摘要，并支持实时问答、语音播放及个性化推荐等功能，帮助用户高效获取关键信息。适用于忙碌人群、新闻爱好者及投资者等，满足多样化信息需求。

AI项目与工具 2025年06月12日 19 点赞 0 评论 788 浏览

Granola

Granola是一款AI驱动的会议助手工具，支持实时转录、发言者识别、笔记记录和重点标记，自动生成会议总结并支持任务管理。它可与主流会议平台集成，根据会议类型智能调整笔记模板，具备高精度语音识别能力，适用于多种会议场景，帮助用户提升会议效率与信息整理能力。

AI项目与工具 2025年06月12日 69 点赞 0 评论 788 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期