Reverb ASR Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具,采用20万小时高质量英语语音数据训练,具备高精度语音转录能力,支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容,并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景,为用户提供灵活且高效的语音转文字解决方案。 AI项目与工具 2025年06月12日 55 点赞 0 评论 433 浏览
Dubverse AI Dubverse.ai 是一个使用人工智能 (AI)让您轻松快速地将视频中说话者的声音更改为另一种语言的网站。 字幕配音 2025年06月05日 62 点赞 0 评论 433 浏览
DreamActor DreamActor-M1是字节跳动推出的AI图像动画框架,能够将静态照片转化为高质量动态视频。其核心在于混合引导机制,结合隐式面部表示、3D头球和身体骨架,实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配,适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域,具备高保真、强连贯性和广泛适用性。 AI项目与工具 2025年06月12日 86 点赞 0 评论 432 浏览
声动视界SoundView 一款面向带货短视频的AI视频工具,声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。 Ai语音工具 2025年06月05日 58 点赞 0 评论 432 浏览
MeloTTS MeloTTS是一个高质量的多语言文本转语音(TTS)库,由MyShell AI开发。该工具支持多种语言的文本转语音任务,包括英语(含不同口音)、西班牙语、法语、中文、日语和韩语,并具备快速的语音合成速度。MeloTTS不仅支持中英混合发音,还易于安装和使用,适用于多种操作系统和环境。用户可以在GitHub和Hugging Face平台上获取和体验MeloTTS。 AI项目与工具 2024年01月01日 57 点赞 0 评论 432 浏览
EAP Talk EAP Talk 是一款基于AI技术的学术英语口语学习工具,提供实时发音、语法和流利度评估,支持多种练习模式如朗读、演讲和情景对话。内置学术场景训练、真人互动及个性化课程,适合高校学生和英语学习者提升口语能力。系统支持词汇练习、学习报告生成和进度跟踪,广泛应用于留学备考、学术研究、国际课堂及职场英语等领域。 AI项目与工具 2025年06月11日 48 点赞 0 评论 431 浏览
Coqui.ai Coqui.ai 是一个语音技术的开源平台,Coqui.ai 通过生成式 AI 提供逼真、富有情感的文本转语音,它可以从 3 秒的音频中克隆任何声音并调整其风格、节奏和情感。 Ai语音工具 2025年06月05日 64 点赞 0 评论 430 浏览
Perplexity macOS客户端 Perplexity macOS 是一款基于人工智能技术的搜索工具,集成了大语言模型,支持实时联网搜索、多源内容整合及信息来源标注。其主要功能包括语音与文本输入、线索跟踪、历史记录查看及文件分析等,适用于深度研究、信息查询、知识管理和文件分析等多种应用场景,旨在提高用户的搜索效率和工作生产力。 AI项目与工具 2025年06月12日 17 点赞 0 评论 430 浏览
FoloUp FoloUp 是一款开源的 AI 语音面试平台,能根据职位描述自动生成面试问题,并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成,提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘,结合语音识别、NLP 和安全数据管理技术,适用于多种招聘场景,提升招聘效率与质量。 AI项目与工具 2025年06月12日 74 点赞 0 评论 430 浏览