Chinese Chinese-LiPS是由智源研究院与南开大学联合开发的高质量中文多模态语音识别数据集,包含100小时语音、视频及手动转录文本。其创新性融合唇读视频与幻灯片内容,显著提升语音识别性能,实验表明可降低字符错误率约35%。适用于教学、科普、虚拟讲解等复杂语境,为多模态语音识别研究提供丰富数据支持。 AI项目与工具 2025年06月11日 47 点赞 0 评论 180 浏览
海豚配音TTS Online 海豚配音TTS Online是一个多功能的在线TTS服务平台,它通过先进的语音合成技术,为用户提供了一种便捷的方式来生成高质量的语音内容。 创作工具 1970年01月01日 0 点赞 0 评论 181 浏览
AI酱 AI酱是一款结合二次元元素与AI技术的多语言智能聊天工具,支持多种语言交流,具备语音识别和即时反馈功能。它通过生动的角色形象和标准化发音,帮助用户练习外语口语,并能在情绪疏导、旅行规划等方面提供个性化服务。此外,其多角色设定和场景切换功能进一步增强了用户体验。 AI项目与工具 2025年06月12日 37 点赞 0 评论 182 浏览
Ming Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。 AI项目与工具 2025年06月11日 79 点赞 0 评论 182 浏览
Voxify Voxify是一款利用AI技术将文本转化为自然语音的专业工具,具备超过450种声音选择,支持140多种语言和方言。用户可自定义音调、语速及情感表达,满足多样化的应用场景。此外,Voxify支持多格式输出并提供API接口,便于集成至其他系统中。 AI项目与工具 2025年06月12日 82 点赞 0 评论 183 浏览
问问小宇宙 即刻App推出的一项基于小宇宙的AI搜索功能。它主要专注于声音内容的深度挖掘,不同于传统的文字搜索,为用户提供了一种新的获取信息和知识的方式。 AI搜索问答 2025年06月05日 27 点赞 0 评论 184 浏览
Koko AI 一款具有AI生成的3D模型和语音聊天功能的社交娱乐应用,Koko AI融合了3D模型、动画表演和语音聊天技术,为用户提供了与动漫角色进行面对面的互动体验。 生活创意 2025年06月05日 87 点赞 0 评论 185 浏览
场辞 场辞,AI视频字幕制作软件,一款基于语音识别技术的视频字幕制作软件,一键智能识别字幕,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,用AI加速你的创作。 Ai语音工具 2025年06月05日 87 点赞 0 评论 186 浏览