Aya Vision Aya Vision 是 Cohere 推出的多模态、多语言视觉模型,支持 23 种语言,具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术,确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景,具有广泛的实用价值。 AI项目与工具 2025年06月12日 70 点赞 0 评论 360 浏览
JoyGen JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架,能够实现唇部动作与音频信号的精准同步,并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑,基于130小时中文视频数据集训练,在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域,为视频内容创作提供了创新解决方案。 AI项目与工具 2025年06月12日 78 点赞 0 评论 359 浏览
Nooka Nooka是一款基于AI技术的听书应用,提供全球非虚构类书籍的20分钟音频摘要,适合碎片化时间学习。用户可随时提问并获得AI即时回答,实现深度互动。应用支持多语言字幕、音频剪辑分享及社区交流,适用于通勤、运动、家务等多种场景,提升学习效率与趣味性。 AI项目与工具 2025年06月11日 16 点赞 0 评论 358 浏览
Read AI Read AI是一款基于先进AI技术的全场景助手,主要功能涵盖自动会议记录、邮件管理、数据分析等,并可与多个主流平台无缝集成。它支持多语言操作,强调数据安全性,广泛适用于远程会议、办公室协作、项目管理、客户服务以及销售营销等领域,为企业和个人用户提供高效的工作体验。 AI项目与工具 2025年06月12日 32 点赞 0 评论 358 浏览
Fish Audio Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。 AI项目与工具 2025年06月11日 79 点赞 0 评论 358 浏览
RWKV RWKV-7是一种先进的大模型架构,超越传统注意力机制,具备强大的上下文学习能力和高效的训练稳定性。其动态状态更新和学习率调整机制提升了模型性能,适用于文本生成、机器翻译、情感分析、对话系统及多语言处理等多种应用场景。 AI项目与工具 2025年06月12日 37 点赞 0 评论 357 浏览
AudioNotes.ai AudioNotes.ai 是一个高效的语音转文本服务,特别适合需要快速记录和整理语音信息的用户。它的自动语音识别和文本改善功能,加上灵活的摘要选项,使用户能够轻松地将语音内容转换... 排版编辑 1970年01月01日 0 点赞 0 评论 356 浏览
FishAudio 一个在线AI文本转语音合成配音声音克隆平台,以其自然、富有表现力的语音生成技术,为用户带来了前所未有的音频体验。 Ai语音工具 2025年06月05日 76 点赞 0 评论 356 浏览
QANDA QANDA是一款由韩国Mathpresso公司开发的AI学习应用,主要面向学生,提供数学及其他学科的即时解答与详细解析。用户可通过拍照或输入问题,获取分步解答、常见错误提示及个性化辅导。应用还支持多语言、学习数据分析和类似题目推荐,适用于家庭作业、考试复习、日常学习及教学辅助等多种场景,帮助用户提升学习效率和理解能力。 AI项目与工具 2025年06月12日 80 点赞 0 评论 355 浏览