Whisper语音识别模型 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Ai开源项目 2025年06月05日 90 点赞 0 评论 659 浏览
蓝藻AI 运用了尖端的创造性人工智能技术,致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。 创作工具 1970年01月01日 0 点赞 0 评论 658 浏览
Allavsoft 一款专业的视频下载和转换工具,Allavsoft支持从 YouTube、Spotify、Vimeo 等 10000 多个网站下载视频和音频。用户可以轻松下载高清视频、音乐视频、播放列表等,并将其转换为 MP4、MP3、AVI 等多种格式。 视频素材 2025年06月05日 59 点赞 0 评论 657 浏览
EMAGE EMAGE是一款基于音频输入生成全身手势的AI框架,可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模,实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域,提升虚拟角色表现力与交互自然度。 AI项目与工具 2025年06月12日 13 点赞 0 评论 657 浏览
voice.ai voice.ai的使命是通过普及人工智能技术,增强协作创造力,并允许社区重新定义音频表达方式。公司相信人工智能应该是易于接近、对所有人开放且富有趣味的。 创作工具 1970年01月01日 0 点赞 0 评论 657 浏览
绘声美音 绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具,用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型,进行歌曲翻唱并生成MV,同时提供变声、音频提取、听歌识曲等功能,适用于娱乐、配音、创作等多种场景。 AI项目与工具 2025年06月12日 39 点赞 0 评论 654 浏览
Enhance Speech 一款由 Adobe 出品的录音增强工具,可以去除音频背景噪音,让语音或者录音听起来就像在专业录音室中录制一样,使音频具有专业录音室品质录音的干净、专业的声音。 Ai语音工具 2025年06月05日 29 点赞 0 评论 651 浏览
RecordScreen 一款不需要安装的浏览器在线屏幕录制工具,用户可以直接通过浏览器录制屏幕。它支持录制整个屏幕、浏览器窗口或特定标签页,并可选择同步录制摄像头画面。 直播录屏 2025年06月05日 83 点赞 0 评论 649 浏览
PoseTalk PoseTalk 是一款基于文本和音频驱动的开源工具,专注于生成自然且逼真的头部动画视频。它通过 Pose Latent Diffusion (PLD) 模型和级联网络实现唇部同步与运动细化,广泛应用于虚拟助手、在线教育和娱乐等领域,提供多样化的动画生成能力和高度精准的唇形同步效果。 AI项目与工具 2025年06月12日 53 点赞 0 评论 648 浏览
PlaiDay PlaiDay和Orchestra平台展现了AI技术在个性化内容生成和其他领域的潜力,为用户提供了一个易于使用且功能强大的视频创作环境。 Ai视频生成 1970年01月01日 0 点赞 0 评论 648 浏览