音频 - 智狐AI导航

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Ai开源项目 2025年06月05日 90 点赞 0 评论 659 浏览

运用了尖端的创造性人工智能技术，致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。

创作工具 1970年01月01日 0 点赞 0 评论 658 浏览

一款专业的视频下载和转换工具，Allavsoft支持从 YouTube、Spotify、Vimeo 等 10000 多个网站下载视频和音频。用户可以轻松下载高清视频、音乐视频、播放列表等，并将其转换为 MP4、MP3、AVI 等多种格式。

视频素材 2025年06月05日 59 点赞 0 评论 657 浏览

EMAGE是一款基于音频输入生成全身手势的AI框架，可同步生成面部表情、肢体动作及整体运动。通过掩蔽音频手势变换器和多模块VQ-VAE建模，实现高质量、多样化的手势生成。适用于虚拟现实、动画制作、数字人交互等领域，提升虚拟角色表现力与交互自然度。

AI项目与工具 2025年06月12日 13 点赞 0 评论 657 浏览

voice.ai的使命是通过普及人工智能技术，增强协作创造力，并允许社区重新定义音频表达方式。公司相信人工智能应该是易于接近、对所有人开放且富有趣味的。

创作工具 1970年01月01日 0 点赞 0 评论 657 浏览

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具，用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型，进行歌曲翻唱并生成MV，同时提供变声、音频提取、听歌识曲等功能，适用于娱乐、配音、创作等多种场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 654 浏览

一款由 Adobe 出品的录音增强工具，可以去除音频背景噪音，让语音或者录音听起来就像在专业录音室中录制一样，使音频具有专业录音室品质录音的干净、专业的声音。

Ai语音工具 2025年06月05日 29 点赞 0 评论 651 浏览

PoseTalk 是一款基于文本和音频驱动的开源工具，专注于生成自然且逼真的头部动画视频。它通过 Pose Latent Diffusion (PLD) 模型和级联网络实现唇部同步与运动细化，广泛应用于虚拟助手、在线教育和娱乐等领域，提供多样化的动画生成能力和高度精准的唇形同步效果。

AI项目与工具 2025年06月12日 53 点赞 0 评论 649 浏览

一款不需要安装的浏览器在线屏幕录制工具，用户可以直接通过浏览器录制屏幕。它支持录制整个屏幕、浏览器窗口或特定标签页，并可选择同步录制摄像头画面。

直播录屏 2025年06月05日 83 点赞 0 评论 649 浏览

PlaiDay和Orchestra平台展现了AI技术在个性化内容生成和其他领域的潜力，为用户提供了一个易于使用且功能强大的视频创作环境。

Ai视频生成 1970年01月01日 0 点赞 0 评论 648 浏览

音频

首页

音频