音频

首页

音频

列表

默认

浏览次数

发布日期

TANGO

TANGO

TANGO是一个开源框架，利用分层音频运动嵌入和扩散插值网络，生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持，适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题，并有效提升了视频内容制作效率。

AI项目与工具 2025年06月12日 78 点赞 0 评论 587 浏览

Lalalai

Lalalai

Lalalai啦啦爱，人声去除器和AI智能伴奏分离器，使用人工智能去除人声并进行音源分离，快速、简单、精确地提取词干（人声/伴奏）

Ai语音工具 2025年06月05日 82 点赞 0 评论 584 浏览

Seaweed

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 584 浏览

Verbalate Ai

Verbalate Ai

Verbalate是一款通用的视频翻译和唇语同步工具，能够轻松地将音频/视频内容转换为多种语言，并具备语音克隆和唇语同步功能。

Ai语音工具 2025年06月05日 19 点赞 0 评论 584 浏览

Stability AI

Stability AI

Stability AI提供了一套完整的生成式AI模型，覆盖图像、视频和音频等多个领域，旨在推动AI技术的普及和应用。

Ai视频生成 1970年01月01日 0 点赞 0 评论 583 浏览

Audio

Audio

Audio-SDS是由NVIDIA研发的音频处理技术，基于文本提示引导音频生成，支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型，即可将预训练音频扩散模型扩展为多功能工具，具备高效推理能力，适用于游戏、音乐制作、教育及智能家居等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 582 浏览

Memo AI

Memo AI

Memo AI 是一款AI 驱动的视频、播客转文字工具。

Ai语音工具 2025年06月05日 96 点赞 0 评论 581 浏览

Covers AI

Covers AI

一款功能强大的AI声音和歌曲生成器工具，允许用户使用来自著名主播、政治家、歌手、卡通人物等的数千种声音生成 AI 翻唱。

Ai语音工具 2025年06月05日 82 点赞 0 评论 581 浏览

UniFab

UniFab

一款功能强大的视频增强工具，UniFab具有AI驱动的升频、降噪、SDR 到 HDR 转换以及其他多种功能，提升视频质量，满足专业人士和爱好者的需求。

视频剪辑 2025年06月05日 21 点赞 0 评论 580 浏览

Speechelo

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具，支持超过30种性别和语言的声音选择，用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件，适用于产品演示、教育培训、营销推广等多种场景，助力高效生成高质量语音内容。

AI项目与工具 2025年06月12日 52 点赞 0 评论 578 浏览

微信公众账号

微信扫一扫加关注