音频

Luvvoice

Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台,提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件,将文本快速转换为自然语音,适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能,生成的音频文件支持 MP3 格式下载。

SynthID

SynthID是一款由DeepMind研发的技术工具,通过在AI生成的内容中嵌入数字水印来验证其真实性与原创性。它支持多种内容形式,包括文本、音乐、图像和视频,并具备良好的抗修改性和检测稳定性。SynthID不仅不影响内容质量,还提升了信息可信度,广泛应用于新闻、版权保护、教育、法律及社交媒体等领域。

UniFab AI

一款可以通过AI算法增强视频和音频质量工具。UniFab AI针对的用户群体主要有老旧视频想要修复和增强、对视频播放有更高要求的影音爱好者。

机连世界

机连世界APP就像是AI机器人世界的“沃尔玛”,这里汇集了大量的AI机器人,只需一个账号,就可以一键直连。

VLOGGER

VLOGGER AI是一款由谷歌研究团队开发的多模态扩散模型,主要用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该工具能够根据音频控制人物动作,包括面部表情、唇部动作、头部运动、眼神、眨眼及上身和手部动作,实现音频驱动的视频合成。VLOGGER生成的视频具有高度的真实性和多样性,能够展示原始主体的不同动作和表情。此外,VLOGGER还可以用于编辑现有视频和跨语言视频内容适配。

有道Clear

全球首款100%基于CPU驱动的实时声伴分离插件,提供实时音轨分离、智能音效优化、非实时处理等主要功能。

DanceFusion

DanceFusion是一款由清华大学开发的开源框架,专注于音频驱动的舞蹈动作生成与重建。它采用分层时空Transformer-VAE和扩散模型,能够处理不完整或嘈杂的数据,生成与音乐高度同步的逼真舞蹈动作。该工具支持多种应用场景,包括内容创作、虚拟现实、互动娱乐、舞蹈教育以及动画制作等,展现了其在多领域的应用价值。

混元图生视频

混元图生视频是腾讯混元推出的开源图生视频模型,支持用户上传图片并输入描述生成5秒短视频,具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种风格与场景,参数量达130亿,已在腾讯云上线并开源,支持本地部署与定制开发,适用于创意视频、特效制作及动画开发等多个领域。

AI绘画箱

AI绘画箱收录近千个AI绘画工具网站,提供Midjourney、Stable Diffusion等一站式AI绘画工具、AI图片处理工具、AI素材下载、AI视频音频等工具,只做最好的AI绘画工具网址导航站。

Liner.ai

Liner.ai 是一款面向非专业程序员和数据科学家的机器学习工具,通过简单的点击操作即可训练模型,无需编写代码。该工具提供多种项目模板,涵盖图像、文本、音频和视频分类,以及对象检测和图像分割等任务。Liner.ai 支持在 CPU 上快速训练模型,并可在本地完成训练以保护数据隐私。此外,该工具还允许用户轻松地将模型导出到多个平台,适合初学者和专业人士使用。