音频 - 智狐AI导航

VLOGGER

VLOGGER AI是一款由谷歌研究团队开发的多模态扩散模型，主要用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该工具能够根据音频控制人物动作，包括面部表情、唇部动作、头部运动、眼神、眨眼及上身和手部动作，实现音频驱动的视频合成。VLOGGER生成的视频具有高度的真实性和多样性，能够展示原始主体的不同动作和表情。此外，VLOGGER还可以用于编辑现有视频和跨语言视频内容适配。

AI项目与工具 2024年01月01日 12 点赞 0 评论 702 浏览

Podcastfy

Podcastfy 是一款基于生成式人工智能技术开发的开源工具，可将网络文章、PDF 文件及纯文本转化为多语言对话式音频。它不仅支持多源文本合并，还具备强大的文本转语音功能，允许用户选择不同的语音模型来优化音频效果。此外，其开源特性便于开发者根据需求进行个性化定制，广泛适用于内容摘要、语言本地化、教育材料转化等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 703 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 703 浏览

悦音配音

AI智能配音工具，独有的AI智能配音技术，更专业，完美贴近真人配音，AI模仿真人情感（怀旧、欢快、激情、伤心、抒情、惊讶等），支持多音字、停顿、整数、小数、数字等特色发音，...

创作工具 1970年01月01日 0 点赞 0 评论 705 浏览

简单听记

百度网盘推出的一款AI语音转文字工具，简单听记能够帮你将音频内容转化为文字，还能进一步把这些文字提炼总结，帮你节省很多时间。

Ai语音工具 2025年06月05日 94 点赞 0 评论 706 浏览

Voice Changer

Voice Changer是一款基于状态空间模型的音频处理工具，可将音频中的语音转换为不同音色，同时保留情感和表达细节。用户可通过选择预设声音库或克隆个人声音实现个性化转换，并对语音细节进行精细调整。该工具广泛应用于内容创作、游戏配音、有声书制作及品牌音频开发等领域，提供高质量的音频输出和灵活的控制选项。

AI项目与工具 2025年06月12日 48 点赞 0 评论 707 浏览

Lightcast

Lightcast是一个优雅的播客播放器，它可以轻松下载播客、管理你的播客订阅，并将播客转录为文字。

Ai语音工具 2025年06月05日 21 点赞 0 评论 709 浏览

DanceFusion

DanceFusion是一款由清华大学开发的开源框架，专注于音频驱动的舞蹈动作生成与重建。它采用分层时空Transformer-VAE和扩散模型，能够处理不完整或嘈杂的数据，生成与音乐高度同步的逼真舞蹈动作。该工具支持多种应用场景，包括内容创作、虚拟现实、互动娱乐、舞蹈教育以及动画制作等，展现了其在多领域的应用价值。

AI项目与工具 2025年06月12日 86 点赞 0 评论 710 浏览

芊芊妙音

芊芊妙音是一款基于AI技术的配音与变声工具，拥有丰富的音色库及强大的音频处理能力。它支持文字提取、语音转文字、音频编辑等功能，可广泛应用于社交媒体内容创作、视频制作、语言学习等领域。用户可以通过该软件实现个性化声音定制，并轻松分享作品至各大社交平台。

AI项目与工具 2025年06月12日 11 点赞 0 评论 710 浏览

Blogcast™

BlogcastTM是一个文本转语音的工具，允许用户创建播客、视频、电子学习课程的音频和音频书籍，而无需录制。它由人工智能驱动的文本转语音技术提供支持，并提供多种声音和语言可供...

Ai语音工具 1970年01月01日 0 点赞 0 评论 711 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期