音频 - 智狐AI导航

HeyMusic AI

一个基于AI的通过输入歌词或简单的提示来生成独特音乐作品的工具，帮助音乐家和歌曲作者创作歌词、旋律和完整的音乐编排。

Ai语音工具 2025年06月05日 54 点赞 0 评论 773 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 775 浏览

MultiFoley

MultiFoley是一款基于多模态控制的音效生成系统，能够根据文本、音频或视频输入生成与视频同步的高质量Foley声音效果。它支持文本驱动和音频驱动的音效生成，同时具备音频扩展和质量控制功能，广泛应用于电影、游戏、动画及虚拟现实等领域，为用户提供灵活且高效的声音设计解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 775 浏览

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具，支持将音频中不同说话人的语音精准分离至独立轨道，适用于广播级音频处理。它具备高保真音频处理能力，支持高采样率，能处理长达数小时的录音，在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域，提升音频编辑效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 777 浏览

鸭鸭配音

一个在线配音网站，是目前为数不多的免费的在线文字转语音的配音神器，用户只需输入文本，即可生成高度拟人的智能配音。

字幕配音 2025年06月05日 80 点赞 0 评论 778 浏览

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架，基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式，直接编辑视频帧，支持无限时长推理，保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导（DS-CFG）机制，提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

AI项目与工具 2025年06月11日 27 点赞 0 评论 780 浏览

Playmate

Playmate是由广州趣丸科技开发的人脸动画生成框架，基于3D隐式空间引导扩散模型和双阶段训练框架，能够根据音频和指令精准控制人物表情和头部姿态，生成高质量动态肖像视频。其支持情感控制、姿态控制和独立控制，可生成多种风格的动态肖像，适用于影视制作、游戏开发、虚拟现实、互动媒体及教育等多个领域。

AI项目与工具 2025年06月11日 88 点赞 0 评论 783 浏览

Podcastle

Podcastle是一款以AI为核心的播客制作平台，集成了录音室、音频与视频编辑器及AI生成的声音工具，支持本地多人协作录音、降噪处理、品牌定制化功能及声音克隆技术。该平台覆盖从创意到发布的全链条服务，并支持内容托管与多平台分发，适用于个人播客、远程采访、教育培训、企业沟通及有声读物制作等多种场景。

AI项目与工具 2025年06月12日 31 点赞 0 评论 784 浏览

妙刷

妙刷是一款由美团推出的AI创作工具，支持修图、文本生图、音频生图及视频生成等功能，可将日常素材转化为艺术作品，如拟人化宠物、魔幻风景等，同时定期更新玩法和特效以保持新鲜感。

AI项目与工具 2025年06月12日 99 点赞 0 评论 786 浏览

Arctime字幕软件

简单、强大、高效的跨平台字幕制作软件

字幕配音 2025年06月05日 76 点赞 0 评论 788 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期