音频 - 智狐AI导航

Open NotebookLM

Open NotebookLM是一个开源工具，能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型，生成自然流畅的对话式音频，并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件，适用于教育、科研、商业分析等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 791 浏览

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本，并支持多种语言。该工具具有多种音频和视频格式兼容性，提供不同的转录模型选择，支持字幕导出，且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速，提升了实时语音识别效率，并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

AI项目与工具 2025年06月12日 15 点赞 0 评论 791 浏览

Arctime字幕软件

简单、强大、高效的跨平台字幕制作软件

字幕配音 2025年06月05日 76 点赞 0 评论 788 浏览

DemoCreator

一款适用于教育工作者、视频会议演示者、企业主和游戏玩家的屏幕录像机和视频编辑器，DemoCreator是制作演示视频和解说视频的一站式解决方案。

视频剪辑 2025年06月05日 60 点赞 0 评论 788 浏览

TIGER

TIGER是由清华大学研发的轻量级语音分离模型，采用时频交叉建模策略与多尺度注意力机制，有效提升语音分离性能，同时显著降低计算和参数开销。模型通过频带切分优化资源利用，适应复杂声学环境，广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 788 浏览

妙刷

妙刷是一款由美团推出的AI创作工具，支持修图、文本生图、音频生图及视频生成等功能，可将日常素材转化为艺术作品，如拟人化宠物、魔幻风景等，同时定期更新玩法和特效以保持新鲜感。

AI项目与工具 2025年06月12日 99 点赞 0 评论 786 浏览

Podcastle

Podcastle是一款以AI为核心的播客制作平台，集成了录音室、音频与视频编辑器及AI生成的声音工具，支持本地多人协作录音、降噪处理、品牌定制化功能及声音克隆技术。该平台覆盖从创意到发布的全链条服务，并支持内容托管与多平台分发，适用于个人播客、远程采访、教育培训、企业沟通及有声读物制作等多种场景。

AI项目与工具 2025年06月12日 31 点赞 0 评论 784 浏览

Playmate

Playmate是由广州趣丸科技开发的人脸动画生成框架，基于3D隐式空间引导扩散模型和双阶段训练框架，能够根据音频和指令精准控制人物表情和头部姿态，生成高质量动态肖像视频。其支持情感控制、姿态控制和独立控制，可生成多种风格的动态肖像，适用于影视制作、游戏开发、虚拟现实、互动媒体及教育等多个领域。

AI项目与工具 2025年06月11日 88 点赞 0 评论 783 浏览

OmniSync

OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架，基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式，直接编辑视频帧，支持无限时长推理，保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导（DS-CFG）机制，提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。

AI项目与工具 2025年06月11日 27 点赞 0 评论 780 浏览

鸭鸭配音

一个在线配音网站，是目前为数不多的免费的在线文字转语音的配音神器，用户只需输入文本，即可生成高度拟人的智能配音。

字幕配音 2025年06月05日 80 点赞 0 评论 778 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期