音频 - 智狐AI导航

ShowNotes

一个提供与音频转录和创建节目笔记相关的服务的网站，它借助chatGPT 将YouTube自动字幕转换为播客节目笔记。

Ai语音工具 2025年06月05日 69 点赞 0 评论 495 浏览

声咔AI配音

声咔AI配音是在线配音软件平台，垂直深度音频效率工具，支持30多种个性化调音功能等，限制少对用户友好。

创作工具 1970年01月01日 0 点赞 0 评论 493 浏览

PDF to Podcast

PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具，能够将 PDF 文档自动转换为高质量的音频内容，如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构，支持从 PDF 提取信息并生成结构化文本，再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点，并支持多种部署方式，适用于企业培训、技术简报、客户服务、医疗教育等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 492 浏览

Descript

Descript是一款可让您像编辑文档一样轻松地编辑视频和音频文件的软件。

Ai语音工具 2025年06月05日 29 点赞 0 评论 492 浏览

妙构

妙构是一款基于AI技术的视频内容分析工具，能够从视觉、音频和创意结构等多个维度对视频进行深度解析，提供专业的优化建议。其功能包括趋势分析、案例学习、智能反馈等，适用于视频创作者、内容策划及营销人员，帮助提升视频质量与传播效果。

AI项目与工具 2025年06月11日 86 点赞 0 评论 492 浏览

Hallo2

Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合，并通过文本提示调节表情，生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术，提升了视频的视觉一致性和时间连贯性，同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域，展现出强大的内容生成能力。

AI项目与工具 2025年06月12日 80 点赞 0 评论 491 浏览

iMyFone VoxBox

iMyFone VoxBox是一款集多种声音制作功能于一体的AI声音生成器，适合各种使用场景，从视频配音到有声书叙述，再到播客和游戏角色配音等。

Ai语音工具 1970年01月01日 0 点赞 0 评论 489 浏览

INFINITE ALBUM

适合游戏玩家的自适应 AI 音乐

创作工具 1970年01月01日 0 点赞 0 评论 488 浏览

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 486 浏览

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示，生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题，并采用部分参数训练和多任务训练策略，保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

AI项目与工具 2025年06月11日 11 点赞 0 评论 484 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期