音频 - 智狐AI导航

INFP

INFP是一款基于音频驱动的头部生成框架，专为双人对话设计，具备自动角色转换功能。它通过两个阶段实现头部生成：基于动作的头部模仿和音频引导的动作生成。同时，INFP提出了大规模双人对话数据集DyConv，推动了相关领域的研究进展。该工具适用于视频会议、虚拟助手、教育培训、客户服务等多个场景，支持实时互动并可调节生成风格。

AI项目与工具 2025年06月12日 62 点赞 0 评论 661 浏览

Sketch2Sound

Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术，通过提取响度、亮度和音高概率等控制信号，结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架，同时赋予声音设计师更强的表达力与可控性，广泛适用于电影、游戏、音乐制作及教育等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 795 浏览

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型，具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程，支持FP16和Q4_K_M量化版本，确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域，为用户提供便捷、高效的语音交互体验。

AI项目与工具 2025年06月12日 95 点赞 0 评论 663 浏览

EDTalk

EDTalk是一款基于音频驱动的唇部同步模型，支持嘴型、头部姿态及情感表情的独立操控。用户可通过上传图片、音频和参考视频生成具有唇形同步和情感表达的动态人脸视频，广泛应用于教育、影视后期、虚拟现实等领域。其高效解耦机制和轻量化设计使其易于操作且资源友好。

AI项目与工具 2025年06月12日 93 点赞 0 评论 453 浏览

Luvvoice

Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台，提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件，将文本快速转换为自然语音，适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能，生成的音频文件支持 MP3 格式下载。

AI项目与工具 2025年06月12日 33 点赞 0 评论 701 浏览

AIGCPanel

AIGCPanel是一款开源的AI数字人系统，支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法，实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能，可应用于影视制作、虚拟主播、教育培训等多个领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 557 浏览

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 424 浏览

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 486 浏览

Ondoku

Ondoku 是一款支持多语言的文字转语音工具，提供文本输入、图片文字提取及语音调整功能。用户可将文本或图片中的文字转换为自然语音，并下载为音频文件。适用于教育、娱乐、商务等多种场景，如课程讲解、有声书制作和视频配音，提升信息传播效率。

AI项目与工具 2025年06月12日 41 点赞 0 评论 529 浏览

Fineshare VoiceTrans

Fineshare VoiceTrans 是一款支持实时变声的 AI 工具，可将声音转换为多种角色或性别，保留原有情感与语调。提供丰富的音效库、声音实验室和预设声音包，适用于游戏、直播、配音等场景。用户可通过不同订阅计划获得无限使用权限和定制服务，提升创作与互动体验。

AI项目与工具 2025年06月12日 24 点赞 0 评论 766 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期