音频 - 智狐AI导航

ConvertIO

ConvertIO，免费在线全能文件格式转换器网站。

格式转换 2025年06月05日 88 点赞 0 评论 839 浏览

LipRead Pro

LipRead Pro 是一款基于AI技术的视频唇读工具，可将视频中的唇部动作转换为文字，支持多语言和口音识别。其高精度算法确保了文字输出的准确性，适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便，处理高效，注重用户数据隐私保护，适合专业用户和普通用户使用。

AI项目与工具 2025年06月12日 100 点赞 0 评论 838 浏览

JoyVASA

JoyVASA是一个基于扩散模型的音频驱动数字人头项目，能够生成与音频同步的面部动态和头部运动。其主要功能包括唇形同步、表情控制及动物面部动画生成，支持多语言和跨物种动画化。项目采用两阶段训练方法，结合解耦面部表示与扩散模型技术，生成高质量动画视频，广泛应用于虚拟助手、娱乐媒体、教育、广告等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 827 浏览

UniScribe

一个帮你更快的从音视频中获取信息的音视频转录和翻译工具。UniScribe能快速将本地音频、视频文件或 YouTube 视频转化为简短摘要，帮助您轻松掌握要点，支持98种语言。

Ai办公效率 2025年06月05日 33 点赞 0 评论 824 浏览

AniPortrait

AniPortrait是一款由腾讯开源的AI视频生成框架，通过音频和一张参考肖像图片生成高质量的动画。该框架包含两个核心模块：Audio2Lmk模块将音频转换为2D面部标记点，而Lmk2Video模块则基于这些标记点生成连贯且逼真的视频动画。AniPortrait以其高质量的视觉效果、时间一致性和灵活的编辑能力著称，能够精确捕捉面部表情和嘴唇动作。

AI项目与工具 2025年06月12日 68 点赞 0 评论 823 浏览

CapCut

CapCut是一款由抖音开发的免费视频编辑软件，支持视频剪辑、音频编辑、字幕生成、滤镜应用及转场效果等多种功能。该软件界面友好，易于学习，适用于初学者和专业人士。它不仅可以在移动设备上使用，还支持PC端，便于用户跨平台编辑和分享视频。CapCut广泛应用于社交媒体内容创作、商业宣传、教育和培训以及个人项目。

AI项目与工具 2025年06月12日 24 点赞 0 评论 821 浏览

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Ai语音工具 1970年01月01日 0 点赞 0 评论 816 浏览

sCM

sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型，通过简化理论框架与优化采样流程，实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像，且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进，sCM不仅提高了训练稳定性，还提升了生成质量。其应用场景广泛，包括视频生成、3D建模、音频处理及跨媒介内容创作，适用于艺术设计、游戏开发、影视制作等多个行业。

AI项目与工具 2025年06月12日 50 点赞 0 评论 815 浏览

InspireMusic

InspireMusic是由阿里巴巴通义实验室开发的AI音乐生成工具，支持通过文字描述或音频提示生成多种风格的音乐作品。其核心技术包括音频 tokenizer、自回归 Transformer 模型、扩散模型（CFM）和 Vocoder，实现文本到音乐的转换、音乐续写及高质量音频输出。该工具支持长音频生成、多种采样率，并提供快速与高音质两种推理模式，适用于音乐创作、音频处理及个性化音乐生成等场景。

AI项目与工具 2025年06月12日 83 点赞 0 评论 805 浏览

配音神器PRO

配音神器官网_文字转语音神器_配音神器pro_语音合成软件_专业配音神器_AI配音神器

创作工具 1970年01月01日 0 点赞 0 评论 805 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期