音频 - 智狐AI导航

爱哔哩

B站视频、音频mp3解析下载站

影视资源 2025年06月05日 67 点赞 0 评论 578 浏览

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 578 浏览

QuickRecorder

一款基于ScreenCapture Kit for macOS的轻量级录屏工具/基于 ScreenCapture Kit的多功能、轻量化、高性能的开源macOS屏幕录制工具。

Ai开源项目 2025年06月05日 59 点赞 0 评论 576 浏览

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具，其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术，实现了高效的数据样本利用和训练效率提升，适用于虚拟主播、远程协作、VR/AR等领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 576 浏览

Songtell

Songtell是第一个人工智能生成的歌曲含义库，生成了超过20000首歌曲的含义。你也可以订购一张印有你最喜欢的歌曲含义的海报。

创作工具 1970年01月01日 0 点赞 0 评论 573 浏览

通义万相AI视频

通义万相AI视频是一款基于人工智能的视频生成工具，支持文生视频和图生视频两种模式。用户可输入文字描述或上传图片生成高质量视频，支持多语言、多种艺术风格及音频生成功能，优化中式元素表现，广泛应用于影视、广告、动画设计等多个领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 573 浏览

Emergent Drums

使用Emergent Drums人工智能生成独特的鼓样本，使用Audialab插件生成无限的鼓样本，全部免版税。

创作工具 1970年01月01日 0 点赞 0 评论 570 浏览

CoGenAV

CoGenAV是一种先进的多模态学习模型，专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练，利用同步音频、视频和文本数据，学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能，适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

AI项目与工具 2025年06月11日 80 点赞 0 评论 570 浏览

SPLASH

将音乐制作的乐趣带给每个人。

创作工具 1970年01月01日 0 点赞 0 评论 568 浏览

Huxe AI

Huxe AI是一款基于生成式AI技术的个人音频伴侣应用，旨在为用户提供高度个性化的音频体验。其主要功能包括个性化音频简报、实时问答、减少屏幕时间以及与现有应用的无缝集成。通过连接用户的日历、邮件等数据流，Huxe AI能够生成定制化的语音内容，帮助用户高效管理日程、获取信息并提升学习效率。

AI项目与工具 2025年06月12日 76 点赞 0 评论 568 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期

爱哔哩

VideoPoet