音频 - 智狐AI导航

AutomateClips

AutomateClips是一款人工智能视频生成器，专为社交媒体平台如TikTok、Instagram和YouTube设计，以自动化创建吸引人的视频内容。

Ai视频生成 1970年01月01日 0 点赞 0 评论 507 浏览

Video

Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积（STC）连接器和音频分支，显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。

AI项目与工具 2025年06月12日 50 点赞 0 评论 505 浏览

Arctime

简单、强大、高效的跨平台字幕制作软件

字幕配音 2025年06月05日 34 点赞 0 评论 501 浏览

Nova A.I.

一款简单却强大的在线视频编辑和日志软件，由计算机视觉视频搜索引擎提供支持。

视频剪辑 2025年06月05日 25 点赞 0 评论 501 浏览

ecrett music

Ecrett Music 是一个利用人工智能技术帮助用户高效创作免版税音乐的在线平台。它允许用户通过设定场景、情感及音乐类型等参数自动生成背景音乐，并提供多种编辑选项以满足个性化需求。同时，该平台还具备强大的音乐管理和匹配功能，适用于视频、游戏、播客等多个领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 501 浏览

音品汇配音

为用户提供文字转语音在线转化服务，文字转语音准确率达99%

字幕配音 2025年06月05日 61 点赞 0 评论 500 浏览

Loopy AI

字节跳动和浙江大学联合开发的音频驱动的AI视频生成模型，能够将静态图像转化为动态视频，实现音频与面部表情、头部动作的完美同步。

Ai视频生成 2025年06月05日 93 点赞 0 评论 496 浏览

Shotcut

一款适用于 Windows、Mac 和 Linux 的免费开源跨平台视频编辑器。Shotcut支持数百种音频和视频文件格式，并且无需导入即可进行本地编辑。

视频剪辑 2025年06月05日 37 点赞 0 评论 496 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 496 浏览

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型，拥有 1.5 亿参数，专注于长音频处理，支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色，具备高效的训练方法和多任务处理能力，适用于语音助手、实时转写、归档理解等场景。

AI项目与工具 2025年06月11日 43 点赞 0 评论 495 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期