视频

Tarsier

字节跳动推出的一系列大规模视觉语言模型(LVLM),专注于视频理解任务,包括视频描述、问答、视频定位、幻觉测试等功能。

VideoGigaGAN

VideoGigaGAN是一款由Adobe和马里兰大学的研究人员开发的生成式视频超分辨率模型。该模型基于GigaGAN图像上采样器,通过流引导特征传播、抗锯齿处理和高频特征穿梭等技术手段,显著提升了视频的分辨率和时间一致性,同时保留了高频细节,改善了整体画质。它适用于视频画质增强、安全监控、视频编辑和后期制作等多个领域。

MoneyPrinter

自动创建YouTube短视频的自动化赚钱项目,只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。

Brev AI

Brev AI 是一款基于 AI 的在线音乐生成工具,能够将文本描述转化为定制化的音乐作品。它支持多种音乐风格,涵盖旋律、和声及完整曲目生成,并具备强大的自定义功能。凭借其高质量音频输出和广泛适用性,Brev AI 可应用于视频、社交媒体、播客等领域,满足不同用户的创作需求。

MediaGo

一款开源免费的跨平台视频提取工具。支持流媒体下载、视频下载、m3u8 文件下载以及 B 站视频下载。

Google Veo

强大的视频生成模型。它可以生成超过一分钟的高质量 1080p 分辨率视频,具有多种电影和视觉风格。

AutoCutVideo

一个完全免费的音、自动视频剪辑神器。一键智能过滤,停顿、杂音、静音,轻点三次鼠标,剪完一部视频兼容专业软件,轻松二次编辑,支持Windows和mac系统。

Sora.FM

一个使用nextjs创建的用于生成 Sora AI视频的开源Web模板。

ChatAnyone

ChatAnyone是阿里巴巴通义实验室开发的实时风格化肖像视频生成工具,基于音频输入生成高保真、自然流畅的上半身动态视频。采用分层运动扩散模型和混合控制融合生成模型,支持实时交互与风格化控制,适用于虚拟主播、视频会议、内容创作等多种场景,具备高度可扩展性和实用性。