视频 - 智狐AI导航

PixVerse V3.5

PixVerse V3.5是一款基于AI技术的视频生成工具，具备超高速视频生成、动漫效果自定义、高清画质输出及首尾帧平滑过渡等功能。它通过优化运动控制和细节表现，为用户提供流畅且精准的视频制作体验，适用于社交媒体内容创作及各类节日主题视频设计。

AI项目与工具 2025年06月12日 25 点赞 0 评论 759 浏览

VE

VE-Bench是北京大学MMCAL团队研发的一款视频编辑质量评估工具，包含数据库（VE-Bench DB）和量化评估模块（VE-Bench QA）。它综合考虑了视觉质量、文本-视频一致性及源视频与编辑后视频的动态关联性，旨在实现与人类感知一致的精准评估。适用于电影制作、短视频优化、广告行业等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 814 浏览

DiTCtrl

DiTCtrl是一种基于多模态扩散变换器架构的视频生成工具，能够利用多个文本提示生成连贯且高质量的视频内容，无需额外训练即可实现零样本多提示视频生成。它通过KV共享和潜在混合策略优化不同提示间的平滑过渡，同时在MPVBench基准上表现出色，适用于电影、游戏、广告及新闻等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 802 浏览

Valley

Valley是一款由字节跳动开发的多模态大语言模型，擅长处理文本、图像和视频数据，广泛应用于内容分析、图像和视频描述、电子商务及短视频平台等领域。其Eagle版本通过引入VisionEncoder增强了模型性能，支持灵活调整令牌数量，实现了更高效的多模态数据处理。Valley在多项基准测试中表现出色，尤其在参数规模较小的情况下依然保持优异的成绩。

AI项目与工具 2025年06月12日 60 点赞 0 评论 919 浏览

Enhance

Enhance-A-Video是一款由多所顶尖高校联合研发的视频生成增强算法，专注于提升AI生成视频的质量，特别是在对比度、清晰度及细节真实性方面具有显著优势。其核心技术基于时间注意力机制优化，无需额外训练即可高效提升视频效果，适用于视频创作、学术研究、在线平台等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 877 浏览

cobalt

Cobalt是一款开源流媒体下载工具，支持从各大视频网站、社交媒体和音乐平台下载视频、音频和图片。其主要功能包括高分辨率视频下载（最高8K）、多种音频格式支持、字幕自动提取及个性化主题切换。用户可通过网页版或自托管Docker方式使用，无需注册即可操作，适合在线学习、视频编辑、音乐收藏等多种应用场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 635 浏览

VidTok

VidTok（Video Tokenizer）是一款由微软开发的开源视频处理工具，通过高效的算法将视频内容转化为“视频词”，支持连续与离散分词化，具有灵活的压缩率和多样的隐空间，适用于视频生成、内容建模及数据压缩等场景。其混合模型架构结合卷积与采样模块，辅以有限标量量化技术，实现了高质量视频重建与高效数据处理。

AI项目与工具 2025年06月12日 54 点赞 0 评论 994 浏览

Diff

Diff-Instruct是一种基于积分Kullback-Leibler散度的知识迁移方法，用于从预训练扩散模型中提取知识并指导生成模型的训练。它能够在无需额外数据的情况下，通过最小化IKL散度提升生成模型的性能。Diff-Instruct适用于多种场景，包括预训练扩散模型的蒸馏、现有GAN模型的优化以及视频生成等。

AI项目与工具 2025年06月12日 61 点赞 0 评论 802 浏览

DisPose

DisPose是一项由多家顶尖高校联合研发的技术，专注于优化人物图像动画的质量。它通过运动场引导和关键点对应的方式，结合混合ControlNet模块，实现了对骨骼姿态的有效控制，无需额外密集输入即可生成高质量、一致性的动画视频。DisPose广泛适用于艺术创作、社交媒体、数字人制作及虚拟现实等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 674 浏览

InvSR

InvSR是一款基于扩散模型逆过程开发的图像超分辨率工具，通过深度噪声预测器和灵活采样机制，从低分辨率图像恢复高质量高分辨率图像。它支持多种应用场景，包括文化遗产保护、视频监控、医疗成像及卫星影像分析，同时兼顾计算效率与性能表现。

AI项目与工具 2025年06月12日 14 点赞 0 评论 895 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期