视频 - 智狐AI导航

TIP

TIP-I2V是一个包含大量真实文本和图像提示的数据集，专为图像到视频生成领域设计。它涵盖了超过170万个独特的提示，并结合多种顶级图像到视频生成模型生成的视频内容。该数据集支持用户偏好分析、模型性能评估以及解决错误信息传播等问题，有助于推动图像到视频生成技术的安全发展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 548 浏览

SmoothCache

SmoothCache是一种针对Diffusion Transformers（DiT）模型的推理加速技术，通过分析层输出的相似性实现自适应缓存和特征重用，有效减少计算成本并提升生成效率。该技术具有模型无关性、跨模态适用性和易于集成的特点，支持图像、视频、音频及3D模型生成，并在多种应用场景中展现出卓越的性能表现。

AI项目与工具 2025年06月12日 52 点赞 0 评论 896 浏览

Boolvideo

Boolvideo是一款基于人工智能技术的视频生成工具，能够将产品链接、博客文章、图片、视频或文本内容快速转化为吸引人的视频。支持多个电商平台，具备动画视频、动态视频生成等功能，适用于电商卖家、内容创作者及市场推广人员，旨在简化视频创作流程，提高工作效率。

AI项目与工具 2024年11月24日 10 点赞 0 评论 681 浏览

WorldDreamer

WorldDreamer 是一种基于 Transformer 的通用世界模型，具备理解与预测物理世界动态变化的能力，专注于视频生成任务。它支持多种应用场景，包括文本到视频、图像到视频、视频编辑和动作序列生成，利用视觉 Token 化、Transformer 架构和多模态提示技术，实现了高效且高质量的视频生成。

AI项目与工具 2025年06月12日 16 点赞 0 评论 763 浏览

The Matrix

The Matrix是一款基于AI的世界模拟器，能够生成高保真度、无限时长的视频流，支持实时交互控制。它融合了3A游戏数据与真实世界视频，具备零样本泛化能力。核心技术包括交互模块、移窗去噪过程模型和流一致性模型，适用于游戏开发、影视制作、虚拟现实、教育模拟及城市规划等多个领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 816 浏览

LTX Video

LTX Video是一款基于开源架构的AI视频生成工具，利用先进的扩散Transformer技术和2亿参数的DiT架构，能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性，适用于游戏、广告、影视等多种行业，为用户提供高效的视频生成解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 660 浏览

AutoVFX

AutoVFX是一款由伊利诺伊大学香槟分校研发的先进物理特效框架，通过神经场景建模、大型语言模型（LLM）代码生成及物理模拟技术，实现自然语言指令驱动的视频特效编辑与创作。其主要功能涵盖3D场景建模、程序生成、VFX模块、物理模拟、渲染与合成等，适用于电影制作、广告营销、游戏开发、虚拟现实及教育等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 574 浏览

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架，支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计，能够快速生成高质量图像并提升推理效率。

AI项目与工具 2025年06月12日 84 点赞 0 评论 724 浏览

CAVIA

CAVIA是一款由苹果、得克萨斯大学奥斯汀分校和谷歌联合研发的多视角视频生成框架。它通过单一输入图像生成多个时空一致的视频序列，并采用视角集成注意力模块增强视频的一致性和连贯性，支持用户精准控制相机运动。此外，CAVIA利用多种数据源进行联合训练，优化生成视频的质量和真实感，在虚拟现实、增强现实以及电影制作等领域具有重要价值。

AI项目与工具 2025年06月12日 76 点赞 0 评论 800 浏览

Metaview

Metaview是一款利用人工智能技术的面试摘要工具，可自动记录和整理面试内容，生成结构化摘要，帮助招聘团队高效处理候选人信息。其核心功能包括关键信息提取、模板定制、数据安全保护以及与主流招聘系统的无缝集成，广泛应用于大规模招聘、远程面试和技术岗位筛选等场景。

AI项目与工具 2025年06月12日 46 点赞 0 评论 808 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期

TIP