视频 - 智狐AI导航

SmoothCache

SmoothCache是一种针对Diffusion Transformers（DiT）模型的推理加速技术，通过分析层输出的相似性实现自适应缓存和特征重用，有效减少计算成本并提升生成效率。该技术具有模型无关性、跨模态适用性和易于集成的特点，支持图像、视频、音频及3D模型生成，并在多种应用场景中展现出卓越的性能表现。

AI项目与工具 2025年06月12日 52 点赞 0 评论 968 浏览

WorldDreamer

WorldDreamer 是一种基于 Transformer 的通用世界模型，具备理解与预测物理世界动态变化的能力，专注于视频生成任务。它支持多种应用场景，包括文本到视频、图像到视频、视频编辑和动作序列生成，利用视觉 Token 化、Transformer 架构和多模态提示技术，实现了高效且高质量的视频生成。

AI项目与工具 2025年06月12日 16 点赞 0 评论 851 浏览

The Matrix

The Matrix是一款基于AI的世界模拟器，能够生成高保真度、无限时长的视频流，支持实时交互控制。它融合了3A游戏数据与真实世界视频，具备零样本泛化能力。核心技术包括交互模块、移窗去噪过程模型和流一致性模型，适用于游戏开发、影视制作、虚拟现实、教育模拟及城市规划等多个领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 911 浏览

LTX Video

LTX Video是一款基于开源架构的AI视频生成工具，利用先进的扩散Transformer技术和2亿参数的DiT架构，能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性，适用于游戏、广告、影视等多种行业，为用户提供高效的视频生成解决方案。

AI项目与工具 2025年06月12日 34 点赞 0 评论 743 浏览

AutoVFX

AutoVFX是一款由伊利诺伊大学香槟分校研发的先进物理特效框架，通过神经场景建模、大型语言模型（LLM）代码生成及物理模拟技术，实现自然语言指令驱动的视频特效编辑与创作。其主要功能涵盖3D场景建模、程序生成、VFX模块、物理模拟、渲染与合成等，适用于电影制作、广告营销、游戏开发、虚拟现实及教育等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 659 浏览

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架，支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计，能够快速生成高质量图像并提升推理效率。

AI项目与工具 2025年06月12日 84 点赞 0 评论 809 浏览

CAVIA

CAVIA是一款由苹果、得克萨斯大学奥斯汀分校和谷歌联合研发的多视角视频生成框架。它通过单一输入图像生成多个时空一致的视频序列，并采用视角集成注意力模块增强视频的一致性和连贯性，支持用户精准控制相机运动。此外，CAVIA利用多种数据源进行联合训练，优化生成视频的质量和真实感，在虚拟现实、增强现实以及电影制作等领域具有重要价值。

AI项目与工具 2025年06月12日 76 点赞 0 评论 877 浏览

Metaview

Metaview是一款利用人工智能技术的面试摘要工具，可自动记录和整理面试内容，生成结构化摘要，帮助招聘团队高效处理候选人信息。其核心功能包括关键信息提取、模板定制、数据安全保护以及与主流招聘系统的无缝集成，广泛应用于大规模招聘、远程面试和技术岗位筛选等场景。

AI项目与工具 2025年06月12日 46 点赞 0 评论 891 浏览

擎舵

擎舵是百度营销推出的多模态AIGC创意生产平台，专注于视频、图片、文字等内容的智能生成。平台通过百度大模型技术支持，实现一键生成视频、图片、文字，自动识别视频素材内容，生成营销图，制作数字人视频，支持图片数字人生成及数字人形象与语音定制。擎舵服务于教育、汽车、旅游等多个行业，提供全流程AI赋能，帮助用户提升营销效率。

AI项目与工具 2025年06月12日 17 点赞 0 评论 780 浏览

ViewExtrapolator

ViewExtrapolator是一种基于稳定视频扩散（SVD）的新视角外推方法，能够生成超出训练视图范围的新视角图像，特别适用于提升3D渲染质量和视觉真实性。该工具通过优化SVD的去噪过程，减少了伪影问题，同时支持多视图一致性生成，无需额外微调即可实现高效的数据和计算性能，广泛适用于虚拟现实、3D内容创作及文物保护等多个领域。

AI项目与工具 2025年06月12日 40 点赞 0 评论 712 浏览

视频

首页

视频

列表

默认

浏览次数

发布日期