人工智能 - 智狐AI导航

InternVideo2.5

InternVideo2.5是一款由上海人工智能实验室联合多机构开发的视频多模态大模型，具备超长视频处理能力和细粒度时空感知。它支持目标跟踪、分割、视频问答等专业视觉任务，适用于视频检索、编辑、监控及自动驾驶等多个领域。模型通过多阶段训练和高效分布式系统实现高性能与低成本。

AI项目与工具 2025年06月12日 50 点赞 0 评论 826 浏览

MoMask

MoMask是一款基于生成式掩码建模的3D人体动作生成工具，支持文本驱动的动作创建与编辑。采用分层量化与Transformer架构，实现高精度、连贯的3D动作序列生成，在HumanML3D数据集上的FID值仅为0.045。支持动作时序控制、多平台部署及动作评估功能，适用于游戏开发、动画制作、VR及体育分析等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 499 浏览

VanceAI

VanceAI是一款基于AI技术的图像处理工具，提供照片增强、修复、放大、去噪、锐化、上色及卡通化等功能，操作简便且支持批量处理，适用于电商、摄影和设计等领域，有效提升图像质量和视觉表现力。

AI项目与工具 2025年06月12日 50 点赞 0 评论 555 浏览

ImageToVideo AI

ImageToVideo AI 是一款基于人工智能的图像转视频工具，能够将静态图片转化为动态视频。通过智能分析图像内容并结合用户输入的文本指令，可添加动画、转场、音乐、字幕等元素，生成高质量、富有表现力的视频。支持多种格式输出，提供丰富的模板和自定义选项，适用于个人创作、内容制作、教育及广告等多种场景，提升视频制作效率与视觉效果。

AI项目与工具 2025年06月12日 80 点赞 0 评论 491 浏览

Pippo

Pippo是由Meta Reality Labs研发的图像到视频生成模型，可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构，结合ControlMLP模块与注意力偏差技术，实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全，适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程，确保生成质量与稳定性。

AI项目与工具 2025年06月12日 38 点赞 0 评论 428 浏览

CineMaster

CineMaster是快手推出的3D感知视频生成框架，支持通过文本提示及深度图、相机轨迹等控制信号生成高质量视频内容。其核心功能包括3D物体与摄像机控制、交互式设计、自动化数据标注和高质量视频输出。采用两阶段工作流程与扩散模型技术，结合语义布局控制网络与摄像机适配器，提升视频生成的精确度与灵活性。适用于影视制作、广告营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 757 浏览