姿态估计 - 智狐AI导航

Sapiens

Sapiens是由Meta实验室开发的AI视觉模型，主要用于解析图片和视频中的人类动作。它支持2D姿态估计、身体部位分割、深度估计和表面法线预测等功能，采用视觉变换器架构。Sapiens具有强大的泛化能力，适用于虚拟现实、增强现实、3D人体数字化、人机交互、视频监控分析、运动捕捉及医学成像与康复等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 890 浏览

GenXD

GenXD是一款由新加坡国立大学与微软联合开发的3D-4D联合生成框架，能够从任意数量的条件图像生成高质量的3D和4D场景。它通过数据整理流程提取相机姿态和物体运动信息，基于多视角时序模块分离相机与物体运动，并借助掩码潜在条件支持多种视角生成。GenXD支持3D场景重建、动态场景生成以及3D和4D数据融合，适用于视频游戏开发、电影制作、虚拟现实、建筑规划等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 553 浏览

RealisHuman

RealisHuman 是一个用于优化生成图像中人体部位的后处理框架，采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构，并重新绘制周围区域实现无缝融合，支持多种图像风格，适用于游戏、影视、艺术等领域。

AI项目与工具 2025年06月12日 65 点赞 0 评论 584 浏览

ViTPose

ViTPose 是一种基于 Transformer 架构的人体姿态估计模型，通过图像块处理和特征提取实现关键点定位。提供多种版本，适用于不同任务需求。模型结构简洁，支持灵活扩展和参数调整，具备知识迁移能力。ViTPose+ 拓展至动物姿态估计，提升适用范围。在多个数据集上达到 SOTA 性能，广泛应用于运动分析、虚拟现实等领域。

AI项目与工具 2025年06月12日 28 点赞 0 评论 846 浏览

Matrix3D

Matrix3D 是一种由多所高校与科技企业联合开发的统一摄影测量模型，集姿态估计、深度预测、新视图合成与3D重建于一体。其核心技术为多模态扩散变换器，支持跨模态数据融合与灵活任务处理。通过掩码学习策略，提高数据利用效率并增强模型泛化能力。适用于VR/AR、游戏开发、影视制作等领域，具有高度交互性和灵活性。

AI项目与工具 2025年06月12日 49 点赞 0 评论 917 浏览

IMAGPose

IMAGPose是由南京理工大学开发的统一条件框架，用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块，解决了传统方法在生成多样姿态图像时的局限性，适用于虚拟现实、影视制作、电商展示等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 781 浏览

姿态估计

首页

姿态估计

列表

默认

浏览次数

发布日期

Sapiens

GenXD

RealisHuman

ViTPose

Matrix3D

IMAGPose

姿态估计 首页 姿态估计

列表 默认 浏览次数 发布日期

Sapiens

GenXD

RealisHuman

ViTPose

Matrix3D

IMAGPose

姿态估计

首页

姿态估计

列表

默认

浏览次数

发布日期