Sapiens Sapiens是由Meta实验室开发的AI视觉模型,主要用于解析图片和视频中的人类动作。它支持2D姿态估计、身体部位分割、深度估计和表面法线预测等功能,采用视觉变换器架构。Sapiens具有强大的泛化能力,适用于虚拟现实、增强现实、3D人体数字化、人机交互、视频监控分析、运动捕捉及医学成像与康复等多个领域。 AI项目与工具 2025年06月12日 73 点赞 0 评论 369 浏览
GenXD GenXD是一款由新加坡国立大学与微软联合开发的3D-4D联合生成框架,能够从任意数量的条件图像生成高质量的3D和4D场景。它通过数据整理流程提取相机姿态和物体运动信息,基于多视角时序模块分离相机与物体运动,并借助掩码潜在条件支持多种视角生成。GenXD支持3D场景重建、动态场景生成以及3D和4D数据融合,适用于视频游戏开发、电影制作、虚拟现实、建筑规划等多个领域。 AI项目与工具 2025年06月12日 54 点赞 0 评论 161 浏览
RealisHuman RealisHuman 是一个用于优化生成图像中人体部位的后处理框架,采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构,并重新绘制周围区域实现无缝融合,支持多种图像风格,适用于游戏、影视、艺术等领域。 AI项目与工具 2025年06月12日 65 点赞 0 评论 129 浏览
ViTPose ViTPose 是一种基于 Transformer 架构的人体姿态估计模型,通过图像块处理和特征提取实现关键点定位。提供多种版本,适用于不同任务需求。模型结构简洁,支持灵活扩展和参数调整,具备知识迁移能力。ViTPose+ 拓展至动物姿态估计,提升适用范围。在多个数据集上达到 SOTA 性能,广泛应用于运动分析、虚拟现实等领域。 AI项目与工具 2025年06月12日 28 点赞 0 评论 390 浏览
Matrix3D Matrix3D 是一种由多所高校与科技企业联合开发的统一摄影测量模型,集姿态估计、深度预测、新视图合成与3D重建于一体。其核心技术为多模态扩散变换器,支持跨模态数据融合与灵活任务处理。通过掩码学习策略,提高数据利用效率并增强模型泛化能力。适用于VR/AR、游戏开发、影视制作等领域,具有高度交互性和灵活性。 AI项目与工具 2025年06月12日 49 点赞 0 评论 372 浏览
IMAGPose IMAGPose是由南京理工大学开发的统一条件框架,用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块,解决了传统方法在生成多样姿态图像时的局限性,适用于虚拟现实、影视制作、电商展示等多个领域。 AI项目与工具 2025年06月12日 42 点赞 0 评论 306 浏览