PSHuman简介
PSHuman是一种先进的单图像3D人像重建技术,采用跨尺度多视图扩散模型,仅需一张照片即可生成高度逼真的3D人像模型,涵盖精细的面部表情和全身姿态。其核心优势在于能够同时建模全局形状与局部细节的联合概率分布,有效避免几何失真,并确保不同视角下身体形状的一致性。通过显式人体雕刻技术,PSHuman可高效还原真实的纹理人体网格,在多个数据集上表现出色,具备良好的几何细节、纹理保真度和泛化能力。
PSHuman的主要功能
-
单图像3D人像重建:用户只需提供一张人像照片,PSHuman即可快速生成详细的3D模型,显著提升3D人体建模效率。
-
多视图扩散技术:基于多视角扩散模型,从单一视角的照片中生成多个角度的人体图像,确保每个角度尽可能真实地反映原始对象。
-
高保真度面部细节:通过跨尺度扩散方法,兼顾整体身体形状与局部面部特征,避免几何变形问题,生成具有高度真实感和细腻度的3D模型。
-
结合SMPL-X人体模型:整合SMPL-X参数化人体模型,支持多种姿态和体型的人体表示,增强3D模型的自然性和真实性。
-
背景移除:支持使用Clipdrop或rembg工具去除人像照片背景,简化后续处理流程。
-
结构化输出:生成的3D模型和渲染视频以结构化文件形式保存,便于查看和分享。
-
SMPL-free版本:无需依赖SMPL条件即可进行多视图生成,适用于一般姿态的人像,拓展应用场景。
PSHuman的技术原理
-
身体+面部增强和多视角生成:系统将输入照片与预测的人体骨架模型(SMPL-X)送入多视角图像扩散模型,生成多个角度的全身图像和高精度面部图像。
-
跨尺度扩散方法:能同时建模全局全身形状与局部面部特征的联合概率分布,避免几何变形,提升3D模型的真实感。
-
基于SMPL-X的显式人物雕刻:利用生成的法线图和颜色图,通过可微分渲染技术调整、变形和细化SMPL-X模型,实现高质量3D人物生成。
-
多视图图像融合:使用可微分渲染技术融合多视图颜色图像,减少不一致性,将纹理投影至重建的3D网格。
-
优化和重建模块:通过优化SMPL-X参数对齐多视图图像,进行几何优化,并使用可微分光栅化技术对网格进行雕刻。
PSHuman的项目地址
- 项目官网:https://penghtyx.github.io/PSHuman
- GitHub仓库:https://github.com/pengHTYX/PSHuman
- arXiv技术论文:https://arxiv.org/pdf/2409.10141
PSHuman的应用场景
-
影视制作与游戏开发:PSHuman可快速生成逼真3D角色模型,提高制作效率并降低成本,增强影视与游戏的真实感。
-
虚拟现实与增强现实:生成的3D人体模型可用于VR/AR环境中的交互体验,如虚拟试衣、虚拟美妆等。
-
时尚设计:用于服装试穿效果生成,加速设计流程,提升用户体验。
-
个性化定制:通过单张照片生成个性化3D模型,满足定制化产品需求,如人偶或游戏角色。
发表评论 取消回复