MVGenMaster是由复旦大学、阿里巴巴达摩院和湖潘实验室联合研发的多视图扩散模型,专注于利用增强的3D先验技术处理多样化的新视角合成任务。该模型基于度量深度和相机姿态扭曲的3D先验,显著提升了新视角合成的泛化能力和3D一致性。通过单一图像输入,MVGenMaster能够在一次前向传播中生成多达100个新视图。研究团队还构建了一个包含160万场景的大型多视图图像数据集MvD-1M,并采用多项先进的训练与优化技术,进一步增强了模型在大规模数据集上的性能。
MVGenMaster是由复旦大学、阿里巴巴达摩院和湖潘实验室联合研发的多视图扩散模型,专注于利用增强的3D先验技术处理多样化的新视角合成任务。该模型基于度量深度和相机姿态扭曲的3D先验,显著提升了新视角合成的泛化能力和3D一致性。通过单一图像输入,MVGenMaster能够在一次前向传播中生成多达100个新视图。研究团队还构建了一个包含160万场景的大型多视图图像数据集MvD-1M,并采用多项先进的训练与优化技术,进一步增强了模型在大规模数据集上的性能。
发表评论 取消回复