IterComp是由清华大学、北京大学、LibAI Lab、中国科学技术大学、牛津大学及普林斯顿大学的研究团队共同研发的一种文本到图像生成框架。该框架通过迭代反馈学习机制整合多个开源扩散模型的优势,显著提升其在复杂组合任务中的综合性能。IterComp首先建立一个包含多种开源扩散模型的库,这些模型在属性绑定、空间关系和非空间关系等方面各具特色。随后,通过训练奖励模型并采用迭代优化策略,逐步增强基础扩散模型的组合生成能力。这种方法不仅提升了生成图像的质量与准确性,还保持了较低的计算成本,使IterComp在多类别对象组合及复杂语义对齐任务中展现出卓越的能力。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部