CSGO(Content-Style Composition in Text-to-Image Generation)是由南京理工大学、小红书等机构联合推出的一项研究项目,专注于图像风格迁移与文本到图像生成领域。该项目通过创新的数据构建流程,生成并清洗了包含内容图像、风格图像及风格化结果图像的三元组,构建了大规模的IMAGStyle数据集。基于此数据集,CSGO框架实现了图像驱动的风格迁移、文本驱动的风格化合成以及文本编辑驱动的风格化合成,显著提升了图像生成中的风格控制能力。项目采用端到端训练模型,结合特征注入技术和扩散模型,确保生成图像在内容和风格上的高度一致性。
发表评论 取消回复