PhotoDoodle

简介：PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架，能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略，结合位置编码重用和无噪声条件范式，确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能，并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源，适用于数字艺术创作、商业设计、社交媒体等多个场景。

AI小编 795 阅读 0 评论 13 点赞

项目地址

PhotoDoodle是由新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat团队联合开发的一种艺术化图像编辑框架。该框架基于少量样本学习艺术家的风格，实现照片涂鸦功能。其采用两阶段训练策略：首先通过大规模数据预训练通用图像编辑模型OmniEditor，随后利用少量艺术家提供的前后图像对进行微调，以捕捉特定的编辑风格。为确保生成结果与背景的无缝融合和一致性，PhotoDoodle引入了位置编码重用机制和无噪声条件范式。此外，项目还提供了包含6种风格和300多个样本的高质量数据集，为相关研究提供基准。 PhotoDoodle具备多项核心功能，包括艺术风格学习与复现、装饰性元素生成、背景一致性保持、指令驱动编辑以及高效风格定制。其技术原理涵盖OmniEditor预训练、EditLoRA微调、位置编码克隆机制、无噪声条件范式及条件流匹配损失函数等。用户可通过GitHub仓库、HuggingFace模型库和arXiv论文获取更多相关信息。

本文分类：AI项目与工具
本文标签：AI图像编辑艺术风格迁移低秩适应图像生成指令驱动背景一致性数字艺术机器学习图像处理开源工具
浏览次数：795 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/8716.html

评论列表共有 0 条评论

暂无评论

PhotoDoodle

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复