OmniSVG是由复旦大学与StepFun联合研发的全球首个端到端多模态SVG生成模型。该模型基于预训练视觉语言模型(VLM),采用创新的SVG标记化方法,将SVG命令和坐标参数化为离散令牌,实现了结构逻辑与几何细节的分离。这使得OmniSVG能够高效生成从简单图标到复杂动漫角色的多样化高质量SVG图形。 OmniSVG支持多种输入方式,包括文本描述、图像参考或角色参考,可生成色彩丰富、细节生动的矢量图形。其训练效率较传统方法提升3倍以上,可处理长达3万令牌的序列,适用于复杂图形生成任务。团队还发布了MMSVG-2M数据集及标准化评估协议MMSVG-Bench,以推动相关研究发展。 此外,OmniSVG生成的SVG文件具备无限缩放性和完全可编辑性,便于集成至专业设计工具如Adobe Illustrator中,广泛应用于品牌设计、网页开发、游戏开发等领域,提升了AI生成图形在创意行业的实用性。
发表评论 取消回复