WeGen

简介：WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型，结合多模态大语言模型与扩散模型，支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力，适用于创意设计、内容创作等多个领域。

AI小编 599 阅读 0 评论 79 点赞

项目地址

WeGen是由中国科学技术大学联合上海交通大学、微信团队及中国科学院等机构共同研发的多模态生成模型。该模型基于自然对话实现多种视觉生成任务，融合多模态大语言模型（MLLM）与扩散模型，支持文本到图像生成、条件驱动生成、图像编辑、风格迁移等多种功能。其核心优势在于能够处理模糊指令并提供多样化创意输出，同时在用户有明确需求时确保生成结果的一致性。WeGen采用动态实例一致性（DIIC）数据管道和提示自重写（PSR）机制，有效解决实例身份一致性和生成多样性问题，展现出作为用户友好型设计助手的潜力。 WeGen通过整合多模态信息处理能力，支持交互式生成与创意设计辅助，适用于多个应用场景，如创意设计、内容创作、教育辅助等。其技术框架具备统一性，便于扩展与优化，为视觉生成领域提供了新的解决方案。

本文分类：AI项目与工具
本文标签：AI生成多模态模型文本到图像图像编辑风格迁移创意设计交互式生成 MLLM 扩散模型视觉生成
浏览次数：599 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/8586.html

评论列表共有 0 条评论

暂无评论

WeGen

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复