Meissonic是由阿里巴巴集团与多家高校联合研发的文本到图像合成模型。该模型基于掩蔽图像建模技术,融合多模态和单模态Transformer层、先进的位置编码策略及优化的采样条件,显著提升了图像生成的效率与性能。通过1B参数量、高质量训练数据、微条件设置及特征压缩层,Meissonic能够生成高分辨率、高质量的图像,其性能可媲美大型扩散模型。模型具备良好的跨平台兼容性,在普通电脑上即可轻松运行,无需额外优化,为移动设备上的文本到图像生成提供了新途径。 ---

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部