F

简介：F-Lite是一款由Freepik与FAL开源项目联合开发的10B参数文本到图像生成模型，基于版权安全数据集训练，支持商业应用。它采用T5-XXL文本编码器，结合扩散模型架构，实现高精度图像生成。支持多分辨率输出，包含256、512和1024像素，并推出专为纹理优化的F-Lite Texture版本。模型通过强化学习和多项优化技术提升生成质量与效率，适用于创意设计、内容创作、游戏开发等多个领域。

AI小编 766 阅读 0 评论 10 点赞

项目地址

F-Lite是由Freepik团队与FAL开源项目联合开发的一款10B参数的文本到图像生成模型。该模型基于Freepik内部的80M版权数据集进行训练，支持商业用途。F-Lite采用T5-XXL作为文本编码器，从其第17层提取特征，并通过交叉注意力机制将文本信息注入到扩散模型中，以提升生成图像的准确性。在训练过程中，模型经历了256和512分辨率的预训练阶段，以及1024分辨率的后训练阶段，以提高图像质量。此外，还推出了专门优化纹理和细节提示的F-Lite Texture版本。 F-Lite采用了多分辨率训练策略，并结合强化学习技术（如GRPO）提升生成结果的多样性和质量。同时，通过引入可学习的register tokens、残差连接和μ-Parameterization等技术手段，进一步增强了模型的稳定性与性能。用户可通过GitHub、HuggingFace及在线Demo等多种方式访问和使用该模型。

本文分类：AI项目与工具
本文标签：AI生成文本到图像扩散模型多分辨率商业可用 F-Lite T5-XXL 纹理优化开源项目 HuggingFace
浏览次数：766 次浏览
发布日期：2025-06-11 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/7991.html

评论列表共有 0 条评论

暂无评论

F

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复