文本到图像

Mini DALL·E 3

Mini DALL·E 3是一款由多所高校联合开发的交互式文本到图像生成工具，支持多轮自然语言对话，实现高质量图像的生成与编辑。系统结合大型语言模型与文本到图像模型，提供内容一致性控制与问答功能，提升交互体验。广泛应用于创意设计、故事插图、概念设计、教育及娱乐等领域，具有高效、灵活和易用的特点。

AI项目与工具 2025年06月12日 18 点赞 0 评论 777 浏览

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型，具备17亿参数，支持多种图像风格生成，包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色，适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构（MoE），并集成多种文本编码器，实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源，便于研究与应用。

AI项目与工具 2025年06月12日 64 点赞 0 评论 869 浏览

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型，支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略，实现从低分辨率到高分辨率的逐步生成，有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异，具备强大的语义理解和视觉表达能力。此外，PixelFlow采用端到端训练方式，支持多种ODE求解器，适用于艺术设计、内容创作、教育研究等多个领域。

AI项目与工具 2025年06月11日 100 点赞 0 评论 491 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 775 浏览

Flex.2

Flex.2-preview是Ostris开发的开源文本到图像生成模型，具备80亿参数规模。支持长文本输入、图像修复和多模态控制输入，适用于创意设计、图像修复和内容生成等多种场景。模型基于扩散框架，采用多通道输入处理和高效推理算法，可通过ComfyUI或Diffusers库集成使用，适合实验性开发和个性化定制。

AI项目与工具 2025年06月11日 20 点赞 0 评论 768 浏览

RepText

RepText是一款由Shakker Labs与Liblib AI联合开发的多语言视觉文本渲染框架，采用字形模仿技术实现高质量文本生成。支持多种语言及复杂排版，具备精准控制、高效兼容和自然融合等特点，广泛应用于平面设计、艺术创作和数字内容生产等领域。

AI项目与工具 2025年06月11日 85 点赞 0 评论 860 浏览

F

F-Lite是一款由Freepik与FAL开源项目联合开发的10B参数文本到图像生成模型，基于版权安全数据集训练，支持商业应用。它采用T5-XXL文本编码器，结合扩散模型架构，实现高精度图像生成。支持多分辨率输出，包含256、512和1024像素，并推出专为纹理优化的F-Lite Texture版本。模型通过强化学习和多项优化技术提升生成质量与效率，适用于创意设计、内容创作、游戏开发等多个领域。

AI项目与工具 2025年06月11日 10 点赞 0 评论 766 浏览

T2I

T2I-R1是由香港中文大学与上海AI Lab联合开发的文本到图像生成模型，采用双层推理机制（语义级和 Token 级 CoT），实现高质量图像生成与复杂场景理解。其基于 BiCoT-GRPO 强化学习框架，结合多专家奖励模型，提升生成图像的多样性和稳定性。适用于创意设计、内容制作、教育辅助等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月11日 63 点赞 0 评论 726 浏览

QLIP

QLIP是一种基于二进制球形量化（BSQ）的视觉标记化方法，具备高质量图像重建和零样本图像理解能力。通过对比学习目标和两阶段训练策略，QLIP可作为视觉编码器或图像标记器，广泛应用于多模态任务，如文本到图像生成、图像到文本生成及多模态理解。其技术设计提升了模型的语义表达与训练效率，为统一多模态模型的开发提供了新思路。

AI项目与工具 2025年06月11日 18 点赞 0 评论 835 浏览

DanceGRPO

DanceGRPO 是由字节跳动与香港大学联合开发的视觉生成强化学习框架，支持文本到图像、文本到视频、图像到视频等多种任务，兼容多种生成模型与奖励机制。其通过强化学习优化生成过程，提升视觉内容质量与一致性，降低显存压力，提高训练效率与稳定性，适用于视频生成和多模态内容创作。

AI项目与工具 2025年06月11日 45 点赞 0 评论 895 浏览

文本到图像

首页

文本到图像

列表

默认

浏览次数

发布日期