文本到图像

Sana

SANA是一个由NVIDIA、麻省理工学院和清华大学共同研发的文本到图像生成框架，支持生成高达4096×4096分辨率的高清图像。它采用了深度压缩自编码器、线性扩散变换器（Linear DiT）和小型语言模型作为文本编码器，并通过优化的训练和采样策略提升了生成效率。SANA在模型大小和运行速度上具备显著优势，适合多种应用场景，包括艺术创作、游戏开发、广告设计和科学研究等。

AI项目与工具 2025年06月12日 11 点赞 0 评论 732 浏览

Ideogram 2.0

Ideogram 2.0 是一款文本到图像的AI工具，能够将文字转化为高质量的视觉内容。该工具支持多种风格选择，包括写实、设计、3D和动漫，具有强大的语义理解能力和先进的文本渲染技术。通过Magic Prompt功能，用户可以输入中文提示词并自动翻译优化。此外，该工具还提供API和搜索功能，支持用户和开发者进行深度集成。

AI项目与工具 2025年06月12日 38 点赞 0 评论 710 浏览

Stable Diffusion 3

Stable Diffusion 3 是一款由 Stability AI 开发的先进文本到图像生成模型，通过改进的文本渲染能力、多主题提示支持、可扩展的参数量、图像质量提升及先进的架构技术，实现了高质量和多样性的图像生成。该模型在图像生成和文本理解方面取得了显著进展，并通过 Diffusion Transformer 架构和 Flow Matching 技术提升了模型效率和图像质量。

AI项目与工具 2024年01月01日 87 点赞 0 评论 705 浏览

Dream Lab

Dream Lab是一款基于人工智能技术的文本到图像生成工具，由Canva推出并依托于收购的AI初创公司Leonardo.ai的技术支持。它能够通过解析用户输入的简单文字描述，生成包括3D渲染、插画等多种风格的高质量图像。此外，Dream Lab还支持参考已有图片进行优化，并提供灵活的尺寸选择与编辑功能，适用于社交媒体、广告营销、品牌设计以及教育培训等多个场景。

AI项目与工具 2025年06月12日 44 点赞 0 评论 703 浏览

Textoon

Textoon是阿里巴巴通义实验室推出的AI工具，可根据文本生成Live2D格式的2D卡通角色，具备文本解析、外观生成、动画增强等功能。支持多语言输入，适用于游戏、影视、教育等多个场景，提升角色设计效率与表现力。

AI项目与工具 2025年06月12日 19 点赞 0 评论 698 浏览

Mini DALL·E 3

Mini DALL·E 3是一款由多所高校联合开发的交互式文本到图像生成工具，支持多轮自然语言对话，实现高质量图像的生成与编辑。系统结合大型语言模型与文本到图像模型，提供内容一致性控制与问答功能，提升交互体验。广泛应用于创意设计、故事插图、概念设计、教育及娱乐等领域，具有高效、灵活和易用的特点。

AI项目与工具 2025年06月12日 18 点赞 0 评论 697 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 694 浏览

F

F-Lite是一款由Freepik与FAL开源项目联合开发的10B参数文本到图像生成模型，基于版权安全数据集训练，支持商业应用。它采用T5-XXL文本编码器，结合扩散模型架构，实现高精度图像生成。支持多分辨率输出，包含256、512和1024像素，并推出专为纹理优化的F-Lite Texture版本。模型通过强化学习和多项优化技术提升生成质量与效率，适用于创意设计、内容创作、游戏开发等多个领域。

AI项目与工具 2025年06月11日 10 点赞 0 评论 692 浏览

STOCKIMG.AI

STOCKIMG.AI 是一款以人工智能驱动的在线设计与内容生成平台，用户可通过文本提示生成高质量图像、标志、书籍封面、海报等内容。平台支持 4K 分辨率图像放大、多风格 AI 模型选择及快速生成，适用于设计师、营销人员及内容创作者，广泛应用于社交媒体营销、品牌设计、图书出版等领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 691 浏览

Flex.2

Flex.2-preview是Ostris开发的开源文本到图像生成模型，具备80亿参数规模。支持长文本输入、图像修复和多模态控制输入，适用于创意设计、图像修复和内容生成等多种场景。模型基于扩散框架，采用多通道输入处理和高效推理算法，可通过ComfyUI或Diffusers库集成使用，适合实验性开发和个性化定制。

AI项目与工具 2025年06月11日 20 点赞 0 评论 687 浏览

文本到图像

首页

文本到图像

列表

默认

浏览次数

发布日期