文本到图像

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型，支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略，实现从低分辨率到高分辨率的逐步生成，有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异，具备强大的语义理解和视觉表达能力。此外，PixelFlow采用端到端训练方式，支持多种ODE求解器，适用于艺术设计、内容创作、教育研究等多个领域。

AI项目与工具 2025年06月11日 100 点赞 0 评论 413 浏览

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型，具备17亿参数，支持多种图像风格生成，包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色，适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构（MoE），并集成多种文本编码器，实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源，便于研究与应用。

AI项目与工具 2025年06月12日 64 点赞 0 评论 768 浏览

Mini DALL·E 3

Mini DALL·E 3是一款由多所高校联合开发的交互式文本到图像生成工具，支持多轮自然语言对话，实现高质量图像的生成与编辑。系统结合大型语言模型与文本到图像模型，提供内容一致性控制与问答功能，提升交互体验。广泛应用于创意设计、故事插图、概念设计、教育及娱乐等领域，具有高效、灵活和易用的特点。

AI项目与工具 2025年06月12日 18 点赞 0 评论 697 浏览

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型，结合多模态大语言模型与扩散模型，支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 521 浏览

ART

ART（Anonymous Region Transformer）是一种新型多层透明图像生成技术，支持基于全局文本提示和匿名区域布局生成多个独立透明图层（RGBA格式）。通过逐层区域裁剪机制，显著提升生成效率，速度快于传统方法12倍以上。具备高质量自编码器，支持50层以上的图像生成，减少图层冲突。广泛应用于艺术设计、内容创作、广告营销及科研等领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 769 浏览

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型，能够根据文本描述精准生成高质量、高分辨率图像，支持多种纵横比输出。具备优秀的人物与物体渲染能力，适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成，单次最多输出 9 张图像，每分钟处理 10 个请求，提升创作效率。采用扩散模型与 Transformer 架构，结合线性注意力与 MoE 技术，确保图像质量与生成效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 738 浏览

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具，支持零样本多语言生成，提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器，实现文本与图像的高效交互。实验表明其性能优于现有方法，适用于艺术创作、广告设计、影视制作等多个领域，具备高效、灵活和高质量的生成能力。

AI项目与工具 2025年06月12日 59 点赞 0 评论 463 浏览

SigStyle

SigStyle是一款由多所高校与Adobe合作开发的签名风格迁移框架，能将单张风格图像的视觉特征（如几何结构、色彩和笔触）精准迁移到目标图像，同时保持内容的语义和结构。其核心技术基于个性化文本到图像扩散模型，结合超网络和时间感知注意力交换技术，实现高效且高质量的风格迁移。支持多种应用场景，如艺术创作、时尚设计、影视制作等，具备灵活性和广泛适用性。

AI项目与工具 2025年06月12日 63 点赞 0 评论 797 浏览

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架，通过高质量提示构建、偏好采样和分布加权机制，提升图像质量和与人类偏好的对齐度，减少训练崩溃风险。它具备自演化能力，降低对大规模数据的依赖，广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 485 浏览

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型，基于代理标记化扩散 Transformer（PT-DiT）架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度，支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性，适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 499 浏览

文本到图像

首页

文本到图像

列表

默认

浏览次数

发布日期