文本到图像

FLUX Tools

FLUX Tools是一套由黑森林实验室开发的增强型文本到图像模型工具，包含FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny和FLUX.1 Redux四个模块，能够通过文本描述和掩码对图像进行精确编辑和扩展，支持图像修复、扩展、结构化引导、混合与再创作等功能。工具基于深度学习和神经网络技术，结合结构引导和文本到图像转换功能，适用于多种应用场景，包括数字艺术创作、游戏开发、

AI项目与工具 2025年06月12日 20 点赞 0 评论 483 浏览

In

In-Context LoRA是一种基于扩散变换器（DiTs）的图像生成框架，通过微调少量数据实现多样化图像生成任务。它无需修改原始模型结构，减少了对大规模标注数据的依赖，同时保持了高质量的生成效果。该工具支持多任务图像生成、上下文学习能力、任务无关性以及条件图像生成等功能，适用于故事板生成、字体设计、家居装饰等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 773 浏览

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架，支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控，具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能，广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 465 浏览

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架，支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计，能够快速生成高质量图像并提升推理效率。

AI项目与工具 2025年06月12日 84 点赞 0 评论 686 浏览

EvolveDirector

EvolveDirector是一个由阿里巴巴与南洋理工大学合作开发的文本到图像生成框架，通过与高级模型API交互获取数据对，结合预训练的视觉语言模型（VLMs）动态优化训练集，大幅降低数据量和训练成本。该框架支持多模型学习、动态数据集管理及在线训练，显著提升了生成图像的质量和多样性，广泛应用于内容创作、媒体娱乐、广告营销、教育科研等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 555 浏览