文本到图像

FLUX Tools

FLUX Tools是一套由黑森林实验室开发的增强型文本到图像模型工具，包含FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny和FLUX.1 Redux四个模块，能够通过文本描述和掩码对图像进行精确编辑和扩展，支持图像修复、扩展、结构化引导、混合与再创作等功能。工具基于深度学习和神经网络技术，结合结构引导和文本到图像转换功能，适用于多种应用场景，包括数字艺术创作、游戏开发、

AI项目与工具 2025年06月12日 20 点赞 0 评论 483 浏览

6Pen Art

支持多种模型和中文描述，不保留版权，不保留数据。6Pen为用户提供了一个强大且易于使用的AI绘画平台，适合需要进行创意绘画和视觉设计的个人或专业人士。

Ai绘画生成 1970年01月01日 0 点赞 0 评论 484 浏览

Fluid

Fluid是一种基于连续标记和随机生成顺序的文本到图像生成模型，具有卓越的视觉表现力和全局结构捕捉能力。它通过自回归架构和Transformer模型，逐步预测序列中的下一个元素，构建与文本提示相匹配的高质量图像。Fluid在多个基准测试中取得了优异成绩，并广泛应用于艺术创作、媒体娱乐、广告营销等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 485 浏览

VMix

VMix是一款提升文本到图像生成美学质量的工具，通过解耦文本内容与美学描述，并引入细粒度美学标签，增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块，可在不改变原有模型结构的情况下注入美学条件，保持图文一致性。VMix兼容多种扩散模型及社区模块，支持多源输入、高质量视频处理、实时直播与远程协作，广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 486 浏览

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架，通过高质量提示构建、偏好采样和分布加权机制，提升图像质量和与人类偏好的对齐度，减少训练崩溃风险。它具备自演化能力，降低对大规模数据的依赖，广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

AI项目与工具 2025年06月12日 49 点赞 0 评论 486 浏览

混元图像2.0

混元图像2.0是腾讯开发的AI图像生成工具，支持文本、语音、草图等多种输入方式，具备实时生成能力。其采用单双流DiT架构和多模态大语言模型，生成图像写实性强、细节丰富，且响应速度快，适用于创意设计、广告营销、教育、游戏等多个领域。用户可通过网页端直接操作，实现高效的图像创作体验。

AI项目与工具 2025年06月11日 41 点赞 0 评论 487 浏览

ELLA

ELLA（Efficient Large Language Model Adapter）是一种由腾讯研究人员开发的方法，旨在提升文本到图像生成模型的语义对齐能力。它通过引入时序感知语义连接器（TSC），动态提取预训练大型语言模型（LLM）中的时序依赖条件，从而提高模型对复杂文本提示的理解能力。ELLA无需重新训练，可以直接应用于预训练的LLM和U-Net模型，且能与现有模型和工具无缝集成，显著提升

AI项目与工具 2024年01月01日 74 点赞 0 评论 490 浏览

Anime Art

Anime Art 是一款基于AI技术的动漫风格图像生成工具，用户可通过文本描述或图片输入生成个性化艺术作品。支持多种AI模型和艺术风格选择，同时集成AI聊天功能，适用于角色扮演和文本互动场景。该工具可用于个人创作、社交媒体、教育、商业营销及游戏影视开发等领域，具有广泛的适用性和创造性价值。

AI项目与工具 2025年06月12日 31 点赞 0 评论 492 浏览

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型，基于代理标记化扩散 Transformer（PT-DiT）架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度，支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性，适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 499 浏览

PIA

PIA是一款个性化图像动画生成器，可以生成具有高运动可控性和强文本和图像对齐性的视频，与条件图像对齐，通过文本实现动作控制，与各种个性化T2I模型兼容，无需特定调整。

Ai开源项目 2025年06月05日 51 点赞 0 评论 500 浏览

文本到图像

首页

文本到图像

列表

默认

浏览次数

发布日期