文本到图像

Gendo

Gendo是一款结合生成式AI技术的建筑可视化平台，通过生成对抗网络（GANs）和扩散模型等手段，帮助设计师快速创建逼真的建筑概念图，并支持从草图到最终图像的全周期操作，具备生成性编辑、风格迁移和文本到图像生成等功能，旨在提升设计效率与视觉沟通质量。

AI项目与工具 2025年06月12日 34 点赞 0 评论 551 浏览

DreamOmni

DreamOmni是一款由香港中文大学、字节跳动与香港科技大学联合研发的统一图像生成与编辑模型。它集成了文本到图像生成（T2I）及多种编辑功能，包括指令式编辑、修复、拖拽编辑和参考图像生成。DreamOmni利用合成数据管道高效生成高质量编辑数据，并通过联合训练提升图像生成与编辑质量。该模型在多任务处理、复杂提示兼容性及训练效率优化上表现优异，适用于数字艺术、影视特效、广告设计等多个领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 542 浏览

AnimateDiff

AnimateDiff是一款由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员共同开发的框架，旨在将文本到图像模型扩展为动画生成器。该框架利用大规模视频数据集中的运动先验知识，允许用户通过文本描述生成动画序列，无需进行特定的模型调优。AnimateDiff支持多种领域的个性化模型，包括动漫、2D卡通、3D动画和现实摄影等，并且易于与现有模型集成，降低使用门槛。

AI项目与工具 2024年01月01日 59 点赞 0 评论 542 浏览

VEED AI

VEED AI游戏生成器是一个多功能的AI工具，它通过文本到图像的转换技术，帮助游戏开发者快速获取游戏设计和营销的视觉素材。

创作工具 1970年01月01日 0 点赞 0 评论 539 浏览

SwiftBrush V2

SwiftBrush V2 是一款基于文本到图像的单步扩散模型，通过改进权重初始化、LoRA训练及夹紧CLIP损失等技术，实现了与多步Stable Diffusion模型相媲美的性能。它无需真实图像数据即可训练，显著提升了生成速度和图像质量，广泛应用于艺术创作、游戏开发、虚拟现实等领域。

AI项目与工具 2025年06月12日 21 点赞 0 评论 537 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 534 浏览

Red_Panda

Red_Panda 是一款由 Recraft AI 开发的先进 AI 图像生成工具，以其高精度的文本到图像转换能力和卓越的解剖学准确性著称。它能够生成复杂长文本对应的高质量图像，支持用户通过风格控制和图形设计工具实现个性化定制。此外，Red_Panda 还具备矢量图像生成能力，并集成 AI 图像编辑功能，广泛应用于设计、品牌营销、教育及出版等多个领域。

AI项目与工具 2024年11月01日 86 点赞 0 评论 533 浏览

VersaGen

VersaGen是一款基于生成式AI的文本到图像合成工具，支持多样化视觉控制和灵活的创意表达。通过适配器训练和优化策略，VersaGen将视觉信息融入生成过程中，显著提升了图像质量和用户体验。该工具适用于创意设计、数字艺术、广告营销、游戏开发及影视制作等多个领域，为用户提供了高效且直观的视觉创作解决方案。

AI项目与工具 2025年06月12日 19 点赞 0 评论 524 浏览

MDM

Matryoshka Diffusion Models (MDM) 是一种由苹果公司开发的新型扩散模型框架，通过嵌套UNet架构实现多分辨率联合去噪，支持从低分辨率到高分辨率的渐进式训练，显著提升高分辨率图像生成效率，适用于多种应用场景，如数字艺术创作、游戏开发、电影制作等，并具备出色的零样本泛化能力。

AI项目与工具 2025年06月12日 28 点赞 0 评论 523 浏览

WeGen

WeGen是一款由中国科学技术大学等机构联合开发的多模态生成模型，结合多模态大语言模型与扩散模型，支持文本到图像生成、图像编辑、风格迁移等多种视觉任务。其特点包括对模糊指令的多样化响应、高一致性输出以及交互式生成能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 521 浏览

文本到图像

首页

文本到图像

列表

默认

浏览次数

发布日期