文本-图像

GroundingBooth

GroundingBooth 是一种创新的文本到图像定制框架，通过结合文本-图像对齐模块和遮罩交叉注意力层，实现了前景主体与背景对象的空间精准对齐。其核心功能包括单主题与多主题定制、身份保留、文本-图像一致性保障及复杂场景下的高精度生成。该工具广泛应用于个性化商品定制、艺术创作、游戏设计、广告营销等多个领域，为视觉内容创作提供了强大的技术支持。

AI项目与工具 2025年06月12日 20 点赞 0 评论 606 浏览

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架，支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计，能够快速生成高质量图像并提升推理效率。

AI项目与工具 2025年06月12日 84 点赞 0 评论 760 浏览

UniReal

UniReal是一款由香港大学与Adobe研究院合作开发的多功能图像处理框架，能够实现图像生成、编辑、定制和合成等任务。它通过视频生成模型的设计理念，利用大规模视频数据作为监督源，学习图像间的连贯性与变化性，生成高质量的逼真图像。该框架特别擅长处理复杂的场景，支持多种应用场景，包括数字内容创作、媒体娱乐、广告营销、电子商务及教育等领域。

AI项目与工具 2025年06月12日 36 点赞 0 评论 705 浏览

Awesome GPT

一个精选的GPT-4o生成图片集锦，收集了OpenAI 最新多模态模型 GPT‑4o 生成的精彩案例，展示其强大的文本‑图像理解与创作能力。

Ai学习资源 2025年06月05日 92 点赞 0 评论 673 浏览

文本-图像

首页

文本-图像

列表

默认

浏览次数

发布日期

GroundingBooth

Kandinsky

UniReal

Awesome GPT

文本-图像 首页 文本-图像

列表 默认 浏览次数 发布日期

GroundingBooth

Kandinsky

UniReal

Awesome GPT

文本-图像

首页

文本-图像

列表

默认

浏览次数

发布日期