图像生成 - 智狐AI导航

UniFluid

UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架，支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入，结合Gemma模型和VAE技术，实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色，具备良好的下游任务迁移能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 673 浏览

Gemini 2.0 Flash

Gemini 2.0 Flash是Google推出的多模态AI模型，支持文本与图像生成及对话式编辑，能根据自然语言生成连贯图像，并保持上下文一致性。其在长文本渲染方面表现优异，适用于广告、社交媒体、教育等领域。开发者可通过Google AI Studio或Gemini API进行测试和集成，广泛应用于创意插图、互动故事、设计辅助等场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 789 浏览

Seedream 2.0

Seedream 2.0 是字节跳动豆包团队推出的中英双语图像生成模型，具备强大的文本理解和渲染能力，可生成具有文化细节和美学表达的高质量图像。支持多分辨率生成、字符级文本处理，并通过强化学习优化性能，适用于海报设计、社交媒体、绘画创作等多领域应用。

AI项目与工具 2025年06月12日 25 点赞 0 评论 738 浏览

绘蛙·创意文生图

绘蛙·创意文生图是一款基于AI技术的图像生成工具，用户可通过文本描述生成符合特定风格和场景的图像。该工具具备文本生成图像、智能扩写、参考图库和创意灵感支持等功能，适用于服装设计、广告制作、内容创作、影视概念艺术等多个领域。操作简便，能够提升创作效率，满足多样化的视觉创作需求。

AI项目与工具 2025年06月12日 98 点赞 0 评论 640 浏览

IMAGPose

IMAGPose是由南京理工大学开发的统一条件框架，用于人体姿态引导的图像生成。其核心功能包括多场景适应、细节与语义融合、灵活对齐及全局一致性保障。通过FLC、ILC和CVA模块，解决了传统方法在生成多样姿态图像时的局限性，适用于虚拟现实、影视制作、电商展示等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 684 浏览

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型，通过文本与图像间的双向循环一致性学习，实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应，支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性，适用于广告、教育等多个应用场景。

AI项目与工具 2025年06月12日 19 点赞 0 评论 560 浏览

Chat2SVG

Chat2SVG 是一种基于大语言模型和图像扩散模型的文本到 SVG 生成工具，能够自动创建高质量矢量图形。通过多阶段处理流程，包括模板生成、细节增强和形状优化，确保图形在视觉质量和语义对齐方面达到较高标准。支持自然语言指令编辑，适用于设计原型、图标创作、教育演示及艺术创作等多种场景。

AI项目与工具 2025年06月12日 74 点赞 0 评论 671 浏览

DiffBrush

DiffBrush是由多所高校与研究机构联合开发的图像生成与编辑工具，支持用户通过手绘草图直接控制图像生成过程。其核心技术包括颜色引导、实例与语义控制、潜在空间再生等，兼容多种主流T2I模型，如Stable Diffusion、SDXL等，并支持LoRA风格调整。该工具简化了AI绘画流程，提升了图像生成的精度与灵活性，适用于创意绘画、图像编辑、教育、游戏设计等多个领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 627 浏览

ART

ART（Anonymous Region Transformer）是一种新型多层透明图像生成技术，支持基于全局文本提示和匿名区域布局生成多个独立透明图层（RGBA格式）。通过逐层区域裁剪机制，显著提升生成效率，速度快于传统方法12倍以上。具备高质量自编码器，支持50层以上的图像生成，减少图层冲突。广泛应用于艺术设计、内容创作、广告营销及科研等领域。

AI项目与工具 2025年06月12日 95 点赞 0 评论 840 浏览

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型，能够根据文本描述精准生成高质量、高分辨率图像，支持多种纵横比输出。具备优秀的人物与物体渲染能力，适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成，单次最多输出 9 张图像，每分钟处理 10 个请求，提升创作效率。采用扩散模型与 Transformer 架构，结合线性注意力与 MoE 技术，确保图像质量与生成效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 813 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期