图像生成 - 智狐AI导航

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 695 浏览

Hautech.AI

Hautech.AI 是一款基于AI技术的图像生成工具，可将平面产品图自动转换为逼真模特展示图。用户可自定义模特特征、背景和细节，适用于社交媒体、产品目录和广告制作等多种场景，提升内容多样性与市场竞争力，节省拍摄时间和成本。

AI项目与工具 2025年06月11日 72 点赞 0 评论 769 浏览

Firefly Image Model 4 是 Adobe 推出的图像生成模型，支持高分辨率（最高2K）图像生成，并提供对图像结构、风格、视角等的精细控制。其增强版 Firefly Image Model 4 Ultra 特别适用于复杂场景和细节处理。该模型基于深度学习技术，包括 GAN 和 Diffusion Model，能够根据文本描述或参考图像生成高质量图像。广泛应用于创意设计、广告、艺术、

AI项目与工具 2025年06月11日 27 点赞 0 评论 464 浏览

Step1X

Step1X-Edit 是由阶跃星辰团队推出的通用图像编辑框架，结合多模态大语言模型与扩散模型，支持多样化的图像编辑任务，如主体修改、背景更换、风格转换等。用户可通过自然语言指令进行操作，系统能精准理解并生成高质量图像。该工具基于大规模数据集训练，具备强大的真实场景适应能力，适用于创意设计、影视制作、社交媒体等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 787 浏览

Concept Lancet

Concept Lancet（CoLan）是一种基于潜在空间稀疏分解的图像编辑框架，能够实现零样本、即插即用的精确概念替换、添加与移除。它通过构建视觉概念字典，结合扩散模型生成高质量图像，保持视觉一致性。适用于创意设计、影视制作、游戏开发等多个领域，提供高效的图像编辑解决方案。

AI项目与工具 2025年06月11日 28 点赞 0 评论 777 浏览

OceanDoc

OceanDoc是科大讯飞推出的AI智能办公工具，基于大语言模型和自然语言处理技术，可自动将文本转化为高质量PPT幻灯片，并提供设计建议、多语言翻译、语音控制、AI图像生成等功能。适用于办公、教育、企业等多种场景，简化演示文稿制作流程，提升效率与专业性。

AI项目与工具 2025年06月11日 44 点赞 0 评论 816 浏览

UniToken

UniToken 是一种面向多模态理解与生成任务的自回归模型，结合了离散与连续视觉表示，实现对图像语义与细节的全面捕捉。它支持图文理解、图像生成、多模态对话、复杂指令执行等多种任务，并具备细粒度视觉处理能力。适用于内容创作、智能客服、教育、医疗及自动驾驶等多个领域。

AI项目与工具 2025年06月11日 67 点赞 0 评论 412 浏览

DreamO

DreamO是由字节跳动与北京大学联合开发的图像定制生成框架，基于扩散变换器（DiT）模型实现多条件图像生成。支持身份、风格、背景等条件的灵活集成，具备高质量生成、条件解耦和精准控制能力。适用于虚拟试穿、风格迁移、主体驱动生成等多种场景，具备广泛的适用性和技术先进性。

AI项目与工具 2025年06月11日 31 点赞 0 评论 440 浏览

Cobra

Cobra是由清华大学、香港中文大学和腾讯ARC实验室联合开发的漫画线稿上色框架，采用因果稀疏注意力机制和局部可复用位置编码技术，实现高精度、高效率的自动上色。支持颜色提示调整，提升灵活性与个性化。适用于漫画、动画、插画等多种场景，具有高效的推理能力和良好的扩展性。项目已开源，包含技术论文与模型资源。

AI项目与工具 2025年06月11日 21 点赞 0 评论 675 浏览

Omni Reference

Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能，允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数，用户可灵活控制参考图像的权重与风格融合程度，提升创作精度与多样性。支持 Web 和 Discord 两种平台操作，适用于角色嵌入、产品展示、场景构建等多种应用场景。

AI项目与工具 2025年06月11日 48 点赞 0 评论 672 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期