图像生成 - 智狐AI导航

PhotoMaker

PhotoMaker V2是腾讯推出的一款AI图像生成框架，能够快速生成逼真的人物照片。它在角色的一致性和可控性上取得了显著进步，用户可以通过文本指令进行精准控制。该工具利用深度学习技术和生成对抗网络（GANs），能够将文本描述转化为图像，并通过集成脚本增强生成过程的个性化和可控性。PhotoMaker V2广泛应用于游戏开发、电影制作、广告、社交媒体、艺术创作和教育等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 792 浏览

Hyper

Hyper-SD是由字节跳动研究人员开发的高效图像合成框架，通过轨迹分割一致性蒸馏（TSCD）、人类反馈学习（ReFL）和分数蒸馏等技术，显著降低了扩散模型在多步推理过程中的计算成本。该框架在保持高图像质量的同时，大幅减少了推理步骤，实现了快速生成高分辨率图像，推动了生成式AI技术的发展。

AI项目与工具 2025年06月12日 73 点赞 0 评论 444 浏览

腾讯元器

腾讯元器是一款基于腾讯混元大模型的AI智能体创作与分发平台，提供低代码或无代码的智能体开发环境，覆盖多种业务场景和功能。它通过智能体商店、工作流模式、腾讯生态集成等功能，简化了智能体的创建、部署和分发过程，支持一键分发至腾讯的多平台渠道，适用于客服、教育、金融、法律等多个行业。

AI项目与工具 2025年06月12日 31 点赞 0 评论 600 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 531 浏览

Amuse AI

Amuse 2.0是一款由AMD开发的AI图像生成工具，专为AMD硬件优化，支持在PC上生成高质量图像。它具备设计模式，可将用户的草图和文本提示转化为图像，并提供AI滤镜功能，便于个性化风格的创作。Amuse 2.0 Beta版本集成了AMD XDNA超级分辨率技术，能有效提升图像分辨率。此外，该工具还提供了平衡、快速和质量三种模式，以满足不同用户的需求和偏好。

AI项目与工具 2025年06月12日 94 点赞 0 评论 804 浏览

Pixel Studio 是谷歌为 Pixel 9 系列手机预装的一款 AI 图像生成应用。它基于 Imagen 3 模型，能够快速生成艺术风格的图片，生成时间仅需约2秒。Pixel Studio 利用 Tensor G4 芯片，支持本地和云端生成方式，并具备 Gemini overlay 功能，便于用户直接分享生成的图片至邮件或聊天平台。该应用适用于艺术爱好者、设计师、社交媒体用户以及专业创作者

AI项目与工具 2025年06月12日 90 点赞 0 评论 572 浏览

Fotographer AI

Fotographer AI是一款基于AI技术的图像生成工具，能够快速生成专业级产品图像，并提供多样化的广告模特图像。该工具支持文本和模板定制，简化创作流程。此外，它还能即时生成博客、新闻稿等营销材料。试用期免费，同时提供企业级服务选项，包括图像生成和账户管理。

AI项目与工具 2025年06月12日 26 点赞 0 评论 812 浏览

Half_illustration

Half_illustration 是一款基于 Flux.1 模型的 LoRA 图像创意工具，融合了摄影写实与插画艺术的元素，创造出独特的视觉效果。该工具支持通过 API 快速生成图像，并与 Diffusers 库兼容。用户可通过详细描述和特定提示词指导模型，实现个性化的艺术创作。其应用广泛，涵盖时尚编辑、广告设计、概念艺术等多个领域。

AI项目与工具 2025年06月12日 55 点赞 0 评论 454 浏览

AuraFlow

AuraFlow v0.1是一款由Fal团队开发的开源AI文生图模型，拥有6.8B参数量。该模型通过优化的MMDiT架构提升了计算效率和可扩展性。AuraFlow在生成精确图像方面表现出色，特别是在物体空间构成和色彩表现上具有优势。此外，它采用了最大更新参数化技术，增强了学习率迁移的稳定性。AuraFlow支持文本到图像的生成，适用于艺术创作、媒体内容生成、游戏开发及广告和营销等多种应用场景。

AI项目与工具 2025年06月12日 35 点赞 0 评论 868 浏览

Transfusion

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 532 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期