图像生成 - 智狐AI导航

PuLID

PuLID是一种由字节跳动团队开发的个性化文本到图像生成技术，主要通过对比对齐和快速采样方法实现高效ID定制。该技术能够生成高度逼真的面部图像，同时保留原始图像的风格元素，支持灵活的个性化编辑。PuLID具有快速出图能力，无需繁琐的模型调整，且与多种现有模型兼容。它适用于艺术创作、虚拟形象定制、影视制作、广告和社交媒体等多个领域。

AI项目与工具 2024年01月01日 39 点赞 0 评论 734 浏览

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型，能够根据文本描述精准生成高质量、高分辨率图像，支持多种纵横比输出。具备优秀的人物与物体渲染能力，适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成，单次最多输出 9 张图像，每分钟处理 10 个请求，提升创作效率。采用扩散模型与 Transformer 架构，结合线性注意力与 MoE 技术，确保图像质量与生成效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 734 浏览

Freeflo.ai

Freeflo.ai 是一个多功能的 AI 绘画辅助平台，它通过提供丰富的风格提示词和直观的样例图像，极大地丰富了 AI 绘画的创作可能性。

创作工具 1970年01月01日 0 点赞 0 评论 737 浏览

Amazon Bedrock

Amazon Bedrock是一款由AWS推出的完全托管型AI服务平台，集成了多家顶级AI公司的基础模型，支持企业通过单一API访问高性能模型。它提供了从基础模型接入、微调到代理构建的一系列功能，包括检索增强生成（RAG）、自动推理检查及多Agent协作等特性。此外，其模型蒸馏技术能够有效提升效率并降低运行成本，广泛适用于文本生成、虚拟助手、图像生成等多种应用场景。

AI项目与工具 2025年06月12日 88 点赞 0 评论 738 浏览

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型，能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器（VAE）和因果Transformer架构，支持自回归生成与跨模态信息共享，特别擅长图像生成、多模态语言模型及文本到语音合成等任务，其提出的σ-VAE进一步提升了模型的鲁棒性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 738 浏览

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具，采用CLIP和VAE编码提取服装外观先验，并结合服装聚焦适配器和高频细节增强算法，生成高保真试穿图像。它能够精准对齐服装与人体姿态，保留复杂图案与纹理，适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域，提供真实且沉浸式的在线试穿体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 738 浏览

Minister AI

Minister AI是一款免费使用的AI绘图工具，登录即用的在线Stable Diffusion，支持海量模型上传下载。

Ai绘画生成 2025年06月05日 28 点赞 0 评论 739 浏览

Getimg

getimg.ai 是一套神奇的人工智能图片生成工具。按比例生成原始图像，修改照片，利用文本生成绘画作品。

Ai绘画生成 2025年06月05日 62 点赞 0 评论 739 浏览

Gemini 2.0 Flash

Gemini 2.0 Flash是Google推出的多模态AI模型，支持文本与图像生成及对话式编辑，能根据自然语言生成连贯图像，并保持上下文一致性。其在长文本渲染方面表现优异，适用于广告、社交媒体、教育等领域。开发者可通过Google AI Studio或Gemini API进行测试和集成，广泛应用于创意插图、互动故事、设计辅助等场景。

AI项目与工具 2025年06月12日 18 点赞 0 评论 740 浏览

Chatbox AI

Chatbox AI是一款开源跨平台AI助手，支持多语言模型集成与本地部署，提供图像生成、代码辅助、文档交互等功能。用户可自由定制并参与社区开发，确保数据安全与隐私保护，适用于办公、学习、开发等多种场景，提升工作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 740 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期