图像生成 - 智狐AI导航

MILS

MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型（LLM）提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化，实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务，适用于内容生成、多模态检索、视觉问答等多个场景，具备高效、灵活和无需训练的优势。

AI项目与工具 2025年06月12日 31 点赞 0 评论 558 浏览

TheB.AI

一个一体化人工智能平台，通过易于使用的界面或统一的API接口，提供从语言到图像处理的各种尖端模型，可通过用户友好的界面或统一的 API 进行访问。

Ai平台模型 2025年06月05日 32 点赞 0 评论 558 浏览

Hayo

在 Hayo 可以找到满足你需求的各种 AI 工具并且可以直接尝试使用。

媒体资讯 2025年06月05日 88 点赞 0 评论 559 浏览

DoraCycle

DoraCycle是由新加坡国立大学Show Lab开发的一种多模态生成模型，通过文本与图像间的双向循环一致性学习，实现跨模态信息转换与对齐。其核心优势在于无需大量标注数据即可完成领域适应，支持风格化设计、虚拟角色生成等多样化任务。模型采用自监督学习和梯度裁剪等技术提升训练稳定性，适用于广告、教育等多个应用场景。

AI项目与工具 2025年06月12日 19 点赞 0 评论 560 浏览

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型，能够生成1024×1024像素的高分辨率图像，质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块，HART实现了高效的图像生成，并在多个指标上表现出色，包括重构FID、生成FID以及计算效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 561 浏览

BYLO AI

BYLO AI是一款基于AI技术的图像生成工具，支持文本转图像的快速转换，提供高级自定义选项和灵活的图像设置。用户可以通过简单的文本描述生成高质量的图像，适用于社交媒体内容创作、广告设计、平面设计、艺术创作及游戏概念设计等多个领域。该工具以其高效的生成速度、多样的风格选择和高分辨率输出受到广泛好评。

AI项目与工具 2025年06月12日 55 点赞 0 评论 566 浏览

MUMU

MUMU是一种多模态图像生成模型，通过结合文本提示和参考图像来生成目标图像，提高生成的准确性和质量。该模型基于SDXL的预训练卷积UNet，并融合了视觉语言模型Idefics2的隐藏状态。MUMU能够在风格转换和角色一致性方面展现强大的泛化能力，同时在生成图像时能够很好地保留细节。主要功能包括多模态输入处理、风格转换、角色一致性、细节保留以及条件图像生成。

AI项目与工具 2025年06月12日 58 点赞 0 评论 566 浏览

AI Ease

AI Ease是一款基于人工智能的在线照片编辑工具，提供背景移除、水印消除、图像生成、艺术风格转换、肖像美化等多种功能。支持移动设备使用，操作简便，适用于电商、社交媒体、个人美化及创意设计等场景。提供免费与专业订阅方案，保障用户数据安全。

AI项目与工具 2025年06月11日 44 点赞 0 评论 566 浏览

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架，由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导，提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态，提供高分辨率基准数据集HR-VVT，适用于在线购物、时尚设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 60 点赞 0 评论 567 浏览

像素猫AI

像素猫AI是一款专注于生成吉卜力风格图像的AI绘画工具，操作简便，用户只需选择风格并上传照片即可快速生成图像。平台支持像素画绘制、撤销与清除功能，并提供实时预览。适用于个人创作、设计辅助、艺术教育及表情包制作等多个场景，是创意表达和个性化设计的实用工具。

AI项目与工具 2025年06月12日 58 点赞 0 评论 568 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期