图像生成

Seedream 3.0

Seedream 3.0是字节跳动推出的AI图像生成模型,支持2K高清输出,3秒内生成高品质图像。优化了小字排版与结构准确性,具备商业级设计能力,适用于海报、插画、电商设计等多场景。支持中英文双语输入,提供高效、精准的图像生成解决方案,适用于设计师与创作者。

Inf

Inf-DiT是由清华大学与智谱AI联合开发的图像上采样技术,基于扩散模型并引入单向块注意力机制(UniBA),有效降低内存消耗,支持超高分辨率图像生成。其采用扩散变换器(DiT)架构,具备灵活的图像上采样能力,并通过全局图像嵌入和交叉注意力机制增强图像的一致性与质量。该技术适用于设计、影视、印刷及医学等领域,具有广泛的应用前景。

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理,能够通过稀疏控制信号(如手动轨迹、面部关键点序列或音频)实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习,能够将多种控制信号组合使用,生成复杂的动画效果,并能生成较长的视频片段。 ---

Stableboost

Stableboost 是一种有趣且简单的方法来释放您的创造力并制作个性艺术化照片的AI工具。

TheB.AI

一个一体化人工智能平台,通过易于使用的界面或统一的API接口,提供从语言到图像处理的各种尖端模型,可通过用户友好的界面或统一的 API 进行访问。

Flux.1 Lite

Flux.1 Lite是一款轻量级AI图像生成模型,基于Transformer架构,通过参数优化和精度保持技术,在减少内存占用的同时提升运行速度。其主要功能包括高质量图像生成、资源优化、快速部署及广泛适用性,适用于个人创作、教育、游戏开发、数字艺术以及广告营销等多个领域。

包图AI文生图

一站式图象、插画生成工具,无需复杂的教程学习,傻瓜式文本输入,一键生成高质高清图片。

Ghibli AI

一款专门用于生成吉卜力风格的AI图像生成器,能够根据用户的文本描述或上传的图片生成具有吉卜力风格的图像。

RLCM

RLCM是由康奈尔大学开发的一种基于强化学习的文本到图像生成框架,通过微调一致性模型以适应特定任务的奖励函数,显著提升生成效率与图像质量。其核心技术包括强化学习、策略梯度优化及任务导向的奖励机制,适用于艺术创作、数据集扩展、图像修复等多个领域,具有高效的推理能力和对复杂任务的适应性。

ImagePrompt.org

ImagePrompt.org是一款基于AI技术的图像提示词生成工具,主要功能包括图片转提示词、AI图片生成器以及灵感探索等,旨在简化设计流程并激发用户创造力。平台提供多语言支持和教程,帮助用户提升创作技能,广泛应用于创意设计、广告营销、游戏开发、艺术创作等领域。