图像

MCA

MCA-Ctrl是由中科院计算所与国科大联合开发的图像定制生成框架,通过引入SAGI和SALQ注意力控制策略及主体定位模块,提升图像生成质量与一致性。支持零样本图像生成,适用于主体特征保持、背景一致性维护等多种任务,广泛应用于数字内容创作、广告设计、艺术创作等领域。

Aiuni

[Aiuni是一款利用先进AI技术将2D图像转化为高质量3D模型的在线平台。它支持纹理生成、模型优化、动画添加等功能,适用于数字媒体、游戏开发、影视制作等多个行业。其核心技术包括多视图扩散模型和网格重建算法,能快速生成高保真度的3D模型,并具备强大的细节捕捉能力。]

魔多AI

一个专为AI创作者打造的趣玩社区,提供多种AI模型和创作工具,支持用户进行插画、动漫、写实等多种风格的图像创作。

SupaRes

SupaRes 是一个使用人工智能 (AI) 来增强图像的平台。它可以提高您上传的任何图像的质量、分辨率和清晰度。

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术,通过自动生成数据集并微调模型,支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集,实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

123APPS

一个可以在线编辑各种类型媒体文件的工具,包括视频、音频文件、PDF 和图像的转换,比如视频编辑器、屏幕录像机、文本到语音转换器、PDF 转换器和编辑器、音频编辑器、图像转换器、存档提取器和其他实用工具。

HeroPack

HeroPack是一款头像生成器,它使用人工智能来生成受电子游戏启发的头像。

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架,支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控,具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能,广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。