图像

PartEdit

PartEdit是一种基于预训练扩散模型的细粒度图像编辑工具,通过优化部分标记实现对图像对象各部分的精准定位与编辑。其采用非二进制掩码和自适应阈值策略,确保编辑内容自然融合,保留原始细节。支持真实图像和多部分同时编辑,无需重新训练模型,适用于艺术设计、影视制作、广告等多个领域。

Shedevrum

Shedevrum是由Yandex推出的AI图像生成工具,支持文本到图像和视频的生成,具备多种艺术风格模仿能力。用户可通过输入描述性文本,快速生成高质量、高分辨率的图像,并进行个性化调整。该工具适用于艺术创作、内容制作、教育及品牌营销等多个领域,提供便捷的视觉内容生成方案。官网提供免费版本,支持多语言输入,适合各类用户使用。

AI Photo Enhancer

AI Photo Enhancer是一款利用AI技术的在线图像增强工具,可将图片放大至10倍且保持清晰度,支持多种格式及批量处理。其主要功能包括高倍放大与细节保留、针对不同风格的照片优化、快速处理时间及多场景应用,如旧照片修复、电商产品展示、肖像优化和风景摄影等。

Fluid

Fluid是一种基于连续标记和随机生成顺序的文本到图像生成模型,具有卓越的视觉表现力和全局结构捕捉能力。它通过自回归架构和Transformer模型,逐步预测序列中的下一个元素,构建与文本提示相匹配的高质量图像。Fluid在多个基准测试中取得了优异成绩,并广泛应用于艺术创作、媒体娱乐、广告营销等领域。

Manga Image Translator

Manga Image Translator 是一个开源的漫画图片文字翻译工具,基于 OCR 和机器翻译技术,实现对漫画和图片中文字的自动识别与翻译。它支持多语言翻译,包括日文、中文、英文和韩文,并具备图像合成能力,保持原图风格。工具提供批量处理和在线/离线翻译功能,适用于漫画爱好者、语言学习者以及出版商等用户群体。

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。

BasedLabs

BasedLabs是一款基于AI技术的图像和视频创作平台,提供包括AI视频生成、图像创作、图像扩展及换脸在内的多种功能。用户可利用平台内置的AI模型生成高质量的视觉内容,适用于社交媒体、数字艺术、广告营销、影视制作、游戏开发以及教育培训等多个领域。平台操作简便,适合各类创作者使用。

PIA

PIA是一款个性化图像动画生成器,可以生成具有高运动可控性和强文本和图像对齐性的视频,与条件图像对齐,通过文本实现动作控制,与各种个性化T2I模型兼容,无需特定调整。

ResAdapter

ResAdapter是一种专为扩散模型设计的分辨率适配器,允许图像生成模型生成任意分辨率和宽高比的图像,同时保持原始风格。其主要功能包括分辨率插值、分辨率外推、域一致性、即插即用设计以及广泛的兼容性。通过在扩散模型中插入ResCLoRA和引入ResENorm,ResAdapter能够在不影响模型风格的情况下扩展其分辨率范围。