图像

VLOGGER

VLOGGER AI是一款由谷歌研究团队开发的多模态扩散模型,主要用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频。该工具能够根据音频控制人物动作,包括面部表情、唇部动作、头部运动、眼神、眨眼及上身和手部动作,实现音频驱动的视频合成。VLOGGER生成的视频具有高度的真实性和多样性,能够展示原始主体的不同动作和表情。此外,VLOGGER还可以用于编辑现有视频和跨语言视频内容适配。

Dream Lab

Dream Lab是一款基于人工智能技术的文本到图像生成工具,由Canva推出并依托于收购的AI初创公司Leonardo.ai的技术支持。它能够通过解析用户输入的简单文字描述,生成包括3D渲染、插画等多种风格的高质量图像。此外,Dream Lab还支持参考已有图片进行优化,并提供灵活的尺寸选择与编辑功能,适用于社交媒体、广告营销、品牌设计以及教育培训等多个场景。

HiCo

HiCo是一款基于扩散模型的层次化可控布局到图像生成工具,采用多分支结构设计,能够精确控制对象的位置和文本描述,解决复杂布局中的常见问题。该工具支持高分辨率图像生成,兼容多种快速生成插件,并在多目标布局生成任务中表现出色,适用于图像编辑、游戏设计、虚拟现实等多个领域。

Suno Scenes

Suno Scenes是一款基于AI技术的音乐生成工具,主要功能是根据上传的图像或视频生成与其内容相符的背景音乐。它支持多种音乐风格,拥有便捷的操作界面,并能在短时间内完成音乐创作。Suno Scenes适用于个性化音乐创作、教育、媒体声音设计、治疗应用以及商业品牌推广等多个领域,为用户提供了丰富的应用场景和无限的创作可能性。

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具,支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术,提供自定义分辨率和生成步骤功能,适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发,具备良好的可扩展性和可观察性。

PhotoEditor AI

PhotoEditor.ai 是一款可以快速从图片中移除不想要的对象、文字或人物的AI 图片编辑工具,高效易用。

AI游戏素材生成器

AI游戏素材生成器是一个创新的游戏开发辅助工具,它通过AI技术简化了游戏美术资源的创作过程。这个平台不仅为独立开发者和小团队节省了成本,也为大型团队提高了工作效率,使得游...

MimicBrush

MimicBrush是一款由阿里巴巴、香港大学和蚂蚁集团联合研发的AI图像编辑工具,通过参考图像模仿和自动区域识别功能,支持对象替换、样式转换和纹理调整等多种图像编辑操作。它具备实时预览、一键编辑和高度自适应的特点,广泛应用于产品设计、时尚、美容、广告、社交媒体内容创作及电子商务等多个领域。

Stable Diffusion 3

Stable Diffusion 3 是一款由 Stability AI 开发的先进文本到图像生成模型,通过改进的文本渲染能力、多主题提示支持、可扩展的参数量、图像质量提升及先进的架构技术,实现了高质量和多样性的图像生成。该模型在图像生成和文本理解方面取得了显著进展,并通过 Diffusion Transformer 架构和 Flow Matching 技术提升了模型效率和图像质量。

MagicColor

MagicColor是一款由香港科技大学开发的多实例线稿图着色工具,基于自监督训练和实例引导模块,实现高效、精准的色彩分配。支持参考图像驱动,具备实例级控制与边缘增强功能,适用于动画、数字艺术、游戏开发等领域。采用扩散模型与双UNet架构,提升着色质量和效率,适合创意设计与教育应用。