图像

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。

RealisHuman

RealisHuman 是一个用于优化生成图像中人体部位的后处理框架,采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构,并重新绘制周围区域实现无缝融合,支持多种图像风格,适用于游戏、影视、艺术等领域。

Diffree

一款通过AI技术可根据文本描述智能地向图像中添加新对象,Diffree让你只需一句话就可以为您的图片添加新元素,不需要复杂的操作就可以体验简单高效的图像编辑工具。

Stablecog

Stablecog 是一款基于人工智能技术的开源图像生成工具,能够根据文本描述或现有图片生成逼真的艺术作品。它支持多种艺术风格,具备图像编辑和调整功能,适用于艺术创作、设计、社交媒体内容制作等多个领域。

绘世启动器

绘世启动器是由B站UP主@秋葉aaaki开发的电脑桌面应用,旨在简化Stable Diffusion-WebUI项目的启动和管理。它支持一键启动、修复、更新、模型下载、模型管理和模型训练等功能,特别适合低配电脑和无编程基础的用户。启动器内置疑难解答系统,能够诊断并解决常见错误,同时支持部署SD-WebUI、ComfyUI等多种WebUI界面,便于用户构建完整的环境。

GoEnhance

GoEnhance换脸工具是一个100%免费的在线服务,允许用户在视频和图像中进行脸部交换,使用AI技术无缝替换人物脸部。

VectorArt.ai

VectorArt.ai 是一款基于人工智能技术的在线平台,专注于通过文本或草图生成高质量的矢量图像。它支持 SVG 格式,具备无损缩放特性,适用于网页设计、平面印刷等多个场景。主要功能包括文本到图像生成、草图到图像转换、自定义 SVG 创建及多种插画风格选择,同时提供免费图像资源和布局优化工具。

AIbus

Albus是一款基于ChatGPT的实时白板应用,旨在帮助用户深入探索感兴趣的主题、学习新技能。它具备自动扩展内容、生成问题、搜索图片、创建思维导图等核心功能,同时支持图像生成、语音叙述及多语言对话,可应用于个人学习、创意生成、教育场景及团队协作,提供便捷高效的AI辅助体验。

BGE

BGE-VL是由北京智源研究院联合高校开发的多模态向量模型,基于大规模合成数据MegaPairs训练,具备高效的多模态数据合成方法和强大的泛化能力。它支持图文检索、组合图像检索和多模态嵌入等功能,适用于智能搜索、内容推荐、图像编辑辅助等多个领域。模型在多种任务中表现优异,尤其在组合图像检索方面取得显著成果。

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架,通过高质量提示构建、偏好采样和分布加权机制,提升图像质量和与人类偏好的对齐度,减少训练崩溃风险。它具备自演化能力,降低对大规模数据的依赖,广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。