图像生成

Story Flicks

一款开源的基于AI大模型的故事短视频生成工具。用户输入故事主题,就能够迅速生成包含AI生成图像、故事内容以及音频的视频。

Boow

Boow-VTON是一种基于先进图像生成技术和数据增强方法的虚拟试衣技术,无需精确遮罩即可实现高质量试穿效果。该工具通过试穿定位损失和注意力机制,精准识别试穿区域并确保服装自然贴合人体,支持多服装试穿且操作简便。其应用场景包括在线购物、时尚零售、个性化推荐、社交媒体互动及服装设计等多个领域,具有广泛的商业应用价值。

BeautyPlus

BeautyPlus是一款结合AI技术的照片编辑软件,支持iOS、Android及网页端操作。它提供AI图像生成、视频编辑、人像优化等功能,可将普通照片转化为创意艺术作品,并包含裁剪、格式转换、滤镜增强等实用工具,适用于社交媒体内容创作、个人肖像美化、艺术创作及商业用途等多个场景。

Amazon Bedrock

Amazon Bedrock是一款由AWS推出的完全托管型AI服务平台,集成了多家顶级AI公司的基础模型,支持企业通过单一API访问高性能模型。它提供了从基础模型接入、微调到代理构建的一系列功能,包括检索增强生成(RAG)、自动推理检查及多Agent协作等特性。此外,其模型蒸馏技术能够有效提升效率并降低运行成本,广泛适用于文本生成、虚拟助手、图像生成等多种应用场景。

QLIP

QLIP是一种基于二进制球形量化(BSQ)的视觉标记化方法,具备高质量图像重建和零样本图像理解能力。通过对比学习目标和两阶段训练策略,QLIP可作为视觉编码器或图像标记器,广泛应用于多模态任务,如文本到图像生成、图像到文本生成及多模态理解。其技术设计提升了模型的语义表达与训练效率,为统一多模态模型的开发提供了新思路。

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具,采用CLIP和VAE编码提取服装外观先验,并结合服装聚焦适配器和高频细节增强算法,生成高保真试穿图像。它能够精准对齐服装与人体姿态,保留复杂图案与纹理,适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域,提供真实且沉浸式的在线试穿体验。

紫东太初大模型

紫东太初,中科院自动化所和武汉人工智能研究院推出新一代大模型,从三模态走向全模态,支持多轮问答、文本创作、图像生成、3D理解、信号分析等全面问答任务,拥有更强的认知、理解、创作能力,带来全新互动体验。

Whisk

Whisk是一款基于AI的图像生成工具,由谷歌推出,支持用户通过上传图像并指定主题、场景和风格生成新图像。它具备多图像输入、自动图像提示及额外文字细节添加等功能,基于谷歌最新的Imagen 3模型,适用于艺术创作、广告营销、社交媒体内容生产等多个领域,助力用户高效完成创意设计。

Interior AI

Interior AI是一个人工智能图像生成器平台,允许用户上传自己(或其他人)家的图像,并根据17种预选风格之一生成新的外观和布局。它是日益增长的人工智能图像生成器生态系统的一部分...

nijijourney

Nijijourney是一款由Spellbrush和Midjourney合作开发的AI工具,主要功能包括基于文本指令生成二次元风格图像、支持图像风格转换、细节微调以及多语言兼容性。它广泛应用于艺术创作、游戏开发、动画制作、漫画绘制及小说插图等领域,帮助用户高效完成高质量的二次元风格视觉内容。