图像处理

倍客AI

倍客AI是一款面向商业摄影、广告设计和电商展示的人工智能内容创作平台,提供AI商图、AI模特、AI工具、AI文案和AI视频五大功能模块。用户可通过上传图片或输入描述,快速生成高质量的产品图、虚拟模特、文案及视频内容,提升视觉表现力与创作效率。该工具适用于广告制作、内容创作及多媒体展示等多个场景,有效优化传统创作流程。

TryOffAnyone

TryOffAnyone是一款基于Latent Diffusion Models技术的AI工具,专注于从人物照片中提取服装区域并生成平铺展示图。它具备在线图片处理、智能服装识别、背景去除和图像优化等功能,广泛应用于电商平台的商品展示、个性化推荐、库存管理和图像检索等领域,帮助提升用户体验和运营效率。

Skywork R1V

Skywork R1V是昆仑万维推出的首个工业级多模态思维链推理模型,具备强大的视觉链式推理能力,可处理数学问题、科学现象分析、医学影像诊断等复杂任务。其技术基于文本推理能力的多模态迁移与混合式训练方法,在多项基准测试中表现优异。模型开源,适用于教育、医疗、科研、内容审核等多个领域,推动多模态人工智能的发展。

佐糖

佐糖是一款在线处理图片的平台,以智能AI数据处理能力为驱动,提供高效创意编辑服务。它支持抠图、在线消除笔、模糊照片变清晰、裁剪压缩图片等操作,操作简单,只需三步:上传照...

Moondream

Moondream是一款小型的开源人工智能视觉语言模型,具有强大的图像处理能力和灵活性,能够在不同设备上运行。它基于Apache 2.0许可证,支持商业使用,并广泛应用于安全监控、无人机和机器人技术以及零售与购物领域。

OmniSVG

OmniSVG是复旦大学与StepFun联合开发的全球首个端到端多模态SVG生成模型,基于预训练视觉语言模型,通过创新的SVG标记化技术实现结构与细节的解耦,支持从文本、图像或角色参考生成高质量矢量图形。其训练效率高,支持长序列处理,适用于图标设计、网页开发、游戏角色生成等场景,生成结果具备高度可编辑性和跨平台兼容性。

书生·浦像

书生·浦像是由多家科研机构联合开发的超高动态成像算法,核心为浦像HDR(UltraFusion HDR)。它结合AIGC与HDR技术,在极端光照条件下实现图像细节修复和高质量输出,有效解决动态场景中的运动伪影问题。适用于摄影、手机成像和自动驾驶等领域,具有多曝光融合、动态处理、色调映射等功能,提升了图像的鲁棒性与真实感。

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型,主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构,集成了视觉和语言信息,通过Siglip视觉编码器和Qwen-2语言模型,实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

Filmfotos

Filmfotos是一款基于Flux架构的LoRA模型,专注于模拟和还原胶片质感。其低饱和度的日系胶片风格适用于多种场景,包括人物、风景、静物、食物和动物等,能够提升照片的艺术感和复古氛围。Filmfotos利用LoRA技术、深度学习和图像处理算法,实现高精度的图像生成,适用于摄影爱好者、专业人士及创意工作者。

小云雀

小云雀是剪映推出的智能创作Agent,基于AI技术提供视频、数字人口播视频、设计图和图片换背景等功能。用户只需输入指令,即可高效完成内容创作。核心功能包括智能成片、数字人视频、AI设计和AI换背景,界面简洁易用,操作便捷高效。依托字节跳动的云雀大模型,融合深度学习与多模态技术,具备强大的图像生成与视频编辑能力,适用于短视频创作、数字人口播、设计广告、社交媒体内容及教育培训等场景。