图像编码 - 智狐AI导航

IP

一个强大的工具，它通过引入图像提示来增强文本到图像扩散模型的能力。它的设计轻量且高效，易于部署和使用，同时支持广泛的应用场景，包括图像生成、转换和修复。通过解耦的交叉...

Ai平台模型 1970年01月01日 0 点赞 0 评论 314 浏览

FastVLM

FastVLM是一款高效的视觉语言模型，采用FastViTHD混合视觉编码器，显著提升高分辨率图像处理速度并减少token数量。其在保持高性能的同时，降低了计算成本和模型复杂度。适用于视觉问答、图文匹配、文档理解、图像描述生成等多模态任务，具备良好的实用性和扩展性。

AI项目与工具 2025年06月11日 85 点赞 0 评论 675 浏览

SmolVLM是一款由Hugging Face开发的轻量级视觉语言模型，专为设备端推理设计。该模型具有三个版本，包括SmolVLM-Base、SmolVLM-Synthetic和SmolVLM-Instruct，分别适用于不同的应用场景。SmolVLM借鉴了Idefics3的理念，采用SmolLM2 1.7B作为语言主干，并通过像素混洗技术提升视觉信息的压缩效率。其训练数据集包括Cauldron和

AI项目与工具 2025年06月12日 62 点赞 0 评论 612 浏览

图像编码

首页

图像编码

列表

默认

浏览次数

发布日期

IP

FastVLM

SmolVLM

图像编码 首页 图像编码

列表 默认 浏览次数 发布日期

IP

FastVLM

SmolVLM

图像编码

首页

图像编码

列表

默认

浏览次数

发布日期