Oryx

简介：Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型，专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块，支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异，广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

AI小编 618 阅读 0 评论 100 点赞

项目地址

Oryx是由清华大学、腾讯和南洋理工大学联合研发的多模态大型语言模型（MLLM），具备处理视觉数据的核心创新能力，包括预训练的OryxViT模型和动态压缩模块。OryxViT能够将任意分辨率的图像转化为适合LLM的视觉表示，而动态压缩模块可根据任务需求在1到16倍范围内压缩视觉标记，从而实现灵活处理各种分辨率和时长的视觉输入。Oryx在多个视觉-语言基准测试中表现出色，尤其在空间和时间理解方面具有显著优势。

本文分类：AI项目与工具
本文标签：多模态大型语言模型视觉数据处理动态压缩空间理解时间理解图像分析视频编辑自然交互教育辅助
浏览次数：618 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://sihangdaima.com/AIxiangmuyugongju/11169.html

评论列表共有 0 条评论

暂无评论

Oryx

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复