多模态 - 智狐AI导航

LlamaV

LlamaV-o1是由阿联酋穆罕默德·本·扎耶德人工智能大学等机构开发的多模态视觉推理模型，具备结构化推理和透明性，支持文本、图像和视频等多种模态的信息处理。该模型引入了VRC-Bench基准测试，涵盖4000多个推理步骤，用于全面评估推理能力。其性能优于多个开源模型，适用于医疗影像分析、金融数据解读、教育辅助和工业检测等场景，具有高准确性和可解释性。

AI项目与工具 2025年06月12日 74 点赞 0 评论 654 浏览

万兴天幕大模型

万兴天幕大模型是万兴科技AILab的创新成果，展现了其在多媒体领域的深厚技术积累和前瞻性布局。通过自研技术和多年行业经验，天幕大模型为全球创作者提供了一个强大的工具，以实现...

创作工具 2026年07月28日 0 点赞 0 评论 655 浏览

LMArena AI

前身为lmsys.org，是一个专注于众包AI基准测试的开放平台，用户可以在此平台上免费与AI聊天并进行投票，比较和测试不同的AI聊天机器人。

Ai平台模型 2025年06月05日 13 点赞 0 评论 655 浏览

OpenVision

OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列，具备从5.9M到632.1M参数的多种模型，适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略，训练效率比同类模型高2至3倍，在多模态任务中表现优异。支持可变大小patch输入，兼具灵活性与高效性，广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。

AI项目与工具 2025年06月11日 58 点赞 0 评论 655 浏览

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型，能够生成长达10秒的高清视频片段，支持文本到视频、图像到视频的转换，并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情，提供运动画笔、高级相机控制和导演模式等高级控制工具，确保内容的安全性和合规性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 656 浏览