评估 - 智狐AI导航

LLM Engineer Toolkit

一个精心整理的LLM工具库，它将120多个与LLM相关的库按照功能和用途进行了细致分类，涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。

Ai学习资源 2025年06月05日 71 点赞 0 评论 577 浏览

CAD

CAD-MLLM 是一款基于多模态输入生成参数化 CAD 模型的系统，融合了文本、图像和点云等多种数据形式。它通过命令序列与大型语言模型的结合，实现了高效的数据对齐与处理，并提出了创新的评估指标。CAD-MLLM 具备强大的鲁棒性和交互式设计能力，适用于工业设计、建筑设计、汽车制造等多个领域。

AI项目与工具 2025年02月07日 61 点赞 0 评论 573 浏览

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集，包含18,000个视频片段，涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随（AIF）基准，用于评估世界模型的预测能力，并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 573 浏览

数英指数

由数英DIGITALING推出的指数型工具，根据入驻企业在数英平台的多维度数据综合得出的指数型工具，用以评估代理商的综合实力、品牌的营销表现。

数据分析 2025年06月05日 25 点赞 0 评论 545 浏览

LMEval

LMEval是谷歌推出的开源框架，用于简化大型语言模型（LLMs）的跨提供商评估。它支持多模态（文本、图像、代码）和多指标评估，兼容Google、OpenAI、Anthropic等主流模型提供商。LMEval基于增量评估引擎，节省时间和计算资源，并通过自加密的SQLite数据库安全存储评估结果。LMEvalboard提供交互式可视化界面，帮助用户分析模型性能并直观比较不同模型的优缺点。

AI项目与工具 2025年06月11日 27 点赞 0 评论 543 浏览

佳医大模型

佳医大模型是一个创新的AI医疗健康服务工具，它通过提供智能化、个性化的医疗健康服务，极大地提升了医疗服务的效率和质量。

Ai平台模型 2026年07月28日 0 点赞 0 评论 435 浏览

OLMo

一个开放的语言模型框架，它为研究人员和开发者提供了一套完整的工具和资源，以促进AI和语言模型的共同进步。

Ai平台模型 2026年07月28日 0 点赞 0 评论 412 浏览

评估

首页

评估

列表

默认

浏览次数

发布日期

LLM Engineer Toolkit

CAD

DrivingDojo

数英指数

LMEval

佳医大模型

OLMo

评估 首页 评估

列表 默认 浏览次数 发布日期

LLM Engineer Toolkit

CAD

DrivingDojo

数英指数

LMEval

佳医大模型

OLMo

评估

首页

评估

列表

默认

浏览次数

发布日期