模型性能评估

首页

模型性能评估

列表

默认

浏览次数

发布日期

WiS

WiS是一个基于“谁是卧底”游戏规则的在线AI竞赛平台，专为评估和分析大型语言模型（LLMs）在多智能体系统中的行为而设计。平台提供统一的模型评估接口、实时排行榜、全面的行为评估功能以及详尽的数据可视化支持，旨在为研究人员和开发者提供一个直观且高效的工具，用于测试和优化智能体在复杂交互环境中的表现。

AI项目与工具 2025年06月12日 20 点赞 0 评论 701 浏览

模型性能评估 首页 模型性能评估

列表 默认 浏览次数 发布日期

WiS

模型性能评估

首页

模型性能评估

列表

默认

浏览次数

发布日期