评估
AndroidLab
AndroidLab 是一款面向 Android 自主代理的训练与评估框架,集成了文本和图像模态操作环境,提供标准化的基准测试任务。它通过支持多种模型类型(LLMs 和 LMMs),覆盖九个应用场景的 138 项任务,有效提升了开源模型的性能。此外,AndroidLab 提供了丰富的评估指标和操作模式,助力研究者优化模型表现并推动开源解决方案的发展。
HIRING.STUDIO
HIRING.STUDIO是一款基于AI技术的面试问题生成平台,专注于优化招聘流程。其核心功能包括智能生成职位相关问题、提供后续问题建议、生成评估标准以及支持多种答案评估模式(如STAR方法)。该工具不仅提升了面试准备的效率和一致性,还增强了面试官对候选人的评价客观性,适用于技术面试、行为面试及团队协作场景,尤其适合校园招聘和远程面试等多样化招聘需求。
Collaborative Gym
Collaborative Gym(Co-Gym)是一款支持人机协作的开发框架,具备异步交互、任务环境设计和多维评估功能。它通过模拟与真实环境支持开发者进行高效迭代与实际部署,适用于旅行规划、表格分析和文献综述等多种协作任务,提升人机协作效率与质量。
Agent K v1.0
Agent K v1.0 是一款端到端自主数据科学智能体,由华为诺亚方舟实验室与伦敦大学学院团队联合开发。该工具能够自动化处理数据科学生命周期中的各个环节,支持多模态数据处理,具备动态多步骤问题解决能力,并通过结构化推理和动态记忆管理实现自我学习与优化。Agent K v1.0 在Kaggle多模态挑战赛中表现优异,广泛应用于金融、医疗、零售、制造及客户服务等领域。
