HelloEval

首页

HelloEval

HelloBench 是一款开源基准测试工具，专注于评估大型语言模型在长文本生成任务中的表现。它基于布鲁姆分类法设计了五个子任务，并采用 HelloEval 方法实现高效自动化评估。该工具支持多领域应用，包括模型开发、学术研究、产品测试等，同时揭示了现有模型在长文本生成中的局限性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 826 浏览