大型语言模型

braintrust

Braintrust 是一个端到端的 AI 工具平台，专注于通过迭代式的工作流帮助公司快速构建高效的 AI 应用。它提供了强大的提示调整、评分器配置及数据集管理功能，支持从模型评估到质量控制的全流程优化。此外，Braintrust 的直观界面和代码库集成特性使其适用于各类用户群体，广泛应用于 AI 产品开发、模型评估、质量控制及数据集构建等领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 855 浏览

SCoRe

SCoRe是一种由谷歌DeepMind提出的基于强化学习的多轮训练方法，旨在提高大型语言模型的自我纠错能力。它通过模型自动生成的数据进行训练，并采用正则化约束与奖励机制，有效提升了模型在数学、编程等任务中的准确性。此外，SCoRe能够适应训练与推理过程中的数据分布差异，展现出较强的灵活性与实用性。

AI项目与工具 2025年06月12日 42 点赞 0 评论 859 浏览

LightEval

LightEval是一款由Hugging Face开发的轻量级AI评估工具，旨在评估大型语言模型。它支持多设备运行，包括CPU、GPU和TPU，具备多任务处理能力和自定义评估功能。LightEval与Hugging Face的生态系统集成，便于模型管理和共享。适用于企业、科研人员及教育机构。

AI项目与工具 2025年06月12日 95 点赞 0 评论 911 浏览

MLE-Agent是一款面向机器学习工程师和研究人员的智能助手，具备自动化基线创建、智能调试、文件系统集成、工具集成和交互式命令行界面等功能。它通过集成大型语言模型（LLM）、自动化机器学习（AutoML）、代码生成和检索（Code Generation and Retrieval）以及智能调试（Smart Debugging）等技术，提供无缝的AI工程和研究体验。MLE-Agent支持与多个AI

AI项目与工具 2025年06月12日 15 点赞 0 评论 1022 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期

braintrust

SCoRe

LightEval

MLE

大型语言模型 首页 大型语言模型

列表 默认 浏览次数 发布日期

braintrust

SCoRe

LightEval

MLE

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期