大型语言模型

MLE

MLE-Agent是一款面向机器学习工程师和研究人员的智能助手，具备自动化基线创建、智能调试、文件系统集成、工具集成和交互式命令行界面等功能。它通过集成大型语言模型（LLM）、自动化机器学习（AutoML）、代码生成和检索（Code Generation and Retrieval）以及智能调试（Smart Debugging）等技术，提供无缝的AI工程和研究体验。MLE-Agent支持与多个AI

AI项目与工具 2025年06月12日 15 点赞 0 评论 824 浏览

SCoRe

SCoRe是一种由谷歌DeepMind提出的基于强化学习的多轮训练方法，旨在提高大型语言模型的自我纠错能力。它通过模型自动生成的数据进行训练，并采用正则化约束与奖励机制，有效提升了模型在数学、编程等任务中的准确性。此外，SCoRe能够适应训练与推理过程中的数据分布差异，展现出较强的灵活性与实用性。

AI项目与工具 2025年06月12日 42 点赞 0 评论 757 浏览

braintrust

Braintrust 是一个端到端的 AI 工具平台，专注于通过迭代式的工作流帮助公司快速构建高效的 AI 应用。它提供了强大的提示调整、评分器配置及数据集管理功能，支持从模型评估到质量控制的全流程优化。此外，Braintrust 的直观界面和代码库集成特性使其适用于各类用户群体，广泛应用于 AI 产品开发、模型评估、质量控制及数据集构建等领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 734 浏览

LightEval

LightEval是一款由Hugging Face开发的轻量级AI评估工具，旨在评估大型语言模型。它支持多设备运行，包括CPU、GPU和TPU，具备多任务处理能力和自定义评估功能。LightEval与Hugging Face的生态系统集成，便于模型管理和共享。适用于企业、科研人员及教育机构。

AI项目与工具 2025年06月12日 95 点赞 0 评论 731 浏览

CodeArena

CodeArena是一个在线平台，用于实时比较多个大型语言模型（LLM）的代码生成能力。它通过实时渲染和排名机制，帮助开发者评估LLM的性能，包括代码的可读性、效率和准确性。CodeArena集成了开发者工具，支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 729 浏览

Agent Laboratory

Agent Laboratory是由AMD与约翰·霍普金斯大学合作开发的基于大型语言模型的研究辅助工具，支持从文献综述到报告撰写的全流程科研任务。它具备实验设计、代码生成、结果分析等功能，并通过多代理协作和用户反馈机制提升研究质量。实验表明其可显著降低研究成本，适用于机器学习、生物医学等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 712 浏览

Goedel

Goedel-Prover是一款由多所高校联合开发的开源大型语言模型，专注于自动化数学问题的形式化证明生成。它通过将自然语言数学问题转化为形式语言（如Lean 4），生成准确且完整的证明过程。采用专家迭代方法持续优化模型性能，在多项基准测试中表现优异。该工具可应用于数学研究、教学、软件验证及AI算法验证等领域，具备强大的数学推理能力和广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 712 浏览

SAC

SAC-KG是一个基于大型语言模型（LLMs）的框架，用于自动化构建领域知识图谱。它包含生成器、验证器和剪枝器三大组件，能从原始语料库生成高精度的特定领域知识图谱，适用于医学、生物学等专业领域。SAC-KG支持大规模数据处理，其精度可达89.32%，显著优于现有方法。

AI项目与工具 2025年06月12日 65 点赞 0 评论 706 浏览

FinRobot

FinRobot是一款开源的AI代理平台，专注于金融领域的应用，基于大型语言模型（LLMs）构建能够执行复杂分析和决策的专业金融AI代理。平台通过金融思维链（CoT）提示功能提升分析能力，并通过开源方式促进AI在金融决策中的广泛应用。架构涵盖金融AI代理层、金融LLM算法层、LLMOps和DataOps层以及多源LLM基础模型层，支持市场预测、文档分析及交易策略等多种金融专业AI代理。

AI项目与工具 2025年06月12日 74 点赞 0 评论 698 浏览

CursorCore

CursorCore 是一款基于大型语言模型的编程辅助工具，通过对话式交互支持代码补全、修改和错误修复。它整合代码历史、上下文信息及用户指令，利用自动化数据生成管道和基准测试优化模型性能，适用于日常编码、代码审查、教学学习及遗留代码维护等多个场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 698 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期

MLE