模型优化 - 智狐AI导航

Math24o

Math24o 是 SuperCLUE 开源的高中奥林匹克数学竞赛级别数学推理测评基准，基于 2024 年全国高中数学竞赛预赛试题，包含 21 道高难度解答题。评测通过程序自动判断答案一致性，客观评估模型正确率。支持自动化评估流程，适用于教育、学术研究和模型优化等领域，为数学推理能力的提升提供重要工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 577 浏览

AReaL

AReaL-boba 是由蚂蚁技术研究院与清华大学联合推出的开源强化学习训练框架，具备高效训练、推理能力提升、低资源训练等核心功能。其 7B 模型在数学推理任务中表现突出，且支持大规模模型的低成本复现。框架集成 SGLang 推理系统，采用数据蒸馏与工程优化技术，提升训练效率。适用于教育、自然语言处理、智能体开发等领域，具有高度可复现性和开源特性。

AI项目与工具 2025年06月12日 46 点赞 0 评论 534 浏览

SWEET

SWEET-RL是Meta开发的多轮强化学习框架，专为提升大型语言模型在协作推理任务中的表现而设计。通过引入训练时的额外信息优化“批评者”模型，实现精准的信用分配与策略优化。在ColBench基准测试中，其在后端编程和前端设计任务中表现出色，成功率提升6%。适用于文本校对、社交媒体审核、广告合规等多种场景，具备高度的通用性和适应性。

AI项目与工具 2025年06月12日 15 点赞 0 评论 865 浏览

PaperBench

PaperBench是OpenAI开发的AI智能体评测基准，用于评估其复现顶级机器学习论文的能力。它涵盖从理解论文、编写代码到执行实验的全流程，具备8316个评分节点和自动评分系统。支持多种智能体配置，提供标准化测试环境，适用于模型优化、学术验证及教育实践等领域，推动AI研究的标准化发展。

AI项目与工具 2025年06月12日 31 点赞 0 评论 735 浏览

OlympicArena

OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架，包含11,163道国际奥赛双语题目，覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估，全面衡量AI模型的逻辑与视觉推理能力，支持多模态输入并具备数据泄漏检测机制，适用于AI模型评估、训练优化、教育辅助及科研应用。

AI项目与工具 2025年06月12日 58 点赞 0 评论 698 浏览

Gemini 2.5 Flash

Gemini 2.5 Flash 是 Google 推出的高性能 AI 模型，具备低延迟、高效率及推理能力，适用于代码生成、智能代理和复杂任务处理。其优化设计降低了计算成本，适合大规模部署。该模型基于 Transformer 架构，结合推理机制和模型压缩技术，提升了响应速度与准确性，广泛应用于智能开发、内容生成和实时交互等领域。

AI项目与工具 2025年06月12日 33 点赞 0 评论 887 浏览

明岐

明岐是上海交通大学LoCCS实验室开发的医学多模态大模型，专注于罕见病精准诊断。它整合影像、病历与化验数据，采用双引擎架构实现高精度、可解释的诊断，准确率超92%。通过模型优化技术，支持低成本本地化部署，适用于基层医疗、远程服务及科研教学，助力医疗资源均衡发展。

AI项目与工具 2025年06月11日 28 点赞 0 评论 927 浏览

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型，采用量化感知训练技术，在降低显存需求的同时保持高性能。它支持多模态任务，具备 128,000-token 长上下文处理能力，并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景，同时兼容多种推理框架，便于部署。

AI项目与工具 2025年06月11日 44 点赞 0 评论 618 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 775 浏览

Miras

Miras是由谷歌开发的深度学习框架，专注于序列建模任务。它基于关联记忆和注意力偏差机制，整合多种序列模型并支持新型模型设计。Miras通过保留门机制优化记忆管理，提升模型在长序列任务中的表现，适用于语言建模、常识推理、长文本处理及多模态任务，具有高效且灵活的架构优势。

AI项目与工具 2025年06月11日 58 点赞 0 评论 675 浏览

模型优化

首页

模型优化

列表

默认

浏览次数

发布日期