模型优化 - 智狐AI导航

FoxBrain

FoxBrain是由鸿海研究院推出的大型语言模型，基于Meta Llama 3.1架构，拥有70B参数，专注于数学与逻辑推理领域。其采用高效训练策略，结合高质量中文数据与Adaptive Reasoning Reflection技术，提升推理能力。FoxBrain适用于智能制造、智慧教育、智能办公等多个场景，支持数据分析、代码生成、文书协作等功能，具备较强的上下文处理能力和稳定性。

AI项目与工具 2025年06月12日 97 点赞 0 评论 814 浏览

Migician

Migician是一款由多所高校联合开发的多模态大语言模型，专为多图像定位任务设计。它基于大规模数据集MGrounding-630k，采用端到端架构和两阶段训练方法，支持跨图像精准定位与多任务处理。Migician适用于自动驾驶、安防监控、医疗影像等多个领域，具有高效的推理能力和灵活的输入方式。

AI项目与工具 2025年06月12日 90 点赞 0 评论 811 浏览

Verifier Engineering

Verifier Engineering是一种创新的后训练方法，通过搜索、验证和反馈三个阶段优化基础模型性能。它采用目标条件马尔可夫决策过程（GC-MDP），结合线性与树搜索算法，对模型输出进行动态调整。其验证器分类涵盖多种形式和粒度，并支持基于训练和推理的反馈方式。这项技术已在自然语言处理、代码生成、教育和内容安全等领域展现广泛潜力，成为提升模型鲁棒性和智能化水平的重要工具。

AI项目与工具 2025年06月12日 79 点赞 0 评论 809 浏览

FastVLM

FastVLM是一款高效的视觉语言模型，采用FastViTHD混合视觉编码器，显著提升高分辨率图像处理速度并减少token数量。其在保持高性能的同时，降低了计算成本和模型复杂度。适用于视觉问答、图文匹配、文档理解、图像描述生成等多模态任务，具备良好的实用性和扩展性。

AI项目与工具 2025年06月11日 85 点赞 0 评论 802 浏览

CAR（Certainty-based Adaptive Reasoning）是字节跳动联合复旦大学推出的自适应推理框架，旨在提升大型语言模型（LLM）和多模态大型语言模型（MLLM）的推理效率与准确性。该框架通过动态切换短答案和长形式推理，根据模型对答案的置信度（PPL）决定是否进行详细推理，从而在保证准确性的同时节省计算资源。CAR适用于视觉问答（VQA）、关键信息提取（KIE）等任务，在数学

AI项目与工具 2025年06月11日 73 点赞 0 评论 800 浏览

Open Code Reasoning

Open Code Reasoning（OCR）是英伟达推出的开源代码推理AI模型，基于Nemotron架构设计，支持多种编程语言。它具备代码生成、逻辑补全、多语言处理及高效推理能力，适用于代码优化、教育、测试等多个场景。OCR提供32B、14B和7B三种参数版本，满足不同计算需求，并与主流框架兼容，具有良好的扩展性。

AI项目与工具 2025年06月11日 10 点赞 0 评论 800 浏览

SmolVLM

SmolVLM是一款由Hugging Face开发的轻量级视觉语言模型，专为设备端推理设计。该模型具有三个版本，包括SmolVLM-Base、SmolVLM-Synthetic和SmolVLM-Instruct，分别适用于不同的应用场景。SmolVLM借鉴了Idefics3的理念，采用SmolLM2 1.7B作为语言主干，并通过像素混洗技术提升视觉信息的压缩效率。其训练数据集包括Cauldron和

AI项目与工具 2025年06月12日 62 点赞 0 评论 796 浏览

LIMO

LIMO是由上海交通大学研发的一种高效推理方法，通过少量高质量训练样本激活大语言模型的复杂推理能力。其核心假设是“少即是多推理假设”，即在预训练阶段已具备丰富知识的模型中，复杂推理能力可通过精心设计的样本被有效激发。LIMO在多个数学推理基准测试中表现优异，且数据使用效率极高，仅需1%的数据即可达到显著效果。适用于教育、科研、工业和医疗等多个领域。

AI项目与工具 2025年06月12日 96 点赞 0 评论 795 浏览

PaperBench

PaperBench是OpenAI开发的AI智能体评测基准，用于评估其复现顶级机器学习论文的能力。它涵盖从理解论文、编写代码到执行实验的全流程，具备8316个评分节点和自动评分系统。支持多种智能体配置，提供标准化测试环境，适用于模型优化、学术验证及教育实践等领域，推动AI研究的标准化发展。

AI项目与工具 2025年06月12日 31 点赞 0 评论 791 浏览

OlympicArena

OlympicArena是由多所高校与研究机构联合开发的多学科认知推理基准测试框架，包含11,163道国际奥赛双语题目，覆盖数学、物理、化学、生物、地理、天文学和计算机科学等7大领域。该平台通过答案级与过程级评估，全面衡量AI模型的逻辑与视觉推理能力，支持多模态输入并具备数据泄漏检测机制，适用于AI模型评估、训练优化、教育辅助及科研应用。

AI项目与工具 2025年06月12日 58 点赞 0 评论 775 浏览

模型优化

首页

模型优化

列表

默认

浏览次数

发布日期