机器学习 - 智狐AI导航

APB

APB是一种由清华大学等机构开发的分布式长上下文推理框架，通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block，结合查询感知的上下文压缩技术，减少计算开销并精准传递关键信息。在128K长度文本上，APB推理速度比Flash Attention快10倍，比Star Attention快1.6倍，适用于多种分布式环境和模型规模，广泛

AI项目与工具 2025年06月12日 64 点赞 0 评论 812 浏览

Instella

Instella是AMD推出的30亿参数开源语言模型，基于自回归Transformer架构，支持4096标记序列，具备强大的自然语言理解、指令跟随和多轮对话能力。通过多阶段训练和高效优化技术，Instella在多个任务中表现优异，适用于智能客服、内容创作、教育辅导、编程辅助和企业知识管理等多个场景。AMD全面开放了模型资源，促进AI技术发展与社区合作。

AI项目与工具 2025年06月12日 79 点赞 0 评论 635 浏览

Tesseract

Tesseract是一款开源的光学字符识别（OCR）引擎，支持多语言识别和多种图像格式。其具备高精度的文字识别能力，适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行，并提供丰富的编程接口和自定义训练功能，便于开发者集成和优化识别效果。

AI项目与工具 2025年06月12日 12 点赞 0 评论 645 浏览

SpatialLM

SpatialLM 是一款由群核科技推出的开源空间理解多模态模型，能通过分析普通手机拍摄的视频生成详细的 3D 场景布局，涵盖房间结构、家具摆放等信息。它结合大语言模型与点云重建技术，实现空间认知与语义标注，并支持低成本数据采集。该模型适用于具身智能训练、AR/VR、建筑设计等多个领域，具备物理规则嵌入和结构化场景生成能力。

AI项目与工具 2025年06月12日 82 点赞 0 评论 394 浏览

AndroidGen

AndroidGen 是一个基于大语言模型（LLM）的智能代理框架，专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练，结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块，增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色，适用于自动化任务处理、

AI项目与工具 2025年06月12日 31 点赞 0 评论 827 浏览

ReasonGraph

ReasonGraph 是一个开源平台，用于可视化和分析大语言模型（LLM）的推理过程。它支持多种主流模型和推理方法，提供直观的图表展示和交互式功能，帮助用户理解 AI 思考逻辑、优化模型表现。模块化设计使其易于扩展，适用于学术研究、教育、开发等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 766 浏览

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的高性能 AI 模型，具备深度推理能力，可在多模态输入下进行复杂任务处理。支持文本、图像、音频、视频及代码等多种输入形式，拥有 100 万 token 的上下文窗口。在推理、代码生成和多模态任务中表现优异，适用于学术研究、软件开发、创意工作和企业应用等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 698 浏览

TripoSG

TripoSG 是一种基于大规模修正流模型的高保真 3D 形状生成技术，能够从单张图像生成高质量的 3D 网格模型。其核心优势包括高分辨率重建、语义一致性、强泛化能力和稳健的性能。通过混合监督训练策略和高质量数据集，TripoSG 实现了更精准的几何表示与细节还原。该技术适用于工业设计、VR/AR、自动驾驶、教育及游戏开发等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 595 浏览

OmniSQL

OmniSQL 是一款开源的文本到 SQL 转换工具，能将自然语言问题精准转化为 SQL 查询语句。它基于大规模数据集 SynSQL-2.5M 进行训练，涵盖 250 万条样本，覆盖 16,000 余个跨领域数据库。支持多种复杂查询类型，提供思维链推理过程，并提供 7B、14B 和 32B 三种模型版本。适用于企业数据分析、教育及跨领域应用，提升数据访问效率与学习体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 660 浏览

AReaL

AReaL-boba 是由蚂蚁技术研究院与清华大学联合推出的开源强化学习训练框架，具备高效训练、推理能力提升、低资源训练等核心功能。其 7B 模型在数学推理任务中表现突出，且支持大规模模型的低成本复现。框架集成 SGLang 推理系统，采用数据蒸馏与工程优化技术，提升训练效率。适用于教育、自然语言处理、智能体开发等领域，具有高度可复现性和开源特性。

AI项目与工具 2025年06月12日 46 点赞 0 评论 447 浏览

机器学习

首页

机器学习

列表

默认

浏览次数

发布日期

APB