机器学习 - 智狐AI导航

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 562 浏览

AgentPrune

AgentPrune 是一种针对大型语言模型驱动的多智能体系统的通信优化框架，通过“剪枝”技术减少冗余通信内容，降低通信成本并提升系统性能。其核心技术包括时空图建模、低秩稀疏图掩码和一次性剪枝，可在 AutoGen 和 GPTSwarm 等框架中无缝集成，实现高达 72.8% 的 token 减少。同时具备对抗攻击防御能力，适用于复杂任务协作和工业级应用。

AI项目与工具 2025年06月11日 27 点赞 0 评论 723 浏览

The AI Scientist

The AI Scientist-v2 是一个端到端的 AI 系统，能够自主完成从提出科学假设到撰写论文的全流程科研任务。它采用基于代理的树搜索方法，提高科学探索效率，并结合视觉-语言模型优化内容质量。该系统已成功生成并通过同行评审的 AI 论文，标志着 AI 在科学研究领域的重大突破。适用于科研自动化、机器学习、跨学科研究及教育等多个场景。

AI项目与工具 2025年06月11日 34 点赞 0 评论 664 浏览

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 666 浏览

Kimina

Kimina-Prover是由月之暗面与Numina团队联合开发的大型数学定理证明模型，采用强化学习技术，在Lean 4语言中实现类人逻辑推理与严谨证明。其“形式化推理模式”结合非形式化推理与代码片段，提升解题效率。在miniF2F基准测试中达到80.7%准确率，显著优于现有模型。具备高样本效率与良好可扩展性，适用于科研、软件测试、算法验证等多个领域。1.5B和7B参数版本已开源。

AI项目与工具 2025年06月11日 33 点赞 0 评论 889 浏览

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型，具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法，提升语言与视觉理解效率，并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署，适用于智能交互、图像识别、视频分析及客服系统等多种场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 574 浏览

MineWorld

MineWorld是由微软研究院开发的基于《我的世界》的实时交互式AI模型，采用视觉-动作自回归Transformer架构，实现高保真、可控性强的场景生成。通过并行解码算法，模型可在每秒4至7帧的速度下实现实时交互，适用于具身智能、强化学习、游戏代理及视频生成等场景。其核心技术包括图像与动作标记器、Transformer解码器以及优化的训练与推理流程。

AI项目与工具 2025年06月11日 93 点赞 0 评论 864 浏览

HumanRig

HumanRig是由阿里巴巴团队研发的3D人形角色自动绑定系统，提供大规模高质量数据集和先进算法，支持从粗到细的骨架估计与蒙皮优化。其核心组件包括先验引导骨架估计器（PGSE）和网格-骨架互注意网络（MSMAN），适用于游戏开发、影视制作、VR/AR及数字人应用，有效提升3D角色动画制作效率和质量。

AI项目与工具 2025年06月11日 11 点赞 0 评论 866 浏览

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型，专为时间序列数据的理解与推理设计，具备 140 亿参数规模。通过合成数据对齐技术提升任务表现，支持自然语言交互，可应用于金融、气象、工业、医疗和运维等多个场景，提供数据分析、预测与诊断功能。模型已开源，便于开发者使用和扩展。

AI项目与工具 2025年06月11日 73 点赞 0 评论 875 浏览

Yuxi

Yuxi-Know是一款基于RAG和知识图谱技术的智能问答平台，支持多种文档格式上传与向量化存储，可高效检索并生成准确答案。集成Neo4j知识图谱，支持复杂关系查询，兼容多模型平台及本地部署。提供智能体拓展、网页检索和可视化配置功能，适用于企业知识管理、教育、客服、医疗及科研等领域，提升信息处理效率与准确性。

AI项目与工具 2025年06月11日 78 点赞 0 评论 619 浏览

机器学习

首页

机器学习

列表

默认

浏览次数

发布日期