模型

AndroidGen

AndroidGen 是一个基于大语言模型(LLM)的智能代理框架,专注于提升 Agent 在数据稀缺环境下的任务执行能力。它通过无监督方式收集用户操作轨迹并进行训练,结合 ExpSearch、ReflectPlan、AutoCheck 和 StepCritic 四个核心模块,增强任务规划、执行和评估能力。该框架在 AndroidWorld 和 AitW 基准测试中表现出色,适用于自动化任务处理、

MCPHub

MCPHub 是一个集成了多种 MCP 服务器的聚合平台,支持将多个服务器整合至流式 HTTP(SSE)端点,提供集中式管理界面和协议兼容性。具备热插拔配置、访问控制、安全认证等功能,支持 Docker 部署,适用于 AI 工具集成、多模型协同及私有化部署等场景,提升 AI 开发与管理效率。

MME

MME-CoT 是一个用于评估大型多模态模型链式思维推理能力的基准测试框架,涵盖数学、科学、OCR、逻辑、时空和一般场景六大领域,包含1,130个问题,每题均附关键推理步骤和图像描述。该框架引入推理质量、鲁棒性和效率三大评估指标,全面衡量模型推理能力,并揭示当前模型在反思机制和感知任务上的不足,为模型优化和研究提供重要参考。

Kiss3DGen

Kiss3DGen是一款基于2D扩散模型的3D资产生成框架,通过“3D Bundle Image”结构实现多视角图像与法线图的融合,从而高效生成和编辑3D模型。它支持文本与图像输入,具备3D编辑、网格优化和纹理增强等功能,适用于游戏开发、影视制作、VR/AR、数字孪生及教育等多个领域。

NodeTool

NodeTool是一款开源的AI工作流可视化构建工具,通过图形化界面和无代码开发环境,用户可以便捷地集成并运行多种AI模型。它支持本地GPU运行、云服务扩展以及多模态数据处理,适用于图像生成、音乐创作、音频转视觉艺术等多个领域,为非技术用户提供高效且灵活的AI解决方案。 ---

TrackVLA

TrackVLA是银河通用推出的端到端导航大模型,具备纯视觉环境感知、语言指令驱动、自主推理和零样本泛化能力。它能在复杂环境中自主导航、灵活避障,并根据自然语言指令识别和跟踪目标对象。无需提前建图,适用于多种场景,如陪伴服务、安防巡逻、物流配送等,为具身智能商业化提供支撑,推动机器人走向日常生活。

Docky AI

多合一AI助手,集成了 ChatGPT、 GPT-4o,为您的对话、阅读和写作提供无缝帮助,助力您的工作效率飞跃。

BlueLM

BlueLM-V-3B是一种针对移动设备设计的多模态大型语言模型,结合了高效算法与系统优化,支持快速、低功耗的文本与图像处理。其主要特性包括多模态理解、实时响应、隐私保护、高效率部署及跨语言能力。该模型通过动态分辨率调整、批量图像编码及令牌下采样等技术,实现了在有限资源下的高性能表现。

360Zhinao2

360Zhinao2-7B是一款由360公司开发的大规模AI语言模型,具备强大的语言理解和生成能力,支持多语言交流和复杂的数学逻辑推理。其核心特性包括灵活的上下文处理、高效的训练技术和广泛的适用性,可应用于智能客服、教育辅助、内容创作和信息检索等多个领域。

Bestprompts

一个中文行业prompt收录网站。 一个全行业AI会话辅助工具,为各行业的内容创作者提供全面准确的提示语。