模型

Find3D

Find3D是一款由加州理工学院开发的3D部件分割模型,通过自动化数据生成技术和对比学习方法,实现了高效且精准的3D对象分割。它能够在多个数据集上达到三倍于次优方法的性能提升,支持开放世界下的任意文本查询分割,广泛应用于机器人、虚拟现实、建筑设计等领域。

Agent

Agent-S 是一款基于图形用户界面(GUI)的人机交互自动化框架,通过经验增强的分层规划和代理-计算机接口(ACI),实现了复杂任务的自动化分解与执行。它结合多模态大型语言模型(MLLMs)进行推理和控制,并具备持续学习和跨操作系统通用性的特点,适用于办公自动化、网页交互、个人助理、客户服务和教育等多个场景。

O1

O1-CODER是一款由北京交通大学研究团队开发的开源编码工具,专精于编程任务。它通过结合强化学习和蒙特卡洛树搜索技术,实现了从伪代码到完整代码的生成,并通过测试用例生成器和过程奖励模型优化代码质量。该工具支持自动化代码生成、代码质量提升、教育辅助以及软件测试等多种应用场景。

Bytespider

Bytespider 是一款由字节跳动推出的网络爬虫工具,凭借极高的数据抓取速度和多线程处理技术,支持互联网数据的高效采集与分析。该工具不仅用于优化字节跳动的AI语言模型,还广泛应用于搜索引擎构建、市场情报分析、客户洞察、内容监控和学术研究等多个场景。

OWL

OWL是一款基于CAMEL-AI框架的多智能体协作系统,支持任务自动化、角色分配与动态交互。其核心功能包括任务分解、记忆模块、灵活部署及大模型驱动的智能体架构。适用于知识工作、智能交通、医疗健康、电商推荐和环境监测等多个场景,提升任务执行效率与智能化水平。

Jan.ai

ChatGPT 的开源、托管替代品,jan.ai可在您的计算机上100%离线运行。

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架,专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力,可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域,同时支持预训练模型微调和端到端开发流程,为企业提供高效灵活的解决方案。

Rodin

Rodin是一款由影眸科技开发的AI驱动3D生成工具,专注于快速生成高质量的3D模型。它支持文本提示和图片输入生成3D资产,具备多视图融合、模型调整及材质生成等功能,适用于游戏开发、角色建模、虚拟现实等多种场景,同时兼顾生成效率与细节表现,但需进一步优化精度与数据集适应性。

Qwen Chat

Qwen Chat是阿里通义推出的AI交互平台,支持多模型对比、文档问答、图像理解、HTML展示及代码生成等功能。用户可通过上传文档或图片进行精准问答与内容分析,同时支持生成图表、代码等人工制品。适用于教育、开发、内容创作及企业办公等多个场景,提升工作效率与用户体验。

AgentRefine

AgentRefine 是由北京邮电大学与美团联合开发的智能体合成框架,采用“精炼调整”方法提升基于大语言模型的智能体在多样化任务中的泛化能力。它通过轨迹中的观察实现错误纠正与自我优化,增强智能体在复杂环境中的适应性和鲁棒性。该框架支持多样化推理路径,广泛应用于自动化决策、游戏 AI、代码生成及自然语言处理等领域。