自动化

O1

O1-CODER是一款由北京交通大学研究团队开发的开源编码工具,专精于编程任务。它通过结合强化学习和蒙特卡洛树搜索技术,实现了从伪代码到完整代码的生成,并通过测试用例生成器和过程奖励模型优化代码质量。该工具支持自动化代码生成、代码质量提升、教育辅助以及软件测试等多种应用场景。

Embodied Reasoner

Embodied Reasoner是由多家科研机构联合开发的具身交互推理模型,通过视觉搜索、推理与行动协同完成复杂任务。采用模仿学习、自我探索和自我修正三阶段训练方法,生成多样化思考过程,提升任务规划效率。在长时序任务中表现优异,减少重复搜索和逻辑错误。适用于智能家居、仓储物流、医疗辅助等多个场景,具备多模态交互和强推理能力。

Smithery

Smithery 是一个基于 Model Context Protocol(MCP)的服务器托管平台,提供集中化发现、托管与分发服务。通过标准化接口,简化 AI 系统与外部数据源的集成,提升开发效率和系统可扩展性。适用于智能 IDE、客服系统、推荐引擎、自动化工作流及研究分析等多种场景,助力 AI 应用的高效开发与部署。

Agent

Agent-S 是一款基于图形用户界面(GUI)的人机交互自动化框架,通过经验增强的分层规划和代理-计算机接口(ACI),实现了复杂任务的自动化分解与执行。它结合多模态大型语言模型(MLLMs)进行推理和控制,并具备持续学习和跨操作系统通用性的特点,适用于办公自动化、网页交互、个人助理、客户服务和教育等多个场景。

OOMOL

OOMOL(悟墨)是一款基于 VSCode 的现代化 IDE,专为工作流自动化设计。通过拖拽式界面,用户可快速构建复杂流程,无需编程基础。内置 Python 和 Node.js 环境,结合容器化技术实现跨平台一致性和数据安全。原生支持 AI 功能,涵盖数据科学、多媒体处理和模型开发等场景,适合开发者高效构建和共享工作流。

Comic Translate

Comic Translate 是一款基于开源框架的漫画翻译工具,支持多语言翻译,涵盖英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等主流语言。它利用深度学习技术和图像处理库,实现从文本检测、OCR 到翻译渲染的全流程自动化,旨在帮助用户突破语言限制,享受跨文化阅读体验。同时,该工具支持自定义翻译服务,适合个人娱乐、教育学习、翻译本地化及学术研究等多个领域。

easypic

Easypic 是一款基于人工智能的在线图片处理工具,专为快速去除图片背景而设计。它支持多种图片格式和应用场景,如人像、电商产品、动植物及设计元素等。工具具备高效的AI抠图能力,可保持图像主体完整性,并提供背景替换和高清导出功能。目前,Easypic 为用户提供免费服务,适合各类图像编辑需求。

Find3D

Find3D是一款由加州理工学院开发的3D部件分割模型,通过自动化数据生成技术和对比学习方法,实现了高效且精准的3D对象分割。它能够在多个数据集上达到三倍于次优方法的性能提升,支持开放世界下的任意文本查询分割,广泛应用于机器人、虚拟现实、建筑设计等领域。

SocialBook

专注于海外网红营销领域。SocialBook利用人工智能、大数据和区块链技术,为品牌提供一站式的网红合作解决方案。

PaperFake

PaperFake是一款利用先进大模型技术支持的论文写作平台,能够快速生成原创性高的论文初稿,支持多种格式输出并附带辅助材料,显著提升学术写作效率。其核心技术降低了AIGC痕迹,确保了论文的原创性和查重率达标,适用于各类学术与非学术写作场景。