机器人

BALROG

BALROG是一款用于评估大型语言模型(LLMs)和视觉语言模型(VLMs)在游戏环境中推理能力的框架。它通过程序化生成的游戏环境,测试模型的规划、空间推理及探索能力,并提供细粒度的性能指标和公开排行榜,以促进AI技术的发展,适用于游戏AI开发、机器人技术、虚拟现实等多个领域。

什么是机器人流程自动化(Robotic Process Automation, RPA)

机器人流程自动化(RPA)是一种通过模拟人类操作实现业务流程自动化的软件技术,主要应用于财务、人力资源、客户服务等领域。其核心技术包括软件机器人和控制中心,能够显著提升效率、减少错误、降低成本。结合人工智能后,RPA还能处理更复杂的认知任务,但需应对系统集成、数据安全及定制化需求等挑战。

iDP3

iDP3是一种基于自我中心3D视觉表征的改进型人形机器人运动策略,由斯坦福大学等机构联合开发。它摒弃了对精确相机校准和点云分割的需求,具备出色的视图、对象及场景泛化能力,可高效适应未知环境。此外,其优化的视觉编码器和扩散模型进一步提高了学习和推理性能,在家庭、工业、医疗、搜救及教育等领域具有广泛应用潜力。

Llama 3.3

Llama 3.3是一款由Meta AI开发的70B参数大型多语言预训练语言模型,支持英语、德语、法语等8种语言的输入输出。它具备长上下文窗口、高效运行和低成本的特点,可与第三方工具集成,广泛应用于聊天机器人、客户服务、语言翻译、内容创作及教育等领域。

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型,通过“扩展-压缩”策略优化处理高分辨率图像和长视频,兼具效率与准确性。它在图像和视频基准测试中表现优异,支持时间定位、机器人导航和医疗成像等应用场景,并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

RDT

RDT是清华大学AI研究院推出的一款双臂机器人操作任务扩散基础模型,拥有十亿参数量,可自主完成复杂任务,如调酒和遛狗。该模型基于模仿学习,具备强大的泛化能力和操作精度,支持多种模态输入和少样本学习。RDT已在餐饮、家庭、医疗、工业及救援等领域展现广泛应用前景,推动机器人技术发展。

Superchat

Superchat是一款为企业设计的全渠道消息服务平台,支持整合WhatsApp、Instagram和Facebook Messenger等沟通渠道,通过AI聊天机器人实现全天候客户服务,同时具备客户关系管理、自动化新闻通讯、多语言支持及产品销售等功能,旨在提升企业与客户之间的沟通效率和客户满意度。

Genesis

Genesis是一款基于开源架构的生成式物理引擎,具备高度准确的物理模拟能力,涵盖物体运动、流体力学、碰撞检测等领域。其显著特点包括超高速模拟、轻量级机器人仿真平台、照片级真实感渲染以及支持自然语言输入的数据生成功能。Genesis旨在推动通用机器人、具身AI及物理AI的发展,适用于机器人训练、游戏开发、影视特效制作等多个领域。

ERA

ERA-42是一款由北京星动纪元开发的端到端原生机器人大模型,结合五指灵巧手星动XHAND1,可执行超过100种复杂灵巧操作任务。ERA-42无需预编程,具有快速学习能力,能在短时间内掌握新技能。该模型融合多模态信息,具备强大的跨模态能力和泛化能力,适用于工业自动化、医疗辅助、家庭服务、灾难救援和物流配送等多种场景。

ASAL

ASAL是一款基于基础模型设计的自动化人工生命探索工具,支持有监督目标搜索、开放式搜索和照明式搜索三大功能模块。它能够在多种人工生命基质中运行,提供定量分析能力,帮助研究者发现新颖且多样的生命现象。ASAL的技术核心包括视觉-语言基础模型、嵌入与相似性测量、优化算法及搜索策略,广泛应用于生物进化研究、智能机器人行为模拟、游戏AI开发等领域。 ---