机器人

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型,通过“扩展-压缩”策略优化处理高分辨率图像和长视频,兼具效率与准确性。它在图像和视频基准测试中表现优异,支持时间定位、机器人导航和医疗成像等应用场景,并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

扣子Coze

抖音官方出品的GPTs,扣子Coze可以让你搭建自己的AI机器人,只要你有想法,都可以用扣子快速、低门槛搭建专属于你的AI机器人,并一键发布到豆包、飞书、微信公众号等各个渠道!

AgentX

AgentX是一个基于多种大语言模型的AI聊天机器人开发平台,用户可通过无代码方式快速构建并部署定制化AI代理。平台具备多模型兼容性、灵活集成能力和实时性能优化功能,广泛应用于客户服务、教育培训、企业内部管理及电子商务等领域。

DreamGen

DreamGen是英伟达推出的机器人学习技术,基于AI视频世界模型生成合成数据,使机器人能在梦境中学习新技能。它通过微调视频世界模型、生成虚拟数据、提取虚拟动作和训练下游策略四步流程,实现机器人在新环境中的行为和环境泛化。DreamGen无需大量真实数据,仅凭文本指令即可完成复杂任务,提升学习效率和泛化能力。其支持多种机器人系统和策略架构,适用于工业生产、家庭服务、医疗护理等多个领域。

Gemini Robotics

Gemini Robotics 是谷歌 DeepMind 基于 Gemini 2.0 开发的机器人系统,融合视觉-语言-动作模型,支持复杂任务执行与环境适应。具备三维空间理解、物体检测、轨迹预测和开放词汇指令执行能力,适用于工业制造、物流仓储、家庭服务、医疗健康等多个领域。系统通过数据驱动训练,结合真实操作与多模态信息,实现高效、灵活的机器人控制。

Reflection AI

Reflection AI是一个零代码AI Agent开发平台,用户可以创建个性化的AI聊天机器人,模仿真人的沟通风格。该平台基于生成式AI技术,尤其是大型语言模型(LLMs),允许用户通过个人数据训练AI,使其能够以独特方式进行交流。主要功能包括个性化AI Agent创建、快速部署、学习和适应、自定义和微调以及多渠道集成。应用场景广泛,涵盖客户服务、个人助理、社交媒体管理、教育和医疗咨询等领域。

heyday by Hootsuite

将对话转化为客户。使用我们的对话式 AI 聊天机器人,推动更多电子商务销售并大规模提供五星级客户服务。

VideoAgent

VideoAgent是一款基于自改进机制的视频生成系统,结合图像观察与语言指令生成机器人控制视频计划。它采用自我条件一致性方法优化视频质量,通过预训练视觉-语言模型反馈和实际执行数据的收集,持续提升生成效果,减少幻觉内容并提高任务成功率。VideoAgent在模拟环境中有优异表现,并已应用于机器人控制、模拟训练、教育研究、游戏开发以及电影制作等领域,展现出广泛的应用潜力。

GoodWeBot

GoodWeBot 是一款基于 RPA 技术的开源 AI 微信机器人,支持一键运行,具备智能回复、群发消息、自动加好友、标签管理等功能。它集成了主流 AI 平台,操作简便,适用于企业营销、客户服务及个人社交管理等场景,兼具高效性和合规性。

Llama 3.3

Llama 3.3是一款由Meta AI开发的70B参数大型多语言预训练语言模型,支持英语、德语、法语等8种语言的输入输出。它具备长上下文窗口、高效运行和低成本的特点,可与第三方工具集成,广泛应用于聊天机器人、客户服务、语言翻译、内容创作及教育等领域。