智谱AI发布了AutoGLM Web,这是一款针对Openai的Operator基于AutoGLM模型推出的浏览器插件。AutoGLM Web能够理解屏幕界面信息,用户只需输入简单的文字或语音指令,AutoGLM Web就能理解意图并自动执行任务!它支持自动搜索网页和内容总结,自动评论、点赞,以及自动创作文章等功能。

AutoGLM Web基于智谱开发的AutoGLM,是由智谱AI团队开发的先进AI智能体,专为模拟人类操作手机和网页而设计,能够理解屏幕界面信息。

AutoGLM Web的核心功能:

  • 基础智能体解耦合中间界面:AutoGLM通过这一设计,实现了规划与执行行为的高效分离,使AI能够更灵活地控制数字设备。

  • 自主任务执行:AutoGLM能够根据用户的自然语言指令,自主规划操作路径,识别手机页面,并模拟人类的操作行为,如执行点外卖、订酒店、朋友圈点赞等多种任务。

  • 跨应用协同多任务处理:支持在不同应用之间进行协同操作,可以同时处理多个任务,如从小红书查找食谱到外卖APP下单,实现无缝衔接。

  • 自进化在线课程强化学习框架:这一框架允许AutoGLM通过不断学习和适应,提升错误恢复能力和任务执行效率,确保在复杂多变的界面中也能稳定工作。

  • 广泛的应用场景:从简单的点外卖、点赞朋友圈,到复杂的网页浏览、跨应用任务执行,AutoGLM能够覆盖超过50步的长步骤操作,支持数十个网站的自动化操作。

  • 多模态处理能力:结合视觉和语言理解,AutoGLM能够像人一样操作计算机,不仅限于手机,还包括PC端的GLM-PC,展现了在不同设备上的通用性。

  • 内容理解与生成:具备从大量数据中提取关键信息的能力,并能快速生成高质量内容,如自动总结公众号文章或生成。

  • 页面总结与翻译:AutoGLM Web提供即时的网页内容总结,帮助用户快速把握文章主旨,同时其翻译功能优于多数内置浏览器翻译,便于跨语言阅读。

  • 模拟用户操作:AutoGLM-Web能够自动模拟用户在浏览器中的行为,如点击、滚动和输入等。


AutoGLM的技术原理

AutoGLM基于大规模生成对抗网络(GAN)和变分自编码器(VAE)的深层神经网络架构,能够理解复杂指令并在多个平台上执行任务。其核心技术包括WebRL,能够在训练过程中自适应学习,逐步提升性能。

AutoGLM的使用场景

  • 日常生活:如点外卖、订酒店、发送微信红包等。

  • 工作学习:如自动整理邮件、生成会议纪要、跨应用处理文档等。

  • 娱乐休闲:如自动点赞朋友圈、参与社交平台活动等。

AutoGLM Web的使用方法

  • 安装插件:AutoGLM Web已经全面上线,而且完全免费!用户需要下载并安装“智谱清言”浏览器插件即可使用,它支持Chrome和Edge浏览器。

  • 启用插件:安装完成后,打开浏览器,点击右上角的插件图标,选择“智谱清言”以启用插件功能。

  • 输入指令:在插件的侧边栏中选择“高级模式”,输入相关的操作指令,AutoGLM会根据指令自动执行相应的网页操作。

智谱AutoGLM Web通过其高效的信息处理能力,为用户提供了全新的网页浏览体验,特别是在信息摘要和跨语言理解方面。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部