刚刚,Adept推出了他们第一个大模型Action Transformer (ACT-1)。
ACT-1是一款能够代替人类使用常见软件的系统,用户只需要输入希望进行的操作或者想要搜索的问题,ACT-1就能帮助用户实现目的。
经过训练的ACT-1可以使用软件,Adept最近教它如何使用网络浏览器。现在,它连接到一个 Chrome 扩展程序,允许 ACT-1 观察浏览器中发生的事情并采取某些操作,如单击、键入和滚动等。观察是浏览器视口的自定义“渲染”,即旨在泛化整个网站,而操作空间是页面上可用的 UI 元素。
以下是一些ACT-1可以完成的任务:
- ACT-1 可以接受高级用户请求并执行它。用户只需在文本框中键入命令,其余的由 ACT-1 完成。
- 这对于手动任务和复杂工具尤其强大——在这个例子中,在 Salesforce 中通常需要点击 10 次以上的操作现在只需一句话即可完成。
- 在电子表格等工具中深入工作,ACT-1 展示了现实世界的知识,从上下文中推断出我们的意思,并且可以帮助我们做我们甚至可能不知道该怎么做的事情。
- 该模型还可以完成需要将多个工具组合在一起的任务;我们在计算机上所做的大多数事情都跨越多个程序。将来,我们希望 ACT-1 通过要求我们澄清我们想要的内容来提供更多帮助。
- 互联网包含很多关于世界的知识!当模型不知道某事时,它知道如何在网上查找信息(见语音输入模式)。
- ACT-1 不知道如何做所有事情,但它非常易于指导。通过 1 条人工反馈,它可以纠正错误,在每次交互中变得更加有用。
内容中包含的图片若涉及版权问题,请及时与我们联系删除
评论
沙发等你来抢