Adept推出第一个大模型Action Transformer (ACT-1),可自动完成常用软件的人工操作

刚刚，Adept推出了他们第一个大模型Action Transformer (ACT-1)。

ACT-1是一款能够代替人类使用常见软件的系统，用户只需要输入希望进行的操作或者想要搜索的问题，ACT-1就能帮助用户实现目的。

经过训练的ACT-1可以使用软件，Adept最近教它如何使用网络浏览器。现在，它连接到一个 Chrome 扩展程序，允许 ACT-1 观察浏览器中发生的事情并采取某些操作，如单击、键入和滚动等。观察是浏览器视口的自定义“渲染”，即旨在泛化整个网站，而操作空间是页面上可用的 UI 元素。

以下是一些ACT-1可以完成的任务：

ACT-1 可以接受高级用户请求并执行它。用户只需在文本框中键入命令，其余的由 ACT-1 完成。
这对于手动任务和复杂工具尤其强大——在这个例子中，在 Salesforce 中通常需要点击 10 次以上的操作现在只需一句话即可完成。
在电子表格等工具中深入工作，ACT-1 展示了现实世界的知识，从上下文中推断出我们的意思，并且可以帮助我们做我们甚至可能不知道该怎么做的事情。
该模型还可以完成需要将多个工具组合在一起的任务；我们在计算机上所做的大多数事情都跨越多个程序。将来，我们希望 ACT-1 通过要求我们澄清我们想要的内容来提供更多帮助。
互联网包含很多关于世界的知识！当模型不知道某事时，它知道如何在网上查找信息（见语音输入模式）。
ACT-1 不知道如何做所有事情，但它非常易于指导。通过 1 条人工反馈，它可以纠正错误，在每次交互中变得更加有用。

内容中包含的图片若涉及版权问题，请及时与我们联系删除