- 简介LLM代理已经变得越来越复杂,特别是在网络安全领域。研究人员已经证明,当给定漏洞描述和玩具捕获旗帜问题时,LLM代理可以利用现实世界的漏洞。然而,这些代理在事先不知道的现实世界漏洞(零日漏洞)上表现仍然很差。 在这项工作中,我们展示了LLM代理团队可以利用现实世界的零日漏洞。之前的代理在单独使用时在探索许多不同的漏洞和长期规划方面表现不佳。为了解决这个问题,我们引入了HPTSA,一个具有规划代理可以启动子代理的系统。规划代理探索系统并确定调用哪些子代理,解决了尝试不同漏洞时的长期规划问题。我们构建了一个15个真实世界漏洞的基准,并展示我们的代理团队在之前的工作上提高了4.5倍。
-
- 图表
- 解决问题解决问题的问题是如何让LLM代理能够利用未知的零日漏洞?
- 关键思路提出了一种由计划代理和子代理组成的系统,称为HPTSA,计划代理可以探索系统并确定要调用哪些子代理,从而解决了尝试不同漏洞时的长期规划问题。
- 其它亮点论文构建了一个包含15个真实世界漏洞的基准,并展示了我们代理团队相比之前的工作提高了多达4.5倍。
- 最近的相关研究包括:1. 'Learning to Exploit New Vulnerabilities via Exploiting Technical Information' 2. 'Automated Whitebox Fuzz Testing with Input-to-State Correspondence' 3. 'Deep Exploit: A Generative Adversarial Network for Cybersecurity'
NEW
提问交流
提交问题,平台邀请作者,轻松获得权威解答~
向作者提问

提问交流