Teams of LLM Agents can Exploit Zero-Day Vulnerabilities

简介

LLM代理已经变得越来越复杂，特别是在网络安全领域。研究人员已经证明，当给定漏洞描述和玩具捕获旗帜问题时，LLM代理可以利用现实世界的漏洞。然而，这些代理在事先不知道的现实世界漏洞（零日漏洞）上表现仍然很差。在这项工作中，我们展示了LLM代理团队可以利用现实世界的零日漏洞。之前的代理在单独使用时在探索许多不同的漏洞和长期规划方面表现不佳。为了解决这个问题，我们引入了HPTSA，一个具有规划代理可以启动子代理的系统。规划代理探索系统并确定调用哪些子代理，解决了尝试不同漏洞时的长期规划问题。我们构建了一个15个真实世界漏洞的基准，并展示我们的代理团队在之前的工作上提高了4.5倍。
作者讲解

目前尚无作者解读视频，你可点击下方【许愿开讲】按钮，许愿作者开讲~
图表
解决问题

解决问题的问题是如何让LLM代理能够利用未知的零日漏洞？
关键思路

提出了一种由计划代理和子代理组成的系统，称为HPTSA，计划代理可以探索系统并确定要调用哪些子代理，从而解决了尝试不同漏洞时的长期规划问题。
其它亮点

论文构建了一个包含15个真实世界漏洞的基准，并展示了我们代理团队相比之前的工作提高了多达4.5倍。
相关研究

最近的相关研究包括：1. 'Learning to Exploit New Vulnerabilities via Exploiting Technical Information' 2. 'Automated Whitebox Fuzz Testing with Input-to-State Correspondence' 3. 'Deep Exploit: A Generative Adversarial Network for Cybersecurity'

Teams of LLM Agents can Exploit Zero-Day Vulnerabilities

提问交流

提问交流