- 简介近期,恶意服务(即Malla)利用大型语言模型(LLMs)进行地下开采的现象正在上升,扩大了网络威胁的范围,同时也对LLM技术的可信度提出了疑问。然而,对于这种新型网络犯罪的规模、影响和技术手段,人们几乎没有进行过研究。本文对212个真实的Malla进行了首次系统研究,揭示了它们在地下市场的广泛传播和运作方式。我们的研究揭示了Malla生态系统的存在,揭示了它的显著增长和对当今公共LLM服务的影响。通过研究212个Malla,我们发现了8个后端LLM,以及182个绕过公共LLM API保护措施的提示。我们进一步揭示了Malla使用的策略,包括滥用未经审查的LLM和通过越狱提示利用公共LLM API。我们的研究结果有助于更好地了解网络犯罪分子对LLM的实际利用情况,并提供了对抗这种网络犯罪的策略。
- 图表
- 解决问题本文试图解决LLM技术被用于恶意服务的问题,即Malla,探究其规模、影响和技术手段。这是一个新的问题。
- 关键思路本文通过对212个真实Malla的研究,揭示了Malla生态系统的扩张和对公共LLM服务的影响。通过研究Malla所使用的8个后端LLM和182个绕过公共LLM API保护措施的提示语,揭示了Malla的操作方式。此外,本文还揭示了Malla所采用的策略,包括滥用未经审查的LLM和通过越狱提示语利用公共LLM API。这篇论文的思路相比当前领域的研究状况有新意。
- 其它亮点本文揭示了Malla生态系统的扩张和对公共LLM服务的影响,以及Malla所采用的策略。实验使用212个真实Malla进行研究,揭示了8个后端LLM和182个绕过公共LLM API保护措施的提示语。本文的研究结果有助于更好地了解LLM技术被网络犯罪分子利用的情况,并提供了应对这种网络犯罪的策略。
- 最近在这个领域中,还有一些相关的研究,如《GPT-2的攻击与防御》、《对抗性文本生成的新兴领域》等。
沙发等你来抢
去评论

评论
沙发等你来抢