PassTSL: Modeling Human-Created Passwords through Two-Stage Learning

Lecture Notes in Computer Science 14897 (2024) 404-423
2024年07月19日
  • 简介
    文本密码仍然是最广泛使用的用户身份验证机制。由于文本密码与自然语言之间的紧密联系,自然语言处理(NLP)和机器学习(ML)的先进技术可用于模拟不同目的的密码,例如研究人类密码创建行为和开发更先进的密码破解方法,以提供更好的防御机制。在本文中,我们提出了PassTSL(通过两阶段学习模拟人类创建的密码),灵感来自于NLP和深度学习(DL)中流行的预训练微调框架。我们报告了不同预训练设置如何影响PassTSL,并通过将其应用于六个大型泄露的密码数据库来证明其有效性。实验结果表明,在密码猜测方面,它比五种最先进的密码破解方法的表现要好得多,在最大点处的差距范围从4.11%到64.69%不等。基于PassTSL,我们还实现了一个密码强度计(PSM),我们的实验表明,它能够更准确地估计密码强度,产生的不安全错误(高估密码强度)比其他两种最先进的PSM少:基于神经网络的方法和zxcvbn。此外,我们探索了多个微调设置,我们的评估结果表明,即使是微小的额外训练数据,例如仅预训练数据的0.1%,平均可以导致超过3%的密码猜测改进。我们还提出了一种基于JS(Jensen-Shannon)散度的微调密码的启发式方法,实验结果验证了其有用性。总之,我们的贡献证明了将先进的NLP和ML方法应用于密码建模和破解的潜力和可行性。
  • 图表
  • 解决问题
    本文旨在探讨如何应用自然语言处理(NLP)和机器学习(ML)技术来模拟和破解用户密码,提高密码安全性。
  • 关键思路
    本文提出了基于预训练-微调框架的PassTSL模型,用于模拟人类创建的密码,并通过实验证明其有效性。同时,本文还探索了微调设置和密码强度评估方法。
  • 其它亮点
    本文在六个大型泄露密码数据库上应用PassTSL模型,结果表明其在密码猜测方面的表现优于其他五种最先进的密码破解方法。此外,本文还实现了密码强度计算器,并与其他两种最先进的密码强度计算器进行了比较。
  • 相关研究
    最近在这个领域的相关研究包括:《Deep Learning-Based Password Strength Meter》、《Password Cracking Using Machine Learning: Review and Research Directions》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论