Topic Modeling Analysis of Aviation Accident Reports: A Comparative Study between LDA and NMF Models

2024年03月04日
  • 简介
    在现代世界中,航空安全至关重要,人们不断致力于减少事故并提高安全标准。这项努力的核心是分析航空事故报告,这些富含见解的文本资源揭示了航空事故背后的原因和促成因素。本文比较了两种著名的主题建模技术——潜在狄利克雷分配(LDA)和非负矩阵分解(NMF)在航空事故报告分析中的应用。该研究利用了国家运输安全委员会(NTSB)数据集,其主要目标是自动化和简化识别事故报告中潜在主题和模式的过程。主题连贯值(C_v)度量用于评估生成主题的质量。LDA表现出更高的主题连贯性,表明主题内的单词之间具有更强的语义相关性。同时,NMF在生成独特和细粒度的主题方面表现出色,使得对航空事故的特定方面进行更集中的分析成为可能。
  • 作者讲解
  • 图表
  • 解决问题
    比较LDA和NMF在航空事故报告分析中的效果,以自动化和简化识别事故报告中潜在主题和模式的过程。
  • 关键思路
    使用NTSB数据集,比较LDA和NMF的主题一致性和细节程度。LDA主题一致性更高,NMF能够产生更具有区分度和细节的主题。
  • 其它亮点
    使用C_v度量评估主题质量,比较LDA和NMF的效果。实验使用NTSB数据集。LDA主题一致性更高,NMF能够产生更具有区分度和细节的主题。
  • 相关研究
    最近的相关研究包括:1. “A Comparison of LDA and NMF for Topic Modeling in Twitter” 2. “Comparing LDA and NMF Topic Models on Similarity-Based Retrieval Tasks”
许愿开讲
PDF
原文
点赞 收藏
向作者提问
NEW
分享到Link

提问交流

提交问题,平台邀请作者,轻松获得权威解答~

向作者提问