A Novel Pseudo Nearest Neighbor Classification Method Using Local Harmonic Mean Distance

2024年05月10日
  • 简介
    在机器学习领域,KNN分类算法以其简单和高效而广受认可。然而,它对K值的敏感性会带来挑战,特别是在样本量较小或存在离群值的情况下,影响分类性能。本文介绍了一种新的基于KNN的分类器,称为LMPHNN(使用局部谐波平均距离的新伪最近邻分类方法)。LMPHNN利用谐波平均距离(HMD)来改善分类性能,基于LMPNN规则和HMD。分类器首先为每个类别识别k个最近邻居,并生成不同的局部向量作为原型。然后,基于每个类别的局部均值创建伪最近邻居(PNNs),通过将样本的HMD与初始k组进行比较来确定每个类别的局部均值。分类是通过计算查询样本与PNNs之间的欧氏距离来确定的,基于这些类别的局部均值。在各种真实UCI数据集和组合数据集上进行了广泛的实验,将LMPHNN与七个基于KNN的分类器进行比较,使用精确度,召回率,准确度和F1作为评估指标。LMPHNN实现了平均精度为97%,超过其他方法14%。平均召回率提高了12%,平均准确度提高了5%。此外,与其他方法相比,LMPHNN的平均F1值提高了13%。总之,LMPHNN优于其他分类器,表现出对小样本量的敏感性较低。
  • 图表
  • 解决问题
    LMPHNN试图解决KNN算法在小样本或者有离群点的情况下表现不佳的问题,以提高分类准确率。
  • 关键思路
    LMPHNN利用谐波平均距离(HMD)来改进KNN算法,通过生成不同的本地向量作为原型,并基于本地均值创建伪最近邻(PNN),从而提高分类性能。
  • 其它亮点
    论文在多个真实数据集上进行了广泛的实验,比较了LMPHNN和其他七种KNN算法的性能,使用精确度、召回率、准确率和F1值作为评估指标。LMPHNN的平均精确度达到了97%,超过其他方法14%。平均召回率提高了12%,平均准确率提高了5%。此外,与其他方法相比,LMPHNN的平均F1值提高了13%。
  • 相关研究
    最近在这个领域中,还有一些相关的研究,如:《A Comparative Study of K-Nearest Neighbor, Naive Bayes, and Decision Tree Classification Techniques》、《A New KNN Classifier Using Local Patterns》等。
PDF
原文
点赞 收藏 评论 分享到Link

沙发等你来抢

去评论