基于共享k-近邻与共享逆近邻的密度峰聚类

【摘要】 为了更好地解决密度不均衡问题与刻画高维数据相似性度量问题,提出一种基于共享k-近邻与共享逆近邻的密度峰聚类算法。该算法计算两个点的共享k-近邻数与共享逆近邻数,并结合欧氏距离来确定这两个点之间的共享相似度;将样本点与其逆近邻点的共享相似度之和定义为该点的共享密度,再通过共享密度选取聚类中心。通过实验证明,该算法在人工数据集和真实数据集上的聚类结果较其他密度聚类算法更加准确,并且能更好地处理密度不均衡问题,同时也提高了高维数据的聚类精度。