基于改进KMOR的聚类算法

【摘要】 为避免KMOR(k-meanswithoutlierremoval)算法因样本中类内离散度不同而产生离群点误判的问题,提出为每类样本分别选取离群点判别标准的改进算法。在算法初始化时,利用样本的密集性排除离群点干扰;在迭代过程中,根据每类样本的类内离散度分别选取判别标准,与样本到其所属聚类中心的距离比较判别离群点。两者结合提高聚类结果正确率,避免因样本中类内离散度不同产生的误判。实验结果表明,改进算法相比原算法在正确率和离群点检测上有所提高&