改进的模糊C-均值聚类有效性指标

【摘要】 针对模糊C-均值的现有评价指标没有涉及到数据集的真实几何分布结构和先验信息的问题,为了能准确找到与数据样本自然分布相匹配的簇,提出了一种改进的有效性评价指标VCSC。该指标结合簇内数据平方误差和、隶属度权值及根号权值定义紧凑性度量,结合簇中心距离最小值、隶属度及各簇中心到平均簇中心的距离和定义分离度,结合隶属度范围及样本分布情况定义结合度量。实验结果表明,所提出的指标能够有效地对聚类结果进行评估,能够准确得出数据中最佳的聚类数目。