基于共享单车时空大数据的细粒度聚类
【摘要】 针对传统上单独采用K-means或DBSCAN等方法对共享单车位置数据聚类时造成的聚类结果与真实的聚类结构不符的问题,本文提出了一种基于共享单车时空大数据的细粒度聚类方法(FGCM)。该方法通过DBSCAN进行初始聚类,并在此基础上采用GMM-EM算法进行细部聚类,以提取细粒度层级的热点区域。试验表明,该方法可根据密度阈值排除噪声和离群值,无需指定细部聚类簇数,簇的形状和大小比较灵活。在对共享单车大数据位置特征进行聚类时,与传统的单独采用K-means或DBSCAN的方法相比,FGCM具备更高的精细程度,能够充分展现共享单车的实际聚集特征,可用于规划共享单车电子围栏等设施,在不降低通勤效率的基础上规范共享单车的停放问题。