基于BTA算法的数据流频繁项集挖掘

【摘要】 针对传统数据流频繁项集挖掘算法在挖掘频繁k-项集时会有候选项集产生,在有新的数据流到来时的数据更新以及频繁项集支持度更新的效率不高,造成挖掘的时间和空间效率不高等一系列问题,提出一种高效的数据流频繁项集挖掘算法BTA(bittablewithandalgorithm)算法。将数据高效压缩进位表中,对窗口更新采用取余覆盖;在频繁k-项集的挖掘采用与操作避免候选项集产生;在支持度更新采用加减运算得到数据更新后的支持度。实验结果表明,该算法在时间和空间效率上均有良好效果。