基于贝叶斯网络与语义树的隐私数据发布方法

【摘要】 为在隐私预算相同的条件下提高发布数据的可用性,在PrivBayes的基础上,提出一种改进的隐私数据发布方法PrivBayes-Hierarchical。基于贝叶斯网络隐私数据发布方法的思想,引入语义树对含有层次关系的数据属性进行抽象,使用贝叶斯网络描述数据属性之间的依赖关系。利用格雷码减少随机噪声对数据精度的影响,并对贝叶斯网络结构学习方法进行优化,以减少不必要的隐私预算消耗,提高数据可用性。实验结果表明,该方法在公开数据集下可以获得比PrivBayes更高的数据精度,从而提升隐私数据集的可用性。