基于贝叶斯决策树的小麦镉风险识别规则提取

【摘要】 为揭示环境因素与小麦Cd超标风险的关系,综合考虑了小麦Cd富集的7个影响因素(土壤Cd浓度、污染企业、城镇村及工矿用地、交通运输用地、土壤类型、土壤有机质含量(SOM)和土壤pH值),采用ID3算法与朴素贝叶斯算法,建立起5棵贝叶斯决策树.提出了15条小麦Cd超标风险的识别规则,将超标风险分为5级并确定了小麦Cd富集的3个主控因子:污染企业、土壤pH值和土壤Cd浓度.经检验,5棵决策树风险识别的平均精度为81.14%,而使用风险识别规则和贝叶斯算法后识别精度提高为89.32%.该模型将贝叶斯算法融入到了决策树模型,可以评估数据完整或缺失样本的Cd污染风险,确定小麦Cd富集的主控因子,同时可以基于风险识别规则判定小麦Cd风险程度和范围,为土壤安全利用和小麦安全生产区的划定提供参考.