基于数据挖掘的前列腺癌风险预测研究
【摘要】 目的:通过构建Logistic回归模型对前列腺癌(PCa)发生的关联因素及风险预测进行分析。方法:采用国家临床医学科学数据中心的PCa数据库中的诊断数据,共筛选出符合标准的病例3080例,其中建模组及对照组分别为2680和400例,分析多因素对PCa的预测作用,同时建立风险预测模型并进行验证。结果:经二元Logistic单因素回归分析发现,体重指数(Ibm)、游离前列腺特异性抗原(fPSA)、总PSA(tPSA)及载脂蛋白A1等对PCa均具有诊断意义(P<0.05)。Logistic多因素回归分析发现,fPSA、tPSA、f/tPSA及载脂蛋白A1均与PCa显著相关(P<0.01)。建立Logistic模型后,对建模组和验证组分别进行受试者工作特征(ROC)曲线分析,得到建模组及验证组模型曲线下面积(AUC)分别为0.827和0.902(均P<0.01)。结论:由PSA、游离钙、肌酸激酶同工酶、载脂蛋白A1构建的Logistic模型对于评价PCa的风险预测有重要意义,合理利用患者上述指标的变化