基于多粒度级联森林的骨质疏松性骨折预测研究
【摘要】 目的骨质疏松性骨折(osteoporoticfracture,OF)的预测对于骨折防范具有重要的临床指导意义。针对传统logistic回归预测模型存在的精度不高和未考虑遗传因子问题,本文引入多粒度级联森林(multi-grainedcascadeforest,gcForest)并结合遗传因子来预测OF。方法首先基于t分布邻域嵌入(t-distributedstochasticneighborembedding,t-SNE)算法对OF关联基因位点进行非线性降维,降维后的基因位点与临床因素构成特征组。然后构建gcForest模型对OF进行预测。最后通过10次十折分层交叉验证与logistic、梯度提升决策树、随机森林进行对比。结果基于gcForest的模型分类精度为0.8927,AUC值为0.92±0.05,泛化性能最优。结论在考虑遗传因素的条件下,gcForest分类效果优于其他模型,验证了本文方法的高效性和实用性。