基于多特征提取和Stacking集成学习的金线莲品系分类

【摘要】 针对传统中药鉴定、分子鉴定、生物技术鉴定及光谱检测技术的主观性强、耗时、操作复杂等不足,以及金线莲整个叶片形态区分度小、单一分类器鉴别精度不高的问题,该研究提出了基于机器视觉的叶片子区间多特征提取方法和基于多模型融合的Stacking集成学习算法实现金线莲的品系分类。试验采集6个品系的金线莲叶片图像数据,进行图像预处理后提取叶片子区间内纹理、颜色共114个特征,基于这些特征,构建堆叠式两阶段集成学习框架,以逻辑回归、K最近邻、随机森林和梯度提升决策树(GradientBoostingDecisionTree,GBDT)作为基分类器,GBDT作为元分类器进行学习。试验结果表明,Stacking集成学习模型的整体识别综合评价指标F值达93.91%,分类正确率达94.49%,分别比逻辑回归、K最近邻、随机森林和GBDT这4个单一分类模型高出4.40、11.87、11.01、12.94个百分点和5.36、11.34、6.93、12.13个百分点。因此,该研究能够有效识别金线莲品系,为形状大小相似、形状特征难以利用的植物叶片识别提供参考