互联网中非法文本特征自适应提取仿真研究

【摘要】 针对传统非法文本特征自适应提取中,普遍存在着提取查全率较低、完成时间较长、成本消耗较大等问题。对此问题,提出一种基于支持向量机回归的非法文本特征自适应提取方法。对互联网文本特征信息进行分析。通过灰度局部的显著非法文本特征变化和显著非法文本特征多方向边缘强度,定位出显著非法文本特征区域,引入支持向量回归模型对非法文本特征区域和合法文本特征区域进行精确分离,消除合法文本边界,提取出互联网中非法文本特征。实验结果表明,所提出方法提取查全率较高、完成时间较短、成本消耗较低。