基于人工特征与深度特征的DGA域名检测算法

【摘要】 当前,各种各样的恶意软件常使用域名生成算法(DomainGenerationAlgorithms,DGAs)来生成大量的随机域名,然后域名的随机性构建人工特征,利用机器学习方法服务器建立通信,发动相应的攻击。现有的检测方法基于DGA域名的检测准确率较低。文中提出了一种域名通用特征的提取方案,建立了LSTM,GRU等深度学习技术学习域名家族的数据集,并设计了基于人工特征与深度特征的检测算法,提高了模型的泛化能力,增加了对DGA域名检测算法取得了比传统深度学习方法更高的准种C&C尝试与学习分类模式,但该类算法存在人工构建特征费时费力、检测误报率高等问题;或利用域名的序列关系,但该类算法对低随机性的包含域名家族的识别种类。实验结果表明,基于人工特征与深度特征的确率和更好的泛化能力。