2024年8月26日发(作者:励如之)
基于N-gram和Transformer的DGA恶意域名检测
杨成;芦天亮;闫尚义;张建岭
【期刊名称】《中国人民公安大学学报:自然科学版》
【年(卷),期】2022(28)3
【摘 要】针对使用域名生成算法(DGA)产生的恶意域名隐蔽性强,传统机器学习检
测算法提取特征复杂等问题,提出了基于N-gram和Transformer的恶意域名检测
方法。对域名数据添加首尾标志位,使用N-gram算法分割成词组元素后转换为向
量输入Transformer模型。该模型能够有效的提取域名的字母组合特征,并且捕捉
到域名中字母的位置信息,如域名中的首部和尾部字符、字母间的位置关系等特征,
从而更准确的识别恶意域名。实验中使用Alexa的合法域名和360安全实验室采
集的恶意域名作为数据样本,使用N-gram算法处理二级域名字符串,并与基于机器
学习和深度学习的分类算法进行对比,实验结果表明该算法对DGA域名检测准确率
达96.04%,能够有效、准确地识别出恶意域名。
【总页数】9页(P100-108)
【作 者】杨成;芦天亮;闫尚义;张建岭
【作者单位】中国人民公安大学信息网络安全学院
【正文语种】中 文
【中图分类】TP393.08
【相关文献】
1.基于Transformer的DGA域名检测方法2.基于深度学习的恶意DGA域名检测
3.基于迁移学习的小样本DGA恶意域名检测方法4.基于融合CNN与LSTM的
DGA恶意域名检测方法5.基于机器学习建模的DGA恶意域名检测
因版权原因,仅展示原文概要,查看原文内容请购买
2024年8月26日发(作者:励如之)
基于N-gram和Transformer的DGA恶意域名检测
杨成;芦天亮;闫尚义;张建岭
【期刊名称】《中国人民公安大学学报:自然科学版》
【年(卷),期】2022(28)3
【摘 要】针对使用域名生成算法(DGA)产生的恶意域名隐蔽性强,传统机器学习检
测算法提取特征复杂等问题,提出了基于N-gram和Transformer的恶意域名检测
方法。对域名数据添加首尾标志位,使用N-gram算法分割成词组元素后转换为向
量输入Transformer模型。该模型能够有效的提取域名的字母组合特征,并且捕捉
到域名中字母的位置信息,如域名中的首部和尾部字符、字母间的位置关系等特征,
从而更准确的识别恶意域名。实验中使用Alexa的合法域名和360安全实验室采
集的恶意域名作为数据样本,使用N-gram算法处理二级域名字符串,并与基于机器
学习和深度学习的分类算法进行对比,实验结果表明该算法对DGA域名检测准确率
达96.04%,能够有效、准确地识别出恶意域名。
【总页数】9页(P100-108)
【作 者】杨成;芦天亮;闫尚义;张建岭
【作者单位】中国人民公安大学信息网络安全学院
【正文语种】中 文
【中图分类】TP393.08
【相关文献】
1.基于Transformer的DGA域名检测方法2.基于深度学习的恶意DGA域名检测
3.基于迁移学习的小样本DGA恶意域名检测方法4.基于融合CNN与LSTM的
DGA恶意域名检测方法5.基于机器学习建模的DGA恶意域名检测
因版权原因,仅展示原文概要,查看原文内容请购买