99 / 2020-07-21 21:03:41
基于大数据多特征融合和机器学习的恶意网页智能识别
大数据;机器学习;HTTP请求;智能识别
全文被拒
互联网高速发展的同时催生了众多恶意网页。恶意网页是指泄露用户隐私、造成财产损失等安全问题的网页。本文主要针对网页URL、JavaScript代码和 HTML代码等3种恶意网页的特征,分析比较了页面导入、脚本注入、页面跳转、域外请求数等10种用于识别恶意网站的智能识别方法,结合网页动态分析和机器学习的方法,提出了一个基于网页源码分析的恶意网页智能识别模型。该方法将请求特征与传统网页特征相融合,利用机器学习分类算法构建网页分类模型来区分正常和恶意网页。通过监控网页中动态执行函数,包括脚本注入、页面插入、URL跳转等,提取对应的函数和参数作为特征,利用机器学习的方法取得较高的精确率。从ALEXA选取1000个正常网页,从pishtank和 malwaredomains中选取1000个恶意网页构建数据集,训练测试网页分类模型。通过实验验证基于URL、网页代码和HTTP请求融合特征的方法优于单个使用URL、JavaScript、HTTP请求特征的方法。
重要日期
  • 会议日期

    07月10日

    2021

    07月12日

    2021

  • 05月10日 2021

    初稿截稿日期

  • 07月06日 2021

    注册截止日期

主办单位
长沙理工大学
协办单位
IEEE Electron Devices Society
IEEE
联系方式
历届会议
移动端
在手机上打开
小程序
打开微信小程序
客服
扫码或点此咨询