信息网络安全 ›› 2017, Vol. 17 ›› Issue (11): 50-54.doi: 10.3969/j.issn.1671-1122.2017.11.008

• • 上一篇    下一篇

一种基于PCA和随机森林分类的入侵检测算法研究

林伟宁1,2, 陈明志1,2(), 詹云清3, 刘川葆1,2   

  1. 1. 福州大学数学与计算机科学学院,福建福州 350108
    2. 网络系统信息安全福建省高校重点实验室, 福建福州 350108
    3.国网福建省电力有限公司电力科学研究院,福建福州 350007
  • 收稿日期:2017-08-15 出版日期:2017-11-20 发布日期:2020-05-12
  • 作者简介:

    作者简介: 林伟宁(1992—),男,福建,硕士研究生,主要研究方向为入侵检测; 陈明志(1975—),男,福建,副教授,博士,主要研究方向为移动互联网通信安全与大数据分析;詹云清(1976—),男,福建,高级工程师,本科,主要研究方向为电力网络安全与系统检测;刘川葆(1992—),男,福建,硕士研究生,主要研究方向为无线通信安全。

  • 基金资助:
    国家自然科学基金 [71231003];福建省科技厅区域发展项目[2015H4005];福建省科技厅工业引导性(重点)项目[2015H0020];福州市科技计划项目[2014G75]

Research on an Intrusion Detection Algorithm Based on PCA and Random-forest Classification

Weining LIN1,2, Mingzhi CHEN1,2(), Yunqing ZHAN3, Chuanbao LIU1,2   

  1. 1.College of Mathematics and Computer Science, Fuzhou University, Fuzhou Fujian 350108, China
    2. Key Lab of Information Security of Network System in Fujian Province, Fuzhou Fujian 350108, China
    3. Electrical Power Research Institute of State Grid Fujian Electric Power Limited Company, Fuzhou Fujian 350007, China
  • Received:2017-08-15 Online:2017-11-20 Published:2020-05-12

摘要:

针对现有的入侵检测方法准确率低的问题,文章提出了一种基于PCA(Principal Component Analysis, 主成分分析法)和随机森林分类的入侵检测算法。该算法思想是对训练数据先清洗后分类,首先通过主成分分析法对数据进行特征降维和降噪,然后对处理后的数据使用随机森林分类器进行分类训练。实验使用基于Python的机器学习库scikit-learn,并采用20%的NSL_KDD数据集。实验结果表明,与常用的基于机器学习的入侵检测技术相比,文章提出的入侵检测算法可更有效地提高检测的准确性。

关键词: 机器学习, 入侵检测, PCA, 随机森林

Abstract:

Due to the low accuracy of existing intrusion detection methods, this paper proposes an intrusion detection algorithm based on PCA (principle component analysis) and random-forest classification. The idea of the algorithm is to clean the training data before classifying. Firstly, PCA is used to decompose the dataset and reduce noises. Then random-forest classifier is used to classify and train the processed data. The experiment uses machine learning library based on Python called scikit-learn and 20% NSL-KDD dataset. Experimental results show that compared with the commonly used intrusion detection technologies based on machine learning, the intrusion detection algorithm proposed in this paper can improve the detection accuracy more effectively.

Key words: machine learning, intrusion detection, PCA, random-forest

中图分类号: