Intelligent system using machine learning techniques for security assessment and cyber intrusion detection

Abdel Karim Kassem

Résumé

Machine learning has become a decisive technology for cybersecurity to protect the computer networks and systems against cybercriminals. Consequently, the aim of our conducted thesis is to enhance the applied security mechanism and to propose an intelligent system using machine learning techniques for cyber intrusion detection. Therefore, we applied the penetration testing technique, it permits the discovering of vulnerabilities for the most popular attacks. Hence, we provided security suggestions and solutions concerning these risk cyber-attacks. In addition, we applied the web mining techniques to identify several approaches in terms of the visitor behavior and the cyber security evaluation. Afterwards, we achieved the detection of the visitor activity, its behavior, the access resources control and the threats that may face the web server. Then, an intelligent host based intrusion detection system (HIDS) has been developed using the text mining techniques. Thus, we constructed a reliable textual dataset which includes 6000 records of malicious URLs. This kind of data derives us to propose the DOC2VEC model as a feature representation method in our HIDS. Additionally, we have applied several machine learning techniques. Hence, the multilayer perceptron found to be the most accurate model by 90.67% in detecting the SQLi, XSS and directory traversal attacks. Furthermore, we developed a new security intelligent system called SIS-ID adopted to detect the latest malicious URLs and expanded to the DDOS attacks. Moreover, our system that is based on several machine learning techniques was examined via two configured data bases which are the DB-MALCURL and DB-DDOS extracted from the Canadian institute for cybersecurity (CIC). Afterwards, we evolved the system performance using our proposed learning optimization methods. Eventually, the SIS-ID achieved the best accuracy (98.52%) based on the voting model that detects the malicious URLs attack. On the other hand, the stacking model recorded the top accuracy (77.04%) for detecting the DDOS attack. Ultimately, we validated our proposed SIS-ID using a hardware based-real-time simulation in the Lebanese university. Hence, the hardware was configured based on the local outlier factor model that achieved the efficiency of avoiding a performed denial of service attack (DOS) on real time stage.

L'apprentissage automatique est devenu une technologie décisive pour la cyber sécurité dans le but de protéger les réseaux et systèmes informatiques contre les cybercriminels. En conséquence, l'objectif de cette thèse est d’améliorer le mécanisme de sécurité appliquée, et proposer un système intelligent basé sur des techniques d’apprentissage automatique pour la détection des cyber-intrusions. Nous avons donc appliqué la technique de test de pénétration permettant de découvrir les vulnérabilités concernant les attaques les plus courantes. Plus tard, nous avons fourni des suggestions de sécurité et des solutions concernant ces cyber-attaques risquées. De plus, nous avons appliqué les techniques de web mining pour identifier plusieurs approches en termes de comportement des visiteurs et d'évaluation de la cyber sécurité. Par la suite, nous avons parvenu à détecter l'activité des visiteurs, leur comportement, le contrôle des ressources d'accès et les menaces qui peuvent affronter le serveur web. Ensuite, un système intelligent de détection d'intrusion hôte (HIDS : Host-based Intrusion Detection System) a été développé en utilisant les techniques de text mining. Pour cela, nous avons construit un ensemble de données de classification de texte fiables comprenant 6000 enregistrements d'URL malveillantes. Ce type de données nous a amené à proposer le modèle DOC2VEC comme méthode de représentation de caractéristiques dans notre HIDS. De plus, nous avons appliqué plusieurs techniques d'apprentissage automatique. Par conséquent, le perceptron multicouche (multilayer perceptron MLP) s'est avéré être le modèle le plus précis à 90,67% pour détecter les attaques SQLi, XSS ainsi que les attaques par traversée de répertoires. En outre, nous avons développé un nouveau système intelligent de sécurité appelé SIS-ID adopté pour détecter les dernières URL malveillantes et étendu aux attaques par déni de service distribuées (DDoS). De plus, notre système qui est basé sur plusieurs techniques d'apprentissage automatique a été examiné via deux bases de données configurées qui sont les DB-MALCURL et DB-DDOS extraites de l'institut canadien de cybersécurité (CIC). Ensuite, nous avons évolué les performances du système en utilisant nos méthodes d'optimisation d'apprentissage proposées. Ainsi, le SIS-ID a atteint la meilleure précision (98,52%) basé sur le modèle de vote qui détecte l'attaque d'URL malveillantes. D'autre part, le modèle stacking a enregistré la précision maximale (77,04 %) pour détecter l'attaque DDOS. Finalement, nous avons validé notre proposition de SIS-ID à l'aide d’un matériel basé sur la simulation en temps réel au sein de l'université libanaise. Par conséquent, le matériel a été configuré sur la base du modèle facteur de valeur aberrante locale (LOF) qui a atteint l'efficacité d'éviter une attaque par déni de service (DOS) effectuée sur une scène en temps réel.

Intelligent system using machine learning techniques for security assessment and cyber intrusion detection

Système intelligent basé sur des techniques de l’apprentissage automatique pour l’évaluation de la sécurité et la détection des cyber-intrusions

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager