Şifreli ağ trafiğinin içerik açısından sınıflandırılması

Thumbnail Image

Date

2022-06-24

Authors

Bozkır, Ramazan

Journal Title

Journal ISSN

Volume Title

Publisher

Bursa Uludağ Üniversitesi

Abstract

Günümüzde internet kullanımının yaygınlaşması mevcut bilgisayar ağları altyapısının verimli ve güvenli bir şekilde yönetilmesini gerektirmektedir. Ayrıca, her geçen gün internet uygulamalarının kullanımındaki artış ile büyük veri hacmini oluşturan ağ trafikleri de ortaya çıkmaktadır. Büyük verilerin işlenebilmesi için performans odaklı yöntemlerin kullanılması gerekmektedir. Ağ trafiği verilerinin, ağ yönetimi ve ağ güvenliği gibi birçok çalışma alanındaki uygulamalar için sınıflandırma ihtiyacı bulunmaktadır. Ağ trafiğinin şifreli olması ve VPN kullanımı gibi uygulamalar ağ trafiği sınıflandırma sürecini zorlaştırmaktadır. Bu tez çalışmasında şifreli ağ trafiğinin sınıflandırılması için gerçek-zamanlı sistemlere kolay ve hızlı uygulanabilir performans-odaklı yeni bir platform geliştirilmiştir. Sınıflandırma sürecinde makine öğrenmesi tekniklerinden yararlanılmıştır. Deney tabanlı makine öğrenmesi tekniklerinin etkili bir şekilde uygulanabilmesi için süreç yönetim gerçekleştirilmiştir. Platformun tasarlanmasında güncel ve performanslı olan veri işleme için Apache Spark, öznitelik çıkarımı için NFStream ve süreç yönetimi için MLflow yazılım teknolojileri kullanılmıştır. Ayrıca, bu çalışma literatüre “pattern byte” isimli yeni bir öznitelik kazandırmıştır. Önerilen platform ile gerçekleştirilen deney kapsamında uygulama ve uygulama türlerine göre ağ trafiği makine öğrenmesi algoritmaları ile sınıflandırılmaktadır. Makine öğrenmesi algoritmalarından GBTree, LightGBM ve XGBoost algoritmalarının kullanılması sonucunda performans sonuçları değerlendirildi. Performans sonuçlarının değerlendirilmesi doğruluk, duyarlılık, kesinlik ve F1 skorları ile incelenmektedir. İncelenen sonuçlarda uygulama sınıflandırmasında GBTree, LightGBM, XGBoost algoritmaları sırasıyla yaklaşık %98, %89 ve %99 F1 skorlarına ulaşmaktadır. Uygulama türlerine göre sınıflandırmada ise tüm algoritmalar %99 F1 skoruna ulaşmaktadır. Sonuç olarak, algoritmalar arasında XGBoost algoritması her iki sınıflandırma probleminde %99’un üzerinde F1 skoru ile en iyi sonuca ulaştığı görülmüştür.
Today, the widespread use of the Internet requires efficient and secure management of the existing computer network infrastructure. Network traffic as big data emerges as a result of increasing internet applications day by day. Therefore, performance-oriented methods should be used to process big data. Network traffic data needs to be classified for applications in many workspaces, such as network management and security. Network traffic encryption and applications such as VPN increases the complexity of network traffic classification process. In this thesis, a new performance-oriented platform has been developed for the classification of encrypted network traffic, which can be easily and quickly applied to real-time systems. Machine learning techniques were used in the classification process. Process management was carried out in order to apply experiment-based machine learning techniques effectively. Apache Spark for data processing, NFStream for feature extraction, and MLflow software technologies for process management were used in the design of the platform. In addition, this study has brought a new feature called “pattern byte” to the literature. Within the scope of the experiment carried out with the proposed platform, network traffic is classified by machine learning algorithms according to the application and application types. Performance results were evaluated as a result of using GBTree, LightGBM, and XGBoost algorithms from machine learning algorithms. Evaluation of performance results is examined by accuracy, recall, precision, and F1 scores. In the results examined, GBTree, LightGBM, and XGBoost algorithms achieve F1 scores of approximately 98%, 89%, and 99% in application classification. In classification according to application types, all algorithms reach 99% F1 scores. As a result, among the algorithms, it was seen that the XGBoost algorithm achieved the best result with an F1 score of over 99% in both classification problems.

Description

Keywords

Ağ trafiği sınıflandırma, Ağ trafiği, Makine öğrenmesi, Topluluk yöntemleri, Network traffic classification, Network traffic, Machine learning, Ensemble methods

Citation

Bozkır, R. (2022). Şifreli ağ trafiğinin içerik açısından sınıflandırılması. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.

11

Views

23

Downloads

Search on Google Scholar