ВИЯВЛЕННЯ АНОМАЛІЙ У МЕРЕЖЕВОМУ ТРАФІКУ ВЕБ-ДОДАТКІВ  З ВИКОРИСТАННЯМ АЛГОРИТМУ RANDOM FOREST

О. І. ФЕДЮШИН; П. В. ШУЛІК; О. М. ТОВМА; В. П. КОЦЮБА

doi:10.35546/kntu2078-4481.2025.4.3.31

Автор(и)

О. І. ФЕДЮШИН Харківський національний університет радіоелектроніки https://orcid.org/0000-0002-3600-405X
П. В. ШУЛІК Харківський національний університет радіоелектроніки https://orcid.org/0009-0004-6200-2172
О. М. ТОВМА Харківський національний університет радіоелектроніки https://orcid.org/0009-0009-7225-3297
В. П. КОЦЮБА Харківський національний університет Повітряних Сил імені Івана Кожедуба https://orcid.org/0000-0001-6336-8193

DOI:

https://doi.org/10.35546/kntu2078-4481.2025.4.3.31

Ключові слова:

кібербезпека, веб-додатки, Random Forest, виявлення аномалій, CICIDS2017, машинне навчання, класифікація трафіку

Анотація

Забезпечення високої точності та ефективності систем виявлення вторгнень є критичним для уникнення помилкових спрацьовувань та пропусків веб-атак. Мережевий трафік є основним каналом комунікації клієнт-серверної моделі у веб-додатках, тому його аналіз є критично важливим для виявлення шкідливої активності. Саме через нього передаються дані запитів користувача, відповіді сервера, API-виклики, а також взаємодія з зовнішніми сервісами. Використання машинного навчання для прогнозування атак на веб-додатки на основі аналізу мережевого трафіку може покращити ці характеристики. В роботі проводиться вибір технік машинного навчання, що можуть допомагати враховувати не лише структуру, а й семантику трафіку, також розглянуто актуальну проблему захисту веб-додатків від сучасних кіберзагроз, зокрема атак типу SQL Injection, XSS та Brute Force. Проаналізовано недоліки традиційних сигнатурних методів захисту (WAF, IDS), які демонструють низьку ефективність проти атак «нульового дня» та модифікованих шкідливих запитів. Обґрунтовано доцільність використання методів машинного навчання (Machine Learning) для побудови адаптивних систем виявлення вторгнень. У якості інструментарію дослідження обрано алгоритм Random Forest (випадковий ліс) через його стійкість до перенавчання та здатність ефективно працювати з багатовимірними даними. Експериментальну частину виконано на базі датасету CICIDS2017, який містить актуальні профілі нормального та аномального трафіку. Описано етапи попередньої обробки даних: очищення від шумів, кодування категоріальних ознак, балансування класів за допомогою бібліотеки Imbalanced-learn. В результаті проведеного експерименту розроблена модель показала загальну точність класифікації (Accuracy) на рівні 98%. Проаналізовано матрицю невідповідностей, яка підтвердила високу здатність моделі розрізняти легітимний трафік та атаки сканування, при цьому виявлено певні обмеження при класифікації складних веб-атак зі схожими сигнатурами. Результати дослідження можуть бути використані для удосконалення існуючих систем моніторингу безпеки та інтеграції в SIEM-системи.

Посилання

Adefemi, K. O., Mutanga, M. B., & Alimi, O. A. (2025). A Hybrid CNN–GRU Deep Learning Model for IoT Network Intrusion Detection. Journal of Sensor and Actuator Networks, 14(5), 96. https://doi.org/10.3390/jsan14050096.

Alahmadi, A. A., Aljabri, M., Alhaidari, F., Alharthi, D. J., Rayani, G. E., Marghalani, L. A., Alotaibi, O. B., & Bajandouh, S. A. (2023). DDoS Attack Detection in IoT-Based Networks Using Machine Learning Models: A Survey and Research Directions. Electronics, 12(14), 3103. https://doi.org/10.3390/ electronics 12143103.

Long, Z., Yan, H., Shen, G. et al. A Transformer-based network intrusion detection approach for cloud security. J Cloud Comp 13, 5 (2024). https://doi.org/10.1186/s13677-023-00574-9.

Wu, Zihan & Zhang, Hong & Wang, Penghai & Sun, Zhibo. (2022). RTIDS: A Robust Transformer-Based Approach for Intrusion Detection System. IEEE Access. 10. 1-1. 10.1109/ACCESS.2022.3182333.

Bilot, T., Madhoun, N.E., Agha, K.A., & Zouaoui, A. (2023). Graph Neural Networks for Intrusion Detection: A Survey. IEEE Access, 11, 49114-49139.

Sun, Z., Teixeira, A. M. H., & Toor, S. (2024). GNN-IDS: Graph neural network based intrusion detection system. In Proceedings of the 19th International Conference on Availability, Reliability and Security (ARES 2024) (Article 14, 12 pages). https://doi.org/10.1145/3664476.3664515.

Kartiwi, M. CNN-LSTM: Hybrid Deep Neural Network for Network Intrusion Detection System. IEEE Access. https://doi.org/10.1109/ACCESS.2022.3206425.

Psychogyios K, Papadakis A, Bourou S, Nikolaou N, Maniatis A, Zahariadis T. (2024). Deep Learning for Intrusion Detection Systems (IDSs) in Time Series Data. Future Internet. 16(3):73. https://doi.org/10.3390/fi16030073.

Ahmad, Waqas & Amjad, Muhammad. (2024). Anomaly Detection in HTTP Logs: Leveraging Machine Learning for Uncovering Anomalous Traffic Patterns with SIEM Integration. 622-629. 10.1109/IBCAST61650.2024.10877256.

Rahman, M. M., Al Shakil, S. & Mustakim, M. R. (2025) A survey on intrusion detection system in iot networks. Cyber Secur. Appl. 3, 100082. https://doi.org/10.1016/j.csa.2024.100082.

Pradhan, Reshamlal. (2022). Decision Tree Based Classifications on CICIDS 2017 Dataset for the Identification of DDoS, Botnet, and Web Attack. NeuroQuantology. 20. 4468-4475. 10.48047/NQ.2022.20.12.NQ77771.

ВИЯВЛЕННЯ АНОМАЛІЙ У МЕРЕЖЕВОМУ ТРАФІКУ ВЕБ-ДОДАТКІВ З ВИКОРИСТАННЯМ АЛГОРИТМУ RANDOM FOREST

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

Мова

logo