МОДЕЛЮВАННЯ ПРИЙНЯТТЯ РІШЕНЬ З УПРАВЛІННЯ РЕСУРСАМИ МІКРОСЕРВІСІВ ТА ВИБОРУ ВІРТУАЛЬНИХ МАШИН У СЕРЕДОВИЩІ KUBERNETES

Автор(и)

  • О. М. ШУШУРА Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0003-3200-720X
  • Д. A. ІГНАТОВ Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0009-0008-2864-8526

DOI:

https://doi.org/10.35546/kntu2078-4481.2025.3.2.67

Ключові слова:

мікросервіси, Kubernetes, управління ресурсами, прогнозування навантаження, автомасштабування, оптимізація, віртуальні машини, інформаційні технології, інформаційні системи

Анотація

Сучасні хмарні системи, побудовані з використанням мікросервісних архітектур, стикаються з критичною проблемою ефективного управління ресурсами в умовах динамічного навантаження. Стандартні реактивні механізми оркестратора Kubernetes, такі як Horizontal Pod Autoscaler, часто виявляються недостатніми через затримки у реакції, відсутність врахування майбутніх трендів навантаження та інерційність процесів запуску нових реплік мікросервісів і віртуальних машин. Це призводить до неефективного використання ресурсів, коливань продуктивності (flapping) та зайвих операційних витрат. У відповідь на ці виклики в статті запропоновано комплексну математичну модель для оптимального проактивного управління ресурсами на основі прогнозування навантаження, динамічне масштабування мікросервісів із врахуванням затримок та оптимальне розміщення подів на віртуальних машинах. Метою даної роботи є розробка математичної оптимізаційної моделі для автоматичного управління ресурсами мікросервісів та динамічного вибору віртуальних машин. Формалізовано предметну область шляхом визначення ключових множин: класів віртуальних машин, активних екземплярів віртуальних машин, типів мікросервісів та їхніх реплік (подів). На основі історичних даних метрик CPU та оперативної пам’яті виконується прогнозування навантаження на горизонті планування і для кожного типу мікросервіса розраховується бажана кількість реплік, необхідна для обробки очікуваного навантаження. Сформовано та формалізовано цільову функцію і обмеження задачі оптимального управління ресурсами мікросервісів та вибору віртуальних машин, спираючись на сукупність прийнятих припущень. Запропонований підхід забезпечує підвищення відмовостійкості та продуктивності мікросервісних додатків при одночасному зниженні операційних витрат за рахунок усунення надмірного резервування та консолідації навантаження на найбільш економічно ефективних типах віртуальних машин. Результати роботи становлять теоретичну основу для подальших досліджень та практичної реалізації системи інтелектуального оркестрування для Kubernetes.

Посилання

Kubernetes. Horizontal Pod Autoscaling. URL: https://kubernetes.io/docs/tasks/run-application/horizontal-podautoscale/ (дата звернення: 03.07.2025).

Федоришин Б., Красько О. (2024) Міграція сервісів в кластері Kubernetes на основі прогнозування навантаження. Інфокомунікаційні технології та електронна інженерія, випуск 4, номер 2, cторінки 82–92. URL: https://doi.org/10.23939/ictee2024.02.082 (дата звернення: 09.07.2025).

Сімакін С., Божуха Л. (2024) Прогнозування навантаження на сервер з використанням ШІ для оптимізації веб–сервісів. Актуальні проблеми автоматизації та інформаційних технологій, номер 28, сторінки. 234–243. URL: http://doi.org/10.15421/432422 (дата звернення: 12.07.2025).

Snehal Chaflekar, Rajendra Rewatkar. (2025) Novel load prediction in microservice architecture using attention mechanism-based deep LSTM networks. International Journal of Innovative Research and Scientific Studies, vol. 8, no. 3, pp. 1046–1058. URL: https://doi.org/10.53894/ijirss.v8i3.6751 (дата звернення: 15.07.2025).

Гутман Д., Сирота О. (2023) Проактивне автоматичне масштабування вверх для Kuberneters. Адаптивні системи автоматичного управління, номер 1, сторінки 32-38. URL: https://doi.org/10.20535/1560-8956.42.2023.278925 (дата звернення: 23.07.2025).

Wei-Kuang Lai, You-Chiun Wang, Syu-Chen Wei. (2023) Delay-Aware Container Scheduling in Kubernetes. IEEE Internet of Things Journal, vol. 10, no. 13, pp. 11813–11824. URL: https://doi.org/10.1109/JIOT.2023.3244545 (дата звернення: 01.08.2025).

Kubernetes. Resource Bin Packing. URL: https://kubernetes.io/docs/concepts/scheduling-eviction/resource-binpacking/(дата звернення: 07.08.2025).

Rodriguez, M. A., & Buyya, R. (2018) Containers Orchestration with Cost-Efficient Autoscaling in Cloud Computing Environments. ArXiv, abs/1812.00300. URL: https://doi.org/10.48550/arXiv.1812.00300 (дата звернення: 15.08.2025).

Guruge PB and Priyadarshana YHPP. (2025) Time series forecasting-based Kubernetes autoscaling using Facebook Prophet and Long Short-Term Memory. Frontiers in Computer Science, vol. 7. URL: https://doi.org/10.3389/fcomp.2025.1509165 (дата звернення: 19.08.2025).

Maiyza, A. I., Hassan, H. A., Sheta, W. M. (2025) VTGAN based proactive VM consolidation in cloud data centers using value and trend approaches. Scientific Reports, vol. 15, no. 20133. URL: https://doi.org/10.1038/s41598-025-04757-z (дата звернення: 27.08.2025).

##submission.downloads##

Опубліковано

2025-11-28