МОДЕЛЮВАННЯ СИСТЕМІ УПРАВЛІННЯ БПЛА ІЗ ЗАСТОСУВАННЯМ МОДЕЛІ REINFORCEMENT LEARNING

М. Б. ЄДИНОВИЧ; Т. О. КУЗЬМІНА; О. І. СОЛОГУБОВ

doi:10.32782/mathematical-modelling/2026-9-1-10

Автор(и)

М. Б. ЄДИНОВИЧ Херсонський національний технічний університет https://orcid.org/0000-0002-8086-8189
Т. О. КУЗЬМІНА Херсонський національний технічний університет https://orcid.org/0000-0002-6113-1923
О. І. СОЛОГУБОВ Херсонський національний технічний університет https://orcid.org/0009-0004-4203-3350

DOI:

https://doi.org/10.32782/mathematical-modelling/2026-9-1-10

Ключові слова:

БПЛА, дрон, ШІ, навчання з підкріпленням, контролер, агент, винагорода, імітація, тяга, спостереження

Анотація

У статті було досліджено найбільш поширені методи управління БПЛА із застосуванням як традиційних методів з використанням пропорційно-інтегрально-диференціального (ПІД) закону керування так і інтелектуальних систем. Застосування алгоритмів штучного інтелекту (ШІ), зокрема алгоритмів навчання з підкріпленням (Reinforcement Learning) забезпечує адаптивність до змінної динаміки та середовища. При створенні моделі БПЛА враховувалися основні показники системи керування БПЛА ‒ амплітуда підйомної сили та різниця підйомної сили. Використання цих параметрів у моделюванні дозволяє забезпечити реалістичну поведінку дрона в двовимірному просторі, що дає змогу точно оцінити ефективність алгоритмів управління. Амплітуда підйомної сили відповідає за базову стабільність та виконання вертикальних завдань, тоді як різниця підйомної сили забезпечує можливість маневрування та досягнення заданих маршрутних точок. Була запропонована система оцінки продуктивності (scoring), яка базується на завданні навігації до випадкових точок у просторі, що представлені у вигляді «повітряних кульок». У ході досліджень було розроблено математичну модель та алгоритми управління, що враховують динаміку руху БПЛА у двовимірному просторі, з урахуванням впливу інерції, гравітації та тяги пропелерів. Було проведено моделювання з використанням алгоритмів DQN, SAC і SAC з модифікацією рівня диференціальної тяги. Виконано порівняльний аналіз ефективності зазначених підходів у різних сценаріях. Для тестування ефективності алгоритмів створено симуляційне середовище на основі мови програмування Python із використанням бібліотек NumPy, Matplotlib, Pygame та Stable-Baselines3. Середовище дозволяє моделювати завдання стабілізації польоту, навігації та уникнення перешкод. З метою створення універсальної платформи для дослідження систем управління розроблено симуляційне середовище на основі мови Python. Це середовище дозволяє тестувати алгоритми в умовах, близьких до реальних, без необхідності використання дорогого обладнання.

Посилання

Литвиненко М. І., Ленець, В. Г., Гармаш Н. В. Шульга В. В. Аспекти впровадження штучного інтелекту у військовій справі. Збірник наукових праць Харківського національного університету Повітряних Сил. 2024. С. 13–18. DOI: https://doi.org/10.30748/zhups.2024.80.02

Koch W., Mancuso R., West R., Bestavros A. 2019. Reinforcement Learning for UAV Attitude Control. ACM Transactions on Cyber-Physical Systems. 2019. Vol. 3. №. 2. Article 22, 21 pages. https://doi.org/10.1145/3301273

ArduPilot Copter URL: https://ardupilot.org/copter/index.html (Дата звернення 18.11.25).

Maleki K. N., Ashenayi K., Hook L. R., Fuller J. G., Hutchins N. A reliable system design for nondeterministic adaptive controllers in small UAV autopilots. 2016 IEEE/AIAA 35th Digital Avionics Systems Conference (DASC’16). Sacramento, 25-29 September 2016. CA, USA, 2016, pp. 1–5, DOI: https://doi.org/10.1109/DASC.2016.7778103

Santoso F., Garratt M. A., Anavatti S. G. State-of-the-art intelligent flight control systems in unmanned aerial vehicles. IEEE Transactions on Automation Science and Engineering. 2017. Vol. 15, № 2, Р. 613–627. DOI: https://doi.org/10.1109/TASE.2017.2651109

Dierks T., Jagannathan S. 2010. Output feedback control of a quadrotor UAV using neural networks. IEEE Transactions on Neural Networks. 2010. Vol. 21, № 1. Р. 50–66. DOI: https://doi.org/10.1109/TNN.2009.2034145

Bobtsov A., Guirik A., Budko M., Budko M. Hybrid parallel neuro-controller for multiro-tor unmanned aerial vehicle. 2016 8th International Congress on Ultra Modern Telecommunications and Control Systems and Workshops (ICUMT’16), 18–20 October 2016. Lisbon, Portugal, 2016. Р. 1–4. DOI: https://doi.org/10.1109/ICUMT.2016.7765223

Shepherd III J. F. Tumer K. Robust neuro-control for a micro quadrotor. In Proceedings of the 12thAnnual Conference on Genetic and Evolutionary Computation. (GECCO’10). ACM, 2010. New York, NY, 1131–1138. https://doi.org/10.1145/1830483.1830693

Miglino O., Lund H. H., Nolfi S. Evolving mobile robots in simulated and real environ-ments. Artificial Life 1995. Vol. 2. № 4, 417–434. DOI: https://doi.org/10.1162/artl.1995.2.4.417

Hwangbo J., Sa I., Siegwart R., Hutter M. Control of a quadrotor with reinforcementlearning. IEEE Robotics and Automation Letters. 2017. Vol. 2. № 4. Р. 2096–2103. https://doi.org/10.1109/LRA.2017.2720851

Zorain M., Khan F. S., Hasanv N., Mohy Ud Din Z., Zeb Gul J. Deep reinforcement learning for UAV attitude control via adaptive gain optimization Applied Intelligence. 2025. Vol. 55. Issue 17. P. 1092. https://doi.org/10.1007/s10489-025-06978-1

Stable-Baselines3 Docs ‒ Reliable Reinforcement Learning Implementations URL: https://stable-baselines3.readthedocs.io/en/v1.0/ (Дата звернення 20.11.25).

Weights & Biases AI developer platform. URL: https://wandb.ai/site/ (Дата звернення 20.11.25).

МОДЕЛЮВАННЯ СИСТЕМІ УПРАВЛІННЯ БПЛА ІЗ ЗАСТОСУВАННЯМ МОДЕЛІ REINFORCEMENT LEARNING

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

Мова

logo