ІДЕНТИФІКАЦІЯ ОБ’ЄКТІВ СТАТИЧНИХ ЗОРОВИХ СЦЕН: НОВИЙ ПІДХІД
DOI:
https://doi.org/10.35546/kntu2078-4481.2024.4.40Ключові слова:
ідентифікація об’єктів, комп’ютерний зір, згорткові нейронні мережі, розпізнавання образівАнотація
Ця наукова стаття пропонує новий підхід до ідентифікації об’єктів на статичних зорових сценах, що поєднує передові методи машинного навчання та обробки зображень. Завдяки двоетапній структурі запропонований метод ідентифікації забезпечує високу точність і швидкість виявлення об’єктів у різних умовах освітлення, спотворень та шумів. Переваги нового підходу включають високу продуктивність, ефективне використання ресурсів та масштабованість для різних галузей застосування. Метою дослідження є підвищення точності і швидкості ідентифікації об’єктів на статичних зорових сценах, стійкості до різних видів шуму та спотворень. Дослідження передбачає оптимізацію алгоритмів обробки зображень і машинного навчання, які дозволяють ефективно виділяти та класифікувати об’єкти в умовах обмежених ресурсів та варіативності зорових сцен. Методологія дослідження полягає у порівняльному аналізі існуючих методів ідентифікації об'єктів, включаючи як двоетапні, так і одноетапні підходи. Виявлено їхні переваги та обмеження. Проведено емпіричне дослідження та оцінку ефективності і точності різних підходів до виявлення та ідентифікації об'єктів. Наукова новизна отриманих у роботі результатів полягає у поєднанні одноетапного та двоетапного виявлення об’єктів за допомогою RefineDet, що дозволяє покращити точність і швидкість виявлення об'єктів, порівняно з традиційними одноетапними методами. Висновки. RefineDet є потужним та ефективним методом для виявлення об'єктів на зображеннях. Його унікальність полягає в комбінації переваг одноетапних та двоетапних підходів, що забезпечує високу точність та швидкість роботи. Це робить його придатним для використання в різних реальних додатках, де потрібна швидка і точна ідентифікація об'єктів.
Посилання
W. Liu, D. Anguelov, D. Erhan, C. Szegedy, S. Reed, and C. Y. Fu. SSD: Single shot multibox detector, in Proc. Eur. Conf. Comput. Vis., Amsterdam, The Netherlands, Oct. 2016, pp. 11–14.
R. Girshick, J. Donahue, T. Darrell, and J. Malik. Rich feature hierarchies for accurate object detection and semantic segmentation, in Proc. IEEE Conf. Comput. Vis. Pattern Recognit., Jun. 2014, pp. 23–28
Sana Pavan Kumar Reddy. Cusp Pixel Labelling Model for Objects Outline Using R-CNN. 2021. URL: https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9667355 (дата звернення: 01.11.2024).
S. Ren, K. He, R. Girshick, J. Sun. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks. IEEE Trans. Pattern Anal. Mach. Intellegence, 39 (2017), pp. 1137-1149.
K. He G. Gkioxari P. Dollár R. Girshick. Mask R-CNN Proceedings of the 2017 IEEE International Conference on Computer Vision (ICCV) Venice, Italy 22–29 October 2017.
J. An, A. Mikhaylov, K. Kim. Machine learning approach in heterogeneous group of algorithms for transport safetycritical system. Appl. Sci., 10. 2020.
S.M. Abbas S.N. Singh Region-based object detection and classification using faster R-CNN Proceedings of the 2018 4th International Conference on Computational Intelligence & Communication Technology (CICT) Ghaziabad, India 9–10 February 2018.
Jiaxu Leng, Ying Liu, Xinbo Gao, Senior Member. Selective region enlargement network for fast object detection in high resolution images. URL: https://doi.org/10.1016/j.neucom.2021.08.015 (дата звернення: 01.11.2024).
S. Ren, K. He, R. Girshick and J. Sun, "Faster R-CNN: Towards real-time object detection with region proposal networks", IEEE Trans. Pattern Anal. Mach. Intell., vol. 39, no. 6, pp. 1137-1149, Jun. 2017.
J. Redmon, S. Divvala, R. Girshick and A. Farhadi, "You only look once: Unified real-time object detection", Proc. IEEE Conf. Comput. Vis. Pattern Recognit., pp. 779-788, Jun. 2016.
W. Liu, D. Anguelov, D. Erhan, C. Szegedy, S. Reed, C.-Y. Fu, et al., "SSD: Single shot multibox detector" in Computer Vision–ECCV, Cham, Switzerland:Springer, pp. 21-37, 2016.
Kai Shuang, Zhiheng Lya, Jonathan Loo, Wentao Zhang. Scale-balanced loss for object detection. URL: https://doi.org/10.1016/j.patcog.2021.107997 (дата звернення: 04.11.2024).