ПІДХОДИ МАШИННОГО НАВЧАННЯ ДЛЯ ІНТЕРПРЕТАЦІЇ ВІЗУАЛЬНИХ ДАНИХ В УМОВАХ НЕВИЗНАЧЕНОСТІ

Автор(и)

DOI:

https://doi.org/10.35546/kntu2078-4481.2024.4.31

Ключові слова:

штучний інтелект, комп’ютерний зір, нейронні мережі, штучні нейронні мережі, згорткові нейронні мережі, рекурентні нейронні мережі, розпізнавання образів

Анотація

У сфері обчислювального інтелекту інтерпретація візуальних даних лежить в основі безлічі застосувань, від автономних навігаційних систем до медичної діагностики. Однак властива невизначеність, присутня у візуальних даних, що виникає через такі фактори, як шум, оклюзії та мінливість зовнішнього вигляду об’єкта, створює значні проблеми для надійної інтерпретації. Традиційні методи комп’ютерного зору часто борються з неоднозначністю та неточністю даних реального світу, що призводить до попиту на більш адаптивні та стійкі методи. Машинне навчання з його здатністю вчитися на складних шаблонах даних і адаптуватися до них стає ключовим рішенням цієї головоломки. У цьому документі досліджуються передові підходи машинного навчання, призначені для інтерпретації невизначених візуальних даних, що має вирішальне значення для підвищення точності та надійності автоматизованого візуального розуміння. Поява машинного навчання у сфері інтерпретації візуальних даних започаткував зміну парадигми, перехід від обробки на основі правил до навчання, керованого даними. Серед безлічі проблем невизначена інтерпретація візуальних даних вимагає тонкого підходу, коли система повинна не лише розпізнавати закономірності, але й кількісно оцінювати та керувати невизначеністю, притаманною вхідним даним. Ця невизначеність може проявлятися в різних формах, включаючи, але не обмежуючись цим, шум датчика, часткові оклюзії та неоднозначні межі об’єктів, які разом погіршують продуктивність звичайних систем перекладу. Тому ця наукова стаття спрямована на аналіз різних моделей і алгоритмів машинного навчання, які спеціально розроблені або адаптовані для інтерпретації візуальних даних в умовах невизначеності. Він зосереджений на розумінні того, як ці методи можуть ефективно обробляти та інтерпретувати дані, які є неоднозначними, неповними або спотвореними. Метою дослідження є вибір оптимального підходу до аналізу візуальних даних за допомогою штучного інтелекту в умовах невизначеності. Основною задачею дослідження є аналіз методів класифікації на основі відомих нейронних мереж, які орієнтовані на обробку та розпізнавання образів зображень.

Посилання

Abhishek G., Alagan A., Ling G., Ahmed S. K. Deep learning for object detection and scene perception in selfdriving cars: Survey, challenges, and open issues. Array. 2021. T. 1, № 10. С. 1-10. DOI: https://doi.org/10.1016/j.array.2021.100057

Arshi P., Muhammad A. K., Rukhsana Z., Huma A., Muhammad A., Muhammad M. F. Vision Transformers in medical computer vision. Engineering Applications of Artificial Intelligence. 2023. Т. 1, № 122. С. 1-10. DOI: https://doi.org/10.1016/j.engappai.2023.106126

Lee M., Valisetty R., Breuer A., Kirk K. Current and Future Applications of Machine Learning for the US Army. URL: https://apps.dtic.mil/sti/pdfs/AD1050263.pdf (дата звернення: 20.10.2024).

Karaman M., Çatalkaya H., Aybar C. Institutional Cybersecurity from Military Perspective. International journal of information security science. 2016. № 5. – C. 1-11. – URL: https://www.researchgate.net/publication/299533127_Institutional_Cybersecurity_from_Military_Perspective

Chang D. T. Bayesian Neural Networks: Essentials. URL: https://www.researchgate.net/publication/353067263_Bayesian_Neural_Networks_Essentials (дата звернення: 20.10.2024).

Rabaey P., De Boom C., Demeester. T. Neural Bayesian Network Understudy. URL: https://www.researchgate.net/publication/365422792_Neural_Bayesian_Network_Understudy (дата звернення: 20.10.2024).

Bonnet D., Hirtzlin T., Majumdar A., Dalgaty T. Bringing uncertainty quantification to the extreme-edge with memristor-based Bayesian neural networks. Nature Communications. 2023. Т. 1, № 14. С. 3-10. DOI: http://dx.doi.org/10.1038/s41467-023-43317-9

Khan Tareen S., Khan Tareen F. Convolutional Neural Networks for Beginners. SSRN Electronic Journal. 2023. С. 1-10. URL: https://www.researchgate.net/publication/373813288_Convolutional_Neural_Networks_for_Beginners 9. Liu C. Research on image classification leveraging deep convolutional neural networks and visual. Applied and Computational Enginering. 2024. Т. 1, № 32. С. 200-209. DOI: https://doi.org/10.54254/2755-2721/32/20230212

Wang R. (2024). Generalisation of Feed-Forward Neural Networks and Recurrent Neural Networks. Applied and Computational Enginering. 2024. Т. 1, № 40. С. 242-246. DOI: https://doi.org/10.54254/2755-2721/40/20230659

Agrwal P., Kumar S., Shekhar Yadav C. Denoising watermarked images using Bidirectional Recurrent Convolutional Neural Networks. URL: https://www.researchgate.net/publication/371899317_Denoising_watermarked_images_using_Bidirectional_Recurrent_Convolutional_Neural_Networks (дата звернення: 20.10.2024).

##submission.downloads##

Опубліковано

2024-12-30