ІНФОРМАЦІЙНА СИСТЕМА КЛАСИФІКАЦІЇ ТА МАРКУВАННЯ ЗОБРАЖЕНЬ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ ШТУЧНОГО ІНТЕЛЕКТУ

Автор(и)

DOI:

https://doi.org/10.35546/kntu2078-4481.2023.3.17

Ключові слова:

класифікація зображень, маркування зображень, штучні нейронні мережі, модель штучного інтелекту, інформаційна технологія, автоматизація

Анотація

Стаття присвячена розробці інформаційної системи для класифікації та маркування зображень з метою навчання моделей штучного інтелекту. Покращення швидкості та точності класифікації і маркування зображень шляхом надання їм певних міток або категорій відкриває нові можливості для використання машинного навчання у різних сферах, включаючи комп'ютерний зір, медичну діагностику, розпізнавання образів. Проведений аналіз наявних систем анотування зображень показав, що слабкими сторонами цих технологій є неповнота та незручність реалізованих інструментів, недостатньо висока швидкість виконання операцій. У роботі запропоновано для класифікації та маркування зображень використати технології штучних нейронних мереж. З метою автоматизації класифікації зображень обрано мережу ResNet, яка навчається в процесі виконання роботи в межах одного датасету, що дозволяє скоротити витрати часу на проведення операції. Для задач маркування зображень застосовано мережу SAM, яка дає змогу узагальнювати незнайомі об'єкти та зображення без необхідності додаткового навчання. Дослідження використання цих технологій на контрольній вибірці даних показало достатньо високу точність їх роботи. Сформовано вимоги до інформаційної системи автоматизації класифікації та маркування зображень, які формалізовані у вигляді діаграми прецедентів UML, спроектована її структура та обрані засоби розробки, створене програмне забезпечення на мові Python та проведене його тестування. В якості системи управління базами даних обрано MongoDB через її безкоштовність та продуктивність. Результати досліджень можуть бути використані розробниками інформаційних технологій, що працюють в області навчання моделей штучного інтелекту.

Посилання

Data Labeling: How to Choose a Data Labeling Partner in 2023 [Електронний ресурс]. Режим доступу до ресурсу: https://research.aimultiple.com/data-labeling/#why-is-it-important-now

Acs B, Rantalainen M, Hartman J. Artificial intelligence as the next step towards precision pathology. J Intern Med. 2020. Vol. 288. P. 62–81.

Gulbahar Karatas. Data Annotation in 2023: Why it matters & Top 8 Best Practices. AIMultiple [Електронний ресурс]. Режим доступу до ресурсу: https://research.aimultiple.com/data-annotation/.

Документація Computer Vision Annotation Tool (CVAT) [Електронний ресурс]. Режим доступу до ресурсу: https://github.com/opencv/cvat.

Документація Label studio(LS) [Електронний ресурс]. Режим доступу до ресурсу: https://labelstud.io/guide/.

Abdou, M.A. Literature review: efficient deep neural networks techniques for medical image analysis. Neural Comput & Applic. 2022. Vol. 34. P. 5791–5812. https://doi.org/10.1007/s00521-022-06960-9.

Gulzar, Y. Fruit Image Classification Model Based on MobileNetV2 with Deep Transfer Learning Technique. Sustainability. 2023. Vol. 15, 1906. https://doi.org/10.3390/su15031906.

Dhiman, G., Kumar, A.V., Nirmalan, R. et al. Multi-modal active learning with deep reinforcement learning for target feature extraction in multi-media image processing applications. Multimed Tools Appl Vol. 82. P. 5343–5367. https://doi.org/10.1007/s11042-022-12178-7.

G. Huang, Z. Liu, L. Van Der Maaten and K. Q. Weinberger. Densely Connected Convolutional Networks. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Honolulu, HI, USA, 2017, pp. 2261-2269. https://doi.org/10.1109/CVPR.2017.243.

Огляд ResNet та його варіантів [Електронний ресурс] – Режим доступу до ресурсу: https://datascience.eu/machine-learning/an-overview-of-resnet-and-its-variants/.

Офіційний Сайт Segment Anything Model (SAM) [Електронний ресурс]. Режим доступу до ресурсу: https://segment-anything.com/.

##submission.downloads##

Опубліковано

2023-11-13