РЕЗУЛЬТАТИ НАЛАШТУВАННЯ ПАРАМЕТРІВ НЕЙРОННИХ ГЛИБОКИХ МЕРЕЖ ЩОДО РОЗПІЗНАВАННЯ FASHION MNIST DATASET
DOI:
https://doi.org/10.32782/mathematical-modelling/2022-5-2-2Ключові слова:
глибоке навчання, згорткова нейронна мережа, архітектура CNN, точність розпізнавання, налаштування параметрів CNN, Fashion MNIST DATASET, PYTHON, KERAS, TENSORFLOW, GOOGLE COLABАнотація
Проведено дослідження моделей згорткової нейронної мережі (Convolutional neural network – CNN) з метою підвищення точності розпізнавання Fashion MNIST DATASET. З огляду відомо, що розпізнавання елементів одягу набору Fashion MNIST є більш складним ніж розпізнавання набору рукопису цифр MNIST. Набор одягу Fashion-MNIST рекомендовано для досліджень різних архітектур нейронних мереж. Найкращі результати якості розпізнавання Fashion MNIST DATASET отримано за згортковою нейронною мережею. В даній роботі було метою покращити точність розпізнавання Fashion MNIST DATASET за рахунок дослідження різних архітектур CNN та їх параметрів. Обрано дві архітектури послідовної згорткової нейронної мережі з тих, у яких точність розпізнавання Fashion MNIST DATASET більше ніж 93%. Проведено дослідження їх архітектур та параметрів. Моделі відповідають визначенню нейронних глибоких мереж та мають різну кількість шарів. В дослідженнях моделей показано вплив параметрів batch_size, validation_split, validation_data на точність розпізнавання, а також варіанти розташування шару BatchNormalization та шару активації; вплив параметра “filters” для згорткового шару. Крім того, було використано два варіанти вибору валідаційної вибірки: перший – з набору даних для навчання (20%), а другий – набор даних тестування. При розрахунках число епох навчання дорівнювало 20. В процесі навчання вирішувалось питання не допустити перенавчання за допомогою аналізу функції втрат. Використано бібліотеки TensorFlow, Keras, мову програмування Python. Розроблено програмні модулі, які було реалізовано у хмарному сервісі Google Colab. В результаті досліджень підтверджено заявлену у роботах інших авторів точність розпізнавання >93% Fashion MNIST DATASET та отримано покращену точність розпізнавання в 94,16% для однієї з обраних моделей. Обґрунтовано вплив параметру batch_size на точність розпізнавання, обрано значення batch_size відповідно найкращому результату розпізнавання Fashion MNIST DATASET. Продемонстровано, що збільшення кількості даних для навчання покращує точність розпізнавання при використанні параметра valid_data==(X_test, X_test_ labels) замість valid_split для даних навчання. Наведені результати чисельного експеримента, які підтверджують важливість та корисність застосування методів регуляризації для вирішення проблеми перенавчання: налаштування шарів Dropout дозволило покращити точність розпізнавання.
Посилання
Goodfellow I., Bengio Y., Courville A. Deep Learning. London: MIT Press, 2016. 800 с.
Datasets [ Електронний ресурс] – Режим доступу. – URL: https://www.kaggle.com/(дата звернення 10.09.2022).
Shivam S. Kadam, Amol C. Adamuthe, Ashwini B. Patil. CNN Model for Image Classification on MNIST and Fashion-MNIST Dataset. Journal of Scientific Research. 2020. Vol. 64. № 02. P. 374-384. DOI:10.37398/JSR.2020.640251
Convolutional neural net tuning with the FASHION MNIST dataset[ Електронний ресурс] – Режим доступу. – URL: http://www.eamonfleming.com/projects/fashion-mnist.html
Гнатушенко В. В., Дорош Н. Л., Фененко Т. М. Розпізнавання зображень набору FASHION MNIST методами глибокого навчання. Прикладні питання математичного моделювання. 2021. Т.4. № 1. С. 78-85. https://doi.org/10.32782/KNTU2618-0340/2021.4.1.8
Sergey Ioffer, Christian Szegedy. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift [Електронний ресурс] – Режим доступу. – URL: https://arxiv.org/abs/1502.03167