МАТЕМАТИЧНІ МОДЕЛІ ДЛЯ ВИЗНАЧЕННЯ ВИКИДІВ У ДВОВИМІРНИХ ДАНИХ ІЗ МЕТРИК CBO ТА RFC ПРОГРАМНИХ ЗАСТОСУНКІВ З ВІДКРИТИМ КОДОМ НА KOTLIN

Автор(и)

DOI:

https://doi.org/10.32782/mathematical-modelling/2025-8-1-8

Ключові слова:

метрики програмного забезпечення, CBO (Coupling Between Objects), RFC (Response For Class), викиди, Kotlin, нормалізуюче перетворення Бокса – Кокса, відстань Махаланобіса, еліпс прогнозування, об’єктно орієнтоване проєктування

Анотація

У наш час розроблення програмного забезпечення потребує засобів для оцінювання якості та складності об’єктно орієнтованого проєктування. Таке оцінювання проводять за допомогою метрик програмного забезпечення. Зазвичай таке оцінювання потребує обробки даних із метрик, зокрема й виявлення викидів. У реальних даних розподіл метрик здебільшого відхиляється від нормального. Ця проблема ставить питання про розроблення математичних моделей, які будуть ураховувати таку поведінку даних із метрик програмного забезпечення.У дослідженні запропоновано математичні моделі для більш достовірного визначення викидів у двовимірних даних із метрик CBO та RFC спеціально для Kotlin-проєктів. Аналіз 102 open-source проєктів виявив значні відмінності порівняно із Java: середнє значення CBO для Kotlin становило лише 2,20 (проти 11,88 у Java), а RFC – 7,46 (проти 18,36). Тест Мардія підтвердив, що розподіл цих метрик для Kotlin суттєво відхиляється від нормального (β₁ = 70,867, β₂ = 14,066 за критичних значень 9,3 та 9,48).Для вирішення цієї проблеми розроблено модель, яка включає: застосування нормалізуючого перетворення Бокса – Кокса з параметрами та застосування двох взаємодоповнюючих підходів до виявлення викидів (на основі квантиля χ²-розподілу, на основі квантиля F-розподілу Фішера).Результати показують, що запропоновані моделі усувають головний недолік моделі Java, де до 25% Kotlin-проєктів помилково класифікувалися як викиди. Удосконалені моделі демонструють більшу достовірність за проведення аналізу даних із метрик CBO та RFC Kotlin-застосунків, водночас зберігають усі переваги підходу, заснованого на застосуванні еліпсоїда (еліпса) прогнозування. Особливо варто відзначити, що модель з χ²-критерієм виявилась більш строгою, що дозволяє виявляти викиди з більшою достовірністю.Це дослідження має велике практичне значення для розробників, які працюють із Kotlin, пропонує спеціалізований інструмент для аналізу даних із метрик CBO та RFC застосунків на Kotlin. Отримані результати підтверджують необхідність створення окремих аналітичних моделей для різних мов програмування, з урахуванням особливостей розподілу їх метрик.

Посилання

Chidamber S.R., Kemerer C.F. A metrics suite for objectoriented design. IEEE Transactions on Software Engineering. 1994. Vol. 20, № 6. P. 476–493. http://dx.doi.org/10.1109/32.295895.

Booch G. Object-Oriented Analysis and Design with Applications. Pearson Education, Limited, 2011. 608 p.

Molnar A.-J., Neamţu A., Motogna S. Evaluation of Software Product Quality Metrics. Communications in Computer and Information Science. Cham, 2020. P. 163–187. https://doi.org/10.1007/978-3-030-40223-5_8.

Johnson R.A., Wichern D.W. Applied Multivariate Statistical Analysis (6th Edition). Prentice Hall, 2007. 800 p.

Ghorbani H. Mahalanobis distance and its application for detecting multivariate outliers. Facta Universitatis. Series “Mathematics and Informatics”. 2019. P. 583. https://doi.org/10.22190/FUMI1903583G.

IoTDS: A One-Class Classification Approach to Detect Botnets in Internet of Things Devices / V.H. Bezerra et al. Sensors. 2019. Vol. 19. № 14. P. 3188. https://doi.org/10.3390/s19143188.

Kim S.-G., Park D., Jung J.-Y. Evaluation of One-Class Classifiers for Fault Detection: Mahalanobis Classifiers and the Mahalanobis – Taguchi System. Processes. 2021. Vol. 9. № 8. P. 1450. https://doi.org/10.3390/pr9081450.

Prykhodko S., Prykhodko N., Makarova L., Pugachenko K. Detecting outliers in multivariate non- Gaussian data on the basis of normalizing transformations. 2017 IEEE First Ukraine Conference on Electrical and Computer Engineering (UKRCON), Kyiv, Ukraine, 2017, pp. 846–849, DOI: 10.1109/UKRCON.2017.8100366.

Prykhodko S., Prykhodko N., Makarova L., Pukhalevych A. Application of the squared Mahalanobis distance for detecting outliers in multivariate non-Gaussian data. 2018 14th International Conference on Advanced Trends in Radioelecrtronics, Telecommunications and Computer Engineering (TCSET), Lviv ; Slavske, Ukraine, 2018, pp. 962–965, DOI: 10.1109/ TCSET.2018.8336353.

Prykhodko S., Prykhodko N., Makarova L., Kudin O., Smykodub T., Prykhodko A. Detecting bivariate outliers on the basis of normalizing transformations for non-Gaussian data. The Vth International Conference «Advanced Information Systems and Technologies, AIST 2017, May 16–17. 2017. Sumy. URL: http://essuir.sumdu.edu.ua/handle/123456789/55754.

Prykhodko S., Prykhodko N., Smykodub T. A Joint Statistical Estimation of the RFC and CBO Metrics for Open-Source Applications Developed in Java. 2022 IEEE 17th International Conference on Computer Sciences and Information Technologies (CSIT), Lviv, Ukraine, 10–12 November 2022. 2022. https://doi.org/10.1109/csit56902.2022.10000457.

Prykhodko S., Prykhodko N., Koltsov A. A nonlinear regression model for early LOC estimation of open-source Kotlin-based applications. Radio Electronics, Computer Science, Control. 2024. № 1. P. 85. https://doi.org/10.15588/1607-3274-2024-1-8.

Mardia K.V. Measures of multivariate skewness and kurtosis with applications. Biometrika. 1970. Vol. 57, № 3. P. 519–530. https://doi.org/10.1093/biomet/57.3.519.

##submission.downloads##

Опубліковано

2025-05-27