РЕГРЕСІЙНІ МОДЕЛІ ДЛЯ РАННЬОГО ОЦІНЮВАННЯ КІЛЬКОСТІ РЯДКІВ КОДУ РІЗНИХ ВИПУСКІВ ЗАСТОСУНКІВ ІЗ ВІДКРИТИМ КОДОМ

Автор(и)

DOI:

https://doi.org/10.32782/mathematical-modelling/2025-8-2-9

Ключові слова:

регресійна модель, оцінювання, рядки коду, застосунок із відкритим кодом, клас, нормалізуюче перетворення, критерій Мардіа, викид, відстань Махаланобіса, тестова статистика

Анотація

Проблема раннього оцінювання кількості рядків коду різних випусків програмних застосунків із відкритим кодом є важливою, оскільки це безпосередньо впливає на прогнозування зусиль з їх розроблення та подальшої модифікації. Об’єктом дослідження є процес раннього оцінювання кількості рядків коду різних випусків програмних застосунків із відкритим кодом. Предметом дослідження є регресійні моделі для раннього оцінювання кількості рядків коду різних випусків програмних застосунків із відкритим кодом. Метою роботи є побудова однофакторних нелінійних регресійних моделей для раннього оцінювання кількості рядків коду різних випусків програмних застосунків із відкритим кодом. У роботі побудовано дві нелінійні регресійні моделі для раннього оцінювання кількості рядків коду різних випусків програмних застосунків із відкритим кодом залежно від кількості класів. Перша модель дає змогу виконувати оцінювання кількості рядків коду першого випуску програмних застосунків із відкритим кодом, а друга модель – останнього їх випуску. Зазначені моделі побудовано за двома наборами даних із двох метрик із 40 програмних застосунків із відкритим кодом: кількість строк коду та кількість класів для першого та останнього випусків відповідних застосунків. Згідно з критерієм Мардіа, розподіл цих двовимірних даних відхилявся від нормального, тому для перевірки наявності викидів у цих наборах даних було застосовано відповідний метод на основі квадрату відстані Махаланобіса для нормалізованих даних. Для нормалізації даних було використано нормалізуюче перетворення у вигляді десяткового логарифму. Згідно з критерієм Мардіа, розподіл нормалізованих даних не відхилявся від нормального. Оцінки параметрів отриманих моделей знайдено за методом найменших квадратів. Якість побудованих моделей перевірено за трьома відомими показниками: коефіцієнтом детермінації R2, середньою величиною відносної помилки MMRE та відсотком прогнозованих результатів PRED, для яких величини відносної помилки менші за 0,25, PRED (0,25). Отримані значення вказаних показників якості свідчать про задовільну якість двох побудованих нелінійних регресійних моделей.

Посилання

Himansh M., Manikandan V.M. A statistical study and analysis to identify the importance of open-source software. Information Technology (ICITIIT) : proceedings of 2022 International Conference, Kottayam, 13–14 February 2022. Kottayam, India: IEEE, 2022. P. 1–6. https://doi.org/10.1109/ICITIIT54346.2022.9744176

Haider S., Khalil W., Al-Shamayleh A.S., Akhunzada A., Gani A. Risk factors and practices for the development of open source software from developers’ perspective. IEEE Access. 2023. Vol. 11. P. 63333–63350. https://doi.org/10.1109/ACCESS.2023.3267048

Molnar A.J., Neamţu A., Motogna S. Evaluation of software product quality metrics. Communications in Computer and Information Science. 2020. Vol. 1172. P. 163–187. https://doi.org/10.1007/978-3-030-40223-5_8

Gradišnik M., Beranič T., Karakatič S. Impact of historical software metric changes in predicting future maintainability trends in open-source software development. Applied Sciences. 2020. № 10 (13). 4624. https://doi.org/10.3390/app10134624

Daud M., Malik A.A. Improving the accuracy of early software size estimation using analysis-to-design adjustment factors (ADAFs). IEEE Access. 2021. Vol. 9. P. 81986–81999. https://doi.org/10.1109/ACCESS.2021.3085752

Dewi R.S., Araynawa T.K., Prasanna F.M., Felianasari N., Rahmawati R., Hartantc A.E., … Mazaya Al-K. Improving software size estimation using data complexity (Case study: Research and community service monitoring apps). Electrical engineering, computer science and informatics (EECSI) : proceedings of 2024 11th International conference, Yogyakarta, 26–27 September 2024.Yogyakarta, Indonesia: IEEE, 2024. P. 315–319. https://doi.org/10.1109/ EECSI63442.2024.10776530

Dewi R.S., Zahrah F.A., Nugraha D.A., Prabowo P.S., Safitri A., Jayadi P. Predicting software size based on conceptual data model (Case study: Shrimp pond system management). Electrical engineering and computer science (ICECOS) : proceedings of 2024 International conference, Palembang, 25–26 September 2024. Palembang, Indonesia: IEEE, 2024. P. 175–178. https://doi.org/10.1109/ICECOS63900.2024.10791154

Nassif A.B., AbuTalib M., Capretz L.F. Software effort estimation from Use Case diagrams using nonlinear regression analysis. Electrical and computer engineering : proceedings of IEEE Canadian conference, 30 August – 02 September 2020. London, ON, Canada: IEEE, 2020. P. 1–4. https://doi.org/10.1109/CCECE47787.2020.9255712

Hussain I., Malik A.A. Determining the utility of use case points and class points in early software size estimation. Emerging Technologies (ICET) : proceedings of 2023 18th International Conference, Peshawar, 06–07 November 2023. Peshawar, Pakistan: IEEE, 2023. P. 171–175. https://doi.org/10.1109/ICET59753.2023.10374977

Prykhodko S.B., Shutko I.S., Prykhodko A.S. Early size estimation of web apps created using Codeigniter framework by nonlinear regression models. Radio-electronic and computer systems. 2022. Vol. 103, No 3. P. 84–94. https://doi.org/10.32620/reks.2022.3.06

Manisha, Rishi R. Early size estimation using machine learning. Computing for sustainable global development (INDIACom) : proceedings of the 2021 8th International conference, New Delhi, 17-19 March 2021. New Delhi, India, Los Alamitos: IEEE, 2021. P. 757–762. https://doi.org/10.1109/INDIACom51348.2021.00135

Molla Y.S., Alemneh E., Yimer S.T. COSMIC-based early software size estimation using deep learning and domain-specific BERT. IEEE Access. 2025. Vol. 13. P. 28463–28475. https://doi.org/10.1109/ACCESS.2025.3540548

Nhung H.L.T.K., Hai V.V., Silhavy R., Prokopova Z., Silhavy P. Parametric software effort estimation based on optimizing correction factors and multiple linear regression. IEEE Access. 2022. Vol. 10. P. 2963–2986. https://doi.org/10.1109/ACCESS.2021.3139183

Приходько С., Шутко І. Регресійні моделі для раннього оцінювання кількості рядків коду вебзастосунків, що створюються за допомогою фреймворку Codeigniter. Прикладні питання математичного моделювання. 2025. Т. 8, № 1. С. 189–196. https://doi.org/10.32782/mathematical-modelling/2025-8-1-18

##submission.downloads##

Опубліковано

2025-12-30