РЕГРЕСІЙНІ МОДЕЛІ ДЛЯ РАННЬОГО ОЦІНЮВАННЯ КІЛЬКОСТІ РЯДКІВ КОДУ ВЕБЗАСТОСУНКІВ, ЩО СТВОРЮЮТЬСЯ ЗА ДОПОМОГОЮ ФРЕЙМВОРКУ CODEIGNITER
DOI:
https://doi.org/10.32782/mathematical-modelling/2025-8-1-18Ключові слова:
регресійна модель, оцінювання, рядки коду, вебзастосунок, PHP, фреймворк, Codeigniter, клас, метод, глибина дерева успадкування, перетворення Бокса – КоксаАнотація
Проблема раннього оцінювання кількості рядків коду у проєктах програмного забезпечення має велике значення, оскільки це безпосередньо впливає на прогнозування зусиль із розроблення програмних застосунків, зокрема й вебзастосунків, які створюються за допомогою такого відомого PHP фреймворку, як Codeigniter. Об’єктом дослідження є процес раннього оцінювання кількості рядків коду вебзастосунку, які створюються за допомогою Codeigniter. Предметом дослідження є регресійні моделі для раннього оцінювання кількості рядків коду вебзастосунків, які створюються за допомогою Codeigniter.Метою роботи є побудова декількох трифакторних регресійних моделей для раннього оцінювання кількості рядків коду вебзастосунків, які створюються за допомогою фреймворку “Codeigniter”, залежно від чинників, що можуть бути знайдені за діаграмою класів.У роботі побудовано дві лінійні регресійні моделі для раннього оцінювання кількості рядків коду вебзастосунків, які створюються за допомогою фреймворку “Codeigniter”, залежно від трьох чинників: кількості класів, середньої кількості методів на клас і метрики DIT (Depth of Inheritance Tree) на рівні застосунку. Зазначені чинники вибрано із двох причин: їхнє значення можна отримати з діаграми класів, вони не мають проблеми мультиколінеарності. Оцінки параметрів отриманих моделей були знайдені за методом найменших квадратів. Зазначені моделі побудовані на основі розбиття чотиривимірного набору даних (фактичний розмір у тисячах рядків коду; кількість класів; середня кількість методів на клас; метрика DIT на рівні застосунку) на два кластери. Ці дані з метрик для 50 вебзастосунків із відкритим кодом, що створювалися за допомогою фреймворку “Codeigniter”, були отримані за допомогою інструменту PhpMetrics (https://phpmetrics.org/). Ці застосунки розміщені на платформі “GitHub” (https://github.com/). Виконано порівняння побудованих лінійних регресійних моделей з існуючими нелінійними регресійними моделями. Ці дві лінійні моделі в порівнянні з існуючими нелінійними моделями дозволяють описувати всі чотиривимірні дані, за якими вони були побудовані. Урахування всього набору даних, зокрема й аномальних значень, дозволяє підвищити універсальність моделей. Аномалії, хоча і можуть впливати на точність окремих прогнозів, часто є важливими для відображення специфічних особливостей реальних проєктів. Використання таких даних сприяє створенню моделей, які є більш адаптивними до різноманітних сценаріїв розробки.
Посилання
Brar P., Nandal D. A systematic literature review of machine learning techniques for software effort estimation models. Computational intelligence and communication technologies (CCICT) : proceedings of 2022 Fifth International conference, Sonepat, India: IEEE, 2022. P. 494–499. https://doi.org/10.1109/CCiCT56684.2022.00093.
Kumar S., Arora M., Sakshi Chopra S. A review of effort estimation in agile software development using machine learning techniques. Inventive research in computing applications (ICIRCA) : proceedings of the 2022 4th International conference, Coimbatore, India: IEEE, 2022. P. 416–422. https://doi.org/10.1109/ICIRCA54612.2022.9985542.
Rahman M., Sarwar H., Kader M.A., Gonçalves T., Tin, T.T. Review and empirical analysis of machine learning-based software effort estimation. IEEE Access. 2024. Vol. 12. P. 85661–85680. https://doi.org/10.1109/ACCESS.2024.3404879.
Hussain I., Malik A.A. Determining the utility of use case points and class points in early software size estimation. Emerging Technologies (ICET) : proceedings of 2023 18th International Conference, Peshawar, Pakistan: IEEE, 2023. P. 171–175. https://doi.org/10.1109/ ICET59753.2023.10374977.
Yuan X., Su J., Yu C., Ye S. Power grid software cost estimation based on improved COCOMO model. Electronic technology, communication and information (ICETCI) : proceedings of the 2023 IEEE 3rd International conference, Changchun, China, Los Alamitos: IEEE, 2023. P. 1265–1269. https://doi.org/10.1109/ICETCI57876.2023.10176686.
Prykhodko S.B., Shutko I.S., Prykhodko A.S. Early size estimation of web apps created using Codeigniter framework by nonlinear regression models. Radio-electronic and computer systems. 2022. Vol. 103. № 3. P. 84–94. https://doi.org/10.32620/reks.2022.3.06.
Prykhodko S., Prykhodko N. Building nonlinear regression models for estimating the number of clusters and their initial centroids. Computer sciences and information technologies (CSIT) : proceedings of the 2023 IEEE 18th International conference, Lviv, Ukraine: IEEE, 2023. P. 1–4. https://doi.org/10.1109/CSIT61576.2023.10324095.
Daud M., Malik A.A. Improving the accuracy of early software size estimation using analysis-to-design adjustment factors (ADAFs). IEEE Access. 2021. Vol. 9. P. 81986–81999. https://doi.org/10.1109/ACCESS.2021.3085752.
Dewi R.S., Araynawa T.K., Prasanna F.M., Felianasari N., Rahmawati R., Hartantc A.E., … Mazaya Al-K. Improving software size estimation using data complexity (Case study: Research and community service monitoring apps). Electrical engineering, computer science and informatics (EECSI) : proceedings of 2024 11th International conference, Yogyakarta, Indonesia: IEEE, 2024. P. 315–319. https://doi.org/10.1109/EECSI63442.2024.10776530.
Dewi R.S., Zahrah F.A., Nugraha D.A., Prabowo P.S., Safitri A., Jayadi P. Predicting software size based on conceptual data model (Case study: Shrimp pond system management). Electrical engineering and computer science (ICECOS) : proceedings of 2024 International conference, Palembang, Indonesia: IEEE, 2024. P. 175–178. https://doi.org/10.1109/ ICECOS63900.2024.10791154.
Nassif A.B., AbuTalib M., Capretz L.F. Software effort estimation from Use Case diagrams using nonlinear regression analysis. In On electrical and computer engineering : proceedings of IEEE Canadian conference, London, ON, Canada: IEEE, 2020. P. 1–4. https://doi.org/10.1109/CCECE47787.2020.9255712.
Sahoo P., Behera D.K., Mohanty J.R., Kumar Dash C.S. Effort estimation of software products by using UML sequence models with regression analysis. Information Technology (OCIT) : proceedings of the 2022 OITS International Conference, Bhubaneswar, India, Los Alamitos: IEEE, 2022. P. 97–101. https://doi.org/10.1109/OCIT56763.2022.00028.
Manisha Rishi R. Early size estimation using machine learning. Computing for sustainable global development (INDIACom) : proceedings of the 2021 8th International conference, New Delhi, India, Los Alamitos: IEEE, 2021. P. 757–762. https://doi.org/10.1109/INDIACom51348.2021.00135.
Nhung H.L.T.K., Hai V.V., Silhavy R., Prokopova Z., Silhavy P. Parametric software effort estimation based on optimizing correction factors and multiple linear regression. IEEE Access. 2022. Vol. 10. P. 2963–2986. https://doi.org/10.1109/ACCESS.2021.3139183.






