АНАЛІЗ ПЕРЕВАГ ТА НЕДОЛІКІВ ГЕНЕРАЦІЇ КОДУ  ІЗ ВИКОРИСТАННЯМ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ  В СУЧАСНИХ IDE

В. С. РАЛЕНКО; К. О. АНТІПОВА

doi:10.35546/kntu2078-4481.2025.2.2.36

Автор(и)

В. С. РАЛЕНКО Чорноморський національний університет імені Петра Могили https://orcid.org/0009-0009-4161-8468
К. О. АНТІПОВА Чорноморський національний університет імені Петра Могили https://orcid.org/0000-0002-9012-5290

DOI:

https://doi.org/10.35546/kntu2078-4481.2025.2.2.36

Ключові слова:

генерація коду, великі мовні моделі, інтегроване середовище розробки, ШІ-помічник

Анотація

У роботі розглянуто способи використання великих мовних моделей для генерації програмного коду. Основна увага приділяється IDE та вбудованим в них системам штучного інтелекту для використання в таких завданнях, як створення проєктів, побудова архітектури програмних застосунків та прототипування застосунків за запитами до моделей. Коду, згенерованому штучним інтелектом, бракує відстежуваності, він часто потребує ітеративного доопрацювання – виклики, з якими існуючі IDE не здатні впоратися. На відміну від коду, створеного людиною, згенерований код погано інтегрується зі структурованими робочими процесами розробки. Як наслідок, розробники борються з галюцинаціями ШІ, коли моделі генерують правдоподібний, але некоректний код, який важко перевірити. У рамках цього дослідження виявлено ситуації некоректної роботи великих мовних моделей як неправильна інтерпретація намірів користувача, галюцинація моделі, неправильне використання API, пов’язане з відсутніми елементами, та використання надлишкової інформації. Зловживання сторонніми API у згенерованому коді є серйозною проблемою у розробці програмного забезпечення. Хоча моделі продемонстрували вражаючі можливості генерації коду, їхня взаємодія зі складними бібліотечними API залишається дуже схильною до появи помилок, що потенційно може призвести до збоїв у роботі програмного забезпечення та вразливостей у безпеці. Результати дослідження демонструють, що найкраще використовувати автозаповнення коду, так як воно надає можливість згенерувати код за запитом із дотриманням заданих обмежень та з меншою ймовірністю появи помилок. Але, серед недоліків такого підходу можна виявити відсутність можливості генерувати код відразу в декількох файлах. Отримані результати сприятимуть оптимальному вибору варіантів використання штучного інтелекту та великих мовних моделей в розробці застосунків. Ця робота спрямована на покращення розуміння сценаріїв використання великих мовних моделей в роботі з програмним кодом.

Посилання

Šavelka, J., Agarwal, A., Bogart, C., Song, Y., & Sakr, M. F. (2023). Can Generative Pre-trained Transformers (GPT) Pass Assessments in Higher Education Programming Courses? Proceedings of the 2023 Conference on Innovation and Technology in Computer Science Education V. 1. DOI: https://doi.org/10.48550/arXiv.2303.09325

Reeves, B., Sarsa, S., Prather, J., Denny, P., Becker, B.A., Hellas, A., Kimmel, B., Powell, G., & Leinonen, J. (2023). Evaluating the performance of code generation models for solving parsons problems with small prompt variations. Proceedings of the 2023 Conference on Innovation and Technology in Computer Science Education V. 1. DOI: https://doi.org/10.1145/3587102.3588805

Denny, P., Kumar, V., & Giacaman, N. (2023). Conversing with Copilot: Exploring prompt engineering for solving CS1 problems using natural language. Proceedings of the 54th ACM Technical Symposium on Computer Science Education V. 1. DOI: https://doi.org/10.1145/3545945.3569823

Finnie-Ansley, J., Denny, P., Becker, B.A., Luxton-Reilly, A., & Prather, J. (2022). The robots are coming: Exploring the implications of openai codex on introductory programming. Proceedings of the 24th Australasian Computing Education Conference. DOI: https://doi.org/10.1145/3511861.3511863

Zhong, L., Wang, Z. (2024). Can LLM replace stack overflow? A study on robustness and reliability of large language model code generation. Proceedings of the AAAI Conference on Artificial Intelligence, vol. 38, no. 19. DOI: https://doi.org/10.48550/arXiv.2308.10335

Mousavi, Z., Islam, C., Moore, K., Abuadbba, A. & Babar, M. A. (2024). An investigation into misuse of java security apis by large language models. Proceedings of the 19th ACM Asia Conference on Computer and Communications Security. DOI: https://doi.org/10.48550/arXiv.2404.03823

Vaithilingam, P., Zhang, T., & Glassman, E. L. (2022). Expectation vs. experience: Evaluating the usability of code generation tools powered by large language models. Chi conference on human factors in computing systems extended abstracts. https://doi.org/10.1145/3491101.3519665

Zhuo, T.Y., He, J., Sun, J., Xing, Z., Lo, D., Grundy, J., & Du, X. (2025). Identifying and Mitigating API Misuse in Large Language Models. DOI: https://doi.org/10.48550/arXiv.2503.22821

АНАЛІЗ ПЕРЕВАГ ТА НЕДОЛІКІВ ГЕНЕРАЦІЇ КОДУ ІЗ ВИКОРИСТАННЯМ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ В СУЧАСНИХ IDE

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

Мова

logo