ПОРІВНЯЛЬНИЙ ОГЛЯД МОВНИХ МОДЕЛЕЙ ШТУЧНОГО ІНТЕЛЕКТУ

Автор(и)

DOI:

https://doi.org/10.35546/kntu2078-4481.2025.2.2.1

Ключові слова:

мовні моделі штучного інтелекту, мовна модель, штучний інтелект, аналіз

Анотація

В даний час штучний інтелект поширюється різними сферами діяльності людини і стає більш доступним для широкого кола користувачів. Зокрема, для широкого кола користувачів стали доступними різні мовні моделі штучного інтелекту. В зв’язку з цим актуальним завданням є визначення мовної моделі штучного інтелекту, яка буде зручною у користуванні і дозволить користувачу на належному рівні вирішити його завдання. У даній роботі розглянуті мовні моделі штучного інтелекту. Визначено мовні моделі штучного інтелекту, які є в безкоштовному доступі та з якими користувач може взаємодіяти через чат-бот: ChatGPT-4 Turbo (OpenAI), Copilot на GPT-4 (OpenAI), Gemini (Google), Claude (Anthropic), Jurassic-2 (AI21 Labs), DeepSeek (Hangzhou DeepSeek Artificial Intelligence Co., Ltd.). Серед досліджених мовних моделей штучного інтелекту Claude, Jurassic-2, DeepSeek не мають доступу до пошуку інформації в мережі Інтернет, що унеможливлює пошук ними актуальної поточної інформації. Серед досліджених мовних моделей штучного інтелекту які мають доступ до пошуку інформації в мережі Інтернет (ChatGPT-4 Turbo, Copilot на GPT-4, Gemini) тільки ChatGPT-4 Turbo не мав повністю хибних відповідей. Проте, необхідно відмітити, що він як і інші досліджувані мовні моделі штучного інтелекту не зміг дати повністю правильну відповідь на промт «Напиши повний список з мереж, які входять в міжнародний стандарт IEC 61158». Він вказав правильно тільки 10 з 18 груп мереж які є в стандарті, та неправильно вказав 3 мережі, які насправді відсутні в стандарті (в даному завданні він був четвертим з шести за правильністю відповіді). Необхідно відмітити, що за промтами, які не потребували доступу до мережі Інтернет, найбільш релевантні відповіді було одержано від мовної моделі ШІ Claude (Anthropic). Також необхідно відмітити, що Claude (Anthropic) як і інші досліджувані мовні моделі штучного інтелекту не зміг дати повністю правильну відповідь на промт «Напиши повний список з мереж, які входять в міжнародний стандарт IEC 61158». Проте, він вказав правильно 15 з 18 груп мереж які є в стандарті, та неправильно вказав тільки 1 мережу, якої насправді не має в стандарті (в даному завданні він був першим з шести за правильністю відповіді). Порівняльний огляд мовних моделей штучного інтелекту показав, що не має ідеальної, яка в різних завданнях надає найкращі або завжди правильні відповіді. Але можна відмітити модель яка надала найбільше релевантних відповідей – це ChatGPT-4 Turbo (OpenAI). Результати досліджень дають підстави стверджувати, що будь-які результати одержані за допомогою існуючих мовних моделей штучного інтелекту потребують додаткової перевірки.

Посилання

Zhao F. F., He H. J., Liang J. J. Benchmarking the performance of large language models in uveitis: a comparative analysis of ChatGPT-3.5, ChatGPT-4.0, Google Gemini, and Anthropic Claude3 // Eye (London, England). 2024. № 39(6). DOI: 10.1038/s41433-024-03545-9

Silhadi M., Nassrallah W., Mikhail D., Harissi-Dagher M. Assessing the performance of Microsoft Copilot, GPT-4 and Google Gemini in ophthalmology // Canadian Journal of Ophthalmology. 2025. DOI: 10.1016/j.jcjo.2025.01.001

Kokala A., Kalluri K. Performance benchmarking of generative AI models: ChatGPT-4 vs. Google Gemini AI // International Research Journal of Modernization in Engineering Technology and Science. 2024. № 06(11). С. 4673–4677. DOI: 10.56726/IRJMETS64283

Bayer H., Araci F., Gürkan G. ChatGPT-4o, ChatGPT-4 and Google Gemini are compared with Students: A Study in Higher Education // International Journal of Technology in Education and Science. 2024. № 8(4). С. 627–644. DOI: 10.46328/ijtes.585.

Silva F. Navigating the dual-edged sword of generative AI in cybersecurity // Brazilian Journal of Development. 2025. № 11(1). С. 869. DOI: 10.34117/bjdv11n1-062

Jedrzejczak W., Kochanek K. Comparison of audiological knowledge in Polish language of three chatbots: ChatGPT, Bing Chat and Bard // Nowa Audiofonologia. 2025. № 13(4). С. 29–47. DOI: 10.17431/na/195982

Renshaw A., Lourentzou I., LeeShow J., Kim J. Comparing the Spatial Querying Capacity of Large Language Models: OpenAI’s ChatGPT and Google’s Gemini Pro // The Professional Geographer. 2025. № 77(2). С. 1–13. DOI: 10.1080/00330124.2024.2434455

Shrijal R. Gemini 2.5 Pro vs. Claude 3.7 Sonnet: Coding Comparison [Електронний ресурс]. 2025. Режим доступу: https://composio.dev/blog/gemini-2-5-pro-vs-claude-3-7-sonnet-coding-comparison/

Nababuddin M. Calude or Jurassic 2 Foundation Model for Text Generation [Електронний ресурс]. 2024. Режим доступу: https://medium.com/@nabab.dev/calude-or-jurassic-2-foundation-model-for-text-generation-7eff326c16f2

Ji X. Best alternatives for deepseek R1 vs claude 3.5 sonnet in 2025 [Електронний ресурс]. 2025. Режим доступу: https://www.byteplus.com/en/topic/384781?title=best-alternatives-for-deepseek-r1-vs-claude-3-5-sonnet-in-2025

Бабчук І. С. Використання Gemini, Chatgpt, Copilot для пошуку інформації про спеціалізовані цифрові мережі // Матеріали V Всеукраїнської студентської наукової конференції «Науковий простір: аналіз, сучасний стан, тренди та перспективи», м. Київ, 17 травня 2024 р. Вінниця : ТОВ «УКРЛОГОС Груп», 2024. С. 341–343.

Бабчук І. С. Порівняльний аналіз результатів взаємодії з ChatGPT та Bing AI Chat // Матеріали IV Міжнародної студентської наукової конференції «Концепт науки XXI: стратегії, методи та наукові інструменти», м. Вінниця, 3 листопада 2023 р. Вінниця : ТОВ «УКРЛОГОС Груп», 2023. С. 155–157.

##submission.downloads##

Опубліковано

2025-06-05