МЕТОДОЛОГІЧНІ ПІДХОДИ ДО ПЕРСОНАЛІЗАЦІЇ ВЕЛИКИХ МОВНИХ МОДЕЛЕЙ

Автор(и)

DOI:

https://doi.org/10.32782/mathematical-modelling/2026-9-1-31

Ключові слова:

великі мовні моделі, персоналізація LLM, RAG, тонке налаштування, LoRA, інжиніринг промптів, FinTech, ШІ-агенти

Анотація

У статті систематизовано методологічні підходи до персоналізації великих мовних моделей (LLM) в контексті їх практичного застосування у галузі фінансових технологій. Актуальність дослідження зумовлена активним впровадженням використання LLM у реальних продуктах, таких як державні ШІ-асистенти, банківські чат-боти, системи автоматизованого фінансового консультування та автоматизовані агенти з обробки фінансових документів. При цьому базові LLM загального призначення не можуть бути ефективно використані для вузько-галузевих задач через відсутність доступу до актуальних корпоративних даних, незнання специфічної нормативно-правової бази та неможливість виконання дій у зовнішніх системах. У даній роботі систематизовано методи персоналізації, які дозволяють подолати ці обмеження. Проаналізовано п’ять ключових методів адаптації LLM до конкретних бізнес-задач: управління контекстом та системний промпт – найпростіший і найменш затратний спосіб задати роль, стиль та обмеження поведінки моделі без додаткового навчання; інжиніринг промптів, включаючи техніки ланцюжка думок (CoT) та дерева думок (ToT), що суттєво підвищують точність логічного міркування при вирішенні складних аналітичних фінансових задач; доповнене пошуком генерування (RAG), що представляє собою архітектурне рішення для динамічного доступу до актуальних даних із зовнішніх джерел; тонке налаштування (Fine-tuning), зокрема параметрично-ефективний метод LoRA (Low-Rank Adaptation), який при мінімальних обчислювальних витратах дозволяє адаптувати LLM до вузькоспеціалізованих задач, таких як класифікації фінансових документів, аналізу тональності новин, кредитного скорингу тощо; виклик функцій (Function Calling) та ШІ-агенти, що забезпечують двосторонню інтеграцію LLM із зовнішніми API, CRM- та ERP-системами. Проведено порівняльний аналіз зазначених методів за п’ятьма критеріями: вартість впровадження, вимоги до навчальних даних, актуальність знань, можливості інтеграції із зовнішніми системами та прозорість сформованих відповідей. За результатами проведеного аналізу визначено, що для інтеграції ШІ-систем у фінансові продукти оптимальною є гібридна архітектура, яка поєднує використання RAG та Fine-tuning. Емпіричні дані свідчать, що кожен із цих методів позитивно впливає на точність відповіді, а їх поєднання є найбільш ефективним. Сформульовано конкретні рекомендації щодо вибору методу персоналізації залежно від типу прикладної задачі.

Посилання

European Commission. Diia.AI: Ukraine’s national AI agent for government services. Public Sector Tech Watch, 2025. URL: https://interoperable-europe.ec.europa.eu/collection/publicsector-tech-watch/diiaai-ukraines-national-ai-agent-government-services (дата звернення: 25.03.2026)

Organisation for Economic Co-operation and Development. Diia AI Assistant. OECD.AI Policy Observatory, 2025. URL: https://oecd.ai/en/dashboards/policy-initiatives/diia-ai-assistant (дата звернення: 25.03.2026)

Chen T., Gasco-Hernandez M. Uncovering the results of AI chatbot use in the public sector: Evidence from US state governments. Public Performance & Management Review. 2025. Vol. 48, No. 6. P. 1331–1356. DOI: https://doi.org/10.1080/15309576.2024.2389864

Sheth J. N., Jain V., Roy G., Chakraborty A. AI-driven banking services: The next frontier for a personalised experience in the emerging market. International Journal of Bank Marketing. 2022. Vol. 40, No. 6. P. 1248–1271. DOI: https://doi.org/10.1108/IJBM-09-2021-0449

Vaswani A. та ін. Attention is all you need. Advances in Neural Information Processing Systems. 2017. Vol. 30. P. 5998–6008. DOI: https://doi.org/10.48550/arXiv.1706.03762

Devlin J., Chang M.-W., Lee K., Toutanova K. BERT: Pre-training of deep bidirectional transformers for language understanding. Proceedings of NAACL-HLT. 2019. P. 4171–4186. DOI: https://doi.org/10.18653/v1/N19-1423

Brown T. B. et al. Language models are few-shot learners. Advances in Neural Information Processing Systems. 2020. Vol. 33. P. 1877–1901. DOI: https://doi.org/10.48550/arXiv.2005.14165

Ouyang L. et al. Training language models to follow instructions with human feedback. Advances in Neural Information Processing Systems. 2022. Vol. 35. P. 27730–27744. DOI: https://doi.org/10.48550/arXiv.2203.02155

Touvron H. et al. LLaMA: Open and efficient foundation language models. arXiv, 2023. DOI: https://doi.org/10.48550/arXiv.2302.13971

Liu P. et al. Pre-train, prompt, and predict: A systematic survey of prompting methods in natural language processing. ACM Computing Surveys. 2023. Vol. 55, No. 9. Article 195. DOI: https://doi.org/10.1145/3560815

Wei J. et al. Chain-of-thought prompting elicits reasoning in large language models. Advances in Neural Information Processing Systems. 2022. Vol. 35. P. 24824–24837. DOI: https://doi.org/10.48550/arXiv.2201.11903

Lewis P. et al. Retrieval-augmented generation for knowledge-intensive NLP tasks. Advances in Neural Information Processing Systems. 2020. Vol. 33. P. 9459–9474. DOI: https://doi.org/10.48550/arXiv.2005.11401

Hu E. J. et al. LoRA: Low-rank adaptation of large language models. Proceedings of ICLR. 2022. DOI: https://doi.org/10.48550/arXiv.2106.09685

Wu S. et al. BloombergGPT: A large language model for finance. arXiv, 2023. DOI: https://doi.org/10.48550/arXiv.2303.17564

Nie Y. et al. A survey of large language models for financial applications: Progress, prospects and challenges. arXiv, 2024. DOI: https://doi.org/10.48550/arXiv.2406.11903

##submission.downloads##

Опубліковано

2026-07-01