ВИЯВЛЕННЯ ТА КЛАСИФІКАЦІЯ ТЕХНІК І ОБ’ЄКТІВ ПРОПАГАНДИ В ТЕКСТОВИХ ПОВІДОМЛЕННЯХ ЗАСОБАМИ МАШИННОГО НАВЧАННЯ

Автор(и)

DOI:

https://doi.org/10.35546/kntu2078-4481.2024.4.42

Ключові слова:

NLP, техніки пропаганди, об’єкти пропаганди, візуальна аналітика

Анотація

У статті запропоновано підхід до виявлення та класифікації технік і об’єктів пропаганди в текстових повідомленнях засобами машинного навчання, що полягає у виконанні послідовних кроків та дозволяє як виявляти застосування технік в цілому, так і виконувати класифікацію застосованих технік, а також виявляти об’єкти, на які спрямовані класифіковані техніки пропаганди. Для виявлення застосованих технік пропаганди було використано гібридну модель машинного навчання на основі об’єднання архітектур BiLSTM та шарів архітектури трансформер. Застосоване поєднання забезпечило поглиблене розуміння текстового контенту та сприяло підвищенню виявлення пропаганди на 0.037 в порівнянні з відомими аналогами. Для класифікації технік пропаганди запропоновано як класифікація застосованих технік, так і візуалізація отриманих результатів з використанням алгоритму LIME. Використовується множина моделей машинного навчання, де за класифікацію кожної техніки відповідає окрема навчена модель машинного навчання на базі архітектури трансформерів, а саме BERT-подібні моделі. Таке використання дозволяє класифікувати застосовані техніки з мінімальною оцінкою Accuracy 0.82. Реалізоване виявлення пропагандистських об’єктів дозволяє знаходити не лише на кого спрямована пропаганда, а і на що здійснюється її спрямування в розрізі використаних класифікованих технік. Для інтерпретованості та наочності також забезпечено візуалізацію результатів. Запропонований у роботі підхід корелює із Цілями сталого розвитку ПРООН та дозволяє автоматизувати процес виявлення та класифікації пропаганди та зробити результати подання повними, інтерпретованими та зрозумілими. Зокрема, виявлення та класифікація технік і об'єктів пропаганди за допомогою методів машинного навчання сприяють досягненню Цілі сталого розвитку ООН № 16 шляхом підвищення прозорості інформаційного простору та зміцнення інституційної довіри, а також Цілі сталого розвитку ООН № 4 через розвиток медіаграмотності та критичного мислення серед населення, що дозволяє ефективно протидіяти дезінформації.

Посилання

Ahmad P.N., Yuanchao L., Aurangzeb K. et al. Semantic web-based propaganda text detection from social media using meta-learning. SOCA. 2024. Vol. 11761. С. 1–10. https://doi.org/10.1007/s11761-024-00422-x.

Malik M.S.I., Imran T., Mona Mamdouh J. How to detect propaganda from social media? Exploitation of semantic and fine-tuned language models. PeerJ Computer Science. 2023. Vol. 9. e1248. https://doi.org/10.7717/peerj-cs.1248.

Kovalchuk O., Slobodzian V., Sobko O. et al. Visual Analytics-Based Method for Sentiment Analysis of COVID-19 Ukrainian Tweets. Lecture Notes on Data Engineering and Communications Technologies. 2023. Vol. 149. С. 591–607.

Krak I., Zalutska O., Molchanova M., Mazurets O., Bahrii R., Sobko O., Barmak O. Abusive Speech Detection Method for Ukrainian Language Used Recurrent Neural Network. CEUR Workshop Proceedings. 2024. Vol. 3688. С. 16–28. https://doi.org/10.31110/COLINS/2024-3/002.

Zalutska O., Molchanova M., Sobko O., Mazurets O., Pasichnyk O., Barmak O., Krak I. Method for Sentiment Analysis of Ukrainian-Language Reviews in E-Commerce Using RoBERTa Neural Network. CEUR Workshop Proceedings. 2023. Vol. 3387. С. 344–356.

Молчанова М.О., Залуцька О.О., Бармак О.В. Метод інтелектуального аналізу тональності текстів. Матеріали XII Всеукраїнської науково-практичної конференції «Глушковські читання». Київ, 2023. С. 113–116.

Ahmad P.N. Robust Benchmark for Propagandist Text Detection and Mining High-Quality Data. Mathematics. 2023. Vol. 11. С. 2668.

Przybyla P. Long Named Entity Recognition for Propaganda Detection and Beyond. Proceedings of the International Conference of the Spanish Society for Natural Language Processing. 2023.

Інформаційна технологія розпізнавання пропаганди, фейків та дезінформації у текстовому контенті на основі методів NLP та машинного навчання. 2024. URL: https://openurl.ebsco.com/EPDB%3Agcd%3A11%3A14025707/detailv2?sid=ebsco%3Aplink%3Ascholar&id=ebsco%3Agcd%3A178891833&crl=c (дата звернення: 24.11.2024).

Центр стратегічних комунікацій 2024. URL: https://spravdi.gov.ua/ (дата звернення: 24.11.2024).

##submission.downloads##

Опубліковано

2024-12-30