ПРОЄКТУВАННЯ АРХІТЕКТУРИ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ НА ОСНОВІ ОБ’ЄКТНО-ОРІЄНТОВАНОГО ПІДХОДУ ДЛЯ РЕАЛІЗАЦІЇ АЛГОРИТМУ НЕЙРОМЕРЕЖЕВОГО ВИЯВЛЕННЯ ЕТНІЧНОЇ ВОРОЖНЕЧІ У ПОВІДОМЛЕННЯХ

В. І. КЛІМЕНКО; І. О. БОЯРЧУК; М. О. МОЛЧАНОВА; О. В. СОБКО; О. В. МАЗУРЕЦЬ

doi:10.35546/kntu2078-4481.2025.4.2.8

Автор(и)

В. І. КЛІМЕНКО Хмельницький національний університет https://orcid.org/0000-0001-5869-4269
І. О. БОЯРЧУК Хмельницький національний університет
М. О. МОЛЧАНОВА Хмельницький національний університет https://orcid.org/0000-0001-9810-936X
О. В. СОБКО Хмельницький національний університет https://orcid.org/0000-0001-5371-5788
О. В. МАЗУРЕЦЬ Хмельницький національний університет https://orcid.org/0000-0002-8900-0650

DOI:

https://doi.org/10.35546/kntu2078-4481.2025.4.2.8

Ключові слова:

етнічна ворожнеча, FastForest, алгоритм нейромережевого виявлення етнічної ворожнечі.

Анотація

У статті розглядається сучасний підхід до нейромережевого виявлення етнічної ворожнечі в цифровому текстовому контенті в умовах великих обсягів даних, що постійно зростають. Запропоновано використовувати технології машинного навчання та обробки природної мови для автоматичного виявлення етнічної ворожнечі у цифрових текстах. Алгоритм, розроблений у роботі, автоматизує процес аналізу публікацій у мережі для виявлення етнічної ворожнечі та конфліктних висловлювань між етнічними групами. Він складається з двох етапів: попередньої обробки тексту (видалення стоп-символів і смайлів) та передбачення за допомогою моделі FastForest, яка пере- творює текст в числову послідовність для подальшого аналізу. Алгоритм генерує відсоткову оцінку ймовірності наявності етнічної ворожнечі в тексті, що полегшує процес виявлення і експертизи таких проявів. Запропоновано конвеєр обробки та класифікації текстових даних, який включає перетворення текстових повідомлень у числові ознаки та їх об'єднання в вектор характеристик для подальшого аналізу. Цільова змін- на перетворюється в числові ключі, після чого застосовується метод OneVersusAll і алгоритм FastForest для навчання моделі на кожному класі окремо, з використанням ансамблю з чотирьох дерев рішень, що підвищує точність і знижує ризик перенавчання. Після навчання модель класифікує новий контент на наявність або від- сутність етнічної ворожнечі. Програмне забезпечення складається з кількох підсистем: обробки даних, виявлення етнічної ворожнечі, попередньої обробки даних, а також допоміжних підсистем для формування навчальної вибірки та навчання моделі. Підсистема формує набір даних для навчання класифікатора, а підсистема навчання моделі відповідає за її налаштування і збереження. Підсистеми були інтегровані в єдину систему для автоматизації виявлення етнічної ворожнечі в цифровому контенті. Оцінка ефективності алгоритму проводилась за допомогою метрик, таких як MicroAccuracy, MacroAccuracy, LogLoss, ConfusionMatrix, f1-міра та Recall. Результати показали високий рівень точності: MicroAccuracy 0.9890, MacroAccuracy 0.9889, LogLoss 0.0463, з високими значеннями Precision та Recall для обох класів. Модель успішно класифікувала більшість випадків, передбачивши 4 854 з 4 918 випадків з етнічною ворожнечею. Отримані результати відкривають нові можливості для створення більш безпечних онлайн-середовищ, що є важливим кроком у боротьбі з дискримінацією та ненавистю в цифровому просторі.

Посилання

Raza Ur Rehman H. M. Detecting hate in diversity: a survey of multilingual code-mixed image and video analysis / H. M. Raza Ur Rehman, M. Saleem, M. Z. Jhandir, E. S. Alvarado, H. Garay, I. Ashraf // Journal of Big Data. 2025. Vol. 12, No. 1. P. 109. https://doi.org/10.1186/s40537-025-01167-w.

Okpala E. Large Language Model Annotation Bias in Hate Speech Detection / E. Okpala, L. Cheng // Proceedings of the International AAAI Conference on Web and Social Media. 2025. Vol. 19. P. 1389–1418. https://doi.org/10.1609/icwsm.v19i1.35879.

Akram M. H. ISE-Hate: A benchmark corpus for inter-faith, sectarian, and ethnic hatred detection on social media in Urdu / M. H. Akram, K. Shahzad, M. Bashir // Information Processing & Management. 2023. Vol. 60, No. 3. P. 103270. https://doi.org/10.1016/j.ipm.2023.103270.

Guan T. Countering Ethnic Minority-Targeted Hate Speech in a Multicultural Society / T. Guan, Y. Yang, T. Liu // Race and Social Problems. 2025. Vol. 17, No. 3. P. 233–248. https://doi.org/10.1007/s12552-024-09426-w

Овчарук О.М. Нейромережеве діагностування проявів ПТСР у текстовому контенті з використанням помилко-орієнтованого навчального набору даних / О.М. Овчарук, О.В. Мазурець // Вісник Хмельницького національного університету. Серія: Технічні науки. 2024. № 6, Т. 1 (343). С. 195–200. http://doi.org/10.31891/2307-5732-2024-343-6-30.

Залуцька О.О. Метод інтелектуального аналізу емоційної тональності текстової інформації для визначення поведінкових намірів нейромережевими засобами / О.О. Залуцька, М.О. Молчанова, О.В. Мазурець, О.І. Мельник, Т.К. Скрипник // Вісник Хмельницького національного університету. Серія: Технічні науки. 2023. № 5 (325), Т. 1. С. 67–73. https://doi.org/10.31891/2307-5732-2023-325-5.

Молчанова М.О. Підхід до тестування об'єктно-орієнтованих систем керування в електронній комерції / М.О. Молчанова, О.В. Мазурець, П.О. Шевчук, В.І. Кліменко, О.О. Тищенко // Наука і техніка сьогодні. 2025. № 4 (45). С. 1273–1285. https://doi.org/10.52058/2786-6025-2025-4(45)-1273-1285.

Yin W. Towards generalisable hate speech detection: a review on obstacles and solutions / W. Yin, A. Zubiaga // PeerJ Computer Science. 2021. Vol. 7. P. e598. https://doi.org/10.7717/peerj-cs.598

Alsafari S. Hate and offensive speech detection on Arabic social media / S. Alsafari, S. Sadaoui, M. Mouhoub // Online Social Networks and Media. 2020. Vol. 19. P. 100096. https://doi.org/10.1016/j.osnem.2020.100096.

Firmino A. A. Improving hate speech detection using cross-lingual learning / A. A. Firmino, C. de Souza Baptista, A. C. de Paiva // Expert Systems with Applications. 2024. Vol. 235. P. 121115. https://doi.org/10.1016/j.eswa.2023.121115.

Мазурець О.В. Метод виявлення депресивного стану пов'язаного із навчанням у закладах освіти із використанням нейромережі дуальної архітектури / О.В. Мазурець, І.А. Тимофієв, В.І. Кліменко, О.О. Тищенко // Вісник Херсонського національного технічного університету. 2024. № 4 (91). С. 311–318. https://doi.org/10.35546/kntu2078-4481.2024.4.41.

Віт Р.В. Підхід до тематичної класифікації текстової інформації засобами обробки природної мови / Р.В. Віт, О.В. Мазурець // Наукові праці Донецького національного технічного університету. Серія: Проблеми моделювання та автоматизації проєктування. 2025. № 1 (21). С. 94–99. https://doi.org/10.31474/2074-7888.

Собко О.В. Особливості програмної інженерії та тестування програмного забезпечення для нейромережевого аналізу фотоданих залишків зруйнованих будівель із роботизованої техніки / О.В. Собко, В.І. Кліменко, О.В. Мазурець, О.О. Залуцька, О.В. Гладун // Наука і техніка сьогодні. 2025. № 4 (45). С. 1566–1581. https://doi.org/10.52058/2786-6025-2025-4(45)-1566-1581.

Молчанова М.О. Алгоритм виявлення аб’юзивного вмісту в україномовному аудіоконтенті для імплементації в об'єктно-орієнтовану інформаційну систему / М.О. Молчанова, О.В. Мазурець, О.В. Собко, Р.В. Віт, В.В. Назаров // Вісник Хмельницького національного університету. Серія: Технічні науки. 2024. № 1 (331). С. 101–106. https://doi.org/10.31891/2307-5732-2024-331-17.

Sathyanarayanan S. Confusion matrix-based performance evaluation metrics / S. Sathyanarayanan, B. R. Tantri // African Journal of Biomedical Research. 2024. Vol. 27, No. 4S. P. 4023–4031. https://doi.org/10.53555/AJBR.v27i4S.4345.

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Номер

Розділ

Ліцензія

Мова

logo