ДОСЛІДЖЕННЯ МЕТОДІВ АНАЛІЗУ ТОНАЛЬНОСТІ ТЕКСТОВИХ ДАНИХ

Автор(и)

DOI:

https://doi.org/10.35546/kntu2078-4481.2024.1.31

Ключові слова:

аналіз тональності, обробка природної мови, машинне навчання, Python, NLTK, spaCy, TextBlob, Gensim

Анотація

Актуальність теми дослідження визначається лавиноподібним зростанням обсягів неструктурованих текстових даних в Інтернеті та потребою в ефективних методах аналізу тональності. Мета роботи – систематично вивчити сучасний стан методології аналізу тональності, порівняти провідні підходи і окреслити подальші перспективи. У статті детально проаналізовано популярні бібліотеки Python для обробки природної мови – NLTK, spaCy, TextBlob, Gensim. Порівняння проведено за критеріями обчислювальної ефективності, зручності використання, гнучкості екстракції ознак та можливостей кастомізації. Методологічне ядро дослідження становить експериментальне порівняння NLTK і TextBlob для класифікації тональності україномовних текстів. Оцінки можуть варіюватися в залежності від конкретного сценарію використання та налаштувань. NLTK, де він може бути більш точним, коли його правильно налаштовано, але вимагає більше зусиль у налаштуванні. TextBlob, навпаки, є більш простим для використання, але може бути менш точним для спеціалізованих завдань. Результати засвідчили переваги TextBlob у швидкодії та NLTK у точності. Аналіз тональності має величезний потенціал для вдосконалення аналітичних можливостей в багатьох сферах – від оптимізації бізнес-процесів до протидії поширенню фейкових новин. Подальші дослідження повинні фокусуватися на розробці спеціалізованих рішень під конкретні прикладні задачі.Визначено перспективи вдосконалення етичних принципів аналізу тексту, урахування лінгвістичного та культурного контексту, а також інтеграції функціоналу аналізу тональності в системи підтримки прийняття рішень.

Посилання

Ivokhin E., Маkhno М., Rets V. Про один спосіб аналізу тональності текстів за допомогою штучних нейронних мереж. Системи управління, навігації та зв’язку. Збірник наукових праць. 2022. Т. 3, № 69. С. 71–74.

Orel A. Social media analyzing for evaluation opinions determination based on sentiment analysis. International scientific journal "Internauka". 2018. No. 10.

Deng Y. Research on sentiment analysis methods for text-oriented data. Frontiers in computing and intelligent systems. 2023. Vol. 3, no. 1. P. 42–47.

Mukasheva А. Tasks and methods of text sentiment analysis. Scientific journal of astana IT university. 2021. No. 7. P. 55–62.

Abonizio H. Q., Paraiso E. C., Barbon Junior S. Toward text data augmentation for sentiment analysis. IEEE transactions on artificial intelligence. 2021. P. 1.

Samigulin T. R., Djurabaev A. E. U. Sentiment analysis of text by machine learning methods. Research result. Information technologies. 2021. Vol. 6, no. 1.

Yao J. Automated sentiment analysis of text data with NLTK. Journal of physics: conference series. 2019. Vol. 1187, no. 5. P. 60–78.

A review of text sentiment analysis methods and applications / Y. Jin et al. Frontiers in business, economics and management. 2023. Vol. 10, no. 1. P. 58–64.

Poria S., Hussain A., Cambria E. Concept extraction from natural text for concept level text analysis. Multimodal sentiment analysis. Cham, 2018. P. 79–84.

Maran S. M., Esh P. S. Text analysis for product reviews for sentiment analysis using NLP methods. International journal of engineering trends and technology. 2017. Vol. 47, no. 8. P. 474–480.

Sarkar D. Sentiment analysis. Text analytics with python. Berkeley, CA, 2019. P. 567–629.

Text as data: text mining and sentiment analysis. Data mining and business analytics with R. Hoboken, NJ, USA, 2013. P. 258–271.

##submission.downloads##

Опубліковано

2024-05-01