МЕТОДИ ВІЗУАЛЬНОГО, ТЕКСТОВОГО ТА ІНТЕРНЕТ-АНАЛІЗУ ДАНИХ У СУЧАСНИХ СИСТЕМАХ DATA MINING
DOI:
https://doi.org/10.35546/kntu2078-4481.2025.4.2.11Ключові слова:
Data Mining, інтелектуальний аналіз даних, текстовий аналіз, візуальна аналітика, web mining, інтернет-дані, машинне навчання, глибинне навчання, інтегровані аналітичні системи, пояснюваний штучний інтелект.Анотація
У статті розглянуто комплексний підхід до аналізу даних у сучасних системах Data Mining, який поєднує методи текстового, візуального та інтернет-орієнтованого опрацювання інформації. Показано, що різнорідність сучасних даних, які охоплюють текстові, поведінкові, структуровані та динамічні інформаційні потоки, зумовлює потребу у використанні багаторівневих аналітичних технологій, здатних одночасно працювати з різними типами представлень та моделями. Проведено огляд наукових джерел, у межах якого підкреслено тенденції розвитку моделей оброблення природної мови (зокрема глибинного навчання), інструментів візуальної аналітики та методів web mining, а також окреслено їхні переваги та обмеження у практичних застосуваннях. У роботі обґрунтовано доцільність інтеграції трьох груп методів у єдину аналітичну платформу, що забезпечує глибоке семантичне опрацювання даних, підвищену інтерпретованість результатів і можливість роботи з високодинамічними інтернет-потоками. Для оцінювання ефективності запропонованого підходу було розроблено прототип системи, який тестували на даних інтернет-каталогу, що містили текстові відгуки користувачів, журнали поведінкової активності та структуровані атрибути товарів. Проведене експериментальне дослідження показало, що поєднання текстових та поведінкових веб-ознак забезпечує покращення якісних метрик класифікації порівняно з використанням лише текстових даних. Інтеграція візуальної аналітики, у свою чергу, суттєво зменшує час інтерпретації результатів та підвищує зручність роботи аналітиків, що підтверджено як операційними показниками, так і суб’єктивними оцінками спеціалістів. Результати дослідження свідчать, що інтегрований підхід є перспективним для побудови масштабованих, адаптивних та інтерпретованих систем Data Mining, орієнтованих на реальні умови оброблення великих даних. Подальші напрями роботи пов’язані з розвитком універсальних моделей об’єднання текстових, поведінкових, графових та просторово-часових даних, а також удосконаленням інструментів пояснюваного штучного інтелекту для аналізу складних аналітичних процесів.
Посилання
Rautela R., Kumar S., Kumar A. та ін. Text mining: a comprehensive survey // International Journal of Recent Scientific Research. 2018. Vol. 9, Iss. 5(G). P. 26959–26962. DOI: 10.24327/IJRSR.2018.0905.2158.
Alqahtani A., Ghazali R., Hasan M. та ін. An efficient approach for textual data classification using deep learning // Frontiers in Computational Neuroscience. 2022. Vol. 16. Article 992296. DOI: 10.3389/fncom.2022.992296.
Li H., Ling X., Zhang B. та ін. Interactive machine learning by visualization: a small data solution // Proc. IEEE International Conference on Big Data. 2018. P. 3513–3521. DOI: 10.1109/BigData.2018.8621952.
Hohman F., Kahng M., Pienta R., Chau D.H. Visual analytics in deep learning: an interrogative survey for the next frontiers // IEEE Transactions on Visualization and Computer Graphics. 2019. Vol. 25, No. 8. P. 2674–2693. DOI: 10.1109/TVCG.2018.2843369.
Yanto I. T., Handayani O. P. Visualization of data inventory using visual data mining (VDM) and exploratory data analysis (EDA) methods // JOIV: International Journal on Informatics Visualization. 2025. Vol. 9, No. 5. P. 1808–1815. DOI: 10.62527/joiv.9.5.4075.
Begam A. M., Saravanan B. V. Web mining concepts, applications and tools: a survey // Journal of Emerging Technologies and Innovative Research. 2019. Vol. 6, No. 5. P. 285–288.
Darwiesh A., Alghamdi M. I., El‑Baz A. H., Elhoseny M. Social media big data analysis: towards enhancing competitiveness of firms in a post‑pandemic world // Journal of Healthcare Engineering. 2022. Article ID 6967158. DOI: 10.1155/2022/6967158.
Hamdi A., Chen Y.‑P., Mohamed M. B., Hmeidi I. Spatiotemporal data mining: a survey on challenges and openproblems // Artificial Intelligence Review. 2022. Vol. 55. P. 1441–1488. DOI: 10.1007/s10462-021-09994-y.
Li W., Aram J., Islam M. M. та ін. A comprehensive survey on machine learning‑based big data analytics for IoT‑enabled smart healthcare system // Mobile Networks and Applications. 2021. Vol. 26, No. 1. P. 234–252. DOI: 10.1007/s11036-020-01700-6.
Wang K., Ding Y., Han S. C. Graph neural networks for text classification: a survey // Artificial Intelligence Review. 2024. Vol. 57, Article 190. DOI: 10.1007/s10462-024-10808-0.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.






