ІНТЕЛЕКТУАЛЬНИЙ АНАЛІЗ ТЕКСТУ: ЗАСТОСУВАННЯ ТА БЕЗКОШТОВНІ ПРОГРАМНІ ЗАСОБИ
DOI:
https://doi.org/10.32782/mathematical-modelling/2022-5-2-5Ключові слова:
класифікація, виявлення експертних знань, видобування інформації, образи, інструменти інтелектуального аналізу тексту, застосування інтелектуального аналізу тексту, система керування бібліотекоюАнотація
Велика кількість даних, що генеруються щодня, є як можливістю, так і викликом для бізнесу. З одного боку, дані допомагають компаніям отримувати відгуки людей про продукти чи послуги. Їх можна отримати, аналізуючи електронні листи, огляди продуктів, публікації в соціальних мережах, відгуки клієнтів, звернення до служби підтримки тощо. Істотний обсяг даних зберігається у формі документів, які можуть бути різними: структурованими, частково структурованими та і неструктурованими. З іншого боку, виникає проблема обробки цих даних. Видобування корисної інформації з величезного обсягу документів є важким завданням. Інтелектуальний аналіз тексту є важливою сферою дослідження, оскільки за допомогою нього можна видобути знання з неструктурованого тексту. У даній статті розглянуто технологію інтелектуального аналізу тексту та їх застосування в різних сферах життя. Було проаналізовано застосування інтелектуального аналізу тексту в системі керування бібліотекою та порівняно особливості популярних інструментів технологій інтелектуального аналізу тексту. Методами дослідження є аналіз наукових статей, у яких дослідники використовували інструменти інтелектуального аналізу тексту, порівняння програмного забезпечення з відкритим вихідним кодом. Розглянуто методи аналізу тексту та описано основне застосування інтелектуального аналізу в системі керування бібліотекою. Було обговорено популярне безкоштовне програмне забезпечення для текстового аналізу RStudio, Python, Orange, RapidMiner з відкритим вихідним кодом, яке також використовується у машинному навчанні та науці про дані. Стаття сприяє підвищенню рівня розуміння дослідників у сфері інтелектуального аналізу текстів. Використовуючи розглянуте програмне забезпечення, початківці зможуть прогнозувати тенденції, теми, нові концепції досліджень, знаходити дублікати текстових документів в статтях, новинах, блогах. Бібліотекарі зможуть покращити свої послуги в системі керування бібліотекою: довідкових службах, CAS, SDI.
Посилання
Ramzan Talib, Muhammad Kashif Hanif, Shaeela Ayesha and Fakeeha Fatima. Text Mining: Techniques, Applications and Issues. International Journal of Advanced Computer Science and Applications, no.11(7), 2016. doi: 10.14569/IJACSA.2016.071153.
Liao S. H., Chu P. H., Hsiao P. Y. Data mining techniques and applications - a decade review from 2000 to 2011. Expert Systems with Applications, 2012, no. 39(12), pp. 11303-11311. doi: 10.1016/j.eswa.2012.02.063.
Zhong N., Li Y., Wu S.T. Effective pattern discovery for text mining. IEEE transactions on knowledge and data engineering, 2012, no. 1(24), pp. 30-44. doi: 10.1109/TKDE.2010.211.
Henriksson A., Moen H., Skeppstedt M., Daudaravicius V., Duneld M. Synonym extraction and abbreviation expansion with ensembles of semantic spaces. Journal of biomedical semantics, 2014, no. 1(5), p. 1, doi: 10.1186/2041-1480-5-6.
Laxman A., Sujatha D. Improved method for pattern discovery in text mining. International Journal of Research in Engineering and Technology, 2013, no. 1(2), pp. 2321-2328. doi: 10.15623/IJRET.2013.0210090.
Chen A.P., Zhang C.Y. Data-intensive applications, challenges, techniques and technologies: A survey on big data. Information Sciences, 2014, vol. 275, pp. 314-347, 2014. doi: 10.1016/j.ins.2014.01.015.
Rajendra R., Saransh V. A Novel Modified Apriori Approach for Web Document Clustering. International Journal of Computer Applications, 2013, vol. 33, pp. 159-171. doi: 10.1007/978-81-322-2202-6_14.
Sumathy K. L., Chidambaram M. Text mining: Concepts, applications, tools and issues – an overview. International Journal of Computer Applications, 2013, no. 4 (80), pp. 29-32. doi: 10.5120/13851-1685.
Joby P. J., Korra J. Accessing accurate documents by mining auxiliary document information. Advances in Computing and Communication Engineering (ICACCE), Second International Conference on. IEEE, 2015, pp. 634-638. doi: 10.1109/ICACCE.2015.37.
Wen Z., Yoshida T., Tang X. A study with multi-word feature with text classification. Proceedings of the 51st Annual Meeting of the ISSS-2007, Tokyo, Japan, 2007, vol. 51, p. 45.
Карпов І., Антоненко С. Огляд методів інтелектуального аналізу тексту. Актуальні проблеми автоматизації та інформаційних технологій. 2020. № 24. С. 40–46.
Sheela S. K., Bharathi T. Analyzing Different Approaches of Text Mining Techniques and Applications. International Journal of Computer Science Trends and Technology, 2018, no. 4(6).
Thakur K., Kumar V. An Overview of Text Mining: Application and Free Software Tools. Library Waves, 2020, no. 2(6), pp. 53-59.