ДОСЛІДЖЕННЯ МЕТОДІВ МАШИННОГО НАВЧАННЯ ДЛЯ ПОШУКУ ІНФОРМАЦІЇ
DOI:
https://doi.org/10.32782/KNTU2618-0340/2021.4.2.2.7Ключові слова:
машинне навчання, кластеризація, колаборативна фільтрація, пошук асоціативних правилАнотація
Перевагами використання машинного навчання в пошуку є те, що пошукова система може навчатися і тим самим приводити до більш персоналізованих відповідей, а не поширених результатів. У відомих пошукових системах такі алгоритми використовуються в же д авно і п остійно удосконалюються. У роботі на прикладах було досліджено методи і алгоритми машинного навчання, які використовуються для пошуку інформації, їх переваги і недоліки. Було обрано колоборативну фільтрацію, кластерізацію та пошук асоціативних правил. Розглянуті основні підходи колоборативної фільтрації – кореляційні і латентні моделі. В якості кореляційних моделей – фільтрацію за подібністю користувачів (user-based filtration) і фільтрація за подібністю посилань (item-based filtration). Ці моделі розглянуті на прикладах, які показують, як працюють алгоритми. Фільтрація за подібністю посилань прогнозує оцінку на основі оцінок іншого посилання та використовує регресійний аналіз або, як альтернативу, використовує спрощений предиктор, що називається алгоритмом SlopeOne. Розглянуті метрики: евклідова відстань, косинусний коефіцієнт та коефіцієнт кореляції Пірсона, що використовуються для визначення коефіцієнта подібності користувачів в моделі фільтрації за подібністю користувачів. В якості латентних моделей розглянуті алгоритми кластеризації: бікластеризація, алгоритм просторової кластеризації з присутністю шуму DBSCAN, алгоритм нечіткої кластеризації c-means. Всі ці алгоритми призначені для формування кластерів даних за визначеним критерієм. Розглянуто пошук асоціативних правил на прикладі алгоритму Apriori, що генеруються на основі всіх поширених пошукових наборів, виявлених в базі даних пошукових запитів, які задовольняють заданому критерію відповідності. Для застосування цього алгоритму дані були приведені до бінарного вигляду та відповідної структури даних. Зроблено висновки, що кожний з цих методів має свої недоліки і тільки завдяки їх комбінуванню можна досягти бажаного результату для підвищення якості пошуку в залежності від задач, які поставив замовник.
Посилання
Щербаков Д. Как искусственный интеллект повлиял на поисковые системы. URL: https://www.uplab.ru/blog/artificial-intelligence/
Segaran T., Programming Collective Intelligence (O’Reilly Media Inc., California, 2007), pp. 27–46.
Yao Z., Weibin C., “Review of research on collaborative filtering recommendation”, Micro Machines and Applications 6, 2013, pp. 4-10.
Owen S., Anil R., Dunning T. and Friedman E., Mahout in Action (Manning Publications Co, Shelter Island, 2012), pp. 48–56.
Pu Wang and HongWu Ye, “A Personalized Recommendation Algorithm Combining Slope One Scheme and User Based Collaborative Filtering”, IIS '09, 2009, pp. 152-154.
Bo F. and Jiujun C. “Collaborative filtering and recommendation algorithm based on multiple similarities among users”, Computer Science, No.39, 2012, pp. 23-26.
Hofmann T. and Puzicha J., “Latent class models for collaborative filtering”, in Proceedings of the International Joint Conference on Artificial Intelligence, 1999, pp. 668–693.
Madeira S. C. and Oliveira A. L., "Biclustering Algorithms for Biological Data Analysis: A Survey", IEEE/ACM Transactions on Computational Biology and Bioinformatics, VOL 1, NO. 1, pp. 24-45 January-March 2004.
Bhavithra, J. and Saradha, A. Personalized Web Page Recommendation Using Case-Based Clustering and Weighted Association Rule Mining. Cluster Computing, 2019, 22, 6991-7002