КРИТЕРІЇ ПОДІБНОСТІ ЛІНГВІСТИЧНИХ МОДЕЛЕЙ

Автор(и)

  • І.В. БАКЛАН
  • А.І. ЛОГВИНЧУК
  • Т.В. ШУЛЬКЕВИЧ

DOI:

https://doi.org/10.32782/2618-0340/2019.2-2.2

Ключові слова:

часові ряди, метрики текстів, лінгвістичне моделювання, лінгвістична модель

Анотація

Важливою складовою лінгвістичного підходу до виявлення аномалій у часових рядах є критерій, за яким оцінюється подібність двох моделей. Наявність аномалії встановлюється шляхом порівняння моделей. Саме від вибору критеріїв залежить можливість застосування лінгвістичного підходу до аналізу часових рядів різної природи. Для вчасної реакції на ситуацію важлива швидкість виявлення аномалії. Вибір критеріїв залежить від можливості застосування мовного підходу до аналізу часових рядів різного характеру. Розглянуті основні метрики схожості текстів Геммінга, Левенштейна, Джаро-Вінклєра та ін.

Посилання

Chandola V., Banerjee A., Kumar V. Anomaly Detection: A Survey. ACM Computing Surveys. 2009. Vol. 41. № 3. Article 15. 58 р.

Gupta M., Gao J., Aggarwal C. C. Han J. Outlier Detection for Temporal Data: A Survey. IEEE Transactions on Knowledge and Data Engineering. 2014. Vol. 25. № 1. 9 p.

Hodge V. J., Austin J. A. Survey of Outlier Detection Methodologies. Artificial Intelligence Review. 2004. Vol. 22. P. 85–126.

Лінгвістичне моделювання (математичне моделювання). URL: https://uk.wikipedia.org/wiki/Лінгвістичне_моделювання_(математичне_моделювання).

Логвинчук А. І., Баклан І. В. Застосування лінгвістичного моделювання до вирішення задачі пошуку аномалій. Інформаційні системи та технології управління (ІСТУ2019): Матеріали ІІІ всеукраїнської науково-практичної конференції молодих вчених та студентів. (Київ, 20-22 листопада 2019 р). Київ: НТУУ «КПІ ім. Ігоря Сікорського», 2019. С. 65–67.

Lohvynchuk A., Baklan I. Linguistic Approach for a Time Series Anomaly Detection. Slovac International Scientific Journal. 2019. Vol. 1. №35. Р. 16–18.

Баклан І. В. Лінгвістичне моделювання: основи, методи, деякі прикладні аспекти. Системні технології. 2011. № 3. С. 10–19.

Шулькевич Т. В., Баклан І. В. Гібридний лінгвістичний підхід до моделювання часових рядів. Прикладні питання математичного моделювання. 2018. № 2. С. 191–202. DOI: https://doi.org/10.32782/2618-0340-2018-2-191-202

Баклан І. В., Шулькевич Т. В. Порівняльний аналіз прогнозу при варіації параметрів гібридної лінгвістичної моделі. Системні технології. 2019. Вип. 3. С. 32–41.

Cohen W., Ravikumar P., Fienberg S. E. A Comparison of String Distance Metrics for Name-Matching Tasks. KDD Workshop on Data Cleaning and Object Consolidation. 2003. Vol. 3. P. 73–78.

Відстань Геммінга. URL: https://uk.wikipedia.org/wiki/Відстань_Геммінга.

Відстань Левенштейна. URL: https://uk.wikipedia.org/wiki/Відстань_Левенштейна

Jaro M. Advantages in record linkage methodology as applied to the 1985 cenus of Tampa, Florida. Journal of the American Statistical Association. 1989. Vol. 84. Issue 406. P. 414–420.

##submission.downloads##

Опубліковано

2023-10-17