КОМП'ЮТЕРНА МОДЕЛЬ ГЕНЕРАЦІЇ ВІДПОВІДЕЙ У ПОШУКОВІЙ СИСТЕМІ НА ОСНОВІ НЕСТРУКТУРОВАНОЇ БАЗИ ЗНАНЬ

Автор(и)

  • Є.Р. КОВИЛІН
  • О.С. ВОЛКОВСЬКИЙ

DOI:

https://doi.org/10.32782/KNTU2618-0340/2020.3.2-1.13

Ключові слова:

семантична мережа; автоматична обробка тексту; система запит-відповідь; генерація тексту

Анотація

Метою роботи є розробка моделі системи запит-відповідь, що спроможна створювати конкретні текстові відповіді на запит користувача, використовуючи у своєму алгоритмі генерацію наукового тексту на природній мові. Система визначає смислові зв'язки в документах, створюючи при цьому новий текст, який містить відповідь на питання користувача. У статті розглядається модель системи, що базується на розробленому підході до формування семантичної моделі документа, який дозволяє отримувати кількісні показники семантичних властивостей документу на природній мові і сенсові зв’язки між компонентами тексту. Розроблена у вигляді прикладного програмного автомата, система семантичного пошуку має використовувати модель, спроможну працювати із достатньо формалізованим типом знань, а саме − науковим текстом і дозволяти автоматично формувати програмну семантичну модель як окремого документа, так і всього корпусу знань в цілому. На основі отриманої структури додаток має генерувати текстову відповідь на отриманий користувальницький запит. Це призводить до важливої наукової властивості створеної моделі – додаток повинен мати можливість використовувати нерозмічений заздалегідь корпус текстів, що являє собою неструктуровану базу знань, задля чого необхідно створити та дослідити семантичну модель наукового тексту на природній мові, а також розробити алгоритм її формування з семантичної мережі. Такий підхід вирішує більшість питань обробки тексту задля подальшої автоматичної генерації відповіді. Додатково розроблена підсистема автоматичної класифікації наукових текстів за ступенем їх зв’язності, що використовує у своїй роботі кількісні характеристики семантичних властивостей створеної моделі наукового тексту. У статті описані розроблені критерії оцінки створених систем та алгоритмів. Отримана таким чином система, окрім організації зручного пошукового середовища, утворює універсальну модель для проведення автоматичної обробки текстів на семантичному рівні для груп слов’яномовних текстів формального стилю, набір інструментів якої дозволяють гнучко створювати і оброблювати тематичні повнотекстові корпуси документів без попередньої семантичної розмітки та отримати програмну модель тексту формалізованої стильової спрямованості із кількісними характеристиками семантичних властивостей тексту, на основі яких можливо вирішувати інші завдання автоматичної обробки текстів.

Посилання

Поляков П. Ю. Використання семантичних категорій в завданні класифікації відгуків про книги. Матеріали міжнародної конференції «Діалог» (м. Москва, 29 травня − 2 червня 2013 р.). Москва, 2013. С. 193−199.

Антонов А. В. Галактика Zoom. Оцінка модифікації методу формування інфопортрета. Матеріали третього російського семінару по оцінці методів інформаційного пошуку. (м. Ярославль, 6 жовтня 2018 р.). Ярославль, 2018. С. 226.

Губин М.Ю., Разин В.В., Тузовский А.Ф. Применение семантических сетей и частотных характеристик текстов на естественных языках для создания семантических метаописаний. Проблемы информатики. 2011. № S2. С. 59–63.

Pismak A. E., Kharitonova A. E. The Method of Automatic Formation of a SemanticNetwork from Weakly Structured Sources. Scientific and Technical Journal ofInformation Technologies, Mechanics and Optics. 2016. Vol. 16. № 2. P. 324−330.

Волковський О. С., Ковилін Є. Р. Комп’ютерна система інтелектуального семантичного пошуку з використанням генерації текстів. Вісник Херсонського національного університету. 2018. № 3(66). С. 238−245.

Volkovsky O. S., Kovylin Y. R. Computer System of Building of the Semantic Model of the Document. IEEE Second International Conference on Data Stream Mining & Processing. (Lviv, August 21-25, 2018). P. 322−327. DOI: 10.1109/DSMP.2018.8478591.

Volkovsky O. S., Kovylin Y. R. Mathematical Model for Automatic Creation the Semantic Thesaurus for the Scientific Text. System Technologies. 2019. № 6. P. 82−88.

Волковський О. С., Ковилін Є. Р. Модель автоматичної оцінки адекватності комп'ютерних систем «запит-відповідь» з використанням генерації текстів. Системні технології. 2020. № 4 (129). C. 50−58.

Волковський О. С., Ковилін Є. Р. (2017). Комп’ютерна система автоматичного визначення зв'язності тексту. Системні технології. 2017. № 1 (112). С. 11−17.

Волковський О. С., Ковилін Є. Р. (2018). Комп’ютерна система автоматичного аналізу промислових інструкцій. Системні технології. 2018. № 3(116). С. 28−37.

##submission.downloads##

Опубліковано

2023-09-11