COMPUTER MODEL OF RESPONSE GENERATION IN THE SEARCH SYSTEM BASED ON AN UNSTRUCTED KNOWLEDGE BASE

Authors

  • Y.R. KOVYLIN
  • O.S. VOLKOVSKY

DOI:

https://doi.org/10.32782/KNTU2618-0340/2020.3.2-1.13

Keywords:

semantic web; automatic text processing; request-response system; text generation

Abstract

The aim of the work is to develop a request-response system model capable of creating specific textual responses to a user’s request, using a scientific text generating in a natural language in its algorithm. The system determines the semantic links in the documents, while creating a new text containing the answer to the user's question. The article discusses a model of a system based on the developed approach to the formation of a semantic model of a document, which allows you to get quantitative indicators of the semantic properties of a document in a natural language and semantic links between components of a scientific text. Developed as an application software, the semantic search system should use a model capable of working with a sufficiently formalized type of knowledge, namely - scientific text and allow you to automatically form a software semantic model of a single document and the body of knowledge as a whole. Based on the received structure, the application should generate a text response to the received user request. This leads to an important scientific property of the created model - the application should be able to use unstructured corpus of texts, which is an unstructured knowledge base, for which it is necessary to create and explore a semantic model of scientific text in natural language, and develop an algorithm for its formation from the semantic network. This approach solves most word processing issues for further automatic generation. In addition, a subsystem for the automatic classification of scientific texts by the degree of their connectivity was developed, which uses quantitative characteristics of the created model of a scientific text in its work. The article describes the developed criteria for evaluating the created systems and algorithms. The system thus obtained, in addition to organizing a convenient search environment, forms a universal model for automatic text processing at a semantic level for groups of Slavic-language texts of a formal style, a set of tools that allow you to flexibly create and process thematic full-text document bodies without preliminary semantic markup and get a program text model formalized stylistic orientation with quantitative characteristics of semantic properties text and, on the basis of which it is possible to solve other problems of automatic word processing.

References

Поляков П. Ю. Використання семантичних категорій в завданні класифікації відгуків про книги. Матеріали міжнародної конференції «Діалог» (м. Москва, 29 травня − 2 червня 2013 р.). Москва, 2013. С. 193−199.

Антонов А. В. Галактика Zoom. Оцінка модифікації методу формування інфопортрета. Матеріали третього російського семінару по оцінці методів інформаційного пошуку. (м. Ярославль, 6 жовтня 2018 р.). Ярославль, 2018. С. 226.

Губин М.Ю., Разин В.В., Тузовский А.Ф. Применение семантических сетей и частотных характеристик текстов на естественных языках для создания семантических метаописаний. Проблемы информатики. 2011. № S2. С. 59–63.

Pismak A. E., Kharitonova A. E. The Method of Automatic Formation of a SemanticNetwork from Weakly Structured Sources. Scientific and Technical Journal ofInformation Technologies, Mechanics and Optics. 2016. Vol. 16. № 2. P. 324−330.

Волковський О. С., Ковилін Є. Р. Комп’ютерна система інтелектуального семантичного пошуку з використанням генерації текстів. Вісник Херсонського національного університету. 2018. № 3(66). С. 238−245.

Volkovsky O. S., Kovylin Y. R. Computer System of Building of the Semantic Model of the Document. IEEE Second International Conference on Data Stream Mining & Processing. (Lviv, August 21-25, 2018). P. 322−327. DOI: 10.1109/DSMP.2018.8478591.

Volkovsky O. S., Kovylin Y. R. Mathematical Model for Automatic Creation the Semantic Thesaurus for the Scientific Text. System Technologies. 2019. № 6. P. 82−88.

Волковський О. С., Ковилін Є. Р. Модель автоматичної оцінки адекватності комп'ютерних систем «запит-відповідь» з використанням генерації текстів. Системні технології. 2020. № 4 (129). C. 50−58.

Волковський О. С., Ковилін Є. Р. (2017). Комп’ютерна система автоматичного визначення зв'язності тексту. Системні технології. 2017. № 1 (112). С. 11−17.

Волковський О. С., Ковилін Є. Р. (2018). Комп’ютерна система автоматичного аналізу промислових інструкцій. Системні технології. 2018. № 3(116). С. 28−37.

Published

2023-09-11