УДК 004.5

Классификация и принципы построения систем вопросно-ответного поиска

Классификация и принципы построения систем вопросно-ответного поиска
©Черноморова Т. С., Южно-Российский государственный политехнический университет (НПИ) им. М.И. Платова, г. Новочеркасск, Россия, tatyana.chernomorova@gmail.com
©Воробьев С. П., канд. техн. наук, Южно-Российский государственный политехнический университет (НПИ) им. М.И. Платова, г. Новочеркасск, Россия, vsp1999@yandex.ru

Аннотация. На анализе неоднозначности естественного языка основана разработка вопросно–ответных систем, способных обрабатывать введенный пользователем вопрос на естественном языке и выдавать осмысленный ответ. В отличие от задачи классического поиска по ключевым словам, в которой результатом является перечень документов, в задаче вопросно–ответного поиска результат — это краткий и лаконичный ответ, сформированный системой в результате анализа разнообразных источников данных. В обзорной статье перечислены и рассмотрены основные подходы и принципы построения вопросно–ответных систем: метапоисковая система, система поиска по аннотированному тексту, экспертная система, система поиска в коллекциях вопросов и ответов. Одним из первых подходов к вопросно–ответным системам можно назвать систему BASEBALL начала 60-х годов прошлого века, так как появилась возможность задавать вопросы к системе на естественном языке, но базой знаний служила обычная структурированная база данных. Таким образом, можно считать ее системой естественного ввода. Все ранние вопросно–ответные системы столкнулись с проблемой отсутствия BigData — большого объема оцифрованных фактов и правил. Реально работающие экспертные системы получались только в ограниченном домене знаний. Поэтому для качественного обсуждения вопросно–ответных систем предлагается классифицировать их в рамках следующих измерений: типы поддерживаемых вопросов, типы поддерживаемых ответов, источник информации, техника вывода вопроса или ответа по источнику информации, ограниченность домена знаний, методики оценки качества, направление — кто задает вопрос: пользователь или система. Направление — это измерение, предлагаемое для классификации вопросно–ответных систем впервые в настоящей статье. Оно определяет ведущего вопросно–ответный диалог в паре — человек–компьютер. Прямая вопросно–ответная система подразумевает, что вопросы задает человек, а машина отвечает. Инвертированная система предполагает, что компьютер является ведущим этого диалога. На сегодняшний день одной из самых развитых и известных прямых вопросно–ответных систем является система на суперкомпьютере IBM Watson. В последнее десятилетие наблюдается активное развитие образовательных технологий в сети Интернет (EduTech). При помощи накопленного объема данных об успешных или тупиковых путях прохождения пользователем по оцифрованным материалам курса можно сформировать для каждого из них адаптивный обучающий курс, позволяющий максимизировать коэффициент готовности обучающегося. На практике обучение сталкивается с высоким порогом входа со стороны автора курса — преподавателя. Ему необходимо не только перерабатывать структуру своих классических курсов, дробя на меньшие блоки, но и добавлять в паузы между блоками оригинальные вопросники и элементы геймификации обучения. Инвертированные вопросно–ответные системы с открытым доменом знаний диалогового типа имеют большую перспективу в решении задачи генерации оригинальных вопросников, ведении простого диалога по адаптивному графу вопросов и внесении элементов геймификации для улучшения восприятия и усвоения материала лекций.

Ключевые слова: прямая вопросно–ответная система, классификация, домен знаний, типы вопросов, инвертированная вопросно-ответная система, образовательные технологии.

Classification and Principles of Building Question-Answer Search Systems
©Chernomorova T., Platov South-Russian State Polytechnic University (NPI), Novocherkassk, Russia, tatyana.chernomorova@gmail.com
©Vorobyev S., Ph.D., Platov South-Russian State Polytechnic University (NPI), Novocherkassk, Russia, vsp1999@yandex.ru

Abstract. The analysis of the ambiguity of the natural language is based on the development of Question Answering Systems that can process a user-entered question in a natural language and give a meaningful answer. Unlike the classical keyword search task, in which the result is a list of documents, in the question-answer search task, the result is a short and concise answer generated by the system as a result of analysis of various data sources. The review article lists and considers the main approaches and principles for constructing question-answer systems: a meta-search system, an annotated text search system, an expert system, a search system in question and answer collections. One of the first approaches to Question Answering Systems can be called the BASEBALL system of the early 60s of the last century, since it became possible to ask questions to the system in a natural language, but the knowledge base was a regular structured database. Thus, it can be considered its natural input system. All early Question Answering Systems were faced with the problem of the lack of BigData — a large amount of digitized facts and rules. Really working expert systems were obtained only in a limited domain of knowledge. Therefore, for a qualitative discussion of Question Answering Systems, it is proposed to classify them in the following dimensions: types of supported questions, types of supported answers, source of information, technique for outputting a question or answer by source of information, limited domain of knowledge, quality assessment methods, direction — who asks the question: user or system. Direction is a dimension proposed for the classification of Question Answering Systems for the first time in this article. It defines the lead question-answer dialogue in a pair — a man-computer. A direct question-answer system implies that a person asks questions and the machine answers. An inverted system assumes that the computer is leading this dialogue. Today, one of the most developed and well-known direct Question Answering Systems is the question and answer system on the IBM Watson supercomputer. In the last decade, there has been an active development of educational technologies on the Internet (EduTech). Using the accumulated amount of data on successful or dead-end paths by the user on digitized course materials, it is possible to form an adaptive training course for each of them, which allows to maximize the student’s readiness coefficient. In practice, training is faced with a high threshold of entry by the author of the course, the teacher. He needs not only to restructure the structure of his classical courses, breaking up into smaller blocks, but also to add original questionnaires and elements of gamification of instruction to the pauses between blocks. Inverted Question Answering Systems with an open dialog domain of knowledge have a great prospect in solving the problem of generating original questionnaires, conducting a simple dialogue on an adaptive question graph and introducing gamification elements to improve the perception and assimilation of lecture material.

Keywords: direct Question Answering Systems, classification, knowledge domain, type of questions, inverted Question Answering Systems, educational technologies.

Ссылка для цитирования:

Черноморова Т. С., Воробьев С. П. Классификация и принципы построения систем вопросно-ответного поиска // Бюллетень науки и практики. 2020. Т. 6. №8. С. 145-156. https://doi.org/10.33619/2414-2948/57/12

Cite as (APA):

Chernomorova, T., & Vorobyev, S. (2020). Classification and Principles of Building Question-Answer Search Systems. Bulletin of Science and Practice, 6(8), 145-156. (in Russian). https://doi.org/10.33619/2414-2948/57/12

© 2015–20 Издательский центр НАУКА И ПРАКТИКА. Сайт создан на Wix.com

  • Facebook Social Icon
  • Twitter Social Icon