Модель автоматического реферирования на основе базы знаний, ориентированная на автоматический перевод

Бесплатный доступ

Представлена модель автоматического реферирования для научно-технических текстов, ориентированная на автоматический перевод. Модель состоит из трех основных компонентов: экстрактора ключевых слов, базы знаний и алгоритма автоматического реферирования. Текст реферата генерируется в форме, исключающей лингвистические явления, которые могут вызвать проблемы при автоматическом переводе (контролируется синтаксическая сложность предложения и ограничивается его длина, не допускаются сложные придаточные предложения и эллипсис). Правила генерации текста реферата описывают используемую грамматическую структуру предложений. Алгоритм автоматического реферирования состоит из четырех основных процедур - предварительной обработки и анализа текста статьи, отбора содержания реферата, генерации текста реферата.

Еще

Автоматическое реферирование, автоматический перевод, извлечение информации, база знаний

Короткий адрес: https://sciup.org/147153904

IDR: 147153904   |   УДК: 81''322

Automatic summarization model oriented toward automatic translation (based on the knowledge base)

The present paper is concerned with a model of automatic summarization for scientific and technical texts, oriented toward automatic translation. The model consists of three main components: a keyword extractor, a knowledge base and a summarization algorithm. The summary text is generated in the form excluding linguistic phenomena that can cause problems during automatic translation (the syntactic complexity of the sentence is controlled and its length is limited, ellipsis and long subordinate clauses are not allowed). Rules for summary generation define the grammar of summary sentences. The summarization algorithm consists of four top level procedures - preprocessing and analysis of the article text, summary content selection and summary text generation.

Еще

Список литературы Модель автоматического реферирования на основе базы знаний, ориентированная на автоматический перевод

  • Sheremetyeva, S. Automatic Extraction of Linguistic Resources in Multiple Languages/S. Sheremetyeva. Proceedings of NLPCS 2012, 9th International Workshop on Natural Language Processing and Cognitive Science in conjunction with ICEIS 2012 (2012, Wroclaw). -P. 44-52.
  • Underwood, N.L. Translatability Checker: A Tool to Help Decide Whether to Use MT/N.L. Underwood, B. Jongejan//Proceedings of MT Summit VIII 18th-22nd September 2001, Santiago de Compostela. -P. 363-368.
  • Автоматическая обработка текста. -http://aot.ru/(дата обращения: 20.02.2014)
  • ГОСТ 7.9-95. Система стандартов по информации, библиотечному и издательскому делу. Реферат и аннотация. Общие требования. -М.: Изд-во стандартов, 1995. -8 с.
  • Дубинина, Е.Ю. Компрессия научного текста: методы и модели: автореф. дис.. канд. филол. наук/Е.Ю. Дубинина. -СПб., 2013. -24 с.
  • Закирова, Г.А. Восстановление потенциала в обратной спектральной задаче для оператора Лапласа с кратным спектром/Г.А. Закирова//Вестник ЮУрГУ. Серия «Математическое моделирование и программирование». -2010. -№ 35 (211). -С. 25-28.
  • Шереметьева, С.О. База знаний для автоматического определения содержания реферата/С.О. Шереметьева, П.Г. Осминин//Вестник ЮУрГУ. Серия «Лингвистика». -2013. -Т. 10, № 2. -С. 77-81.
  • Шереметьева, С.О. Интерактивное реферирование, ориентированное на машинный перевод/С.О. Шереметьева//Вестник Южно-Уральского государственного университета. Серия «Лингвистика». -2013. -Т. 10, № 1. -С. 89-92.
Еще