Разработка системы рекурсивных порождающих грамматик для решения задачи автоматического построения интонационных шаблонов языковых выражений
Автор: Личаргин Дмитрий Викторович, Трушакова Анастасия Ивановна, Сафонов Константин Владимирович, Бачурина Елена Петровна
Журнал: Сибирский аэрокосмический журнал @vestnik-sibsau
Рубрика: Математика, механика, информатика
Статья в выпуске: 5 (57), 2014 года.
Бесплатный доступ
Рассматривается проблема, заключающаяся в разработке нового класса порождающих грамматик, обеспечивающих лучшее качество генерации строк и внутреннюю упорядоченность правил. Цель работы состоит в теоретическом обосновании и построении модуля разработанной ранее программы по автоматической генерации транскрипции на различных европейских языках, обеспечивающего добавление интонационной разметки, что даст возможность обучающемуся более качественно изучать язык, его фонетический строй и особенности. Кроме того, важным является решение проблемы определения модальности высказывания - различение повествования, вопроса и восклицания, что должно обеспечить возможность говорить и выражать множество эмоций на иностранном языке без предварительного знания слов и правил. Данный тип порождающих грамматик - рекурсивные порождающие грамматики - должен позволить решать более широкий класс задач благодаря использованию разбиения всего класса правил порождающих грамматик на уровни и разделы, что будет отражено в структуре соответствующих правил. Методы реализации поставленной цели состоят в гибридизации порождающих грамматик и подстрок команд в форме особых нетерминальных символов языка порождающих грамматик. В результате исследования сформулирован принцип организации множества деревьев, состояний порождаемой строки высказывания на естественном языке. Разработанный подход позволяет обеспечить выполнение алгоритмов генерации строк естественного языка с учетом использования командных нетерминальных символов порождающих грамматик. Заявленный подход к расширению синтаксиса правил порождающих грамматик может позволить обеспечить более сложную и качественную трансформацию генерируемой строки алфавита символов с учетом структурирования деревьев состояния строки на уровне рекурсивной генерации. Такой инструментарий компьютерной лингвистики может найти свое применение в качестве средства моделирования и анализа естественных языков, в частности, в целях генерации осмысленной речи и осуществления языковых трансформаций. Это позволит решать более сложные классы проблем в компьютерной лингвистике и разработке лингвистического программного обеспечения.
Порождающие грамматики, рекурсивные порождающие грамматики, компьютерная лингвистика, искусственный интеллект, генерация транскрипций
Короткий адрес: https://sciup.org/148177379
IDR: 148177379 | УДК: 004.9
Development of recursive generative grammars system for solving the problem of automatic generation of language phrases intonation patterns
This paper considers the problem of developing a new class of generative grammars, providing higher quality of string generation and internal order of the rules. The purpose is to justify theoretically and to develop the module in the previously developed system for automatic generation of transcription in various European languages, which allows adding the intonation patterns, which will enable the student to study the language, its phonetic structure and features in a more effective way. In addition, it is important to solve the problem of modality identification, the distinction between narrative sentences, questions and exclamations that will provide an opportunity to speak and express many types of emotions in a foreign language without preliminary knowledge of words and rules. This type of generative grammars - “recursive generative grammars ” - should allow solving a wider class of problems through the use of dividing the entire class of rules within generative grammars to levels and sections, what will be demonstrated in the structure of the relevant rules. Methods to accomplish the above purpose consist in hybridization of generative grammar and substring of command in the form of nonterminals of generative grammar. As a result of work a principle organizing a set of trees of the states of generated string expressions in the natural language has been developed. The developed approach allows the implementation of the algorithms for generating the strings of the natural language from concerning the application of nonterminal characters of generative grammars. The proposed approach to extending the syntax of the generative grammar rules can allow providing a more complex and qualitative transformation of generated string of the characters alphabet considering the structuring process for the trees of states on the levels of recursive generation. These tools of computational linguistics can be applied as the means of modeling and analyzing the natural languages, in particular, in order to generate meaningful speech and carry out language transformations. This will allow solving more complex problems in computational linguistics and the development of linguistic software.
Список литературы Разработка системы рекурсивных порождающих грамматик для решения задачи автоматического построения интонационных шаблонов языковых выражений
- Carnap R. Meaning and Necessity//A Study in Semantics and Modal Logic.1956.
- Chomsky N. Syntatic Structures: Mouton de Gruyter. 2002.
- Хомский Н. Синтаксические структуры//Новое в зарубежной лингвистике. Вып. V. М., 1962.
- Automatic Expansion of Domain-Specific Lexicon by Term Categorization/H. Avancini //ACM Translation on Speech and Language Processing. 2006. Vol. 3, No. 3. P. 1-30.
- Evaluating Discourse Understanding in Spoken Dialogue Systems/R. Higashinaka //ACM Translation on Speech and Language Processing. 2004. Vol. 1. P. 1-20.
- Towards Efficient Human Machine Speech Communication: The Speech Graffiti Project/S. Tomko //ACM Translation on Speech and Language Processing. 2005. Vol. 2. No. 1.
- Сафонов К. В. О возможности вычислительного распознавания контекстно-свободных грамматик//Вычислительные технологии. 2005. Т. 10, № 4. С. 91-98.
- Сафонов К. В., Егорушкин О. И. О синтаксическом анализе и проблеме В. М. Глушкова распознавания контекстно-свободных языков Хомского//Вестник Томского государственного университета. 2006. № 17. С. 63.
- Свидетельство о государственной регистрации базы данных № 2014615928. Генератор транскрипции/Е. П. Бачурина, Д. В. Личаргин. Заявл. 14.04.2014; опубл. 05.06.2014.
- Личаргин Д. В. Порождение дерева состояний на основе порождающих грамматик над деревьями строк//Вестник СибГАУ. 2010. № 1(27). C. 57-59.
- Личаргин Д. В., Бачурина Е. П. Обобщенная иерархическая структура учебного электронного курса и рассмотрение на ее основе электронных курсов обучения английскому языку//Информатизация образования и науки. 2012. № 3(15). C. 20-36.
- Статистические методы анализа естественного языка как способ повышения эффективности его генерации на основе семантических шаблонов/Д. В. Личаргин //Информатизация образования и науки. 2014. № 4(24). С. 92-103.
- Бачурина Е. П., Трушакова А. И., Личаргин Д. В. Информационная система генерации тестовых заданий по фонетике иностранного языка для студентов технических вузов//Современные инновации в науке и технике: c6. науч. тр. 4-й Междунар. науч.-практ. конф. Т. 1/Юго-Зап. гос. ун-т. Курск, 2014. С. 115-120.
- Бачурина Е. П. Разработка программы генерации учебных материалов по иностранному языку на основе порождающих грамматик Хомского//Современные инструментальные системы, информационные технологии и инновации: сб. науч. тр. XI-й Международной науч.-практ. конф. Т. 1/Юго-Зап. гос. унт. Курск, 2014. С. 204-207.
- К вопросу об упорядочении многоуровневой семантической сети на дереве семантической классификации/Д. В. Личаргин //Вестник СибГАУ. 2014. № 2. С. 44-50.