Формирование навыков обработки семантики текстов студентами нелингвистических направлений
Автор: Тимерманис Олег Игоревич
Журнал: Высшее образование сегодня @hetoday
Рубрика: Факультатив
Статья в выпуске: 10, 2013 года.
Бесплатный доступ
Рассматриваются методы обработки семантики текста студентами нелингвистических специальностей. Освещаются семантические ошибки, способы и методы сравнения значений текста.
Педагогика, методика, обработка текста, семантика
Короткий адрес: https://sciup.org/148320646
IDR: 148320646
Текст научной статьи Формирование навыков обработки семантики текстов студентами нелингвистических направлений
типично (человек в космосе) и невозможно (корабль под землей).
Проводя дидактическую работу по анализу семантики текста, не следует смешивать семантические и фактические отношения. «Возьмем воду и кирпич, подогреем и получим яблоко» (текст-инструкция, материалы). Мы не можем семантически определить достоверность такого высказывания, так как требуется программа для расчета физических и химических процессов. Сложный по верификации для большинства людей пример: «возьмем диацетил-морфин и метиловый эфир бензо-илированного экгонина и получим декстрометорфан». Фактическую достоверность предложения неспециалисту определить (не обращаясь к справочным источникам) трудно или невозможно, однако можно сделать верные заключения о тематике (химия), содержании текста (инструкция), тональности (нейтральная и т.д.) Таким образом, значения текста многочисленны, а возможно и противоречивы, и не всегда для верной оценки нам нужно полностью оценивать весь текст, для ряда задач нужны лишь некоторые параметры. «В картину окружающего нас мира человек включает представления о таких фундаментальных категориях бытия, как время, личность, качество, количество и т.д.» [1, с. 9]. Количество сем для анализа в принципе неограниченно, но обычный их набор сравнительно постоянен.
Существенной педагогической проблемой при редактировании научного или учебного текста является определение активного актора по словоформе (в том числе по падежу): «Мише не понравилось, и он сказал». Иначе говоря, главный герой не всегда выражен именительным падежом. Излишнее увлечение грамматическими категориями может извратить семантические отношения.
Семантические отношения определяют и размер сцены текста (мы имеем в виду топологические свойства пространства, по Д.С. Лихачеву). Психологическая фокусировка поля зрения (фокали-зация) отражает соразмерные объекты по размеру и характеристикам. Именно поэтому разноранговые агенты, вступая в отношения, получают среднюю оценку. При этом малый объект входит в сцену, пока он различим, а большой -пока входит в сцену хотя бы значимой частью. Используя прагматический подход, мы устанавливаем границы не только восприятия, но и понимания того, что может быть пространством. Например, «у кошки микробы» - мы не понимаем здесь кошку как пространство для акторов-микробов, это лишь означает, что «кошка больна».
Для удобства анализа семантики текста студентам и-нел и нг-вистами выделим большую сему слова (общую) - атрибуцию слова, фактически описываемую как характеристику, определяемую по словарю (т.е. коррелирующую с денотатом). Узкая сема (коммуникативная) - ситуационная, характеризуется по анализу всего текста и отвечает за алгоритмы действий по ситуации. Мы применяем размеченную информацию (заранее заданные слова-паттерны) к неразмеченной (учебный текст на естественном языке). В работе с учебными текстами нас интересует не столько теоретическое описание или создание теоретической модели, сколько практическое применение. Малому и простому элементу (описывающему неполную ситуацию) будет отдано предпочтение перед крупным, полным и сложным.
Значимыми структурными компонентами обучения анализу семантики текста являются связи объектов, основывающиеся на заявленном совпадении сем, которое слабо объяснимо. Действия сем формализуются в сравнительно небольшой набор шаблонов (паттернов): кот - погладить, кормить; машина - ехать и т.д. Существуют маркеры, относящиеся к слову (например, прилагательные к существительным), а есть относящиеся ко всему тексту (в некотором царстве - сказка). Оценить проработанность темы возможно, если в энциклопедии (базе данных) все основные слова, связанные с темой, также обработаны (усвоены) или если все слова семантической сети этого слова обработаны. Таким образом, если студент-нефилолог корректно выделил ключевые слова (ядро семантической сети), то можно говорить о верном определении согласования сем текста.
Согласование сем текста задается при моделировании семантических граф текста. При формировании модели комплекса дидактического обеспечения обработки семантики текста следует учиты- вать, что включение в текст слов с разными семантическими дифференциалами может быть оправданным или ошибочным. Пока не доказано обратное, полагаем, что текст создан осознанно и «ошибка» является приемом. Изначально текст считаем нейтральным и согласованным, лишь при большом количестве ошибок - неверным. Можно ввести обратную проверку: пока не найдено согласование, текст не согласован.
Принцип лингвистической достоверности может быть описан следующим образом: если в большинстве текстов дано сочетание X, а в исследуемом тексте при равных параметрах дано сочетание не X, то это ошибка. Подсчет всех семантических сочетаний весьма долог, но при использовании педагогом семантического анализатора для оценки внеаудиторных работ студентов-нефилологов это возможно. Полученную из машинной разметки информацию можно использовать для наглядного представления семантических ошибок в тексте.
Стандарт высшего профессионального образования 141400 «Электроэнергетика и электротехника» выделяет «способность и готовность использовать информационные технологии (профессиональные компетенции 1)» и «умение логически верно, аргументированно и ясно строить устную и письменную речь (профессиональные компетенции 2)». Такой подход подчеркивает значимость машинного анализатора и навыков обработки семантики текста студентами-нефилологами. Так как в алгоритме формирования информационной компетенции(и как метода - семантического анализа текста) основной упор делается на семантику, т.е. смысл работать с семантическими отношениями, подключая грамматические и фонетические отношения для улучшения результата. Мы принимаем, что характеристика относится к семантическому существитель- ному, но опосредованно и ко всему фрейму: «дьявольский» задает негативную коннотацию всему фрейму, а не только единичному элементу, поэтому семантически согласуем по близким словам, игнорируя род, число, падеж, время и часть речи. Если нужно, это можно выполнить отдельным блоком (или взять готовый синтаксический разбор) и сравнить результаты грамматического и семантического согласования. При внедрении информационных технологий для семантического анализа высказываний мы используем когнитивное понятие «фрейм». Для начального разбора можно предположить, что фреймы по акторам делятся:
-
- на нулевые (актор подразумевается или указан в предыдущих предложениях);
-
- на моноописательные (семантическое существительное и его характеристика, действие, сюда входят акторы, предметы, время и пространство);
-
- на дуальные (отношения двух акторов).
Некоторые грамматические связи одновременно являются и семантическими и проявляются в особом контексте (лексическом блоке, реализующемся лишь в особом «лицензируемом» контексте (от англ, negative polarity item) «путем использования NPI лицензирования и соответствующих выводов» (one involving NPI licensing and the corresponding inferences) [5, c. 2]. Например, в высказывании «приведенные результаты совершенно неудовлетворительны» конструкция верна, а в тексте «приведенные результаты совершенно удовлетворительны» она не реализуется без отрицательного контекста.
Ряд конструкций можно переставить в предложении, не меняя их смысла (как правило, время, пространство, тональность, модальность), ряд нужно соотнести с ближайшими словами (калькулировать). Лишь тогда можно игнорировать их порядок. Сначала калькулируем все характеристики и действия, потом соотношения акторов. Наша задача - получить изолированные блоки слов, которые можно менять, не изменяя их смысла. Часть слов можно убрать из текста без потери смысла, поэтому значимые слова выделяются коннотацией либо грамматически, либо тропом. Это сложный и долгий анализ, поэтому имеет смысл передать его машинному анализатору, астуденту-нефилологу представить потом калькулированный текст.
При оптимизации дидактического обеспечения анализа текста необходимо учитывать различие семантических и логических связей. Это различие состоит в том, что отношения статистически важны, но неабсолютны. К примеру, «люди используют речь», но младенец не использует, что противоречит шаблону, но не делает шаблон неверным. Возможность абсолютного (числового) описания семантических отношений (в том числе через семантический дифференциал) является лишь меркантильной задачей отображения и калькуляции семантических значений, а не их реальным свойством. Например, для решения задач по физике мы используем лишь ряд параметров, применяя соотношения (формулы), которые лишь частично (в большей мере) описывают явление. Это же можно сказать и о семантике: мы используем предпочтительные шаблоны и фреймы (сценарии, формулы), и адекватность диктуется нашими меркантильными задачами, а не реальным положением дел. Например, «собака говорит» - отмечается ошибка, но характеристика «говорить» добавляется к собаке.
Строго говоря, тропы являются семантической ошибкой, так как нарушение шаблона привлекает внимание. «Наивное восприятие постоянно подталкивает читателя к отождествлению художественного и физического пространства. В подобном восприятии есть доля истинности, поскольку даже когда обнажается его функция моделирования внепространственных отношений, художественное пространство обязательно сохраняет в качестве первого плана метафоры представление о своей физической природе». [3, с. 251]. Метафора при нарушении каких-либо семантических связей обязательно сохраняет другие. Если бы метафора не имела никаких сем, связывающих ее с исходным понятием, она бы потеряла смысл. Метафора является достаточно сложной для студентов-нефилологов при анализе и описании концептов, имеющих множество толкований (Н.А. Никитина). Действительно, в случае конкуренции прямого и переносного значений токена его семантика может быть искажена. При этом личный ассоциативный ряд студентов может в некоторых случаях также искажать денотат слова (например, Пипин короткий, кокаиновые горы, Вал-терперженка и др.).
Значительную трудность представляет задача описания и калькуляции процесса перехода сем слов в семы текста. При этом если действия и характеристики, которые относятся к акторам, добавляют им новые характеристики, то предметы добавляют тему, место, время, тональность всему фрейму, т.е., формируя фрейм, мы оставляем акторов (и их отношения) на сцене. Например,понятие «стол» означает локацию «помещение», отметив это, мы удаляем стол, так как его маркер уже использован. Не нужно пытаться описать и проанализировать все связи, мы работаем лишь с наиболее важными, отсекая использованные. Слово при помощи сем описывается иерархически и многогранно. «Психолингвистические данные свидетельствуют о том, что сложное синтаксическое построение с параллельными связями, исходящими из одной вершины, интерпретируется быстрей конструкций с последовательны ми связями» [2, с. 377]. Иными словами, слово с иерархическими связями удобней в машинной обработке. При анализе студентами такое слово выделяется как яркий маркер тематики или иных характеристик текста.
Студенты при анализе текста выделяют не все семы, которые могли бы быть связаны со словом (которые это слово включает), а лишь наиболее яркие. При этом происходит обобщение и потеря данных, но за этот счет данные сжимаются до приемлемых размеров. Подобная компрессия происходит из речевой экономии и хорошо демонстрируется студентами при конспектировании. Семантическое значение текста сочетает дискретные и континуальные свойства, например «кошка» - это животное, не слон, не летает и т.д., но в то же время мы не знаем, какое действие она осуществляет, как изогнуто ее тело, точный ее размер и другие факторы, в которых лежат значения кошки. Понимание дуратив-ности и дискретности сем весьма важно для семантического анализа текста.
В заключение хочется отметить, что семантический анализ текста очень важен для когнитивных процессов в обучении. Необходимо обратить внимание и на тот факт, что не все студенты при обработке текста проявляют языковую компетенцию. Педагогической проблемой предстает проблема заучивания текста наизусть без понимания его смысла.
Психолингвистический подход к проблеме анализа студентами семантики текста требует от преподавателя создания и использования объективных (не зависящих от модальности читателя), достаточно точных и достоверных критериев. Разложение текста на семантические дифференциалы, определение семантических связей, их согласованность - все это позволяет формировать навыки обработки семантики учебных
___________ ФАКУЛЬТАТИВ Я текстов у студентов нелингвистических направлений. Такое разложение формализованно и объективно, что облегчает обработку текста нефилологами. Наглядное представление семантической связи в виде графа позволяет отслеживать различные связи (например, используя цветовое выделение).
Таким образом, хотя обработка семантики учебных текстов удовлетворяет и не всем требованиям к тексту (потому что, например, физический движок (physics engine) лежит вне лингвистической педагогики), но отвечает на наиболее важные, эксплицитные и обобщенные вопросы. Наша главная задача состоит в том, чтобы на основании выявленных критериев и требований студенты нелингвистических специальностей могли получить результат валидной дифференциации текстов по стилям речи и языка, функциональносмысловым типам речи, иллокуции, тональности и модальности. Используя навыки работы с семами, студенты-нелингвисты могут демонстрировать высокое качество обработки семантики учебных текстов.