Синтаксические и семантические характеристики русских, польских и чешских глаголов в словаре сочетаемостей Vallex
Автор: Skwarska Karolina
Журнал: Ученые записки Петрозаводского государственного университета @uchzap-petrsu
Рубрика: Филология
Статья в выпуске: 1 (138), 2014 года.
Бесплатный доступ
Словарь валентностей чешских глаголов VALLEX создается в Институте общей и прикладной лингвистики математико-физического факультета Карлова университета (МФФ УК) в Праге с 2001 года. Доступен в печатной (2008 год) и электронной (бесплатно в Интернете) версиях. В настоящее время в Славянском институте Академии наук в Праге ведется работа по описанию русских и польских эквивалентов некоторых чешских глагольных лексических единиц в этом словаре. Статья показывает основные принципы выбора единиц для эквивалентации - способность вступать в разного рода лексикализованные альтернации; называет проблемы, связанные с описанием русских и польских лексических единиц: правильный выбор эквивалента, понятие видовой пары в словаре, применение чешской системы диатез к описанию русских и польских глаголов. В словаре VALLEX, расширенном за счет описания польских и русских единиц, можно найти много материала для сопоставительного изучения морфологических, синтаксических и семантических свойств глаголов в исследуемых языках: различия в форме актантов или свободных дополнений, в возможности поверхностной реализации актанта, в возможности образовать грамматикализованную или лексикализованную альтернацию.
Синтаксические свойства глагола, семантические свойства глагола, валентность, словарь валентностей, сопоставительное изучение славянских языков
Короткий адрес: https://sciup.org/14750587
IDR: 14750587
Текст научной статьи Синтаксические и семантические характеристики русских, польских и чешских глаголов в словаре сочетаемостей Vallex
Словари валентностей глаголов1 создаются с конца 60-х годов ХХ века. Всем известна немецкая традиция разработки таких словарей, сначала одноязычных, позднее двуязычных. С тех пор возникли также одноязычные словари валентностей разных славянских языков, однако до сих пор не был издан двух- или трехъязычный словарь славянских языков, включающий информацию о свойствах чешских глаголов2. Выбор конкретных глаголов, которые будут описаны в данном двухъязычном словаре, всегда чем-то ограничен, будь то семантический класс глагола [1], [5] или (как единицы описания в словаре VALLEX) синтаксическо-семантические признаки глаголов.
Valenční slovník českých sloves VALLEX (VALency LEXicon) создается в Институте общей и прикладной лингвистики математикофизического факультета Карлова университета в Праге с 2001 года. Словарь предназначен для преподавателей, переводчиков, журналистов и т. п., но он разработан таким образом, что его можно использовать также и для целей автоматического перевода. Печатная версия была издана в 2008 году, электронная версия бесплатно доступна в Интернете[12]. В основе этого словаря валентностей лежит теория функционального генеративного описания, в особенности подход к проблематике валентностей, разработанный прежде всего Я. Паневовой [17], [18], [19], [20]. Концепция словаря опирается на теоретические работы М. Лопатковой, З. Жабокртского и В. Кеттнеровой (ср., например, [6], [7], [8], [9],
[10], [11], [23], [27]). VALLEX дает информацию о 2730 чешских глагольных лексемах3. В начале работы над VALLEX было выбрано 2500 самых частотных глаголов в Чешском национальном корпусе4, позже было добавлено небольшое количество дополнительных глаголов (видовые пары, омонимы и т. п.).
В словарной статье представлены отдельные лексические единицы одной лексемы. В рамках описания лексической единицы даны ее морфологические, синтаксические и семантические характеристики и характеристики ее дополнений (управляемых этим глаголом компонентов). В словарной статье приводится фрейм – модель валентностей данного глагола с указанием формы и степени облигаторности дополнений. Форма приведена у так называемых актантов (ACT – актор, PAT – пациенс, ADDR – адресат, ORIG – источник, EFF – результат)5 и у некоторых свободных дополнений (например, INTT – цель), но не приводится у дополнений места, направления, времени и т. п., для которых типичной реализацией являются прежде всего наречия. Актанты – это такие семантические партиципанты, которые могут вступать в отношения только с некоторыми глаголами и они неповторимы (т. е. с одним глаголом в одной конструкции не могут быть связаны, например, два ORIG, кроме сочетания с отношениями координации). Свободные дополнения могут соединяться с любым глаголом, у некоторых глаголов это дополнение может дублироваться ( Брат приехал вчера вечером – два дополнения времени) [17; 32].
Как было сказано выше, словарь содержит также информацию об облигаторности данного актанта / свободного дополнения. Кроме облигаторных (obl) актантов различают факультативные (opt), ср. чеш. bát se [рус. бояться]: ACT (1; obl) PAT (2, inf, aby, zda, že, cont; opt), кроме облигаторных свободных дополнений ‒ типичные (typ), ср. чеш. blahopřát [рус. поздравлять] ACT (1; obl) PAT (4; obl) CAUS (k + 3; typ), чеш. сítit se [рус. чувствовать себя] ACT (1; obl) MANN (; obl)6. Описание валентностной структуры данной лексической единицы не может, конечно, содержать перечень всех типических свободных дополнений, поэтому указаны только некоторые из них (особенно те, которые могут быть полезны для целей автоматического перевода). Словарная статья содержит парафразу значения данной лексической единицы (синоним), примеры, информацию о контроле, о возможности вступать в так называемые диатезы или о способности образовать рефлексивные формы другого типа, у некоторых лексических единиц – о семантическом классе предиката.
В настоящее время в рамках совместного проекта Института общей и прикладной лингвистики МФФ УК и Славянского института Академии наук Чешской Республики в Славянском институте ведется работа по описанию русских и польских эквивалентов некоторых чешских глаголов в словаре VALLEX. Выбор глаголов основывается на их способности вступать в конструкции, которые находятся между собой в отношениях лексикализованной альтернации. Альтернация – это отношение двух конструкций, обозначающих одну и ту же ситуацию, но отличающихся друг от друга соответствием участников ситуации и единиц семантического плана и – вследствие этого – единиц семантического и синтаксического планов. Таким образом, одна и та же ситуация оказывается структурирована различным образом. Средства структурирования могут быть лексико-семантические (лексикализованные альтернации) или грамматические (грамматикализованные альтернации, диатезы – см. ниже) [6; 81], [8]. Лексикализован-ные альтернации носят:
-
а) конверсивный характер – лексикосемантические конверсии, например: Otec vyložil auto . – Otec vyložil kufry z auta [рус. Отец разгрузил машину. – Отец выгрузил чемоданы из машины];
-
б) неконверсивый характер:
-
– разное выражение участника ситуации, например: рус. Павла поселили в общежитие . – Павла поселили в общежитии ;
-
– структурный распад участника ситуации, например: чеш. Viděl tatínka přicházet. – Viděl, jak tatínek přichází [ * Он видел папу приходить. – Он видел, как папа приходит] [6], [8], [11], [20].
После подбора чешских лексических единиц производятся поиск эквивалентных русских и польских лексических единиц и их подробное описание. В качестве примеров в словаре приводятся контексты из Национального корпуса русского языка (далее – НКРЯ) [2] и Национального корпуса польского языка (Narodowy Korpus Języka Polskiego, далее – NKJP) [15], иногда использованы примеры из Интернета или носителей языка.
При разработке русской и польской частей необходимо обращать внимание на несколько проблем:
-
а) Эквиваленты. Двух- и трехъязычный словарь валентностей должен прежде всего содержать синтаксическую и семантическую информацию о валентностных свойствах глагола в данном языке. В то же время важны также межъязыковые отношения: для потенциальных сопоставительных исследований необходим тщательный подбор эквивалентов.
-
б) Видовые пары русских и польских эквивалентов. Важно, что члены видовой пары отличаются друг от друга только видом, лексическое значение у них одинаковое7.
-
в) Грамматикализованные альтернации (диатезы). Одной из характеристик лексической единицы является ее способность вступать в разные типы так называемых диатез.
В характеристику глагольной лексической единицы входит также описание возможности ее дополнений вступать в отношения взаимности (reciprocity). Описание осложняется тем, что разные языки выражают это явление при помощи различных средств. Концепция словаря VALLEX исходит из системы чешского языка, в котором выражению этих отношений в большой степени служат грамматические средства, включая форму глагола, между тем как в русском языке используются прежде всего лексические средства (друг друга). Необходимо искать решения, каким образом можно сохранить в словаре информацию о взаимности, не нарушая первоначальной концепции.
В словаре можно найти много материала для сопоставительного изучения морфологических, синтаксических и семантических свойств глаголов в исследуемых нами языках:
-
а) разница в форме: чеш. schovávat se ACT (1; obl) PAT ( před + 7 ; opt) LOC (; typ) DIR3(; typ) ~ рус. прятаться ACT (1; obl) PAT ( от + 2 ; opt) LOC (; typ) DIR3(; typ);
-
б) разница в возможности поверхностной реализации актанта: у глаголов, обозначающих очищение поверхности предмета от другого предмета, в польском языке, в отличие от чешского, можно в некоторых случаях на поверхностном языковом уровне выразить и реализацию устраняемой субстанции: ср. польск. obłupywać, obłupać [рус. чистить, очистить] , obierać, obrać
[рус. чистить, очистить] ACT (1; obl) PAT (4; obl) ORIG (z + 2; opt) , в отличие от чеш. oloupávat ACT (1; obl) PAT (4; obl). Obłupał go [kasztan] z zielonej łuski i podał Helenie (NKJP). – Oloupal kaštan a podal ho Heleně ;
-
в) разница в диатезах: главная проблема при описании русских и польских лексических единиц заключается в том, что в русском и польском языках существуют глагольные конструкции (особенно возвратные), которые нельзя отнести ни к одной из этих диатез, ср. рус.: Издалёка как бы лучше виделось и ценилось (НКРЯ) [3; 185– 186]; также польские возвратные структуры типа A sprząta się głównie butelki po alkoholu (NKJP) [рус. Убирают прежде всего бутылки из-под алкоголя] вряд ли можно отнести к деагентной (с рефлексивной глагольной формой) диатезе чешского типа (при изменении диатезы в чешских и русских структурах первичный объект в винительном падеже трансформируется в объект в именительном падеже, в отличие от этого в польском языке объект сохраняет форму винительного падежа8);
-
г) разница в возможности образовать лекси-кализованную альтернацию: русские и польские глаголы движения не обладают способностью образовать альтернацию с разным выражением
участника ситуации ~ место , которое является точкой отправления или целью . На семантическом уровне место реализовано в чешском языке в виде пациенса или дополнения направления DIR1 «откуда» или DIR3 «куда»: чеш. vyjít ACT (1; obl) DIR3(; obl) 9 Pavel vyšel na kopec . – ACT (1; obl) PAT (4; obl) Pavel vyšel kopec . В польском и русском языках возможна только структура ACT (1; obl) DIR3(; obl) : польск. wyjść: Paweł wyszedł na górę . – рус. подняться : Павел поднялся на пригорок .
Благодаря описанию русских и польских эквивалентных глагольных значений словарь валентностей чешских глаголов VALLEX может стать базой для сопоставительных описаний морфологических, а особенно синтаксических и семантических свойств глагола в исследованных языках. Мы надеемся, что в будущем появится возможность для описания более широкой группы глаголов и VALLEX можно будет считать трехъязычным словарем валентностей.
Автор благодарна коллегам К. Вацуловой, А. Филас, М. Подобовой и Б. Голчаковой за поиск и проверку примеров и Н. Занегиной за консультацию и помощь при языковом оформлении текста.
* Работа была поддержана грантом GA ČR P406/12/0557 «Lexikografické zpracování syntaktických a sémantických vlastností sloves v češtině».
Список литературы Синтаксические и семантические характеристики русских, польских и чешских глаголов в словаре сочетаемостей Vallex
- Голчакова Б. Валентность глаголов помещения в русском, чешском и немецком языках: Дис.. д-ра филол. наук. Филологический факультет Масарыкова университета. Брно, 2011. 163 с. + 539 с. словаря.
- Национальный корпус русского языка [Электронный ресурс]. Режим доступа: http://www.ruscorpora.ru
- Русский синтаксис в сопоставлении с чешским/Под ред. М. Кубика. Прага, 1982. 283 с. Синтаксические и семантические характеристики русских, польских и чешских глаголов.
- Český národní korpus. Available at: http://www.korpus.cz
- Greń Z. Semantyka i składnia czasowników oznaczających akty mowy w języku polskim i czeskim. Warszawa, Slawistyczny Ośrodek Wydawniczy, 1994. 425 s.
- Kettnerová V. Lexikálně-sémantické konverze ve valenčním slovníku. MFF UK, Praha, 2012. 220 p.
- Kettnerová V., Lopatková M. Changes in Valency Structure of Verbs: Grammar vs. Lexicon. J. Levická, R. Garabík (eds.). NLP, Corpus Linguistics, Corpus Based Grammar Research [Proceedings of Slovko]. 2009. Bratislava, Slovak National Corpus, L. Štúr Institute of Linguistics, Slovak Academy of Science, 2009. P. 198-210.
- Kettnerová V., Lopatková M., Bejček E. The Syntax-Semantics Interface of Czech Verbs in the Valency Lexicon. Fjeld R.V., Torjusen, J.M. Proceedings of the 15th Euralex International Congress, 2012. P. 434-443. Available at: http://www.euralex.org/proceedings-toc/euralex_2012/
- Lopatková M. Valency Lexicon of Czech Verbs: Towards Formal Description of Valency and Its Modeling in an Electronic Language Resource. Habilitation. Charles University in Prague, Faculty of Mathematics and Physics. Prague, 2010. 171 p.
- Lopatková M., Kettnerová V. The Representation of Diatheses in the Valency Lexicon of Czech Verbs/H. Loftsson, E. Rögnvaldsson, S. Helgadóttir (eds.). IceTAL 2010, LNAI 6233. Berlin, Springer-Verlag, 2010. P. 185-196.
- Lopatková M., Kettnerová V. Lexikalizované alternace//Mluvnice současné češtiny. 2. Syntax na základě anotované-ho korpusu. Praha, Karolinum (in print).
- Lopatková M., Žabokrtský Z., Kettnerová V. Valenční slovník českých sloves. Praha, Karolinum, 2008. 381 s. Available at: http://ufal.mff.cuni.cz/vallex/
- Kubiński W. Reflexivization in English and Polish: An Arc Pair Grammar Analysis. Tübingen, Max Niemeyer Verlag, 1987. 127 s.
- Ordęga G. Problem aspektu w leksykografii. Walencja czasownika a problemy leksykografii dwujęzycznej. Wrocław etc., Zakład Narodowy im. Ossolińskich, 1991. S. 117-124.
- Narodowy Korpus Języka Polskiego. Available at: http://www.nkjp.pl
- Panevová J. On Verbal Frames and the Meaning of the Sentence. The Prague Bulletin of Mathematical Linguistics. 1974. P. 33-40; 1975. P. 17-52.
- Panevová J. Formy a funkce ve stavbě české věty. Praha, Academia, 1980. 222 s.
- Panevová J. Valency Frames and the Meaning of the Sentence. Luelsdorff P.A. (ed.). The Prague School of Structural and Functional Linguistics, Amsterdam, Benjamins Publ. House, 1994. P. 223-243.
- Panevová J. Ještě k teorii valence. Slovo a slovesnost. 1998. 59. 1. S. 1-13.
- Panevová J. et al. Mluvnice současné češtiny. 2. Syntax na základě anotovaného korpusu. Praha, Karolinum (in print).
- Rytel-Kuc D., Greń Z., Ordęga G. Koncepcja czesko-polskiego słownika walencyjnego czasowników. Studia z filologii polskiej i słowiańskiej 31. Warszawa, Slawistyczny Ośrodek Wydawniczy, 1993. S. 175-192.
- Słownik języka polskiego/Pod red. M. Szymczaka, PWN. Warszawa, 1992.
- Straňáková-Lopatková M., Žabokrtský Z. Valenční slovník stokrát jinak: co je pod povrchem?/Z. Hladká, P. Karlík (eds.). Čeština -univerzália a specifika 4, Praha, Lidové noviny, 2002. S. 361-363.
- Svozilová N., Prouzová H., Jirsová A. Slovesa pro praxi. Praha, Academia, 1997. 359 s.
- Svozilová N., Prouzová H., Jirsová A. Slovník slovesných, substantivních a adjektivních spojení. Praha, Academia, 2005. 579 s.
- Walencja czasownika a problemy leksykografii dwujęzycznej. Wrocław etc., Zakład Narodowy im. Ossolińskich, 1991. 177 s.
- Žabokrtský Z. Valency Lexicon of Czech Verbs. PhD thesis, Charles University, Prague, 2005. 119 p.
- Živko M. Morfološko sintaktička valencija glagola u hrvatskom i češkom jeziku te češko hrvatski valencijski rječnik glagola. Disertační práce. FF UK Praha, 2010.