Русский конструктикон – новый лингвистический ресурс: возможности и перспективы
Автор: Малахова Е.В.
Журнал: Евразийский гуманитарный журнал @evrazgum-journal
Рубрика: Общее языкознание
Статья в выпуске: 1, 2026 года.
Бесплатный доступ
Статья представляет новый лингвистический ресурс – Русский конструктикон(РК), представляющий собой базу данных устойчивых синтаксических конструкцийсовременного русского языка. Ресурс создан на основе принципов грамматики конструкций(Construction Grammar) и содержит описания более 2200 единиц, что делает его одним изкрупнейших в мире. Каждая конструкция сопровождается подробным лингвистическимописанием: толкованием, семантическими и синтаксическими пометами, примерами изНационального корпуса русского языка (НКРЯ), переводом на иностранные языки и указаниемуровня сложности по шкале CEFR. Основное внимание уделяется возможностям иинтерфейсу ресурса, рассчитанного на широкую аудиторию: лингвистов-исследователей,специалистов по компьютерной обработке текста, преподавателей и изучающих русский язык какиностранный (РКИ). В статье описаны функции расширенного поиска, позволяющегофильтровать конструкции по более чем 10 параметрам, включая семантические типы, роли,синтаксические характеристики и уровень владения языком. Например, пользователь можетотбирать конструкции по конкретным семантическим ролям (каузатор, экспериенцер),морфологическим признакам (инфинитив, императив) или стилистическим пометам. ДанныеРусского конструктикона могут служить эмпирической основой для типологическихсопоставлений и верификации теоретических моделей. Постоянное пополнение базы и открытыйдоступ обеспечивают его актуальность и востребованность в академической и образовательнойсреде. Ресурс также служит моделью для создания аналогичных конструктиконов для другихязыков, демонстрируя успешную интеграцию теоретической лингвистики в цифровую среду.Русский конструктикон устанавливает новый стандарт лингвистического ресурса, эффективносоединяющего фундаментальное описание языка с решением современных прикладных задач.
Русский конструктикон, новый лингвистический ресурс, функциональная грамматика, Грамматика конструкций, Ч. Филлмор
Короткий адрес: https://sciup.org/147253417
IDR: 147253417 | УДК: 811.161.1’36 | DOI: 10.17072/2587-6589-2026-1-6-17
The russian constructicon – a new linguistic resource: opportunities and future directions
The article presents a new linguistic resource – the Russian Constructicon (RC), which is adatabase of stable syntactic constructions in modern Russian. Created based on the principles of ConstructionGrammar, the resource contains descriptions of over 2,200 units, making it one of the largest of its kind inthe world. Each construction is accompanied by a detailed linguistic profile, including definitions, semanticand syntactic tags, examples from the Russian National Corpus (RNC), translations into foreign languages,and an indication of difficulty level according to the CEFR scale. The main focus is on the capabilities andinterface of the resource, designed for a wide audience: linguistics researchers, natural language processingspecialists, teachers, and learners of Russian as a foreign language. The article details the functionsof advanced search, which allows filtering constructions by more than 10 parameters, including semantictypes, roles, syntactic features, and proficiency levels. For example, a user can select constructions byspecific semantic roles (Causer, Experiencer), morphological features (infinitive, imperative), or stylisticlabels. The data of the Russian Constructicon can serve as an empirical basis for typological comparisonsand verification of theoretical models. Continuous updating of the database and open access ensure itsrelevance and demand in academic and educational environments. The resource also serves as a model forcreating similar constructicons for other languages, demonstrating the successful integration of theoreticallinguistics into the digital environment. The Russian Constructicon sets a new standard for linguisticresources, effectively combining a fundamental description of the language with solving modern appliedproblems.
Текст научной статьи Русский конструктикон – новый лингвистический ресурс: возможности и перспективы
Данное исследование основывается на принципах грамматики конструкций, в рамках которой конструкция рассматривается как основная единица языковой системы [Рахилина 2010; Fillmore et al., 1988; Croft 2001; Goldberg 2006;]. Русский конструктикон (далее
РК) представляет собой лингвистический ресурс нового типа – базу данных устойчивых синтаксических конструкций русского языка. Его создание стало практической реализацией принципов грамматики конструкций (Construction Grammar, CxG), в рамках которой единицей описания признается целостная формально-семантическая структура, усваиваемая и используемая говорящими как готовая единица [Fillmore et al., 1988]. Ресурс сочетает в себе теоретическую строгость, будучи основанным на современных лингвистических концепциях, и сугубо практическую ориентацию. Он предназначен как для задач автоматической обработки текста, требующей учета идиоматичности и некомпозициональности языковых выражений, так и для преподавания русского языка как иностранного, где необходимо явное описание речевых паттернов. Разработка Русского конструктикона ведется в рамках совместного проекта исследовательской группы CLEAR Университета Тромсё – Норвежского арктического университета (Л. А. Янда, Т. Нессет, А. А. Эндресен) и Школы лингвистики Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ). Подробное описание архитектуры и специфики ресурса представлено в работах [Эндресен и др., 2020; Мордашова 2025].
В качестве теоретической основы для исследования используется классическое определение конструкции, предложенное Ч. Филлмором на раннем этапе развития грамматики конструкций. Согласно этому определению, прототипическая конструкция обладает тремя фундаментальными признаками, которые в совокупности отличают её от свободного словосочетания. Во-первых, конструкция является неоднословной единицей, то есть представляет собой комбинацию нескольких элементов. Во-вторых, она характеризуется некомпозициональностью. Это означает, что её общее значение не равно простой сумме значений её компонентов и не выводится полностью из правил их синтаксического соединения. Значение конструкции как целого обладает собственной семантикой, часто идиоматичной. В-третьих, в её структуре обязательно присутствуют слоты (переменные элементы) наряду со стабильной, «якорной» частью. Таким образом, конструкция – это абстрактный образец, шаблон, который всегда содержит как минимум одну переменную позицию для заполнения конкретными лексическими единицами.
Рис. 1. Определение прототипической конструкции в ранних версиях грамматики конструкция (CхG, Fillmore 1988)
В дальнейшем развитии теории грамматики конструкций рамки понятия «конструкция» были расширены. Однако такие единицы, как однословные конструкции (например, производные слова), требуют иного формата описания и пока не включаются в РК. В теории грамматики конструкций, которой уже почти полвека, давно сложились главные, основополагающие вопросы: Сколько таких конструкций в языке? Какие они? Как комбинируются в их структуре три главных признака? Что лежит за пределами «конструкционной зоны»? [Рахилина, Жукова, Демидова и др. 2022; Апресян, Иомдин 2010]
Русский Конструктикон (РК) был впервые представлен научному сообществу в 2021 году на конференции SCLC в Тромсё. Его первая публичная версия содержала детальное описание примерно 2200 конструкций, оформленных по специально разработанной схеме. Однако этот корпус не является исчерпывающим: ещё порядка 3–4 тысяч выявленных единиц ожидают описания и включения.
Методологическая основа проекта – индуктивный сбор конструкций – восходит к идее самого Ч. Филлмора, который в последний период своей работы инициировал проект English Constructicon, заложив в его фундамент несколько десятков ключевых образцов. Сегодня его научная программа продолжается учениками и последователями по всему миру, что привело к созданию национальных конструктиконов для шведского, японского, бразильского португальского, испанского и других языков.
Основная часть
Русский конструктикон представляет собой новый лингвистический ресурс – базу данных устойчивых синтаксических конструкций современного русского языка. На сегодняшний день в нём описано и систематизировано более 2200 единиц. Типичными примерами таких конструкций служат: NP-Nom за -Verb VP-Pfv.Inf: Я зашёл поговорить ; VP на основе NP-Gen: Они действовали на основе инструкции ; что касается NP-Gen, то Cl: Что касается спорта, то я никогда не любил бегать. Каждая конструкция снабжена подробным лингвистическим описанием, включающим толкование значения, а также семантические, синтаксические и стилистические пометы.
В качестве иллюстраций приводятся аутентичные примеры из Национального корпуса русского языка (НКРЯ). Ресурс находится в открытом и бесплатном доступе. Для единообразия описания в Русском конструктиконе используется система условных обозначений. Например, помета NP-Nom указывает на именную группу с существительным в именительном падеже, что позволяет компактно и точно фиксировать структуру каждой единицы.
Что касается объемов РК, то он значительно превышает размеры других аналогичных ресурсов. На сегодняшний день, база данных РК включает более 2200 конструкций, из которых первые 600 предварительно описаны. Ведется активная работа по пополнению базы новыми конструкциями. Для сравнения, шведский конструктикон содержит описание около 400 конструкций.
РК ориентирован на широкий круг пользователей и предлагает специализованные инструменты для каждой группы. Основными адресатами ресурса выступают: лингвисты (русисты, типологи), для которых реализована детальная система семантических тегов. Эта система опирается на терминологию «универсального грамматического набора», принятую в типологических исследованиях [Плунгян 2011], специалисты по компьютерной лингвистике, заинтересованные в структурированных данных для автоматической обработки естественного языка; преподаватели и изучающие русский язык как иностранный (РКИ). Для этой аудитории предусмотрены переводы толкований конструкций на иностранные языки и пометы, указывающие на уровень языковой сложности конструкции (Например, А2, B1).
Основой для отбора материала служат неоднословные синтаксические конструкции, занимающие промежуточное положение между лексикой и грамматикой. В русскоязычной традиции они известны как «конструкции малого синтаксиса» и характеризуются частичной идиоматичностью [Apresjan, Iomdin 2010].
С одной стороны, они недостаточно прозрачны для выведения значения из суммы компонентов, что создает трудности для не-носителей языка; с другой – не обладают полной идиоматичностью фразеологизмов. Типичная структура таких конструкций включает неизменяемую «якорную» часть и переменные слоты, заполняемые разными лексемами. Например, конструкция (не/самое) время Cop VP-Inf (Самое время вершить большие дела) обозначает, что для совершения некоторого действия наступил подходящий момент. При использовании отрицательной частицы не конструкция указывает, что текущий момент неблагоприятен для действия, при этом слот VP-Inf заполняется глаголами несовершенного вида [РК].
Навигация и базовый поиск
Профиль конструкции в рамках данного ресурса представляет собой комплексное описание, разработанное для разных категорий пользователей – от специалистов-лингвистов до учащихся. В качестве иллюстрации рассмотрим конструкцию id:2175 XP невооружённым глазом, примером которой служит предложение: «Сходство отца и сына видно невооруженным глазом» (см. Таблицу 1).
Описание начинается с поля «Имя конструкции / Name», где приведена формальная запись паттерна с выделением якорных элементов и слотов, имеющих лексические ограничения. Поле «Иллюстрация / Illustration» содержит краткий типовой пример употребления. Семантика конструкции и её отличия от синонимичных вариантов детально раскрываются в разделе «Толкование / Definition», который сопровождается переводом на английский и норвежский языки. Практику использования в реальных контекстах демонстрируют «Примеры / Examples» из Национального корпуса русского языка (НКРЯ). Уровень владения языком, необходимый для усвоения конструкции, указывается в соответствии с общеевропейской шкалой CEFR (от A1 до C2).
Важную часть профиля составляет семантико-ролевая разметка: в толковании и примерах выделяются как общие роли (например, Участник / Participant, Действие / Action), так и более специфичные (Экспериенцер / Experiencer, Каузатор / Causer, Объект каузации / Causee и др.).
Для специалистов предусмотрен блок дополнительной лингвистической информации, включающий: Структуру зависимостей (Dependency structure) в формате Universal Dependencies (UD); Семантические теги (Semantic tags); Синтаксические характеристики: Синтаксический тип конструкции (Syntactic type), а также Синтаксическая функция, структура и часть речи якорного элемента. Для клаузальных конструкций указывается Коммуникативный тип (Communicative type) (повествовательный, вопросительный и т. д.); поле Стилистический тег (Usage label) содержит информацию о регистре употребления. Профиль дополняют поля «Комментарий / Comment» и «Библиографические ссылки / References». На основе корпусных данных также приводятся наиболее частотные заполнители слотов (Common fillers).
Таблица 1. Профиль конструкции VP под давлением NP-Gen
|
Имя конструкции / Name |
XP невооружённым глазом |
|
Иллюстрация / Illustration |
Сходство отца и сына видно невооруженным глазом |
|
Толкование / Definition |
Конструкция обозначает, что какую-то [визуальную информацию] Theme можно [получить]Action, не используя специальный оптический прибор, поскольку эта информация является достаточно очевидной и доступной, лежит на поверхности (примеры 1, 2). В переносном употреблении конструкции речь идет уже не о визуальной информации, а о любого рода наблюдениях о [ситуации] Situation , которые представляются говорящему очевидными и лежащими на поверхности (примеры 3, 4, 5). Слот XP может заполняться глаголом (заметить, отличить, угадываться), предикативом (видно, заметно) или прилагательным (заметный). |
|
Частотные заполнители слотов / Common fillers |
Видеть Заметить Отличить Видно Заметно |
|
Примеры / Examples |
Situation.
экономике] Situation [видны] Action невооруженным взглядом. |
|
Имя конструкции / Name |
XP невооружённым глазом |
|
Уровень / CEFR Level |
С1 |
|
Semantic Type |
Caritive Manner Instrument |
|
Syntactic Type of Construction |
Head and Modifier Construction |
|
Syntactic Function of Anchor |
Modifier |
|
Syntactic Structure of Anchor |
Not Applicable |
|
Part of Speech of Anchor |
Noun Participle Negation Marker |
|
Dependency Structure |
[root XP [iobj [amod невооруженным] глазом]] |
|
Dependency Structure of Illustration |
[root [nsubj Сходство [nmod отца [conj [cc и] сына]]] видно [iobj [amod невооруженным] глазом |
На стартовой странице РК интерфейс пользователя организован с помощью шести основных навигационных ссылок, расположенных в верхней части экрана: Browse (Обзор): позволяет просматривать полный список конструкций в базе данных, организованный в алфавитном или систематическом порядке; Advanced search (Расширенный поиск): дает возможность осуществлять целенаправленный поиск конструкций по различным критериям, таким как семантические теги, синтаксический тип, уровень CEFR и другие лингвистические параметры; Daily dose (Конструкция дня): предоставляет доступ к случайно выбранной конструкции, что служит инструментом для регулярного знакомства с ресурсом и расширения знаний о русском языке; Statistics (Статистика): визуализирует данные о наполнении базы, например распределение конструкций по типам или уровням сложности, что полезно для исследовательских целей; Instructions (Инструкции): содержит руководство пользователя с подробным объяснением структуры сайта, формата описания конструкций и принципов работы с ресурсом; About (О проекте): включает информацию о разработчиках, методологических основах проекта (Грамматика конструкций), целях и актуальных публикациях команды.
На стартовой странице раздела Browse (Обзор) пользователю доступен полный список конструкций, входящих в РК – на данный момент их более 2200. Каждая конструкция представлена в виде краткой записи. Под этим описанием находится кнопка «Show additional information», при нажатии на которую открывается новое окно с подробными лингвистическими данными о выбранной конструкции.
Для удобства навигации слева расположена поисковая строка. В неё можно ввести любую последовательность символов для поиска по базе: конкретное слово или словоформу; обозначение грамматических категорий (например, NP, Dat, Pfv); часть формального шаблона конструкции. Также существует возможность фильтрации по уровню сложности (CEFR), что особенно полезно для изучающих язык.
Рис. 2. Интерфейс ресурса Русский конструктикон
Страница Advanced Search (Расширенный поиск) представляет наибольший интерес для лингвистов и исследователей, поскольку предоставляет инструменты для сортировки конструкций.
Рис. 3. Страница расширенного поиска / Advanced search
В рамках расширенного поиска пользователь может задать семантический тип (Semantic types) искомой конструкции. Доступный для выбора список типов является обширным и разветвлённым; он включает, например, такие категории, как Achieved Result, Causation, Instrument, Condition, Location, Personality, Prohibition, Taxis, Volition и многие другие. Общее количество семантических типов в системе превышает 300 единиц, что позволяет проводить точный и детализированный отбор языкового материала.
В системе также предусмотрена фильтрация по семантическим ролям (Semantic roles), таким как Participant (Участник), Patient (Пациенс), Addressee (Адресат), Speaker (Говорящий), Possessor (Обладатель), Possessed (Обладаемое), Causer (Каузатор), Listener (Слушающий), Experiencer (Экспериенцер), Аgent (Агенс) и др. Общее число доступных для выбора ролей превышает 70.
Фильтрация по морфологическим признакам (Morphology) предоставляет возможность отбирать конструкции по типу их ключевых компонентов. Пользователь может задавать такие категории, как: NP (именная группа / Noun Phrase), Cl (клауза / Clause), Adv (наречие / Adverb), Imp (императив / Imperative), Inf (инфинитив / Infinitive) и многие другие. Общее количество доступных морфологических признаков для фильтрации превышает 40 опций.
Критерий Синтаксическая структура якоря (Syntactic structure of anchor) позволяет фильтровать конструкции по типу синтаксической единицы, образующей их неизменяемую основу. В списке для выбора представлены следующие варианты: Prepositional Phrase (Предложная группа), Subject and Predicate (Подлежащее и сказуемое), Double Negation (Двойное отрицание), Subordinate Clause (Придаточное предложение), Impersonal Construction (Безличная конструкция) и т. д. Общее количество доступных для выбора синтаксических структур превышает 30 наименований.
Часть речи якорного элемента (Part of speech of anchor) – позволяет отбирать конструкции по грамматическому классу их устойчивой, неизменяемой части. Пользователь может выбрать из обширного списка, включающего такие категории, как: Conjunction (Союз), Pronoun (Местоимение), Particle (Частица), Preposition (Предлог), Negation marker (Маркер отрицания) и многие другие. Общее количество доступных вариантов для выбора в этом поле превышает 100 единиц.
Синтаксический тип конструкции (Syntactic type of construction) – это параметр, позволяющий классифицировать и искать конструкции по их фундаментальной структурной организации в рамках предложения. Пользователь может выбрать из таких категорий, как: Copula construction (Связочная конструкция), Head and modifier construction (Конструкция «ядро и зависимое»), Coordinate construction (Сочинительная конструкция) и др. Общее количество доступных синтаксических типов составляет более 20 вариантов.
Синтаксическая функция якорного элемента (Syntactic function of anchor) – это параметр, позволяющий классифицировать конструкции по той роли, которую их неизменяемая часть играет в структуре предложения или высказывания. Пользователь может выбирать из таких категорий, как: Matrix Predicate (главное сказуемое), Discourse Particle (дискурсивная частица), Complement (комплемент, дополнение) и др. Общее количество доступных вариантов синтаксических функций составляет более 30.
Для эффективного начала работы с ресурсом начинающему пользователю рекомендуется первым делом обратиться к разделу «Инструкция», а именно – к подразделу «Сокращения и символы». Это позволит быстро освоить систему условных обозначений (таких как NP, VP, Gen, Pfv и т. д.), которая используется для формального описания конструкций. Понимание этой системы является ключом к корректному чтению профилей конструкций и использованию поисковых фильтров. После ознакомления с обозначениями можно приступать к просмотру каталога и выполнению поиска (рис. 4).
Eng Rus
-
1.3. Продвинутый поиск (Advanced Search)
-
1.4. Инструкции по-английски (Instructions (English))
-
1.5. Инструкции по-русски (Instructions (Russian))
-
1.6. О проекте (About)
-
2. Сокращения и символы
-
3. Правила записи имени конструкции
-
4. Объяснение терминов
-
4.1. Стилистические пометы (Usage labels)
-
4.2. Морфологические пометы
-
-
2 . Сокращения и символы
Запись каждой конструкции включает ее Имя и Иллюстрацию: напр., найти-Pst NP-Acc! - Нашли развлечение!Имя конструкции представляет собой обобщенную морфосинтаксическую формулу, которая обычно включает фиксированные лексические элементы (якорь) и грамматические слоты, которые мы обозначаем при помощи широко используемых сокращений типа NFJ VP и др. При необходимости, мы указываем морфологические характеристики как лексических (якорных) элементов, так и слотов, используя при этом систему сокращений, принятую в Лейпцигских правилах глоссирования.
Обозначение Объяснение 1 первое лицо
-
2 второе лицо
-
3 третье лицо
() факультативный элемент конструкции
/ альтернативные элементы конструкции
~ редупликация (повторение элемента, обычно повторение слова или морфемы
Асе винительный падеж
Adj имя прилагательное
Adv ид поим о
Рис. 4 Раздел «Сокращения и символы».
Заключение
Русский конструктикон представляет собой значимый шаг в развитии лингвистических ресурсов, предлагая систематизированное описание устойчивых синтаксических конструкций современного русского языка. Будучи основанным на принципах грамматики конструкций, он не только реализует теоретические положения этой теории на практике, но и расширяет границы её применения, демонстрируя масштабную картину конструкционной организации русского языка.
Ресурс выделяется своим объемом (более 2200 единиц) и многоаспектностью описания, что делает его уникальным инструментом для разнородных задач. Его практическая ценность заключается в способности одновременно обслуживать потребности фундаментальной лингвистики, преподавания русского языка как иностранного и автоматической обработки естественного языка (NLP).
Детализированный интерфейс, включая расширенный поиск с фильтрацией по семантическим, синтаксическим и прагматическим параметрам, обеспечивает гибкость и точность работы с данными для специалистов разного профиля. Перспективы развития Русского конструктикона связаны с количественным расширением базы (включением тысяч новых конструкций), так и с углублением лингвистической аннотации.
Ресурс открывает новые возможности для сопоставительных (типологических) исследований в рамках международной сети конструктиконов, а также для создания производственных продуктов – от интерактивных учебных пособий до алгоритмов интеллектуального анализа текста.