Конструирование терминологического корпуса русского языка

Бесплатный доступ

Рассматривается конструирование терминологического корпуса русского языка в форме гипертекстового тезауруса (ГИЗАУРУСА). Корпус разрабатывается в виде гипертекстовой системы в нелинейной форме с учетом реляционных, иерархических и сетевых парадигматических связей посредством реализации синтагматических связей в интерактивном режиме на персональном компьютере оцифрованных лексикографических материалов русского языка.

База данных, гизаурус, гипертекстовый тезаурус, метаязык, искусственный интеллект, корпус, лексикография, лингвистика, поиск, русский язык, словарь, справочник, текст, энциклопедия

Короткий адрес: https://sciup.org/148310937

IDR: 148310937

Текст научной статьи Конструирование терминологического корпуса русского языка

На современном этапе развития русского языка необходимы фиксация, описание и репрезентация академических словарей и энциклопедий и других лексикографических материалов русского языка, поскольку многие культурные реалии становятся частью истории. В связи с глобальной индустриализацией и урбанизацией лексика уходит в прошлое и уносит за собой огромный массив истории русского народа. Необходимость создания терминологического корпуса русского языка для обобщающего исследования русской лексики как части исторической картины нашей страны очевидна. Кроме того, получение репрезентативного терминологического корпуса русского языка позволит предоставить квалифицированный доступ к богатству материальной и духовной народной культуры как для специалистов, так и для всех социальных групп общества, включая студентов, аспирантов, магистрантов, школьников и всех интересующихся историей и культурой нашей страны.

В качестве основы терминологического корпуса в форме гизауруса предполагаются оцифрованные словари, справочники и энциклопедии русского языка. В нашем распоряжении для гизауруса на данный момент имеются следующие оцифрованные словари русского языка:

  • а)    академические (изданные Императорской АН, АН СССР, РАН): САР – «Словарь Академiи Россiйской по азбучному порядку» (1806–1822); «Церковный словарь» (1817– 1819); «Общий церковно-славяно-российский словарь» (1834); «Словарь церковно-славянского и русского языка» (1847); ООВС – «Опыт областного великорусского словаря» (1852); «Толковый словарь живого великорусского языка» В.И. Даля (1863–1912); «Словарь церковно-славянского и русского языка» (1867–1868); СРЯ – «Словарь русского языка» (1891–1937); «Толковый словарь русского языка» (1934–1940); БАС1 – «Словарь современного русского литературного языка» (1948–1965); СРНГ – «Словарь русских народных говоров» (1965–2017), 50 выпусков; «Словарь русского языка XI–XVII вв.» (1975); «Новые слова и значения» (1977–2014); «Словарь русского языка XVIII века» (1984–2013); МАС (1985–1988); «Словарь древнерусского языка XI–XIV вв.» (1988); БАС2 (1991–1994); РСС – «Русский семантический словарь» (1998– 2007); «Словарь обиходного русского языка Московской Руси XVI–XVII вв.» (2004–2012); БАС3 (2004–2017);

  • б)    другие (энциклопедии, справочники, монографии, диссертации) предметные словари.

Приведем краткое описание некоторых наиболее авторитетных академических словарей:

АН – Академия наук.

ВОАН СССР – Второе отделение АН СССР.

ВОИАН – Второе отделение Императорской АН. ВОРАН – Второе отделение Российской АН.

И АН СССР – Издательство АН СССР.

ИЯМ – Институт языка и мышления АН СССР.

ИЯМ СО – Институт языка и мышления АН СССР (Словарный отдел).

КРЯЗ – Комиссия по русскому языку АН СССР.

ПСК – Постоянная словарная комиссия АН СССР.

СК – Словарная комиссия АН СССР.

Академией наук были выпущены следующие словари:

  • 1)    САР1 – «Словарь Академии Российской» в 6 ч., от А до Я (Спб., 1789–1794);

  • 2)    САР2 – «Словарь Академии Российской» в 6 ч., от А до Я (Спб., 1806–1822);

  • 3)    СЦРЯ1 – «Словарь церковно-славянского и русского языка», составленный II Отделением Академии Наук, в 4 т., от А до Я (СПб., 1847);

  • 4)    СЦРЯ2 – 2-е издание СЦРЯ (Спб., 1867–1868);

  • 5)    СРЯ 1891–1895 – «Словарь русского языка», сост. II Отделением Академии Наук (под редакцией акад. Я.К. Грота), т. I, вып. 1, 2 и 3 (от А до Дя) (Спб., 1891–1895); по существу не закончен, т. к. его продолжение построено было уже на иных принципах и должно приниматься как новое издание;

  • 6)    СРЯ 1897–1929 – издание, начатое по плану акад. А.А. Шахматова и в значительной части им же разработанное, также осталось незаконченным; в него вошли т. II, вып. 1–9 (Е, Ж, 3), т. III, вып. 1–2 (И – Издергивать), т. IV, вып. 1–10 (К – Крошечный), т. V, вып. 1–3 (Л – Лисичий), т. VI, вып. 1–2(М –Маститый), т. VIII, вып. 1–2 (Не – Недорубщик); это шестое по счету издание выходило в 1897–1916, 1922, 1926–1929 гг.;

  • 7)    СРЯ 1929–1937 – новое издание «Словаря русского языка», начатое с конца 1929 г., является в серии словарных академических изданий седьмым, представляя собою совершенно новое предприятие: это толковый словарь современного русского языка, взятый в историческом развитии (СРЯ 1933. Т. 1. Вып. 2: Ажно – Аллотриология. Предисловие).

С 1934 г. нумерация томов «Словаря русского языка» меняется. Впредь каждой букве будет соответствовать свой номер тома, а именно: А – т. 1, Б – т. 2, В – т. 3, Г – т. 4, Д – т. 5, Е – т. 6, Ж – т. 7, З – т. 8, И – т. 9, К – т. 10, Л – т. 11, М – т. 12, Н – т. 13, О – т. 14 и т. д. (СРЯ 1934. Т. 11. Вып. 3).

САР-1 1789–1794

Словарь Академии Российской, производным порядком расположенный: в 6 ч. Спб., 1789–1794. Ч. 1 (А–Г); Ч. 2 (Г–З); Ч. 3 (З–М); Ч. 4 (М–Р); Ч. 5 (Р–Т); Ч. 6 (Т–Я). В САР вошло 43 257 слов, объеди- ненных в словообразовательные гнезда. Основной задачей САР было «сочинение Словаря или изъяснения слов, речений, речей и разнаго образа вещаний, в языке Славенороссийском употребительных» (т. 1, с. 5). В предисловии к первому тому: «без пол-наго собрания слов и речей, и не определя точнаго им знаменования, не можно ни утвердительно сказать в чем состоит обилие, красота, важность и сила языка, ниже пользоваться оными в произведениях разума» (т. 1, с. 5–6). САР-1 на 3 581 страницах содержит 64 779 лексических единиц. Работа над словарем началась в 1783 г. и заняла 11 лет. Словарь содержит элементы этимологического словаря: слова располагались по общему корню, образуя разветвленные смысловые гнезда.

САР-2 1806–1822

Словарь Академии Российской по азбучному порядку расположенный: в 6 ч. Спб., 1806–1822. Ч. 1 (А–Д), Спб., 1806; Ч. 2 (Д–К), Спб., 1809; Ч. 3 (К–Н), Спб., 1814; Ч. 4 (О–П), Спб., 1822; Ч. 5 (П–С), Спб., 1822; Ч. 6 (С–Я), Спб., 1822. Это фактически 2-е издание «Словаря Академии Российской», при этом словарные статьи упорядочены по алфавиту. САР-2 на 4 044 страницах содержит 64 322 лексические единицы.

ОЦСРС 1834

Соколов Петр Иванович (1764–1835). Общий церковно-славяно-российский словарь, или Собрание речений как отечественных, так и иностранных, в церковно-славянском и российском наречиях употребляемых... по поручению Комитета устройства учебных заведений составленное П.С.: с присовокуплением таблиц склонений и спряжений, заимствованных из Грамматики г. Востокова, напечатанной в 1832 г. и введенной в употребление в нижних и сред. учеб. заведениях. Ч. 1: А–Н; Ч. 2: О–Я. Спб.: Тип. Рос. акад., 1834. 909 с.

СЦСРЯ 1847

Словарь церковнославянскаго и русскаго языка, сост. Вторым отделением Императорской Академии наук. Спб., 1847. Т. I–IV. Назначение словаря: «Словарь должен соответствовать не только настоящему состоянию наук и искусств, но и согласоваться с ходом государственных наших учреждений – быть сокровищницею языка на протяжении многих веков, от первых письменных памятников до позднейших произведений нашей словесности» (т. 1, с. 11). СЦСРЯ на 1 962 страницах содержит 115 052 лексические единицы.

Даль Владимир Иванович

Толковый словарь живого великорусского языка. Ч. I–IV. Изд. Об-ва любит. рос. слов. при Моск. ун-те. М., 1863–1866. Ч. 1: А–З. Тип. Семена, 1863. IV, 680 с. С. I–XV. Напутное слово; Ч. 2: И–О. 1865. 681–1351. Ч. 3: П. 1865. 508 с.; Ч. 4: Р–J. 1866. 625 с. 2-е изд. Т. 1–4. Спб. – М., 1880–1882. 3-е изд. (под ред. проф. И.А. Бодуэна-де-Куртенэ); Т. 1–4. 1904– 1909. 4-е изд. Т. 1–4. 1912–1913 / статьи А.М. Бабкина, В.П. Вомперского. М.: Рус. яз., 1989. Т. 1: А–З.

1989. XCVI, 699 с.; Т. 2: И–О. 1989. 779 с. Т. 3. П. 1990. 555 с.; Т. 4: P-и. 1991. 683 с. М.: Прогресс: Универс, 1994. М.: Цитадель, 1998. Т. 1: А–З. 1998. 700 с. Т. 2: И–О. 1998. 780 с. Т. 2: И–О. 2001. 669 с. Т. 3: П. 1998. 556 с. Т. 3: П–Р. 2001. 573 с.; Т. 4: Р-V. 1998. 684 с.; Т. 4: С–Я. 2001. 575 с.

СРЯ 1891–1895

Словарь русского языка, сост. II отд. Императорской Академии наук / ред. акад. Я.К. Грот. Спб: Тип. Имп. АН, 1891–1895. Т. 1, вып. 1: А – Втас, 1891; вып. 2: Втас – Да, 1892; вып. 3: Да – Дя, 1895. Гротовский словарь – тип толкового нормативного (в системе стилистических и грамматических помет) словаря (табл. 1).

СРЯ 1897–1907

Словарь русского языка, сост. II отд. Императорской Академии наук / ред. А.А. Шахматов. Спб.:

Тип. Имп. АН, 1897–1907. Т. 2, вып. 1: Е – Железный, 1897; Т. 2, вып. 2: Железный – За, 1898; Т. 2, вып. 3: За – Заграчить, 1899; Т. 2, вып. 4: Заграять – Закрепить, 1900; Т. 2, вып. 5: Закреплять – Заносить, 1901; Т. 2, вып. 6: Заносить – Засада, 1902; Т. 2, вып. 7: Засада – Заудиться, 1902; Т. 2, вып. 8: Заудак – Зелье, 1905; Т. 2, вып. 9: Зельце – Зятюшко, 1907. Шахматовский словарь – тип ненормативного словаря-тезауруса. Издатели последующих отдельных выпусков постепенно отходили как от принципов словаря-тезауруса, так и от построения словарных материалов по гротовскому типу, при этом принцип нормативности словарных статьях этих выпусков соблюдался непоследовательно (табл. 2).

СРЯ 1906–1929

Словарь русского языка, сост. II отд. Императорской Академии наук / ред. С.К. Булич, Д.К. Зеленин, В.М. Истрин, Е.Ф. Карский, В.И. Чернышев,

СРЯ 1891–1895

Таблица 1

N

Интервал, том, выпуск

Год

Страниц

Столбцов

Тираж

Издание

Редактор

1

А – ВТАСоВЫВАТЬ, т. 1, вып. 1

1891

316

1–576

---

ВОИАН

Я.К. Грот

2

ВТАСоВЫВАТЬСЯ – ДА, т. 1, вып. 2

1892

189

577–948

---

ВОИАН

Я.К. Грот

3

ДА – ДЯ Пропущенные слова А, Б, В, Г, т. 1, вып. 3

1895

175

949–1250

---

ВОИАН

Я.К. Грот

680

СРЯ 1897–1907

Таблица 2

N

Интервал, том, выпуск

Год

Страниц

Столбцов

Тираж

Издание

Редактор

1

Е – ЖЕЛеЗНЫЙ (№ 4), т. 2, вып. 1

1897

189

1–320

---

ВОИАН

А.А. Шахматов

2

ЖЕЛеЗНЫЙ – За (№ 5), т. 2, вып. 2

1898

171

321–632

---

ВОИАН

А.А. Шахматов

3

ЗА – ЗАГРаЧИТЬ (№ 6), т. 2, вып. 3

1899

167

633–952

---

ВОИАН

А.А. Шахматов

4

ЗАГРаЯТЬ – ЗАКРЕПЛяТЬ (№ 7), т. 2, вып. 4

1900

165

953–1272

---

ВОИАН

А.А. Шахматов

5

ЗАКРЕПЛяТЬ – ЗАНОСиТЬ (№ 8), т. 2, вып. 5

1901

165

1273–1592

---

ВОИАН

А.А. Шахматов

6

ЗАНОСиТЬ – ЗАСаДА (№ 9), т. 2, вып. 6

1902

167

1593–1912

---

ВОИАН

А.А. Шахматов

7

ЗАСаДА – ЗАуДИТЬСЯ (№ 10), т. 2, вып. 7

1903

168

1913–2232

---

ВОИАН

А.А. Шахматов

8

ЗаУДОК – ЗеЛЬЕ (№ 11), т. 2, вып. 8

1905

167

2233–2552

---

ВОИАН

А.А. Шахматов

9

ЗеЛЬЕЦЕ – ЗяТЮШКО (№ 12), т. 2, вып. 9

1907

215

2553–2966

---

ВОИАН

А.А. Шахматов

1574

СРЯ 1906–1929

Таблица 3

N

Интервал, том, выпуск

Год

Страниц

Столбцов

Тираж

Издание

Редактор

1

И – ИЗБа, т. 3, вып. 1

1922

118

1–224

---

ВОРАН

С.К. Булич

2

ИЗБа – ИЗДёРГИВАТЬ, т. 3, вып. 2

1929

85

225–384

1500

СК

Е.Ф. Карский

3

К – КАМПИЛиТ, т. 4, вып. 1

19061907

168

1–320

---

ВОИАН

Д.К. Зеленин

4

КАМПIЯ– КАЧаЛКА, т. 4, вып. 2

1908

167

321–640

---

ВОИАН

Д.К. Зеленин

5

КАЧаЛКА – КЛаСТЬСЯ, т. 4, вып. 3

1909

166

641–960

---

ВОИАН

Д.К. Зеленин

6

КЛаСТЬСЯ – КОГДа, т. 4, вып. 4

1910

165

961–1280

---

ВОИАН

Д.К. Зеленин

7

КОГДа – КОЛПаК, т. 4, вып. 5

1911

165

1281–1600

---

ВОИАН

Д.К. Зеленин

8

КОЛПаК – КОНЦеПЦIЯ, т. 4, вып. 6

1912

166

1601–1920

---

ВОИАН

Д.К. Зеленин

9

КОНЦеПЦIЯ – КОРПуНЬЯ, т. 4, вып. 7

1913

166

1921–2240

---

ВОИАН

Д.К. Зеленин

10

КоРПУСИСТЫЙ –

КОШНЯЧёК, т. 4, вып. 8

1914

166

2241–2560

---

ВОИАН

Д.К. Зеленин

11

КОШоБА – КРИКуН, т. 4, вып. 9

1916

168

2561–2880

----

ВОИАН

Д.К. Зеленин

12

КРИКуН – КРоШЕЧНЫЙ, т. 4, вып. 10

1926

86

2881–3040

3000

ВОАН СССР

В.М. Истрин

14

Л – ЛёГКIЙ, т. 5, вып. 1

1915

165

1–320

---

ВОИАН

С.П. Обнорский

15

ЛёГКИЙ – ЛЕТУНоК, т. 5, вып. 2

1927

85

321–480

---

ПСК

В.М. Истрин

16

ЛЕТуНЧИК – ЛИСиЧИЙ, т. 5, вып. 3

1928

85

481–640

3000

ПСК

В.М. Истрин

17

М – МаЛЫЙ, т. 6, вып. 1

1927

85

1–160

3000

ПСК

В.М. Истрин

18

МаЛЫЙ – МАСТиТЫЙ, т. 6, вып. 2

1929

84

161–320

1500

СК

Е.Ф. Карский

19

НЕ, т. 8, вып. 1

1927

58

1–98

3000

АН СССР

В.И. Чернышев

20

НЕ – НЕВРеМИЩЕ, т. 8, вып. 1

1927

85

1–160

3000

ВОАН СССР

В.М. Истрин

21

НЕВРеМЯ –

НЕДОРуБЩИКЪ, т. 8, вып. 2

1929

84

161–320

1500

СК

В.М. Истрин

22

О – ОБЕЗОРУЖИВАТЬ, т. 9, вып. 1

1929

84

160

2000

СК

Е.Ф. Карский

23

ОБЕЗОРуЖИВАТЬ –

ОБКАТаТЬСЯ, т. 9, вып. 2

1930

83

161–320

2000

КРЯЗ

Е.Ф. Карский

2684

Л.В. Щерба [и др.]. Спб., 1908–1930. Т. 3, вып. 1: И–Изба, 1922; Т. 3, вып. 2: Изба – Издёргивать, 1929; Т. 4, вып. 1: К – Кампилист, 1906–1907; Т. 4, вып. 2: Кампания – Качалка, 1908; Т. 4, вып. 3: Качалка – Класться, 1909; Т. 4, вып. 4: Класться – Когда; Т. 4, вып. 5: Когда – Колпак, 1911; Т. 4, вып. 6: Колпак – Концепция, 1912; Т. 4, вып. 7: Концепция – Корпунья, 1913; Т. 4, вып. 8: Корпусистый – Кошнячек, 1914; Т. 4, вып. 9: Кошоба – Крикун, 1916; Т. 4, вып. 10: Крикун – Крошечный, 1926; Т. 5, вып. 1: Л – Лёгкий, 1915; Т. 5, вып. 2: Лёгкий – Летунок, 1927; Т. 5, вып. 3: Летунчик – Лисичий,

1928; Т. 6, вып. 1: М – Малый, 1927; Т. 6, вып. 2: Малый – Маститый, 1929; Т. 8, вып. 1: Не – Неврони-ще, 1927; Т. 8, вып. 2: Невремя – Недорубщик, 1929; Т. 9, вып. 1: О – Обезоруживать; Т. 9, вып. 2: Обезоруживать – Обкататься, 1930 (табл. 3).

СРЯ 1930–1937

Словарь русского языка, сост. комиссией по русскому языку АН СССР / ред. Н.С. Державин [и др.]. 2-е изд. Л., 1930–1937. Т. 5, вып. 1: Л – Лакту-кон, 1930; Т. 5, вып. 2: Лактокупикрин – Лебёдушка, 1932; Т. 6, вып. 1: М – Малый, 1932; Т. 8, вып. 1:

СРЯ 1930–1937

Таблица 4

N

Интервал, том, выпуск

Год

Страниц

Столбцов

Тираж

Издание

Редактор

1

А – АЖНО, т. 1, вып. 1

1932

116

1–224

2000

КРЯЗ

Н.С. Державин

2

аЖНО – АЛЛОТРИЛоГИЯ, т. 1, вып. 2

1933

84

225–384

2000

ИЯМ СО

Н.С. Державин

3

АЛЛОТРИМоРФНЫЙ –

АНАРХиЧЕСКИЙ, т. 1, вып. 3

1935

83

385–544

2175

ИЯМ

Н.С. Державин

4

АНАРХиЧЕСКИЙ – АНТИЦИПиРОВАТЬСЯ, т. 1, вып. 4

1936

83

545–704

2175

ИЯМ

Н.С. Державин

5

Е – еКАТЬ, т. 6, вып. 1 (данный выпуск найден в личной библиотеке

Р.П. Рогожниковой. По нашим данным, этот выпуск является уникальным и редким и до настоящего времени не введенным в научный оборот)

1937

83

1–160

2175

ИЯМ

Н.С. Державин

6

И – ИДЕАЛИЗиРОВАТЬСЯ, т. 9, вып. 1

1935

83

1–160

2175

ИЯМ

Н.С. Державин

7

Л – ЛАКТУКоН, т. 5, вып. 1

1930

83

1–160

2000

КРЯЗ

Е.Ф. Карский

8

ЛАКТОКУПИКРиН –

ЛЕБёДУШКА, т. 5, вып. 2

1932

83

161–320

2000

КРЯЗ

Н.С. Державин

9

ЛЕБёДУШКА – ЛЕЗГиНКА, т. 11, вып. 3

1934

85

321–480

2175

ИЯМ

Н.С. Державин

10

ЛЕЗГОТа – ЛЕСНоЙ, т. 11, вып. 4

1935

83

481–640

2165

ИЯМ

Н.С. Державин

11

МаЛЫЙ – МАСЛоВЫЙ (№ 6), т. 6, вып. 2

1934

83

161–320

2000

ИЯМ

Н.С. Державин

12

МАСЛОГЛаЗЫЙ – МАХаТЬ (№ 6), т. 6, вып. 3

1936

83

321–480

2175

ИЯМ

Н.С. Державин

13

НЕ – НЕВиННОСТЬ, т. 8, вып. 1

1932

83

1–160

2000

КРЯЗ

Н.С. Державин

14

НЕДОВЕРНуТЬСЯ –

НеЖУНЬКА, т. 13, вып. 3

1935

83

321–480

2175

ИЯМ

Н.С. Державин

15

НЕЖУРёННЫЙ –

НЕКРыТЫЙ, т. 13, вып. 4

1936

109

481–692

2175

ИЯМ

Н.С. Державин

16

ОБКАТиТЬ –

ОБЛУПЛИВАТЬ, т. 14, вып. 3

1934

81

321–480

2175

ИЯМ

Н.С. Державин

17

ОБЛуПЛИВАТЬ – ОБОДРаТЬ, т. 14, вып. 4

1935

83

481–640

2175

ИЯМ

Н.С. Державин

18

ОБОДРаТЬСЯ –

ОБРаТНОСТЬ, т. 14, вып. 5

1936

93

641–820

2175

ИЯМ

Н.С. Державин

1564

38090

Не – Невинность, 1932; нов., перераб. и доп. изд. Л., 1932. Т. 1, вып. 1: А – Ажно, 1932; Т. 1, вып. 2: Ажно – Аллотрилогия, 1933; Т. 6, вып. 2: Малый – Масловый, 1933; Т. 8, вып. 2: Невинность – Недовернуться, 1933. 7-е изд. Л. – М., 1934–1937. Т. 1, вып. 3: Аллотриморфный – Анархический, 1935; Т. 1, вып. 4: Анархический – Антиципироваться, 1936; Т. 5, вып. 1: Д – Даятельный, 1937; Т. 9, вып. 1: И – Идеализировать, 1935; Т. 11, вып. 3: Лебёдушка – Лезгинка, 1934; Т. 11, вып. 4: Лезгота – Лесной, 1935; Т. 12, вып. 2: Малый – Масловый, 1934; Т. 12, вып. 3: Маслоглазый – Махат, 1936; Т. 13, вып. 4:

Нежуренный – Некрытый, 1935; Т. 14, вып. 4: Облупливать – Ободрать, 1935; Т. 14, вып. 5: Ободраться – Обратность, 1936 (табл. 4).

Ушаков 1934–1940

Толковый словарь русского языка: в 4 т. / сост. Г.О. Винокур, проф. Б.А. Ларин, С.И. Ожегов [и др.]; под ред. проф. Д.Н. Ушакова. М.: Госизд. иностр. и нац. словарей, 1934–1940. Т. 1: А – Кюрины. В предисл.: обзор изданий словарей русского языка. М..: Сов. энцикл., 1934. LXXVI, 1568 стлб. То же. 1935. М.: Рус. словари, 1994. Т. 1: А – кю-

Таблица 5

БАС1 1948–1965

Том

Интервал

Год

Столбцов

Экземпляров

Словарных статей

Ссылок

Главный редактор

А – Б

1948

736

3000

0

В.И. Чернышев

1

А – Б

1950

767

25000

5747

0

В.И. Чернышев

2

В

1951

1393

26000

7844

0

В.И. Чернышев, С.Г. Бархударов

3

Г – Е

1954

1340

26000

8349

0

С.Г. Бархударов

4

Ж – З

1955

1364

23500

6637

806

С.Г. Бархударов

5

И – К

1956

1918

24000

9388

748

В.В. Виноградов

6

Л – М

1957

1460

22000

6924

357

Ф.П. Филин

7

Н

1958

1468

20000

8473

857

Ф.П. Филин

8

О

1959

1840

19000

9867

1847

Ф.П. Филин

9

П – Пнуть

1959

1482

18200

6615

952

Ф.П. Филин

10

По – Поясочек

1960

1774

17500

7920

809

Ф.П. Филин

11

Пра – Пятью

1961

1842

16600

8996

1587

Ф.П. Филин

12

Р

1961

1675

16700

6270

910

Ф.П. Филин

13

С – Сняться

1962

1516

16400

5448

380

Ф.П. Филин

14

Со – сям

1963

1390

16300

5020

395

Ф.П. Филин

15

Т – тятя

1963

1286

16000

4005

263

Ф.П. Филин

16

У – фють

1964

1610

13800

5484

947

Ф.П. Филин

17

Х – ящурный

1965

2126

13600

7724

666

Ф.П. Филин

5022

333600

120711

11524

рины (25916 слов без 1463 ссылочных). 844 с. Т. 2. Л – Ояловеть. М.: ГИС, 1938. 1040 стлб. 1996. Т. 2: Л – Ояловеть, 16840 слов без 987 ссылочных) 523 с. 1996. Т.3. П – Ряшка. М.: ГИС, 1939. 1424 стлб. Т. 3: П – Ряшка (22 076 слов без 1 586 ссылочных). 714 с. 1996. Т. 4: С – Ящурный. М.: ГИС, 1940. 1504 стлб. Т. 4: С – ящурный (20 692 слова без 1 017 ссылочных). 754 с. 3 000 экз. М.: Терра, 1996. М.: Рус. словари, 1994. По изд. 1935–1940 гг. Т. 1: А – К. 1994. XV c., LXXVI, 1 562 cтлб., 3 c. Т. 2: Л – О. 1994 [3 с.], 1 040 стб. Т. 1: А – Кюрины. 2000. 1568 с. Т. 2: Л – Ояловеть. 2000. 1040 с. Т. 3: П – Ряшка. 2000. 1424 с. Т. 4: С – Ящурный. 2000. 1500 с. Т. 1: А – М. 2001. 703 с. Т. 2: Н – П. 2001. 688 с. Т. 3: Р – Я. 2001. 672 с.

БАС1 1948–1965

Словарь современного русского литературного языка: в 17 т. / под ред. А.М. Бабкина, С.Г. Бархударова, Ф.П. Филина и др. М. – Л., 1948–1965. Т. 1: А – Б. 1948, 1950; Т. 2: В – Вящий. 1951; Т. 3: Г – Е. 1954; Т. 4: Ж – З. 1955; Т. 5: И – К. 1956; Т. 6: Л – М. 1957; Т. 7: Н. 1958; Т. 8: О. 1959; Т. 9: П – Пнуть. 1959; Т. 10: По – Поясочек. 1960; Т. 11: Пра – пятю. 1961; Т. 12: Р. 1961; Т. 13: С – Сняться. 1962; Т. 14: Со – Сям. 1963; Т. 15: Т. 1963; Т. 16: У – Ф. 1964; Т. 17: Х – Я. 1965. БАС1: Словарь русского литературного языка: в 17 т. М. – Л., 1948–1965. Гл. ред. В.И. Чернышев (1, 2), С.Г. Бархударов (2, 3, 4), В.В. Виноградов (5), Ф.П. Филин (6, 7, 8, 9, 15, 16). АН СССР. Ин-т рус. яз., Ин-т языкознания. Первый том был подготовлен к изданию до Великой Отечественной войны и должен был выйти в свет в конце 1941 г., однако работа возобновилась лишь в 1945 г. Планировалось издать 15 томов. Реально вышло 17 томов. Авторы (в скобках номера томов): П.К. Абабков (1), И.М. Абрамович (11, 12, 15, 17), Э.В. Алексеева (9, 11, 12, 15, 17), Н.И. Андреева-Васина (11), С.А. Аннинский (1), А.М. Бабкин (1, 4, 5), Л.И. Балахонова (9, 10, 13, 14), С.Л. Баженова (11, 12, 14, 16, 17), С.Г. Бархударов (1–3), К.К. Баумгарт (1), О.Е. Березина (17), Л.С. Берг (1), П.Н. Берков (1), Е.Э. Биржакова (5, 6, 16), Э.В. Брицке (1), Н.З. Бу-тарова (12), Д.И. Буторин (11, 13, 15, 17), С.И. Вавилов (1), В.И. Вернадский (1), В.В. Виноградов (1), Л.А. Войнова (8–10, 13, 15), А.Я. Вышинский (1), Г.П. Галаванова (6–9, 11, 17), В.Л. Георгиева (5, 6), А.П. Герасимов (1), Е.Н. Головинская (10), К.С. Горбачевич (14, 16), И.Л. Городецкая (9, 14, 16, 17), Б.Д. Греков (1), Н.П. Гринкова (1), И.М. Губкин (1), Е.А. Гузунова (12, 15), М.К. Давыдова (10), А.М. Деборин (1), Н.С. Державин (1), А.П. Евгеньева (4), С.А. Жебелев (1), В.П. Жуков (8), О.Е. Зайчикова (14), И.К. Зборовский (1–7), Е.А. Иванникова (17), Е.М. Иссерлин (4, 5), Е.С. Истрина (1), Г.А. Качевская (5, 6, 8, 9, 12, 15, 17), Г.П. Князькова (4–6, 12, 15), Л.С. Ковтун (4, 5, 8), Т.С. Ко-готкова (7, 8), О.И. Козелюкина (1), В.Л. Комаров (1), Э.И. Коротаева (5), З.Т. Короткевич (15, 16), Н.З. Котелова (8, 9, 15), Г.Е. Кочин (1), И.Ю. Крачковский (1), А.Н. Криштофович (1), О.Д. Кузнецова (10, 13, 15, 17), Е.А. Левашов (15), И.Г. Лем- берик (1), А.И. Литвиненко (15, 17), К.А. Логинова (10, 15–17), Л.С. Ляпунова (1, 2), С.Е. Малов (1), И.М. Мальцева (9, 10, 13, 14, 16), А.Ф. Марецкая (12, 14, 17), А.И. Махонина (1), Н.М. Меделец (8, 10, 12, 14, 16), И.И. Мещанинов (1), А.И. Молотков (7, 8, 10–12, 14–17), Д.В. Наливкин (1), А.М. Невжинская (14), Л.П. Неманежина (14), Е.К. Никольская (1, 2, 4–6, 9, 10), С.П. Обнорский (1), Л.В. Омельянович-Павленко (2, 3, 6, 12, 15), Л.А. Орбели (1), А.С. Орлов (1), М.М. Орлов (5–7), Л.В. Павленко (1, 4, 5, 11, 17), П.И. Павленко (7, 10, 13–16), Н.Т. Панченко (1, 4–6), Ф.Д. Перевозчикова (10, 12, 14, 17), Е.Ф. Петрищева (8), В.П. Петушков (13, 14, 16, 17), В.И. Пономарев (1–3), Т.Н. Поповцева (13, 15–17), Р.Э. По-рецкая (1, 2), О.Г. Порохова (7–9, 11, 12), М.Б. Рабинович (5, 6), Г.А. Разумникова (17), Р.П. Рогож-никова (11, 17), В.В. Розанова (14, 16), И.Ф. Рудакова (10, 13–15, 17), В.С. Садиков (1), Г.А. Сараева (8, 9), Ю.М. Северинова (2, 16), И.С. Семенов (1), А.В. Семериков (1), В.Н. Сергеев (15), Н.П. Синельникова (1), С.С. Советов (1, 2), Ю.С. Сорокин (4), Ф.П. Сороколетов (7, 9, 13), Г.А. Стахова (12, 15, 16), В.В. Струве (1), М.Н. Судоплатова (5, 6, 13, 14, 16), К.А. Тимофеев (9, 10), В.А. Тихомирова (11, 13, 16), Е.Н. Толикина (10), И.И. Толстой (1), В.Н. Тонков (1), Н.А. Торопов (1), В.И. Чернышев (1–3), И.А. Фалев (1, 2), А.И. Федоров (7–9), Е.А. Федоров (1), В.П. Фелицына (5, 6, 8, 9, 12, 17), А.Е. Ферсман (1), Ф.П. Филин (1, 7), Т.А. Фоменко (11, 17), Л.И. Царева (9, 11, 12), В.Н. Цыганова (10, 13, 14, 16), Е.Н. Шипова (1, 3), В.Ф. Шишмарев (1), И.Н. Шмелева (6, 12), Л.В. Щерба (1), М.А. Яковлев (1), Н.П. Яковлева (3). Ред. С.А. Аннинский (1), А.М. Бабкин (4, 5), Л.И. Балахонова (14), С.Г. Бархударов (2, 3), П.Н. Берков (1), Е.Э. Биржакова (6, 11), Л.А. Войнова (14), Г.П. Галаванова (13), Г.А. Качевская (9, 15), Л.С. Ковтун (8), Э.И. Коротаева (6), Н.З. Котелова (9, 16), Н.М. Меделец (10, 16), Е.К. Никольская (4), С.П. Обнорский (3), Л.В. Омельянович-Павленко (6), Р.П. Рогожникова (11), Ю.С. Сорокин (4, 5), Ф.П. Сороколетов (7, 13), К.А. Тимофеев (10), Е.Н. Толикина (15), И.А. Фа-лев (1), В.П. Фелицына (12), Ф.П. Филин (4, 7), В.И. Чернышев (1, 2), И.Н. Шмелева (8, 12). Т. 1: А – Б. 1948. 736 стбл. 3000 экз. Т. 1 издавался два раза (в 1948 и в 1950 гг.) практически без изменений, но в 1950 г. добавлен алфавитный указатель.

В 17-м томе БАС1 на с. 4 в предисловии «От редакционной коллегии» указано, что всего в словаре 120 480 слов, а формально, по данным отдельных томов, 120 711 словарных статей (табл. 5).

МАС 1957–1961

Словарь русского языка: в 4 т. / под ред. А.П. Евгеньевой. М., 1957–1961. Т. 1: А – Й; Т. 2: К – О; Т. 3: П – Р; Т. 4: С – Я. 2-е изд., испр. и доп. М., 1981–1984; 3-е изд., стереотип. М., 1985– 1988; 4-е изд., стер.: М., 1999. И.М. Брамович (2, 3), Э.В. Алексеева (3), Л.П. Алекторова (1–4), С.Л. Баженова (1–4), С.Ф. Геккер (2), Е.А. Гузуно-ва (1–3), М.К. Давыдова (1–4), О.Е. Зайчикова (1–3), В.В. Замкова (1–4), В.В. Зуева (1, 2), Е.А. Иванни- кова (3, 4), М.А. Каллистрати (1–3), Г.П. Князькова (2), Е.Г. Ковалевская (1–3), Л.С. Ковтун (2), З.Т. Ко-роткевич (1, 2, 4), О.Д. Кузнецова (1–4), Л.Л. Кутина (1, 3), А.И. Литвиненко (1, 2, 4), А.Ф. Марецкая (2–4), И.И. Матвеев (1–3), А.И. Молотков (2– 4), П.И. Павленко (3, 4), Ф.Д. Перевозчикова (1–3), В.П. Петушков (1–4), Т.Н. Поповцева (2), Г.А. Раз-умникова (1, 4), Р.П. Рогожникова (1–4), Т.В. Рождественская (1), Г.Н. Скляревская (1, 3), Ф.П. Соро-колетов (3), Г.А. Стахова (2, 3), М.Н. Судоплатова (1, 2), В.А. Тихомирова (1–4), Е.Н. Толикина (2–4), В.Н. Цыганова (1–4), М.М. Чумандрина (2). МАС: Словарь русского языка: в 4 т. / гл. ред. А.П. Евгеньева. М.: Рус. яз., 1957–1961. 2-е изд., испр. и доп. 1981–1984. 3-е изд. стереотип. 1985–1988. Т. 1: А – Й. 1985. 696 с. 200 000 экз. Т. 2: К–О. 1986. 736 с. 200 000 экз. Т. 3: П – Р. 1987. 750 с. 200 000 экз. Т. 4: С – Я. 1988. 782 с. 200 000 экз. 4-е изд., стереотип. М.: Рус. яз., 1999.

БАС2 1991–1994

Словарь современного русского литературного языка. 2-е изд., перераб. и доп. Т. 1: А – Б. 1991; Т. 2: В. 1991; Т. 3: Г. 1992; Т. 4: Д. 1993; Т. 5–6: Е – З. 1994. БАС-2: Словарь современного русского литературного языка: в 20 т. / АН СССР, Ин-т рус. яз.; гл. ред. К.С. Горбачевич. 2-е изд., перераб. и доп. М.: Рус. яз., 1991. Т. 1: А – Б. 1991. 864 с. 100 000 экз. Т. 2: В. 1991. 958 с. 100 000 экз. Т. 3: Г. 1992. 400 с. 74 100 экз. Т. 4: Д. 1993. 573 с. 74 100 экз. Т. 5–6: Е–З. 1994. 912 с. 10 060 экз. Ред. Л.И. Балахонова (3, 5–6), Г.П. Князькова (1, 4), В.П. Фелицына (5–6). Сост.: Л.П. Алекторова (1), С.Л. Баженова (1, 4, 5–6), Л.И. Балахонова (1–3), Н.З. Бутарова (1, 2, 4), Г.Н. Верещагина (1), Т.И. Гайкович (2, 4, 5–6), Г.П. Галаванова (4), К.С. Горбаче-вич (2), И.Л. Городецкая (3), Е.А. Иванникова (1), Г.Н. Князькова (1), Л.С. Ковтун (2), Т.А. Корова-ненко (1), С.А. Кузнецов (2), Н.Н. Куканова (3), Е.А. Левашов (2, 3), А.И. Литвиненко (1–3, 5–6), Н.М. Меделец (2), А.М. Невжинская (1, 3), В.О. Петрунин (4, 5–6), В.П. Петушков (2), Т.Н. Поповце-ва (1), Г.А. Разумникова (3, 4), В.Н. Сергеев (4, 5), Г.Н. Скляревская (1, 4), Н.В. Соловьев (2, 4, 5–6), Е.Н. Толикина (2, 3), В.П. Фелицына (2, 3, 5–6), Т.А. Фоменко (4, 5–6), В.Н. Цыганова (1, 4).

ССРЛ 1991

Сводный словарь современной русской лексики: в 2 т. / под ред. Р.П. Рогожниковой. М., 1991.

РСС 1998–2007

Шведова Н.Ю. [и др.]. Русский семантический словарь. Толковый словарь, систематизированный по классам слов и значений / ИРЯ им. В.В. Виноградова РАН / под общ. ред. Н.Ю. Шведовой. М.: Азбуковник, 1998. Т. 1: Слова указующие (местоимения). Слова именующие: имена существительные (Все живое. Земля. Космос). XXV, 807 с. Т. 2: Имена существительные с конкретным значением. Все создаваемое руками и умом человека (населенные места, обрабатываемые участки дороги; веще-

Таблица 6

Выпуск

Интервал

Год

Страниц

Экземпляров

Словарных статей

01

А

1965

304

4500

2114

02

Ба-ба-ба – Блазниться

1966

315

4500

4356

03

Блазнишка – Бяшутка

1968

324

3650

4476

04

В – Военки

1969

356

4200

4745

05

Военство – Выростковый

1970

344

4200

4488

06

Выросток – Гон

1970

344

4200

2923

07

Гона – Депеть

1972

356

3600

3913

08

Дер – Ерепениться

1972

369

3600

5094

09

Ерепеня – Заглазеться

1972

362

3550

4495

10

Заглазки – Заросить

1974

388

3800

5421

11

Зароситься – Зубрёнка

1976

363

7200

5298

12

Зубреха – Калумаги

1977

368

7200

5021

13

Калун – Кобза

1977

358

6350

5226

14

Кобзарик – Корточки

1978

376

6150

4436

15

Кортусы – Куделюшки

1979

399

6300

4803

16

Куделя – Лесной

1980

326

6500

5535

17

Леснокаменный – Масленичать

1981

383

7850

5914

18

Масленичок – Мутарсливый

1982

367

6600

5682

19

Мутаситься – Накучить

1983

360

5600

5043

20

Накучкать – Негоразд

1985

376

5600

6142

21

Негораздый – Обвива

1986

360

4300

5931

22

Обвивень – Одалбливать

1987

368

4900

5472

23

Одале – Осеть

1987

376

5000

5532

24

Осець – Отчураться

1989

367

3000

5192

25

Отчурить – Первачок

1990

352

4200

4654

26

Первее – Печетник

1991

350

3500

4330

27

Печечки – Поделывать

1992

400

1850

4735

28

Подель – Покороче

1994

400

1820

6063

29

Покорочеть – Попритчиться

1995

347

1640

5017

30

Поприугомонить – Почестно

1996

384

1160

4861

31

Почестно – Присуть

1997

432

1200

5689

32

Присуха – Протишь

1998

272

1200

1519

33

Протка – Разлука

1999

362

1200

6725

34

Разлуканье – Ревенька

2000

368

1200

5881

35

Реветь–Рящик

2001

360

1200

5351

36

С – Святковать

2002

344

1200

5109

37

Свято – Скимяга

2003

416

1200

5824

38

Скинать – Сметушка

2004

373

1200

5304

39

Сметушка – Сопочить

2005

343

1200

4290

40

Сопочка – Ссуворить

2006

346

1200

4909

41

Ссувориться – Стригчись

2007

342

1200

3988

42

Стриж – Сухловина

2010

330

1200

4443

43

Сухлость – Телепа

2010

349

1200

5370

44

Телепай – Транба

2011

350

1000

5114

45

Транбовать – Тыча

2012

344

1000

5241

46

Тычак – Ужоля

2013

350

1000

4337

47

Ужом – Урос

2014

353

1000

4848

48

Уроса – Ушибь

2015

342

800

3418

49

Ушивальник – Харятый

2016

351

800

3646

50

Хас – Хоглок

2017

335

300

2549

11546

138920

240467

СРНГ 1965–2017

ственные продукты труда); организации и учреждения. Названия предметов по форме, состоянию, составу, местонахождению, употреблению. 2000. ХХХII. 762 с. Т. 3: Имена существительные с абстрактным значением. Бытие. Материя, пространство, время. Связи, отношения, зависимости. Духовный мир. Состояние природы, человека. Общество. 2003. 720 с. Т. 4: Глагол. 2007. 952 с.

БАС3 2004–2017

Т. 1–24. 2004–2017. Гл. ред.: К.С. Горбачевич (т. 1–9), А.С. Герд (т. 10–24). 2004. Т. 1: А – Бишь. 663 с. 5 000 экз.; 2005. Т. 2: Благо – Внять. 659 с. 5 000 экз.; 2005. Т. 3: Во – Вящей. 664 с. 5 000 экз.; 2006. Т. 4: Г – День. 679 с. 5 000 экз.; 2006. Т. 5: Деньга – Жюри. 695 с. 5 000 экз.; 2006. Т. 6: З – Зятюшка. 827 с. 5 000 экз.; 2007. Т. 7: И – Каюр. 730 с. 5 000 экз.; 2007. Т. 8: Каюта – Кюрины 840 с. 5 000 экз.; 2008. Т. 9: Л – Медь. 660 с. 5 000 экз.; 2008. Т. 10: Медяк – Мячик. 573 с. 5 000 экз.; 2008. Т. 11: Н – Недриться. 634 с. 5 000 экз.; 2009. Т. 12: Недруг – Няня. 653 с. 5 000 экз.; 2009. Т. 13: О – Опор. 770 с. 5 000 экз.; 2010. Т. 14: Опора – Отрыть. 656 с. 5 000 экз.; 2011. Т. 15: Отряд – Перевал. 612 с. 5 000 экз.; 2011. Т. 16: Перевалец – Пламя. 640 с. 5 000 экз.; 2011. Т. 17: План – Подлечь. 672 с. 5 000 экз.; 2012. Т. 18: Подлещ – Порой. 774 с. 5 000 экз.; 2012. Т. 19: Порок – Пресс. 708 с. 5 000 экз.; 2012. Т. 20: Пресса – Продел. 732 с. 5 000 экз.; 2012. Т. 21: Проделать – Пятью. 631 с. 5 000 экз.; 2013. Т. 22. Р – Расплох. 736 с. 5 000 экз.; 2014. Т. 23: Расплыв – Розниться. 742 с. 5 000 экз.; 2017. Т. 24: Розница – Сверяться. 671 с. 5 000 экз. БАС3 построен на тех же принципах, что и «Словарь современного русского литературного языка» в 17 томах. Авторы БАС3 позиционируют его не как переиздание, а как новый академический словарь [22]. В частности, в предисловии (т. 1) говорится: «БАС – новый академический словарь современного русского языка. Он охватывает гораздо более протяженный хронологический период, чем все предыдущие академические словари, и тем самым представляет собой сокровищницу русской лексики XIX–XXI веков».

Под ГИЗ а УРУС ом понимается реляционная база данных с гиперссылками (цифровой идеографический словарь, отображающий семантические отношения между лексическими единицами и предназначенный для поиска слов по их значениям) [66, с. 29].

Моделирование, разработка, создание, конструирование гизауруса обязательно включают следующие основные этапы: 1) формирование генерального словника – отбор ЛЕ; 2) нормализация лексики; 3) систематизация и группировка ЛЕ; 4) построение классификационных схем понятий; 5) организационное оформление лексики гизауруса [6, с. 24].

Можно выделить как минимум три группы терминов: 1) специальные термины, употреб- ляемые только в конкретной предметной области, являющиеся ее опознавательными знаками, символами; 2) термины смежных отраслей знания, обозначающие необходимые для данной предметной области понятия из смежных отраслей науки (они отражают важнейшую закономерность развития науки: интеграцию, взаимопроникновение научных идей); 3) общенаучные термины, бытующие в любой отрасли знания (например: метод, анализ, исследование, объект, справочник, обзор, рукопись, теория, закон), и другая так называемая общая лексика.

При моделировании гизауруса приходится всякий раз решать, к какой группе терминов относится то или иное слово, насколько целесообразно его включение в состав генерального словника гизауруса, т. к. пропуск ЛЕ влечет за собой неизбежные потери информации при поиске, а излишнее расширение словарного состава делает его громоздким, неудобным и затрудняющим поиск.

Очевидно, что в первую очередь в состав лексики разрабатываемого гизауруса включаются термины первой группы. Именно они являются ключевыми. Отсутствие же формальных критериев значимости или незначимости терминов второй и третьей групп для моделируемого гизауруса существенно осложняет этап их отбора. При моделировании гизауру-са все источники лексики используются в комплексе.

Отобранные в результате анализа ЛЕ образуют генеральный словник – базовый терминологический массив. Важнейшее требование к формируемому генеральному словнику – полнота охвата ЛЕ.

В составе моделируемого гизауруса выделяются логико-лингвистические универсалии, к которым относятся алфавит, лексика, парадигматические и синтагматические отношения. Знание структуры гизауруса позволяет рационально использовать гизаурус, в частности проводить сопоставительный анализ источников гизауруса (например, хронологию появления и фиксации тех или иных терминов в научном обиходе), осуществлять эффективный поиск и решать определенный круг задач в соответствии с выполняемыми гизауру-сом функциями.

В настоящий момент наряду с национальными корпусами (НК) (Мангеймский корпус немецкого языка (COSMAS corpora, или DeReKo, URL: de/cosmas2-web/), НК шотландского языка (URL: , Британский НК – British National Corpus (URL:

, Корпус современного американского английского (Corpus of Contemporary American English, COCA, URL: , Tresor de la langue francaise, Коранический корпус арабского языка (URL: , Корпус Хамшахри (URL: Hamshahri/), Чешский НК (URL: cz/), Tekstaro de Esperanto (Корпус эсперанто, Эсперантский текстовый корпус, URL: , Корпус японской разговорной речи (URL: seika/corpus) и др. можно констатировать создание следующих корпусов текстов русского языка:

  • а)    Национальный корпус русского языка – онлайновый корпус русских текстов (URL: http://www.ruscorpora.ru/ ); открыт 29 апреля 2004 г.;

  • б)    Корпус русского литературного языка (URL: www.narusco.ru );

  • в)    Машинный фонд русского языка (URL: http://cfrl.ruslang.ru/ ) [2, с. 28–31];

  • г)    Открытый корпус (OpenCorpora) – проект по созданию размеченного корпуса текстов с лингвистической разметкой ( http://opencorpora.org ) и др.

Корпус – компьютерная система, содержащая информацию о свойствах входящих в него текстов – аннотацию = разметку, что принципиально отличает текстовый корпус от обычных цифровых коллекций текстов и / или электронных библиотек [13; 75; 92].

При составлении гизауруса учитываются следующие обстоятельства.

  • 1.    Компьютерные словари (наследуя недостатки книжных словарей) имеют такие особенности и проблемы, как:

  • –    неполнота генерального словника и в целом словаря;

  • –    трудности поддержания словаря в актуальном состоянии;

  • –    необходимость специфичных программных и аппаратных средств.

  • 2.    Словник и содержимое книжных словарей в процессе постепенного и длительного их издания требуют значительного дополнения, расширения и уточнения. За период издания появляются словари русского языка, а также множество аспектных, терминологических словарей и энциклопедий, которые могут существенно обогатить гизаурус.

  • 3.    Дифференциальный принцип отбора словников (нормативный, терминологический, аспектный и др.), оказавшийся продуктивным при описании лексики в книжных версиях, для цифровой версии гизауруса не является принципиальным, т. к. в компьютерной форме лексическая база данных автоматически становится полной и зависит лишь от полноты введенных источников (текстов записей информантов, картотек и любых источников лексикографических материалов), что позволяет в компьютерной форме конструировать гизаурус в тезаурусной (наиболее полной) форме.

  • 4.    Порядок расположения фразеологизмов и устойчивых словосочетаний в словарях, как правило, подчинен избранному для лексики словаря алфавитному или гнездовому принципу, что затрудняет поиск нужного словосочетания не только в объемных вокабулах, но и в словаре или энциклопедии в целом. Именно поэтому в гизаурусе несколько входов: авторский, алфавитный, база данных, библиографический, веб-формат, генеральный словник, географический и территориальный, гнездовой, источниковедческий, систематический и пермутационный, тематический, предметный, хронологический, а также по ключевым словам и словосочетаниям и др., что, безусловно, по возможностям отличает гизаурус от книжных версий академических словарей русского языка.

При этом одним из главных достоинств электронных версий словарей является то, что электронные словари многофункциональны, доступны и неуклонно становятся дешевле, чем их бумажные аналоги.

Список литературы Конструирование терминологического корпуса русского языка

  • Азарова И.В., Митрофанова О.А., Синопальникова А.А. [и др.]. Разработка компьютерного тезуаруса русского языка типа WordNet. СПб., 2002.
  • Андрющенко В.М. Концепция и архитектура машинного фонда русского языка. М., 1986.
  • Васильева Н.В., Виноградов В.А., Шахнарович А.М. Краткий словарь лингвистических терминов. М.: Рус. яз., 1995. С. 154-160.
  • Васильева Н.В. К семантическому и функциональному описанию греко-латинских терминоэлементов в лингвистической терминологии // Вопр. языкознания. 1984. № 1. С. 71-79.
  • Галиева А.М., Кириллович А.В., Лукашевич Н.В. [и др.]. Русско-татарский общественно-политический тезаурус: публикация в облаке лингвистических открытых связанных данных // International Journal of Open Information Technologies ISSN: 2307-8162. 2017. Vol. 5. No. 11. P. 64-73.
Статья научная