Цифровизация иероглифической письменности
Бесплатный доступ
Изучены современные проблемы цифровизации иероглифической письменности и причины их появления. В качестве инструментов решения изученных проблем описываются механизмы упорядочения, стандартизации и кодирования иероглифической письменности посредством электронно-вычислительных машин. Проанализированы наиболее часто применяемые методы кодирования иероглифической письменности. Цифровизация рассматривается как средство разрешения проблемы изучения иероглифической письменности.
Иероглиф, иероглифическая письменность, китай, цифровизация, способ кодирования, электронно-вычислительные машины
Короткий адрес: https://sciup.org/148309449
IDR: 148309449 | DOI: 10.25586/RNU.V925X.20.02.P.048
Текст научной статьи Цифровизация иероглифической письменности
Практически каждый этап исторического развития Китая сопровождался реформами устной и письменной речи, что связано с обилием диалектов китайского языка и сложностью иероглифической письменности. В настоящий момент вопрос китайской письменности снова находится на пике актуальности, поскольку заключает в себе совокупность нерешенных проблем, связанных с процессом слияния разговорной речи с письменными стилями, формированием единых стандартов произношения, большим количеством и сложностью иероглифов.
Первые предложения о разрешении проблем, вызванных необходимостью упрощения и унификации иероглифического письма, были сформированы в начале XX в. С течением времени они приобрели вид масштабной реформы. Сегодня реформа китайских иероглифов фактически сводится к реализации двух приоритетных направлений: язык и письменность, – в рамках которых наиболее актуальными задачами представляются распространение путунхуа как государственного языка, упрощение иероглифов, внедрение проекта фонетического алфавита [2, с. 133].
Решение обозначенных задач осложняется тем, что латиница, фактически ставшая международным стандартом, является лишь ограниченной частью китайского языка, что затрудняет доступ Китая к мировому информационному пространству. В этих условиях действенными инструментами снятия информационно-коммуникационного барьера являются механизмы упорядочения, стандартизации и цифро-
Абдрахманова А.Р. Цифровизация иероглифической письменности визации иероглифической письменности посредством электронно-вычислительных машин.
Особенности китайской письменности и ее существенное отличие от латиницы диктуют необходимость отказа от инструментов стандартного программирования и применения уникальных методов кодирования иероглифической письменности. Анализ особенностей цифровизации иероглифической письменности следует начинать с обозначения существующих проблем упорядочения и стандартизации.
Процедура упорядочения иероглифов включает несколько аспектов:
-
1) определение количества употребляемых в письменности иероглифов – отсутствует всеобъемлющая статистика, указывающая на достоверное количество используемых, «живых» иероглифов;
-
2) стандартизация чтения иероглифов – в различных словарях вариации транскрипции чтения иероглифов расходятся;
-
3) упрощение иероглифов, связанное с различным письменным начертанием одних и тех же единиц;
-
4) стандартизация структуры словарей иероглифов [5, с. 380].
Обозначенные проблемы упорядочения и стандартизации тесно связаны с цифровизацией иероглифической письменности. С осознанием необходимости ввода иероглифов в электронно-вычислительные машины актуализировались вопросы исследования способов кодирования иероглифического письма. Кодирование осуществляется на принципах, лежащих в основе структуры словарей иероглифов.
Сегодня известно более четырехсот способов ввода иероглифов в электронно-вычислительные машины, которые можно классифицировать по трем большим группам: преобразование алфавита, графические способы и кодирование посредством числового кода. Среди этих групп на практике наиболее широко используется две последние: графический метод (единицы вводятся по элементам в порядке очередности) уже утвердился в крупных учреждениях Китая (например, в типографиях), числовой заключает в себе самое большое количество видов кодирования [4, с. 112].
К основным видам кодирования китайских иероглифов посредством числового кода относятся следующие:
-
1) кодирование элементов (элементы отличаются по размеру: большие элементы соответствуют ключу иероглифа, а малые появляются как результат их разложения, при этом под ключом следует понимать графический знак, определяющий положение иероглифа в словаре);
-
2) кодирование по особым признакам иероглифа (например, первая или последняя черта, первый или второй угол);
-
3) кодирование по чертам (черты, из которых состоят иероглифы, классифицируются по нескольким группам, каждой из которых соответствует определенный числовой код или клавиша панели электронно-вычислительной машины);
-
4) комбинирование начертания и звучания (одна часть текста вводится посредством алфавита, другая – иероглифов);
-
5) кодирование по числовому коду (на основании частотности упоминания, места в словаре или какой-либо другой значимой характеристики иероглифа ему присваивается числовой код; самым распространенным типом такого кода является четырехзначная телеграфная комбинация) [3].
Все описанные виды кодирования не являются универсальными, существуют и другие менее практикуемые нечисловые способы цифровизации китайской письменности: по произношению, структуре, рукописный ввод и т.д. По мере расши-
50 в ыпуск 2/2020
рения перечня способов кодирования сужается рынок сбыта осуществляющей кодирование техники, что влечет за собой неудобства пользования. Для сокращения числа применяемых способов кодирования иероглифов необходимо сформировать единую политику разработки способов введения иероглифов в электронно-вычислительные машины.
Методы кодирования иероглифов позволяют частично разрешить проблему изучения иероглифической письменности, поскольку использование электронно-вычислительных машин позволяет значительно сократить затраты умственной энергии. Одним из последних достижений в области «преобразования алфавита» является создание электронно-вычислительных машин, способных производить из введенного китайского алфавита или алфавитных сокращений не только отдельные знаки, но и целые предложения.
При этом количество клавиш подобной техники является аналогичным клавиатурному набору электронно-вычислительных машин, работающих с английскими текстами. Это нивелирует проблему изучения китайской иероглифической письменности, поскольку, для того чтобы овладеть соответствующими навыками, обучаемому достаточно изучить китайский алфавит. Итогом дальнейшего совершенствования технологии цифровизации иероглифической письменности должно стать создание специального процессора для обработки китайских слов, который будет отличаться от уже существующих электронно-вычислительных машин более широким функционалом, позволяющим производить алфавитное и иероглифическое преобразование с опорой на китайский фонетический алфавит [1, с. 55].
Таким образом, процесс цифровизации иероглифической письменности Китая существенно осложняется отказом китайцев от латиницы и методов стандартного программирования. Из-за обилия применяемых способов кодирования информации с помощью иероглифов, наиболее распространенными среди которых представляются комбинированное кодирование, по элементам, особым признакам, чертам, числовому коду, достаточно остро стоит вопрос о стандартизации данного процесса. При этом унификация подходов к кодированию иероглифической письменности и упрощение механизмов цифровизации иероглифов являются ключом к разрешению проблемы изучения иероглифической письменности.
Список литературы Цифровизация иероглифической письменности
- Завьялова О.И. Китайская иероглифическая письменность на рубеже третьего тысячелетия // Китайское языкознание: Изолирующие языки: материалы X Международной конференции. М.: Институт языкознания Российской академии наук, 2002. С. 53-57.
- Коротков Н.Н. Конференция в Пекине по вопросам реформы китайской письменности и нормализации китайского языка // Вопросы языкознания. 1950. № 2. С. 131-136.
- Методы ввода иероглифов // Хабр. URL: https://habr.com/ru/post/160249/ (дата обращения: 25.02.2020).
- Су Пэйчэн. Программа современной иероглифики. (Дополненное издание). Пекин: Издательство Пекинского университета, 2007. 272 с.
- Чжоу Югуан. Модернизация китайского языка и письменности // Новое в зарубежной лингвистике. Вып. XXII: Языкознание в Китае. М.: Прогресс, 1989. С. 376-398.