Автоматизация слогоделения и переноса слов в церковнославянских текстах
Автор: А.А. Андреев, М.П. Крутиков
Журнал: Труды и переводы @proceedings-and-translations
Рубрика: Кафедра древних языков
Статья в выпуске: 1, 2017 года.
Бесплатный доступ
Решение проблемы автоматизации слогоделения и переноса слов (hyphenation) в системе TeX было впервые предложено для английского языка в 1983 г. Ф. Льянгом. Однако до сих пор этот метод не применялся к церковнославянским текстам в кодировке Юникод. Тем не менее проблема автоматизации переноса слов является актуальной при верстке церковнославянских текстов, как в научных изданиях, так и в богослужебных книгах. В данной статье формулируются правила переноса слов для современного церковнославянского языка и предлагается автоматизированное решение, основанное на методе Льянга. Авторы описывают процедуру генерирования шаблонов переноса (hyphenation patterns) с использованием новой программы, разработанной авторами, и предлагают методы и критерии оценки их эффективности. Полученные шаблоны скомпонованы в пакет, позволяющий автоматически оформлять перенос слов как в си- стеме компьютерной типографики TeX (и производных программах), так и в текстовых редакторах и других программах верстки текста.
Типографика, морфология, слогоделение, компьютерные алгоритмы, Юникод, TeX, LaTeX, Алгоритм Кнута-Льянга, PATGEN
Короткий адрес: https://sciup.org/140290799
IDR: 140290799
Список литературы Автоматизация слогоделения и переноса слов в церковнославянских текстах
- Грот Я. К. Русское правописание. СПб.: Тип. Императорской Академии наук, 1902. 167 с.
- Andreev A., Shardt Y., Simmons N. Unicode Technical Note 41: Church Slavonic Typography in Unicode. 2015. URL: http://www.unicode.org/notes/tn41/.
- Davis M., Whistler K. Unicode Standard Annex 15: Unicode Normalization Forms / Unicode Consortium. 2016. URL: http://www.unicode.org/reports/tr15/.
- Ferguson M. J. Report on Multilingual Activities // TUGboat. 1990. Т. 11, No 4. С. 514–516.
- Haralambous Y. A small tutorial on the multilingual features of PatGen2. 1993.
- Haralambous Y. Hyphenation patterns for Ancient Greek and Latin // TUGboat. 1992. Т. 13, № 4. С. 459–467.
- Knuth D. E. TeX and METAFONT: new directions in typesetting. Digital Press, 1979.
- Liang F. M. Word Hy-phen-a-tion by Com-put-er: дис. ... док. философии / Stanford University. 1983.
- Sojka P., Antoš D. Context sensitive pattern based segmentation: a Thai challenge // Proceedings of EACL 2003 Workshop on Computational Linguistics for South Asian Languages. 2003. С. 65–72.