Автоматизация слогоделения и переноса слов в церковнославянских текстах

Автор: А.А. Андреев, М.П. Крутиков

Журнал: Труды и переводы @proceedings-and-translations

Рубрика: Кафедра древних языков

Статья в выпуске: 1, 2017 года.

Бесплатный доступ

Решение проблемы автоматизации слогоделения и переноса слов (hyphenation) в системе TeX было впервые предложено для английского языка в 1983 г. Ф. Льянгом. Однако до сих пор этот метод не применялся к церковнославянским текстам в кодировке Юникод. Тем не менее проблема автоматизации переноса слов является актуальной при верстке церковнославянских текстов, как в научных изданиях, так и в богослужебных книгах. В данной статье формулируются правила переноса слов для современного церковнославянского языка и предлагается автоматизированное решение, основанное на методе Льянга. Авторы описывают процедуру генерирования шаблонов переноса (hyphenation patterns) с использованием новой программы, разработанной авторами, и предлагают методы и критерии оценки их эффективности. Полученные шаблоны скомпонованы в пакет, позволяющий автоматически оформлять перенос слов как в си- стеме компьютерной типографики TeX (и производных программах), так и в текстовых редакторах и других программах верстки текста.

Еще

Типографика, морфология, слогоделение, компьютерные алгоритмы, Юникод, TeX, LaTeX, Алгоритм Кнута-Льянга, PATGEN

Короткий адрес: https://sciup.org/140290799

IDR: 140290799

Automated Hyphenation of Church Slavonic Text by Computer

The problem of automated word hyphenation by computer in the TeX typesetting system was first tackled for the English language in 1983 by F. Liang. His algorithm, however, still has not been applied to Church Slavonic texts encoded in Unicode. Yet there is a need to be able to hyphenate Church Slavonic text by computer, both in typesetting scholarly works and in editions of liturgical texts. In the present article, the authors formulate rules for syllable breaking and word hyphenation for modern Church Slavonic and present the hyphenation algorithm developed by Liang. The authors describe the procedure used to generate the hyphenation patterns with the help of a new application, created by the authors, and offer methods and criteria for evaluating the efficiency of the patterns. The newly generated patterns have been packaged by the authors, and this package allows users to automatically hyphenate Church Slavonic text both in the TeX typesetting system (and derivative programs), and in popular word processing and page layout software.

Еще

Список литературы Автоматизация слогоделения и переноса слов в церковнославянских текстах

  • Грот Я. К. Русское правописание. СПб.: Тип. Императорской Академии наук, 1902. 167 с.
  • Andreev A., Shardt Y., Simmons N. Unicode Technical Note 41: Church Slavonic Typography in Unicode. 2015. URL: http://www.unicode.org/notes/tn41/.
  • Davis M., Whistler K. Unicode Standard Annex 15: Unicode Normalization Forms / Unicode Consortium. 2016. URL: http://www.unicode.org/reports/tr15/.
  • Ferguson M. J. Report on Multilingual Activities // TUGboat. 1990. Т. 11, No 4. С. 514–516.
  • Haralambous Y. A small tutorial on the multilingual features of PatGen2. 1993.
  • Haralambous Y. Hyphenation patterns for Ancient Greek and Latin // TUGboat. 1992. Т. 13, № 4. С. 459–467.
  • Knuth D. E. TeX and METAFONT: new directions in typesetting. Digital Press, 1979.
  • Liang F. M. Word Hy-phen-a-tion by Com-put-er: дис. ... док. философии / Stanford University. 1983.
  • Sojka P., Antoš D. Context sensitive pattern based segmentation: a Thai challenge // Proceedings of EACL 2003 Workshop on Computational Linguistics for South Asian Languages. 2003. С. 65–72.