На днях Нурсултан Назарбаев в рамках программы латинизации казахского языка поставил задачу до конца 2017 года разработать проект латинского алфавита.
Тема перехода на другую письменность — постоянный предмет спора среди лингвистов, ведь единого варианта латинизации не существует.
Институт языкознания им. Байтурсынова в настоящий момент работает над 3 приоритетными вариантами алфавита.
С апострофами
Узбекский вариант. К недостающим в стандартной латинице буквам добавляется какой-нибудь апостроф (' ` ʻ ’). Ғ превращается в gʻ. На мой взгляд, это худшее, что можно выбрать из существующего. Апострофы визуально разрывают слова и полотно текста. С технической стороны слово с апострофом не является целостным. До недавних времен даже в Google нельзя было искать узбекские слова — поисковик считал апостроф разрывом.
Пример текста на узбекском с апострофами:
Возможно, это сыграло непоследнюю роль в том, что с момента введения у узбеков этого алфавита прошло более 20 лет, но все еще большинство текста в стране на кириллице.
С диграфами
Отсутствующие в латинице буквы заменяются сочетанием букв, чаще всего двумя. Отсюда и название — диграфы. Ш превращается в sh, ғ в gh, ө в oe. В качестве примера можно посмотреть на тот же узбекский текст — они применили диграфы для обозначения некоторых букв языка. Плюсы этого варианта — не нужно изобретать особые раскладки компьютеров, достаточно стандартной клавиатуры с латиницей. Минусов больше — увеличивается объем текста, замедляется скорость его набора, снижается удобство восприятия.
С диакритическими знаками
Диакритика — это различные черточки-крючки, воторые добавляются к буквам, чтобы отобразить недостающие звуки языка. Примером является латиница, которую использует информационное агентство КазИнформ.
Акценты, кратки, умляуты, конечно, решают вопрос с нехваткой букв в алфавите, но создают визуальный мусор. Лаконичный текст превращается в рогато-хвостатое нечто. Наглядно о проблеме диакритики:
Что же выбрать, что же будет оптимальным вариантом? Придется идти на уступки.
В 30-е годы прошлого столетия в СССР был эксперимент по внедрению универсальной латиницы для тюркских народов — Яналиф. В это азбуке дефицит букв разрешили, применив диакритику и придумав уникальные символы, несуществовавшие ранее в латинице.
Главное удобство было в том, что одна буква обозначала один звук, диакритики было немного, текст смотрелся довольно целостно и красиво.
Однако, сейчас использовать этот алфавит — не лучшее решение. В нем есть нестандартные символы, отсутствующие во многих компьютерных шрифтах. А некоторые знаки до сих пор не включены в стандарт кодирования символов — Юникод.
С учетом всего вышесказанного попробуем разработать свой вариант латинского алфавита. Постараемся его сделать лаконичным, красивым, минималистичным, удобным. Без диграфов, по возможности избегая диакритики.
Новый вариант
В таблице представлены согласные звуки казахского языка. Звуки [f], [v], [ɕ], [х], [ʦ], [ʨ], [h] встречаются только в заимствованных словах.
Над латинским обозначением некоторых звуков можно не размышлять — нет многозначностей. Они будут совпадать с их обозначением в МФА — Международному фонетическому алфавиту.
Остается приспособить к буквам несколько согласных звуков — [ʃ], [ʒ], [j], [ŋ], [ʁ].
Звук [ŋ] в кириллице обозначется буквой ң. В латинице ему есть несколько альтернатив:
- Ñ — согласно классификации Юникода, буква дополнительный латиницы. В алфавите испанского языка обозначает звук [ɲ]. Присутствует почти во всех шрифтах, содержащих латиницу, поэтому этот знак удобен. Но он содержит диакритику.
- Ń — буква расширенной латиницы, блок А. В алфавите польского языка обозначает звук [ɲ], как и в испанском. Этот блок расширенной латиницы присутствует во многих шрифтах, но не так часто, как предыдущая буква. Диакритика.
- Ņ — буква расширенной латиницы, блок А. В алфавите латышского языка обозначает звук [ɲ]. Диакритика.
- Ň — буква расширенной латиницы, блок А. В чешском и словацком языках обозначает звук [ɲ], в туркменском — [ŋ]. Диакритика.
- Ŋ — буква расширенной латиницы, блок А. Используется в МФА для обозначения звука [ŋ], а также в некоторых других языках. Цельный знак.
- Ꞑ — буква расширенной латиницы, блок D. Использовалась в Яналифе для обозначения звука [ŋ]. Этот блок расширенной латиницы присутствует в малом количестве шрифтов.
Выбираем лучшее решение. Последний вариант из Яналифа интересен, но неудобен для использования, мало компьютерных шрифтов его содержат. Остаются два варианта — Ñ и Ŋ. Первый, хоть и содержит отдельный диакритический элемент, имеет большой плюс — присутствует в подавляющем большинстве шрифтов. Второй — несколько реже встречается, но не только является цельным символом, а еще и по определению обозначает именно тот звук, который нам нужен — [ŋ]. Берем его.
Звук [ʃ] в кириллице обозначется буквой ш, в некоторых случаях щ. Щ — упрощенная запись для удвоенного звука [ʃʃ], поэтому нет смысла для него выделять отдельный знак латиницы.
Существующие альтернативы из блока А расширенной латиницы:
- Ś — используется в некоторых славянских языках для обозначения звуков [ɕ] и [ʃ].
- Ŝ — используется в эсперанто для обозначения звуков [ʃ] и [ʂ].
- Ş — используется во многих языках для обозначения звука [ʃ].
- Š — используется в некоторых европейских языках — чешский, латышский, литовский, эстонский — для обозначения звука [ʃ].
Дальше блока А смотреть варианты нет смысла, покрытие символами в шрифтах невелико. Все варианты с диакритикой. А что если взять другой символ?
C — звук [ʦ] в исконно казахских словах отсутствует, его этой буквой обозначать не потребуется. Все, берем для звука [ʃ], как когда-то это было в Яналифе.
[ʒ] и [j] в кириллице соответствуют буквам ж и й.
Варианты для [ʒ] из блока А расширенной латиницы:
- Ź — используется в польском для обозначения звука [ʑ].
- Ż — используется в мальтийском и польском алфавитах, обозначает звук [ʐ]
- Ž — используется в славянских языках для обозначения звука [ʒ].
Снова все с диакритикой. Но у нас имеются неиспользованные буквы J и Y из основной латиницы. Используем их для обозначения звуков [j] и [ʒ] соответственно.
Казахская фонетика подчиняется закону сингармонизма, в слове, исключая некоторые заимствования, могут быть только передние либо задние гласные. Звуки [q] и [k], [g] и [ʁ] являются аллофонами, то есть эти фонемы одинаковы, но звуки различаются в зависимости от соседних звуков одного слова. Например, [q] может быть только в слове с гласными заднего ряда, а [k] — с гласными переднего ряда. Так зачем создавать избыточные буквы? Убираем букву Q, аллофоны [q] и [k] будут обозначаться одной буквой K. Теперь не нужно искать букву латиницы для обозначения звука [ʁ], он, как и [g], будет обозначаться буквой G.
Перейдем к гласным.
За этими значками скрываются 9 гласных. Здесь уже удобнее использовать диакритику — классические для передачи парных гласных умляуты.
Готово, мы подобрали латинские буквы для соответствия казахской фонетике.
В современном казахском языке много заимствований, есть арабские, персидские, русские. Многие термины уже сложно представить, используя только классическую казахскую фонетику. Интернациональные термины, топонимы содержат отсутствующие в казахской фонетике звуки. Например, Франция. По стандартам кириллизации казахского языка все подобные слова брались из русского как есть, в той же самой буквенной форме, с чуждыми языку звуками. Обратимся к докириллическим временам.
На приведенном выше изображении указаны названия стран так, как они записывались Яналифом, максимально адаптированно к казахской фонетике.
Германия — Керман, Франция — Пырансы, Италия — Ійталійа, Англия — Ағылшын, Швеция — Шібет, Норвегия — Норбек.
Времена изменились, казахский язык тоже не стоит на месте. Среднестатистический человек, говорящий на казахском, уже давно не испытывает проблем с произнесением звуков [f], [v], [х], [h]. Часть этих звуков появилась вместе с арабскими и персидскими заимоствованиями. Поэтому опционально в алфавит можно добавить буквы для обозначения этих звуков.
- [f] — f
- [v] — v
- [х], [h] — h
Делать две разные буквы для звуков [х], [h] не имеет смысла, в современном казахском языке грань между этими заимствованными звуками стерлась.
Теперь поговорим о правилах транслитерации. Больше всего вопросов может возникнуть с буквами и, у кириллицы. Эти буквы обозначают сразу несколько звуков. И — [ɤj], [ɪj], [i]; У — [w], [ɪw], [ɤw], [ɯw].
В латинице будет достаточно развернуть эти дифтонги, превратив их в одну-две отдельные буквы.
Сиыр — sıyır, ине — iyne, иелік — iyelik, интернет — internet
Ру — ruw, ауа — аwa, құйысу — kuyısıw, күйісу — küyisiw
Из примеров можно сформулировать правила преобразования.
Букву Ц можно преобразовать как в S, так и в Z, в зависимости от происхождения слова. Ц в словах немецкого происхождения превратится в Z: цугцванг — zugzvaŋ. В словах иного происхождения — в S: цифр — sifr.
Буквы Ю, Я преобразуются с учетом того, что они являются дифтонгами. Аю — ayıw, яғни — yagnıy.
Буква Ч превращается в C: чек — cek.
Посмотрим на то, что получилось в итоге. Фрагмент из книги Саина Муратбекова «Жусан иісі».
По-моему, красиво. Нет большого мусора от диакритики, текст выглядит органично. Внешне отличается от латиниц других тюркских языков, что обеспечит его узнаваемость.
Именно этот вариант латиницы разработала команда проекта «Kazak Grammar Nazi» — энтузиастов, которые трудятся над реформированием казахского языка, чтобы сделать его современным и конкурентоспособным.
Их страницы в соцсетях:
Было бы прекрасно, если бы их вариант заметили в институте языкознания им. Байтурсынова, лингвисты которого работают над проектом латиницы. Как стало известно, в настоящее время в институте является приоритетным следующий вариант:
Алфавит довольно похож на тот, что разработали Kazak Grammar Nazi, но содержит существенно больше диакритики и отдельные буквы для қ и ғ. Сравним тексты обоих вариантов (откройте картинку в новой вкладке, чтобы рассмотреть подробнее).
Наглядно, текст слева выглядит чище. Текст справа пестрит птичками диакритики.
В дополнение к алфавиту Kazak Grammar разработан прототип клавиатуры для нового алфавита. Все символы помещаются на основную клавиатуру, поэтому цифровые кнопки остаются нетронутыми. Для оптимизации некоторые кнопки были перемещены, отмечены зеленым. Можно этого и не делать, если нужно максимально сохранить исходную раскладку США.
Примечание: все использованные в статье звуки МФА, данные в квадратных скобках, можно послушать на этой странице: ipachart.com