Yvision.kz
kk
Разное
Разное
399 773 постов42 подписчика
Всяко-разно
12
10:59, 14 апреля 2017

Вариант латинизации казахского языка

На днях Нурсултан Назарбаев в рамках программы латинизации казахского языка поставил задачу до конца 2017 года разработать проект латинского алфавита.

Тема перехода на другую письменность — постоянный предмет спора среди лингвистов, ведь единого варианта латинизации не существует.

Институт языкознания им. Байтурсынова в настоящий момент работает над 3 приоритетными вариантами алфавита.

С апострофами

Узбекский вариант. К недостающим в стандартной латинице буквам добавляется какой-нибудь апостроф (' ` ʻ  ). Ғ превращается в gʻ. На мой взгляд, это худшее, что можно выбрать из существующего. Апострофы визуально разрывают слова и полотно текста. С технической стороны слово с апострофом не является целостным. До недавних времен даже в Google нельзя было искать узбекские слова — поисковик считал апостроф разрывом.

Пример текста на узбекском с апострофами:

Blog post image

Возможно, это сыграло непоследнюю роль в том, что с момента введения у узбеков этого алфавита прошло более 20 лет, но все еще большинство текста в стране на кириллице.

С диграфами

Отсутствующие в латинице буквы заменяются сочетанием букв, чаще всего двумя. Отсюда и название — диграфы. Ш превращается в sh, ғ в gh, ө в oe. В качестве примера можно посмотреть на тот же узбекский текст — они применили диграфы для обозначения некоторых букв языка. Плюсы этого варианта — не нужно изобретать особые раскладки компьютеров, достаточно стандартной клавиатуры с латиницей. Минусов больше — увеличивается объем текста, замедляется скорость его набора, снижается удобство восприятия.

С диакритическими знаками

Диакритика — это различные черточки-крючки, воторые добавляются к буквам, чтобы отобразить недостающие звуки языка. Примером является латиница, которую использует информационное агентство КазИнформ.

Blog post image

Акценты, кратки, умляуты, конечно, решают вопрос с нехваткой букв в алфавите, но создают визуальный мусор. Лаконичный текст превращается в рогато-хвостатое нечто. Наглядно о проблеме диакритики:

Blog post image

Что же выбрать, что же будет оптимальным вариантом? Придется идти на уступки.

В 30-е годы прошлого столетия в СССР был эксперимент по внедрению универсальной латиницы для тюркских народов — Яналиф. В это азбуке дефицит букв разрешили, применив диакритику и придумав уникальные символы, несуществовавшие ранее в латинице.

Blog post image

Главное удобство было в том, что одна буква обозначала один звук, диакритики было немного, текст смотрелся довольно целостно и красиво.

Blog post image

Однако, сейчас использовать этот алфавит — не лучшее решение. В нем есть нестандартные символы, отсутствующие во многих компьютерных шрифтах. А некоторые знаки до сих пор не включены в стандарт кодирования символов — Юникод.

С учетом всего вышесказанного попробуем разработать свой вариант латинского алфавита. Постараемся его сделать лаконичным, красивым, минималистичным, удобным. Без диграфов, по возможности избегая диакритики.

Новый вариант

В таблице представлены согласные звуки казахского языка. Звуки [f], [v], [ɕ], [х], [ʦ], [ʨ], [h] встречаются только в заимствованных словах.

Blog post image

Над латинским обозначением некоторых звуков можно не размышлять — нет многозначностей. Они будут совпадать с их обозначением в МФА — Международному фонетическому алфавиту.

Blog post image Остается приспособить к буквам несколько согласных звуков — [ʃ], [ʒ], [j], [ŋ], [ʁ].

Звук [ŋ] в кириллице обозначется буквой ң. В латинице ему есть несколько альтернатив:

  • Ñ — согласно классификации Юникода, буква дополнительный латиницы. В алфавите испанского языка обозначает звук [ɲ]. Присутствует почти во всех шрифтах, содержащих латиницу, поэтому этот знак удобен. Но он содержит диакритику.
  • Ń — буква расширенной латиницы, блок А. В алфавите польского языка обозначает звук [ɲ], как и в испанском. Этот блок расширенной латиницы присутствует во многих шрифтах, но не так часто, как предыдущая буква. Диакритика.
  • Ņ — буква расширенной латиницы, блок А. В алфавите латышского языка обозначает звук [ɲ]. Диакритика.
  • Ň — буква расширенной латиницы, блок А. В чешском и словацком языках обозначает звук [ɲ], в туркменском — [ŋ]. Диакритика.
  • Ŋ — буква расширенной латиницы, блок А. Используется в МФА для обозначения звука [ŋ], а также в некоторых других языках. Цельный знак.
  • — буква расширенной латиницы, блок D. Использовалась в Яналифе для обозначения звука [ŋ]. Этот блок расширенной латиницы присутствует в малом количестве шрифтов.

Выбираем лучшее решение. Последний вариант из Яналифа интересен, но неудобен для использования, мало компьютерных шрифтов его содержат. Остаются два варианта — Ñ и Ŋ. Первый, хоть и содержит отдельный диакритический элемент, имеет большой плюс — присутствует в подавляющем большинстве шрифтов. Второй — несколько реже встречается, но не только является цельным символом, а еще и по определению обозначает именно тот звук, который нам нужен — [ŋ]. Берем его.

Звук [ʃ] в кириллице обозначется буквой ш, в некоторых случаях щ. Щ — упрощенная запись для удвоенного звука [ʃʃ], поэтому нет смысла для него выделять отдельный знак латиницы.

Существующие альтернативы из блока А расширенной латиницы:

  • Ś — используется в некоторых славянских языках для обозначения звуков [ɕ] и [ʃ].
  • Ŝ — используется в эсперанто для обозначения звуков [ʃ] и [ʂ].
  • Ş — используется во многих языках для обозначения звука [ʃ].
  • Š — используется в некоторых европейских языках — чешский, латышский, литовский, эстонский — для обозначения звука [ʃ].

Дальше блока А смотреть варианты нет смысла, покрытие символами в шрифтах невелико. Все варианты с диакритикой. А что если взять другой символ?

C — звук [ʦ] в исконно казахских словах отсутствует, его этой буквой обозначать не потребуется. Все, берем для звука [ʃ], как когда-то это было в Яналифе.

[ʒ] и [j] в кириллице соответствуют буквам ж и й.

Варианты для [ʒ] из блока А расширенной латиницы:

  • Ź — используется в польском для обозначения звука [ʑ].
  • Ż — используется в мальтийском и польском алфавитах, обозначает звук [ʐ]
  • Ž — используется в славянских языках для обозначения звука [ʒ].

Снова все с диакритикой. Но у нас имеются неиспользованные буквы J и Y из основной латиницы. Используем их для обозначения звуков [j] и [ʒ] соответственно.

Blog post image

Казахская фонетика подчиняется закону сингармонизма, в слове, исключая некоторые заимствования, могут быть только передние либо задние гласные. Звуки [q] и [k], [g] и [ʁ] являются аллофонами, то есть эти фонемы одинаковы, но звуки различаются в зависимости от соседних звуков одного слова. Например, [q] может быть только в слове с гласными заднего ряда, а [k] — с гласными переднего ряда. Так зачем создавать избыточные буквы? Убираем букву Q, аллофоны [q] и [k] будут обозначаться одной буквой K. Теперь не нужно искать букву латиницы для обозначения звука [ʁ], он, как и [g], будет обозначаться буквой G.

Blog post image

Перейдем к гласным.

Blog post image

За этими значками скрываются 9 гласных. Здесь уже удобнее использовать диакритику — классические для передачи парных гласных умляуты.

Blog post image

Готово, мы подобрали латинские буквы для соответствия казахской фонетике.

В современном казахском языке много заимствований, есть арабские, персидские, русские. Многие термины уже сложно представить, используя только классическую казахскую фонетику. Интернациональные термины, топонимы содержат отсутствующие в казахской фонетике звуки. Например, Франция. По стандартам кириллизации казахского языка все подобные слова брались из русского как есть, в той же самой буквенной форме, с чуждыми языку звуками. Обратимся к докириллическим временам.

Blog post image

На приведенном выше изображении указаны названия стран так, как они записывались Яналифом, максимально адаптированно к казахской фонетике.

Германия — Керман, Франция — Пырансы, Италия — Ійталійа, Англия — Ағылшын, Швеция — Шібет, Норвегия — Норбек.

Времена изменились, казахский язык тоже не стоит на месте. Среднестатистический человек, говорящий на казахском, уже давно не испытывает проблем с произнесением звуков [f], [v], [х], [h]. Часть этих звуков появилась вместе с арабскими и персидскими заимоствованиями. Поэтому опционально в алфавит можно добавить буквы для обозначения этих звуков.

  • [f] — f
  • [v] — v
  • [х], [h] — h

Делать две разные буквы для звуков [х], [h] не имеет смысла, в современном казахском языке грань между этими заимствованными звуками стерлась.

Теперь поговорим о правилах транслитерации. Больше всего вопросов может возникнуть с буквами и, у кириллицы. Эти буквы обозначают сразу несколько звуков. И — [ɤj], [ɪj], [i]; У — [w], [ɪw], [ɤw], [ɯw].

В латинице будет достаточно развернуть эти дифтонги, превратив их в одну-две отдельные буквы.

Сиыр — sıyır, ине — iyne, иелік — iyelik, интернет — internet

Ру — ruw, ауа — аwa, құйысу — kuyısıw, күйісу — küyisiw

Из примеров можно сформулировать правила преобразования.

Blog post image

Букву Ц можно преобразовать как в S, так и в Z, в зависимости от происхождения слова. Ц в словах немецкого происхождения превратится в Z: цугцванг — zugzvaŋ. В словах иного происхождения — в S: цифр — sifr.

Буквы Ю, Я преобразуются с учетом того, что они являются дифтонгами. Аю — ayıw, яғни — yagnıy.

Буква Ч превращается в C: чек — cek.

Посмотрим на то, что получилось в итоге. Фрагмент из книги Саина Муратбекова «Жусан иісі».

Blog post image

По-моему, красиво. Нет большого мусора от диакритики, текст выглядит органично. Внешне отличается от латиниц других тюркских языков, что обеспечит его узнаваемость.

Именно этот вариант латиницы разработала команда проекта «Kazak Grammar Nazi» — энтузиастов, которые трудятся над реформированием казахского языка, чтобы сделать его современным и конкурентоспособным.

Blog post image

Их страницы в соцсетях:

Было бы прекрасно, если бы их вариант заметили в институте языкознания им. Байтурсынова, лингвисты которого работают над проектом латиницы. Как стало известно, в настоящее время в институте является приоритетным следующий вариант:

Blog post image

Алфавит довольно похож на тот, что разработали Kazak Grammar Nazi, но содержит существенно больше диакритики и отдельные буквы для қ и ғ. Сравним тексты обоих вариантов (откройте картинку в новой вкладке, чтобы рассмотреть подробнее).

Blog post image

Наглядно, текст слева выглядит чище. Текст справа пестрит птичками диакритики.

В дополнение к алфавиту Kazak Grammar разработан прототип клавиатуры для нового алфавита. Все символы помещаются на основную клавиатуру, поэтому цифровые кнопки остаются нетронутыми. Для оптимизации некоторые кнопки были перемещены, отмечены зеленым. Можно этого и не делать, если нужно максимально сохранить исходную раскладку США.

Blog post image

Примечание: все использованные в статье звуки МФА, данные в квадратных скобках, можно послушать на этой странице: ipachart.com

12