Латинка допомагає китайцям

Як китайцям вдалось запхати 50 000 ієрогліфів у звичайну клавіатуру?

текст: Данило Герасимов

Одна з причин, чому українську латинку вважають неповноцінною, це нібито невідповідність латинських символів українській фонетиці і необхідність введення додаткових символів для коректної передачі звуків нашої мови. Чи дійсно це перешкода для латинізації абетки – питання дискусійне. Але чітке “ні” на нього могли б відповісти китайці, японці та інші народи, які використовують – так, саме латинку! – для друку текстів на комп’ютерах та смартфонах.

Китайська мова – найцікавіша в цьому плані. По-перше тому, що носіїв китайської мови у світі більше, ніж будь-якої іншої – близько 1,3 млрд людей. По-друге тому, що китайська писемність є чи не найскладнішою в порівнянні з іншими ієрогліфічними мовами – вона має понад 50 000 ієрогліфів. У повсякденні з них використовують не більше п’ятої частини, але це не сильно зміеншує складнощі, які виникають при спробі створити ієрогліфічну клавіатуру.

Необхідність швидко та автоматично відтворювати правильні ієрогліфи з’явилась задовго до появи комп’ютерів з клавіатурами. Друк навіть однієї сторінки тексту перетворюється на кропітку працю, коли замість 20-30 символів твоя мова оперує тисячами. Тому ще на початку 20-го століття китайські винахідники намагались створити друкарську машинку, яка б могла коректно відображати ієрогліфи і при цьому мала б ті ж самі розміри, що й звичайний “Ремінгтон”. Найбільш вдалою була спроба Лінь Юйтана, китайського лінгвіста, який побудував таку машинку навколо принципу розкладу ієрогліфів на графеми.

Незважаючи на кількість ієрогліфів, всі вони складаються з однакових елементів, комбінація яких і створює усі різноманіття у писемності. Такі елементи називаються графемами, а існує їх всього 208. Власне, на них і була побудована ця друкарська машинка – натискаючи комбінацію з декількох клавіш, можна було легко обрати необхідний ієрогліф. Маючи 64 клавіші, така машинка могла надрукувати до 90 000 символів, а швидкість друку досягала 50 символів на хвилину.

Цей структурний метод пізніше ліг в основу перших клавіатур. 208 графем були розподілені по клавішах, при цьому заглавним символом клавіші став один з 25 найпоширеніших ієрогліфів. Інші графеми – згруповані за досить складними правилами і додані до існуючих клавіш, послідовне натискання яких дозволяє відтворити необхідний ієрогліф. Цей метод називається “убі цзисін” (wubing zixing), і його величезною перевагою є можливість набору тексту всліпу. Досвідчені користувачі “убі” можуть набирати до 160 символів на хвилину і, на відміну від наших символів, кожен зі 160 може бути окремим словом, а не просто буквою. Головний недолік такого методу – звісно ж, його складність: опановують його переважно ті, хто працює стенографістом.

Для пересічного ж користувача придумано набагато простіший і зрозуміліший метод – фонетичний. Він з’явився лише з появою цифрового друку, оскільки реалізувати його на друкарській машинці просто неможливо. Суть полягає як раз таки у наборі ієрогліфа за його звучанням і подальшим вибором правильного варіанта, адже багато китайських ієрогліфів мають дуже схоже звучання. Ось тут на допомогу й приходить латиниця, яка дозволяє передавати фонетику складних символів на письмі.

Цей метод набору називається “пінь’їнь” – він входить до стандартного набору мов усіх ОС Windows, починаючи з Windows XP. Кожне слово – наприклад, “привіт”, або ж “ni hao” китайською, – набирається латинськими символами, що передають його звучання. Після того, як користувач набирає символи, що передають звучання першого ієрогліфу “ni”, система пропонує перелік усіх варіантів “ni’ у китайській мові. А якщо продовжити і дописати до існуючих символів “hao”, система зрозуміє, що ви пишете слово “привіт” і автоматично відтворить правильні ієрогліфи “ni” та “hao”.

Тим не менше, такий метод – не ідеальний через низьку швидкість набору: якщо “убі цзисін” дозволяє друкувати зі швидкістю до 160 символів на хвилину, ліміт “пінь’їня” – 50. “Пінь’їнь” не вважається стандартним для набору китайської мови, і навіть у Тайвані чи Гонконзі існують альтернативні, хоч і схожі методи набору. Тим не менш, використання сучасних технологій на кшталт того ж машинного навчання дозволяють створити достатньо точний “т9” для китайської мови. Таким чином, можна значно пришвидшити друк “пінь’їнем” – особливо, якщо мова йде про повсякденне листування у месенджерах, де ми використовуємо переважно одні й ті ж самі слова.

А найголовніша перевага “пінь’їня” полягає в тому, що цей метод набору є найзручнішим для іноземців. Вивчити китайські тони та звикнути до звучання мови не так складно, як запам’ятати тисячі унікальних символів – і можливість друкувати свої думки за допомогою фонетичного методу спрощує життя мільйонам тих, хто не є носієм китайської мови від народження. Саме в цьому і полягає користь латинки – можливість зробити мови світу ближчими та більш універсальними.

Add a Comment