az_mnogogreshny (az_mnogogreshny) wrote,
az_mnogogreshny
az_mnogogreshny

Буква или иероглиф? Что лучше?

Принято считать, что иероглифическое письмо это безумно сложно и совершенно нерационально. А запись фонетического звучания буквами это очень удобно. Может оно так и есть, но меня всегда в таких случаях интересует вопрос: а что бы сказал инопланетянин? Может, это мы просто так привыкли? А на самом  деле, нефига не проще?

Первый аргумент против букв в том, что мы не читаем слово по буквам. Мы запоминаем как оно выглядит. Так же, как китаец запоминает свои иероглифы. Для того, чтобы в этом убедиться попробуйте прочитать русский текст, записанный латинскими буквами (транслит). Вроде, все буквы знакомые, а читать стало как-то мучительно. И скорость чтения упала в разы.

То есть, мы в любом случае имеем дело с иероглифами. И намного ли иероглифы из букв сложнее китайских, которые кодируют не отдельный звук, а слово целиком (точнее, его корень)? Прикинемся снова инопланетянами. У нас есть слово "электричество". На китайском оно выглядит так: 电力. Что проще? Электричество или 电力? Для нас электричество, конечно же. Потому, что мы так привыкли. Но возьмём другие способы фонетического письма. Например, армянское письмо: электричество - էլեկտրականություն. Или грузинское: ელექტროენერგიის.

И какой из иероглифов покажется сложнее инопланетянину? 电力 или էլեկտրականություն?

Второй аргумент в том, что все мы с удовольствием пользуемся иерглифами. Только не подозреваем об этом. Пример иероглифов - цифры. Они тоже передают не фонетическое звучание, а смысл. Вот теперь сравните два способа написания:

569357+89642=658999
Пятьсот шестьдесят девять тысяч триста пятьдесят семь плюс восемьдесят девять тысяч шестьсот сорок два равно шестьсот пятьдесят восемь тысяч девятьсот девяносто девять.


А еще учтите, что цифры для всех одни, а фонетика разная в каждой местности. Китайцы из разных провинций не понимают друг друга. А иероглифы у них общие. Почему бы этот полезный опыт не распространить на всю землю? У каждого народа свой язык, а иероглифами пользуются одними и теми же.

Кроме цифр, иероглифами являются обозначения валют, дорожные знаки, знаки в аэропортах, обозначения химических элементов...


Главный аргумент против иероглифов - сложно их набирать на клавиатуре. Но так ли это на самом деле? Вот ссылка на интересную статью по теме: Китайские иероглифы — это паззлы, собираемые из одних и тех же частей (т.н. графем). Количество этих графем не так уж велико — 208, и их уже можно «запихнуть» в обычную клавиатуру. Правда, получится около 8 графем на одну клавишу, но эта проблема легко решается.

С непривычки это выглядит очень сложно. Но если учитывать, что иероглиф это не буква, а слово, то не факт, что инопланетянину это будет сложнее.

Какие еще преимущества букв? Считается, что они хороши тем, что несут информацию не только об обозначаемом предмете, но и о звучании слова, которым предмет обозначается. А в случае иероглифа нужно отдельно учить написание и звучание. Но так ли это?

Фонетика постоянно меняется. А правила правописания изменяются очень редко или не меняются никогда. Нам еще повезло, что совсем недавно в 1918 году правила русского языка сильно упростили. Примерно, как пишется, так и произносится. Пока.

Другим народам повезло меньше. Например, написание слова autumn вообще мало сообщает информации о том, как оно произносится. То есть, разница с иероглифом тут вообще нет. И там и там отдельно надо заучивать как пишется и как произносится. Проводить реформу правописания каждые 100 лет слишком дорого. Да и для народа большой стресс. Надо снова учиться читать. Ведь, как я уже писал выше, люди не читают по буквам. Они просто запоминают как выглядит слово.

То есть, иероглиф пока выигрывает у буквы с разгромным счётом. Конечно, китайское письмо, в отличие от математики, накопило за века много нелепостей и лишних сложностей. Как любой живой человеческий язык. Но я, например, за 2 минуты могу предложить пример очень простой системы иероглифического письма. Никаких тебе 208 символов и 8 значков на одну клавишу.

Берём всего 36 простых символов (цифра с потолка) и комфортно размещаем их по одному на клавиатуре. А затем, берём частотный словарь. Первые 36 самых часто употребляемых слов кодируем одним символом.

Частота слов в тексте подчиняется закону Ципфа. Берём самое популярное слово. В русском языке это "и" Второе по частоте слово будет в 2 раза реже встречаться. Третье - в 3 раза. В итоге, получаем такой график:


Слова с частотой больше 37 кодируем уже двумя символами. Таких слов будет 1296. Плюс 36. В итоге, одним и двумя символами мы закодировали 1332 слова. А это уже больше 90% слов текста (помним Ципфа).

Остальные слова кодируем тремя символами. Это уже 46 656 слов. А в целом - 59 988.

В академических словарях порядка 300 000 слов. Но большинство из них состоят из нескольких корней (твердолобые, длинношеее, книголюбы, четырёхсотпятидесятисемимиллиметровое, превысокомногорассмотрительствующий, водогрязеторфопарафинолечение). Иероглифами правильнее кодировать отдельные корни. А их в языке не больше 25 тысяч. То есть, трёх символов нам хватит с большим запасом.

Остаются только имена личные. Для них можно и фонетический алфавит оставить. Или закодировать с помощью 4-7 символов.

upd. продолжение темы здесь.
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 12 comments