morpher.ru +7 (925) 336 9960
nowhere@morpher.ru
 
 
Мой Морфер

«Машинная» орфография

Для целей машинной обработки текстов представляется удобной система записи, более точно отвечающая фонологическому принципу «одна буква = одна фонема». Соответственно этому принципу, в ней должны быть различные буквы для парных по твёрдости-мягкости согласных фонем. Таким образом устраняется необходимость в буквах Ё Ю Я Э Ь Ы Ъ, служащих для обозначения твёрдости/мягкости предшествующей согласной и для передачи фонемы <й>. Фонема <й> в новой системе во всех случаях передаётся буквой Й.

С потерей названных букв возникает необходимость в новом способе обозначения твёрдости/мягкости согласных. Использование для этой цели апострофа несколько нарушило бы впечатление того, что «одна буква = одной фонеме»: апостроф воспринимался бы как замена мягкому знаку, что неверно.

В конце концов, для мягких фонем было решено использовать подчёркивание. И выглядит вполне приемлемо, и суть передаёт верно. Вот примеры записи некоторых слов:

дорога = дорога
войско = войско
кон = кон
кон = конь
лук = лук
лук = люк
бил = бил
бил = был
стрема = стремя
свадба = свадьба
вейер = веер
майак = маяк
вйуга = вьюга
подйезд = подъезд
йуг = юг
йолка = ёлка
йакор = якорь
фоййе = фойе
маййа = майя
шажок = шажок
чаща = чаща
щолоч = щёлочь

Так же, как и в обычной орфографии, мягкость согласных, за которыми следуют другие согласные, не обозначается: ровесник, банщик. Исключения составляют р, л и согласные перед суффиксом -б(а): балний, Уралский, серга, косба, молотба, судба.  А также н в словах ийунский и денской.

 

Близость этой системы записи к фонетическому строю русского языка способствует тому, что многие части слов (корни, суффиксы, приставки и окончания) более последовательно сохраняют свой вид при склонении / спряжении / словообразовании:

  • Не «съедается» буква Й: стойат - стойу - стойка, стайа - стай - стайка.
  • Буква И не превращается в Ы после приставок: искат - поиск - розиск.
  • Суффиксы и окончания, начинающиеся на А/Я, У/Ю, И/Ы, имеют только один вариант записи, а те, что на О/Е/Ё, – два: домами - берегами - йакорами, краснайа - синайа, гуси - кури - овци - волки - миши - овощи, котонок - галчонок - мишонок (мышонок), целоват - клеват - заклованний.

О беглости гласных. Утверждения типа «в паре койка – коек Е чередуется с Й» или, того пуще, «в тюрьма – тюрем Е чередуется с Ь» не имеют смысла для фонологии. В новой записи беглые гласные, как им и положено, чередуются с нулём гласной, с её отсутствием: чайка - чайек, сладкий - сладок, лод - лда - леданой, зайац - зайца, достойин - достойна и т.п.

 

«Машинная» орфография ничуть не хуже «человеческой» в том смысле, что преобразование из одного вида записи в другой проходит почти без потерь и в большинстве случаев обратимо. Однако, некоторые потери (не затрагивающие, впрочем, фонетическую сторону языка) всё же есть, а именно:

  • Исчезает «родовой» («грамматический») Ь, порождая омонимию в таких редких случаях как сеч – сечь, рож – рожь и, возможно, других.
  • Омонимичными становятся формы ожог (сущ.) и ожёг (гл. в прош. вр.) Другие подобные пары мне неизвестны.
  • Единообразие передачи фонемы <й> буквой Й устраняет орфографическую исключительность слов, подобных йод, йог, район, майор и т.п., а также бульон, почтальон и т.п.
  • Невозможно передать «слова» на букву Ы.

Небольшую проблему представляет собой буква И в позиции перед гласной. Если её «сородичи», буквы Е Ё Ю Я, в этой позиции передают фонему <й> (плюс соответствующую гласную), то буква И может передавать йот, а может и нет. Так, в слове строить в сочетании ОИ есть йот (так как стройка), а в слове поиск – нет. Предполагаю, что йот отсутствует в начале корней на и-, а в остальных случаях присутствует.

 

При обратном преобразовании нужно будет решать такие вопросы как:

Резюме. Описанная система записи русских слов удобна для моделирования процессов словоизменения и словообразования (частный пример – морфологический анализ), но порождает некоторые трудности при синтезе. Может быть рекомендована для использования в ИПС и в других программах, где синтез не требуется.



 

Библиотеки

© Сергей Слепов, 2003 - 2024.