morpher.ru 8 (499) 647 86 54
nowhere@morpher.ru
 
 
Мой морфер

Ответы на часто задаваемые вопросы

1. «Есть ли преобразование в именительный падеж?»

Пока нет, но планируется.

2. «Можно ли использовать Морфер для полнотекстового поиска?»

Зависит от того, что у вас лежит в поисковом индексе. Если леммы, то вам нужна функция лемматизации, которую Морфер на данный момент не реализует. Если словоформы, то да, можно – получать с помощью Морфера все падежно-числовые формы поискового запроса и искать их в индексе.

3. «Почему склоняются не все слова?»

Например:

  1. врач терапевт
  2. клиника уролог
  3. Крит (Греция)

Ответ:

1. «Врач-терапевт» пишется через дефис. Пишите правильно, и склоняться будет правильно.

2. Что касается второго примера (и множества ему подобных), необходимо понимать, что программа предназначена для склонения слов и словосочетаний. Поэтому если вы подаете ей на вход что-то, что не является словом или словосочетанием, то результат скорее всего не совпадет с ожидаемым. Если со словами все ясно, то как понять, является ли данная последовательность слов словосочетанием? Очень просто: попробуйте подставить ее в какое-нибудь предложение:

  • «Я нахожусь в клиника уролог»
  • «Я нахожусь в клинике уролог»
  • «Я нахожусь в клинике урологе»

Как бы вы ни склоняли эти два слова, они не образуют связного словосочетания и поэтому не вписываются в предложение. Программа предназначена для генерации связных текстов, а если на вход подается заведомо несвязный набор слов, то задача решения не имеет.

«Как же быть?» – спросите вы тогда. Все зависит от того, что вы хотите получить. Если вы хотите, чтобы каждое слово склонялось, склоняйте каждое слово отдельно.

3. «Крит (Греция)» можно рассматривать как словосочетание и обычно в контексте уточняющая часть не склоняется:

  • «Отели острова Крит, Греция»
  • «Призеры олимпиады 2011 года из Дубны (Московская область)»
  • «В Салехарде (Ямало-Ненецкий автономный округ) проходит Вторая международная нефтегазовая конференция»

Поэтому несклонение части в скобках не является ошибкой.

4. «Что будет, если дать программе слово в не именительном падеже?»

Как написано в первом абзаце главной страницы http://morpher.ru и в разделе "Ограничения", программа ожидает слово или словосочетание в именительном падеже. На данном этапе это принципипальное ограничение.

Такой подход был выбран сознательно. Дело в том, что русский, как и любой естественный язык, изобилует неоднозначностью. Например, слово Филин можно просклонять тремя различными способами, если рассматривать его как название птицы, фамилию или притяжательное прилагательное от имени Филя. На начальном этапе программа позволяла вводить слова только в именительном падеже единственного числа. Впоследствии по просьбе пользователей была добавлена возможность вводить слова и во множественном числе (но только в именительном падеже), что как минимум утроило количество неоднозначных слов, т.к. есть слова, которые различаются в единственном числе и совпадают во множественном: банки (от банк и банка), белки (от белок и белка), парки (от парк, парок и парка) и т.п. По всем таким словам мне пришлось пройтись и выбрать наиболее вероятный вариант. Причем выбор этот был зачастую нелегкий. Так, древнеримскую богиню Парку можно смело отмести, а вот отдать предпочтение продавцам курток-парок или строителям парков — большой вопрос. Пока остановился на куртках, так как Морфер часто используют для склонения наименований товаров. Еще раз подчеркну: эти случаи нередки, их очень много: гарнитуры (от гарнитур и гарнитура), гранаты (от гранат и граната), математики (от математик и математика), физики (от физик и физика) и т.п. В последних двух случаях и многих им подобных выбор прост: название науки редко употребляется во множественном числе, оставляем ученых. Эта часть той работы, которую я проделал за вас. Это то, что придает ценность Морферу по сравнению с обычным морфанализатором, который просто выдает все возможные варианты, перекладывая выбор на пользователя. Если мой выбор вас не устроит, есть возможность переопределить склонение при помощи пользовательского словаря.

Если позволить вам вводить слова в любом падеже, то неоднозначность еще больше возрастет. Например, если введено Иванова А. А., то это женская фамилия в именительном падеже или мужская в родительном? Если введено "гранату", то это граната или гранат?

Как показывают многочисленные просьбы пользователей, задача эта актуальна и мы ищем путе ее решения. Следите за новостями.


 

Библиотеки

Заметили опечатку? Выделите слово мышкой и нажмите Ctrl-Enter. Система Orphus

© Сергей Слепов, 2003 - 2017. Перепечатка материалов сайта только с разрешения автора.