Это старая версия документа!


Общие замечания к разметке русских диктантов

Сначала размечается орфография, далее, пунктуация. Параллельно идёт добавление допустимых вариантов.

Когда база готовых слов ещё достаточно мала, разметку следует проводить поэтапно (чтобы максимально переиспользовать размеченные ранее слова):

  • сначала производится авторазметка предложения;
  • в предложении последовательно размечаются все слова и заносятся в базу готовых слов;
    • для словарных слов следует создавать общую ошибку;
    • важно помнить, что если какая-то ошибка не размечена, то при её допущении пользователем, она считается опечаткой;
    • для нетривиальных случаев можно пользоваться функцией тестировани разметки, чтобы убедиться в корректности проверки;
  • переход на следующее предложение и так далее, пока все слова не станут готовыми (зелёными).

После того как произведена разметка орфографии, однокоренные слова следует связать между собой.

  • /opt/bitnami/dokuwiki/data/attic/reglament/russian/markup.1643010314.txt.gz
  • Последнее изменение: 2022/01/24 07:45
  • dmitry_kalashnikov