Общие замечания к разметке русских диктантов

Когда база готовых слов ещё достаточно мала, разметку следует проводить поэтапно (чтобы максимально переиспользовать размеченные ранее слова):

  • сначала производится авторазметка предложения;
  • в предложении последовательно размечаются все слова и заносятся в базу готовых слов;
    • для словарных слов следует создавать общую ошибку;
    • важно помнить, что если какая-то ошибка не размечена, то при её допущении пользователем, она считается опечаткой;
    • для нетривиальных случаев можно пользоваться функцией тестирования разметки, чтобы убедиться в корректности проверки;
  • переход на следующее предложение и так далее, пока все слова не станут готовыми (зелёными).

После того как произведена разметка орфографии, однокоренные слова следует связать между собой, чтобы корректно считалось число ошибок и оценка за диктант.

Разметка пунктуации может проходить независимо от разметки орфографии (но не ровно в то же время). По возможности размечаются все места, где может быть поставлен или не поставлен знак. Если какое-то место осталось неразмеченным, то при постановки или непостановке знака препинания будет выведено сообщение «Лишняя запятая» и «Пропущен знак препинания», соответственно.

Основные цели разметки пунктуации:

  • дать адекватные комментарии (пояснения) для всех возможных случаев ошибок;
  • учесть комбинации постановки нескольких знаков так, чтобы корректно считалось число ошибок (а следовательно, оценка за диктант);
  • предусмотреть все возможные комбинации допустимой постановки знаков.
  • /opt/bitnami/dokuwiki/data/pages/reglament/russian/markup.txt
  • Последнее изменение: 2023/02/22 06:17
  • arina_lukash