Rusl8
|
Posted: Tue Feb 19, 2013 05:33 Post subject: |
|
|
Число повторений это интересно бы, это может быть использовано для оценки, является ли ошибка единичной, опечаткой, например, или, если она повторяется, следствием незнания правильного варианта написания слова.
Но это не обязательно, достаточно просто списка слов с ошибками. Из этого уже работать намного проще. Берётся слово с ошибкой и забивается в поиск по второму тексту, с которым нужно сравнивать. Если слово с такой же ошибкой попадается, то уже может говорить это о том, что или в обоих случаях люди одинаково ошибаются или написавший тот же самый человек. Тогда берутся следующие слова... и т.д.
Ну а если есть программы, которые автоматически это все сравнения делают и по разным прочим признакам, то было бы любопытно... |
|