alexanderwdark

|
Posted: Wed Jan 28, 2009 22:11 Post subject: |
|
|
Nearga wrote: | alexanderwdark wrote: | Возможно, если текст не является unicode. |
я тестирую работу плагина с 100 разных файлов, там и юникод, и анси, и утф...
мне просто нужно написать свою дллку, чтоб только она извлекала текст из дока и сохраняла в тхт... а так как использую ваш плагин, решил сюда отписать об ошибках  |
Тогда попробуйте новую редакцию плагина, здесь имеется эвристический детектор текста в юникод-16, поддерживаются блоки в ANSI формате (например, документы, содержащие только символы из US ASCII набора Word может сохранить именно так - версия плагина для unicode в direct режиме такое не читает. Конечно, детектор - это не чтение флага в заголовке документа или потока, но работает довольно стабильно (на первый взгляд ), т.о. теперь можно читать и ANSI doc документы, и юникод (детектор определяет символы поднабора US ASCII и наборов Cyrillic ) |
|