alexanderwdark

|
Posted: Mon Jan 26, 2009 20:45 Post subject: |
|
|
Добрый вечер! Прямой "direct" конвертер не обрабатывает файл как полноценный документ и полностью не поддерживает структуру doc файла, он пытается извлечь печатные символы по ряду offset. Обычно текст без форматирования, макросов, объектов и на одном языке извлекается без проблем, но в сложных документах могуть быть проблемы. Думаю , могуть быть проблемы при "быстром сохранении" файла и при любом наличии не-текстовых данных непосредственно рядом с местонахождением текстовых. Решение - изучать детально спецификации doc файлов, смотреть код OpenOffice и улучшать модуль direct преобразования. Если разберетесь - можно и плагин улучшить, это будет большим плюсом.  |
|