Skif_off
|
Posted: Fri Apr 29, 2016 03:50 Post subject: Поиск в DOCX (RSID) |
|
|
На Ру-Борде появился вопрос, странно, что не всплыло раньше (или я проглядел). Копипаста, дабы не повторяться и не потерялось:
Quote: | Здравствуйте!
Совета прошу.
Начиная с 8.5 (а может и раньше) ТС научился искать текст в офисных XML (xlsx, docx ...)
Пишу в чистом документе Word слово "Проверка" - ТС находит файл по тексту. Так и должно быть.
Но если в чистом документе написать "Пров1ерка", а затем стерев "1", получить нужное "Проверка", то ТС уже по тексту не найдёт этот документ.
Порылся в xml структуре документа и обнаружил, что в первом и втором случае запись слова выглядит по разному.
Проверка здорового человека:
<w:r><w:t>Проверка</w:t></w:r>
Проверка курильщика:
<w:r><w:t>Пров</w:t></w:r><w:r w:rsidR="00C371CD"><w:t>ерка</w:t></w:r>
Это всё характерно для формата docX (doc, xls, xlsx, ppt, pptx с подобными эксперементами в ТС корректно находится)
Тут конечно даже претензия не к ТС, а больше к Word, но всё же. Насоветуйте как научить искать такие docx по тексту. |
Не сталкивался, но стало любопытно: RSID и с чем его едят. Это вообще реально обойти?
P.S. По-хорошему, стоило бы и на оффоруме отписать, наверное... |
|