Total Commander Forum Index Total Commander
Форум поддержки пользователей Total Commander
Сайты: Все о Total Commander | Totalcmd.net | Ghisler.com | RU.TCKB
 
 RulesRules   SearchSearch   FAQFAQ   MemberlistMemberlist   UsergroupsUsergroups   RegisterRegister 
 ProfileProfile   Log in to check your private messagesLog in to check your private messages   Log inLog in 

Поиск в DOCX (RSID)

 
Post new topic   Reply to topic    Total Commander Forum Index -> Общие вопросы printer-friendly view
View previous topic :: View next topic  
Author Message
Skif_off



Joined: 28 Nov 2012
Posts: 1244

Post (Separately) Posted: Fri Apr 29, 2016 03:50    Post subject: Поиск в DOCX (RSID) Reply with quote

На Ру-Борде появился вопрос, странно, что не всплыло раньше (или я проглядел). Копипаста, дабы не повторяться и не потерялось:
Quote:
Здравствуйте!
Совета прошу.
Начиная с 8.5 (а может и раньше) ТС научился искать текст в офисных XML (xlsx, docx ...)
Пишу в чистом документе Word слово "Проверка" - ТС находит файл по тексту. Так и должно быть.
Но если в чистом документе написать "Пров1ерка", а затем стерев "1", получить нужное "Проверка", то ТС уже по тексту не найдёт этот документ.

Порылся в xml структуре документа и обнаружил, что в первом и втором случае запись слова выглядит по разному.

Проверка здорового человека:
<w:r><w:t>Проверка</w:t></w:r>
Проверка курильщика:
<w:r><w:t>Пров</w:t></w:r><w:r w:rsidR="00C371CD"><w:t>ерка</w:t></w:r>

Это всё характерно для формата docX (doc, xls, xlsx, ppt, pptx с подобными эксперементами в ТС корректно находится)
Тут конечно даже претензия не к ТС, а больше к Word, но всё же. Насоветуйте как научить искать такие docx по тексту.

Не сталкивался, но стало любопытно: RSID и с чем его едят. Это вообще реально обойти?

P.S. По-хорошему, стоило бы и на оффоруме отписать, наверное...
Back to top
View user's profile Send private message
MVV



Joined: 15 Oct 2009
Posts: 4815
Location: Ростов-Дон

Post (Separately) Posted: Fri Apr 29, 2016 11:11    Post subject: Reply with quote

В идеале наверное научить тотал удалять теги из файла с содержимым документа перед поиском...

А эти метки скорее всего для рецензирования - когда оно включено, история правок документа с их авторством сохраняется.
_________________
TCFS2 + TCFS2Tools: Полноэкранный режим и многое другое (обсуждение)
WINCMD.RU: AskParam, CopyTree, NTLinks, Sudo, VirtualPanel…
Back to top
View user's profile Send private message
Skif_off



Joined: 28 Nov 2012
Posts: 1244

Post (Separately) Posted: Fri Apr 29, 2016 13:39    Post subject: Reply with quote

MVV
Неудобно ещё и то, что эта фича с атрибутом по умолчанию включена.
По идее есть ещё TextSearch и PCREsearch (во втором - уже юникодная версия xdoc2txt). Но если не изменяет память, при поиске с wdx-плагинами не используется юникодная строка? Вроде Гислер добавит такое только в 9.х?

Тю, есть ещё fb2 и неаккуратное (автоматическое или ручное) обращение с тегами форматирования <strong></strong> и <emphasis></emphasis>, когда слова тоже разрывает...
Back to top
View user's profile Send private message
Display posts from previous:   
Post new topic   Reply to topic    Total Commander Forum Index -> Общие вопросы All times are GMT + 4 Hours
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum


Powered by phpBB © 2001, 2005 phpBB Group