Total Commander Forum Index Total Commander
Форум поддержки пользователей Total Commander
Сайты: Все о Total Commander | Totalcmd.net | Ghisler.com | RU.TCKB
 
 RulesRules   SearchSearch   FAQFAQ   MemberlistMemberlist   UsergroupsUsergroups   RegisterRegister 
 ProfileProfile   Log in to check your private messagesLog in to check your private messages   Log inLog in 

Single Post  Topic: PCREsearch как пользоваться? 
Author Message
Monarch-LFV



PostPosted: Mon Mar 07, 2022 13:36    Post subject: Reply with quote

Есть бинарные файлы *.dwg, из которых в принципе можно считать данные о пользователе. Но, данные файлы в кодировке UTF-16 LE (1200).
То есть, если открыть текстовым редактором например в кодировке UTF-8, то будет так:
    < s t r i n g > e v g e n i y . f a m i l y < / s t r i n g >

Причем, пробелы там, это по сути не пробелы "\020", а символы NUL - "\000".
Вопрос, как дать понять плагину, что файл в UTF-16? Чтобы понимал двухбайтовые символы в таком виде:
    <string>evgeniy.family</string>

По идее, должно быть что-то наподобие такого:
Code:
regex10=\<string\>(.*?)\<\/string\>


Пока выхожу из положения так:
Code:
regex10=\<.s.t.r.i.n.g.\>.(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.)
regex10replace=$1$2$3$4$5$6$7$8$9$10$11$12$13$14$15$16$17$18$19$20

Но не очень красиво получается, просто выборка 20 символов.
View user's profile Send private message


Powered by phpBB © 2001, 2005 phpBB Group