Monarch-LFV
|
Posted: Mon Mar 07, 2022 13:36 Post subject: |
|
|
Есть бинарные файлы *.dwg, из которых в принципе можно считать данные о пользователе. Но, данные файлы в кодировке UTF-16 LE (1200).
То есть, если открыть текстовым редактором например в кодировке UTF-8, то будет так:
< s t r i n g > e v g e n i y . f a m i l y < / s t r i n g >
Причем, пробелы там, это по сути не пробелы "\020", а символы NUL - "\000".
Вопрос, как дать понять плагину, что файл в UTF-16? Чтобы понимал двухбайтовые символы в таком виде:
<string>evgeniy.family</string>
По идее, должно быть что-то наподобие такого:
Code: | regex10=\<string\>(.*?)\<\/string\> |
Пока выхожу из положения так:
Code: | regex10=\<.s.t.r.i.n.g.\>.(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.).(.)
regex10replace=$1$2$3$4$5$6$7$8$9$10$11$12$13$14$15$16$17$18$19$20 |
Но не очень красиво получается, просто выборка 20 символов. |
|