Lev

Joined: 02 Mar 2005 Posts: 392
|
(Separately) Posted: Tue Aug 28, 2007 22:10 Post subject: Multiarc, конверторы и поиск |
|
|
Сам не знаю почему, мне не нравится поиск с помощью контентных плагинов, архиваторные как-то гораздо привычнее. Вот и захотелось присобачить к данному делу недавно обсуждавшиеся конверторы. В качастве базового архиватора, решил попробовать Multiarc, подопытным конвертором стал pdftotext.exe из TextSearch. К сожалению, я кучу лет не кодил бат файлов и всё перезабывал, мне не удается сделать конкатенацию нового расширения к имени файла, ни в echo, ни в параметрах распаковки (см. закомментированные строки). Единственное, что получается - добавить расширение с пробелом перед точкой, но распаковку я наладить не смог. С временным именем файла "tmp.txt", распаковка и пакетный поиск получаются, но как-то это мне не нравится. Можно было бы сочинить отдельные скрипты-прожки для конкатенации, но мне стало лениво. Может кто-то хорошо разбирается в Dos и укажет мне на мои ошибки, и не надо будет мудрить.
Пример настроек Multiarc-pdf
Code: | [PDF]
ID=25 50 44 46
IDPos=0
Extension=pdf
Description="pdf to text converter"
Archiver=c:\WINCMD\Content_wdx\TextSearch\Conv\PDF\pdftotext.exe
List=command.com /C echo tmp.txt
Format0="nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn"
; мне стало лень набивать кучу букв "n" их может не хватать в случае реализации пожелания с подстановкой имени файла
Extract=%P %A tmp.txt
;ниже мои неудачные попытки приделать новое расширение файлу
;List=command.com /C echo %AW .txt
;Extract=%P %A "%AW .txt" |
Расширение надо будет зарегистрировать в Multiarc на возможность текстового поиска и входа по Ctrl+PgDown как в архив.
Плюсы архиваторного поиска перед контентным, на мой взгляд, в возможности перехода к искомому тексту, "разархивирование" текстовых внутренностей файла при желании и т.п.
Минусы - т.к. в ТС не удачно реализована возможность переключения желаемого плагина разархивирования для конкретного расширения, то плагин для поиска может перебивать собой более нужный для пользователя плагин.
ps Опыты лучше проводить на копиях pdf файлов, иначе можно повредить их содержимое. |
|