View previous topic :: View next topic |
Author |
Message |
Serge Yolkin
Joined: 25 Jul 2009 Posts: 664
|
(Separately) Posted: Tue Oct 15, 2013 13:16 Post subject: |
|
|
Alextp
Я думаю, определять кириллицу в ANSI надо уже при наличии 3 нелатинских символов подряд. Резон: HTML, где в первых 2k может быть кириллическим только <title>Главная</title>, например. Меньше 3 - может быть спецсимволом или ещё чем-то подобным. |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Tue Oct 15, 2013 13:19 Post subject: |
|
|
SY
Число 2Кб будет опцией. Так что для html просто задашь 4-5.
Добавлено спустя 38 секунд:
Число 30% тоже будет _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
Serge Yolkin
Joined: 25 Jul 2009 Posts: 664
|
(Separately) Posted: Tue Oct 15, 2013 13:26 Post subject: |
|
|
Alextp
У меня есть несколько файлов, где в хидере скрипты по 10-15k... И ещё будут. И русского текста там, с учётом скриптов, тэгов и CSS и половины не наберётся. Может, и 30% не быть. |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
|
Back to top |
|
|
Serge Yolkin
Joined: 25 Jul 2009 Posts: 664
|
(Separately) Posted: Tue Oct 15, 2013 13:41 Post subject: |
|
|
Alextp
Ну, настаивать не буду - автору виднее, но только что обнаружил у себя такой файл: Quote: | Пример скрипта для {трам-пам-пам} - < 50 символов кириллицы
{Далее - сам скрипт} - > 1000 символов - сплошная латиница
...
{ещё несколько таких же секций} | файл, однозначно, русский... |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Tue Oct 15, 2013 13:57 Post subject: |
|
|
Beta. INI added.
Добавлено спустя 10 минут:
SY,может будет опция "детект по N подряд идущим русиш байтам" _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
Serge Yolkin
Joined: 25 Jul 2009 Posts: 664
|
(Separately) Posted: Tue Oct 15, 2013 14:16 Post subject: |
|
|
Alextp
Спасибо. |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
|
Back to top |
|
|
Avada
Joined: 01 Aug 2008 Posts: 10285 Location: Россия, Саратов
|
(Separately) Posted: Tue Oct 15, 2013 14:52 Post subject: |
|
|
Alextp
С INI-файлом пока не игрался, но в тестовом каталоге русские тексты в ANSI по крайней мере определяются правильно. А с текстовыми файлами в латинице пока никакого прогресса.
Предлагаю не разносить информацию на две колонки и сделать маркировку бинарников тут же, как в CodePage. Часть вопросиков сразу заменится чем-то понятным. _________________ Даже самая богатая фантазия
Не представит себе наши безобразия. |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Tue Oct 15, 2013 15:01 Post subject: |
|
|
>текстовыми файлами в латинице
А что ты предлагал? Не знаю. Что именно надо делать с латиницей? показывать "ANSI Lat" что-ли. ты не говорил
Добавлено спустя 2 минуты:
Колонка2 нужна! хотя бы мне _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
Avada
Joined: 01 Aug 2008 Posts: 10285 Location: Россия, Саратов
|
(Separately) Posted: Tue Oct 15, 2013 15:09 Post subject: |
|
|
Alextp
Я и вопросы показывать не предлагал. А они есть. Разумеется, отображать что-то осмысленное. Пусть ANSI Lat, почему нет?
А если вторая колонка тебе нужна, это вовсе не значит, что в первой для бинарников должны отображаются вопросы, наводящие в первую очередь на мысли то ли о нераспознанных файлах, то ли о продолжающейся обработке списка. Можно бы и там продублировать (как BIN). _________________ Даже самая богатая фантазия
Не представит себе наши безобразия. |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Tue Oct 15, 2013 15:13 Post subject: |
|
|
еще раз. что предлагаем? показывать а) для бинов текст Bin, б)для прочих -- ANSII ?
Добавлено спустя 16 минут:
просьба говорить более четко. "чего хотим".
BEta. _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
Avada
Joined: 01 Aug 2008 Posts: 10285 Location: Россия, Саратов
|
(Separately) Posted: Tue Oct 15, 2013 15:31 Post subject: |
|
|
Alextp
Предлагается для бинарников показывать BIN, для текстовых — их кодировку, а вопросы оставить для нераспознанных. И лучше не ANSI и ASCII, а WIN Rus/Win Lat и DOS. Плюс RTF и юникодные. Если нужна вторая колонка с разделением Text и Binary — нет вопросов, что кому надо, то он и выберет.
Посмотрел бету. Да, это лучше. Но досовский файл File_id.diz отображается как ANSI. _________________ Даже самая богатая фантазия
Не представит себе наши безобразия. |
|
Back to top |
|
|
Alextp
Joined: 06 Feb 2005 Posts: 4957
|
(Separately) Posted: Tue Oct 15, 2013 15:41 Post subject: |
|
|
В Листере именно ANSI/ASCII. не Win/DOS
Добавлено спустя 7 минут:
Нет файла file_id в 8.50Б5. после апдейта. Пришли его _________________ UniViewer - CudaText - LogViewer
|
|
Back to top |
|
|
Avada
Joined: 01 Aug 2008 Posts: 10285 Location: Россия, Саратов
|
(Separately) Posted: Tue Oct 15, 2013 15:48 Post subject: |
|
|
Alextp
В Листере так, во многих других местах — эдак. Но тут я категорически не настаиваю. Пусть хоть ASCII, но чтобы правильно определялось...
А насчёт DOS — дело не в конкретном файле. Берётся файл в ANSI и пересохраняется в DOS-кодировке. Только что на произвольном файле с кириллицей проверял. Плагин его считает ANSI, Листер и всякое другое разное — ASCII. Или файл комментария descript.ion в DOS-кодировке создать... _________________ Даже самая богатая фантазия
Не представит себе наши безобразия. |
|
Back to top |
|
|
|