Orion9

|
Posted: Thu Jan 30, 2025 18:21 Post subject: |
|
|
CaptainFlint wrote: | А какой должна быть логика? |
Простой и понятной пользователю. Если в readme написано:
Quote: | This content plugin shows information about actual encoding of text files. |
То и при определении кодировки в поле "Type" должно быть "Text", раз уж автор сам избрал такую парадигму.
CaptainFlint wrote: | Ведь тогда с точки зрения UTF-16 90% файлов можно считать текстовыми |
Нельзя, пока алгоритм не определит иначе (вы же прекрасно это понимаете). Но вот именно алгоритма в плагине, похоже, и нету, отсюда все проблемы. Как-то я сразу это упустил, но в readme же написано:
Quote: | - "UTF-16 LE" (detection by signature)
- "UTF-16 BE" (detection by signature) |
Следует понимать, что, никаких определений кодировок, за исключением простого считывания маркера BOM, нет? Мне и в голову такое не могло прийти. Да, похоже, именно так. Добавил в начало mp3-файла FFFE - теперь он определяется как "UTF-16 LE" в поле плагина.
Интересует продвинутый и полноценный детект кодировки, как это делает CudaView или AkelPad. Если автор не планирует больше заниматься плагином, то какие есть альтернативы, кто-нибудь в курсе? |
|