Добро пожаловать на Открытый христианский форум JesusChrist.ru. Для того чтобы писать в форуме, Вам необходимо зарегистрироваться и войти на форум через ссылку для входа.
Re: Бета-версия 6.0 программы "Цитата из Библии"
[re: AlekId]
Это не так - нет поддержки BOM-кода для кодировки UTF-8.
А поддержка самого utf-8 есть... не так ли?
Вопрос поднят именно потому, что её нет. Программа воспринимает кодировку 1251 и на экране отображает соотвествующими искаженными символами, которые должны были быть прочитаны как кодировка 65001 и преобразованы в двубайтную UNICODE системными средствами (сама система не поддерживает однобайтного UNICODE, преобразуя её в памяти в двубайтную). В начале файла есть BOM (EF BB BF), неоднозначностей быть не должно и не нужно никаких дополнительных указаний на UTF-8.
Ц. использует BOM для двухбайтового представления юникода, чтобы определить порядок байт. Для однобайтовых кодировок в этом нет нужды.
UTF-8 не является однобайтной кодировкой, у неё многобайтные символы, предаставленные в упакованном виде. Однобайтная кодировка позволяет представить 256 символов только, а эта может представить 24-битный символ (16777216 различных символов одновременно в окне программы).
Ссылку на описание назначения BOM-кода я давал, и UTF-8 предполагает наличие BOM-кода.
Равно как и двубайтная кодировка может быть представлено без него, и программа должна все равно принять эту кодировку, чего нет (вот тут и можно уточнять используемую кодировку с помощью тэгов).
А в самих этих файлах модуля, в html, вы проверили, что есть строчка
<meta http-equiv="content-type" content="text/html; charset=utf-8">
Ставил, как и указание на кодировку UTF-8. Бесполезно. Программа не понимает. Не понимает также, если изымать BOM-код, когда указания на кодировку должны быть действенны.
Поддержка кодировок, насколько я знаю, сделана Дорошем, и сделана неплохо.
Спасибо ему, работает поддержка UNICODE-32 в виде чарсетов 1200 и 1201.