SamuelAKim
28/02/11 10:29
# 820655
|
Создание словарей в Unicode для "Цитаты" версии 6.0+
|
| |
При создании словарей с помощью программы DictMaker1.1 для BibleQuote4.5/5 из файла с расширением .htm генерируется одноименный .idx файл. Но вот в чем проблема, при генерировании эта программа не понимает Юникод. таким образом при том что в файле htm содержится <h4>07225</h4> <p><b>ראשׁית</b> <p>рейшит <p><i>рэйшит </i> От слова 07218; начало, начаток, лучшая часть, первый, прежние времена,
программа выдает
07225 ?????? Ёхщ°шЄ Ё¤щ°шЄ ╬Є ёыютр 07218; эрўрыю, эрўрЄюъ, ыєў°р ўрёЄ№, яхЁт√щ, яЁхцэшх тЁхьхэр,
Помогите решить эту проблему. и еще я хочу включить звуковой файл произношения для каждого слова. Как это сделать?
|
Тимофей
Христианин
28/02/11 10:39 timh.ru
# 820656
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: SamuelAKim, #820655] |
| |
К словарям в "Библиологии" еще прилагается PHP-скрипт, которым генерировался idx файл. Может быть, с его помощью попробуете? Я еще посмотрю дома.
Вы можете выложить словарь ваш куда-нибудь на narod.yandex.ru для тестирования?
|
ModulMaker
христианин
08/07/11 16:31
# 842877
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: Тимофей, #820656] |
| |
У меня та же проблема. Хочу сделать словарь Дворецкого для Цитаты. Html в utf-16 создал, разметку довел до ума. А сгенерировать idx нечем. Уже пробовал этим PHP-скриптом. Специально поставил Denwer, JDK и NetBeans. Если файл в ANSI - все как по маслу, но с UTF-16 не работает.
Вот он этот скрипт:
<? $lines = file("brockhaus.htm"); $count = count($lines); $fp = fopen("brockhaus.idx", "w"); fputs($fp, "Библейский словарь Брокгауза\r\n"); $offset = 0; for($i=0;$i<$count;$i++) { if(substr($lines[$i],0,4)=='<h4>') fputs($fp, strip_tags(trim($lines[$i]))."\r\n".$offset."\r\n"); $offset += strlen($lines[$i]); } fclose($fp); ?>
Вот ссылка на словарь для тестирования. Цифры в idx расставлены наугад с помощью Exel.
Люди! Подскажите, что делать?! Исправлено пользователем ModulMaker 08/07/11 17:36.
|
Тимофей
Христианин
08/07/11 16:41 timh.ru
# 842881
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: ModulMaker, #842877] |
| |
Надо скрипт пересохранить в UTF-8 (16) тоже. Ну и названия файлов тоже поменять.
|
ModulMaker
христианин
08/07/11 18:11
# 842893
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: Тимофей, #842881] |
| |
Тимофей!
Я создаю проект в NetBeans IDE изначально в UTF кодировке + в html-части скрипта указываю <meta http-equiv="Content-Type" content="text/html; charset=UTF-16BE">. То есть в папке проекта все файлы в нужной кодировке.
Требуется положить этот же скрипт и в папку локального сервера. Но там он вообще не работает ни в какой кодировке, кроме Ansi. Если в UTF - браузер выдает абракадабру и скрипт не исполняется. Что я делаю не правильно?
p.s. названия само собой поменял. Исправлено пользователем ModulMaker 08/07/11 19:14.
|
Тимофей
Христианин
08/07/11 18:16 timh.ru
# 842895
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: ModulMaker, #842893] |
| |
Лучше консольную версию PHP использовать...
скачай php в ZIP варианте с php.net для Windows и запускай из консоли Windows. Сервер не нужен...
|
ModulMaker
христианин
08/07/11 18:34
# 842896
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: Тимофей, #842895] |
| |
может и лучше, но как ее поставить и что с ней потом делать я не понимаю. И чето гугл никак не помогает в этом.
|
Тимофей
Христианин
08/07/11 18:51 timh.ru
# 842899
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: ModulMaker, #842896] |
| |
Обычно я распаковываю архив в C:\PHP а внутри папки Windows делаю файл php.bat
@echo off c:\php\php.exe %1 %2 %3 %4 %5 %6
Потом в консоли (Start / Run / cmd.exe) просто набираю php indexer.php - если это скрипт indexer.php
|
ModulMaker
христианин
08/07/11 19:03
# 842901
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: Тимофей, #842899] |
| |
ок, а где должен лежать indexer.php? Как он его находит?
|
ModulMaker
христианин
08/07/11 19:31
# 842908
|
Re: Создание словарей в Unicode для "Цитаты" версии 6.0+
[re: Тимофей, #842899] |
| |
скачал зип php разархивировал, как написано выше создал файл php.bat перезагрузился win+r - вызываю командную строку пишу в ней php путь к файлу мелькает черный экран консоли с кучей текста и исчезает с файлами ничего не происходит.
|