Открытый христианский форум JesusChrist.ru

Библия | Книги | Словари | Софт | Аудио, BQT, Евангелизм, JCQ, Молитва

Добро пожаловать на Открытый христианский форум JesusChrist.ru. Для того чтобы писать в форуме, Вам необходимо зарегистрироваться и войти на форум через ссылку для входа.

Общие разделы
   >> "Цитата из Библии"
Просмотров: 8683 Просмотреть ВСЕ ветвиСледующая ветвь*Отображение Ветвями

В теме участвуют: ModulMaker (8) Тимофей (5) rigelzion (4) SamuelAKim (3)

Страниц в этой нити: 1 | 2 | (показать все)
Тимофей
Христианин
08/07/11 19:42
timh.ru

# 842910

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: ModulMaker, #842908] Help admins  

Можно в зипе мне исходники словаря прислать?

ModulMaker
христианин
09/07/11 21:56

# 843033

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: Тимофей, #842910] Help admins  

http://narod.yandex.ru/disk/18578223001/Dictionaries.zip

ModulMaker
христианин
20/07/11 00:24

# 844671

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: Тимофей, #842910] Help admins  

Спасибо за помощь, Тимофей!

После долгих мучений,
http://narod.yandex.ru/disk/19533836001/Dvorecky.zip

Возможно найду еще какие-то баги и придется дорабатывать, но в целом работает.

rigelzion
21/07/11 19:51

# 844975

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: ВСЕМ, #820655] Help admins  

Сделал скрипт для создания Индексного файла (ini) модулей Словарей и Стронга.
Работает с ASCII (ANSI X3.4), UTF-8 (на всякий случай, хотя не поддерживается Цитатой) и UTF-16 little endian. Кодировку определяет автоматически по BOMу.
В тексте скрипта только заменить "greek.htm", "greek.idx" и "Греческий лексикон Стронга (с) Bob Jones University\r\n" на необходимые названия.

<?

$lines = file("greek.htm");
$count = count($lines);

$fp = fopen("greek.idx", "w");

fputs($fp, "Греческий лексикон Стронга (с) Bob Jones University\r\n");

$offset = 0;

if(substr($lines[0],0,2)=='яю')

// обработка UTF-16, little endian
{print"Кодировка UTF-16, little endian";
if(substr($lines[0],2,1)=='<' && substr($lines[0],4,1)=='h' && substr($lines[0],6,1)=='4' && substr($lines[0],8,1)=='>')
fputs($fp, strip_tags(trim(substr($lines[0],2)))."\r\n".$offset."\r\n");

for($i=0;$i<$count;$i++)
{
if(substr($lines[$i],1,1)=='<' && substr($lines[$i],3,1)=='h' && substr($lines[$i],5,1)=='4' && substr($lines[$i],7,1)=='>')
fputs($fp, strip_tags(trim($lines[$i]))."\r\n".($offset + 1)."\r\n");

$offset += strlen($lines[$i]);
}
fclose($fp);exit;}

if(substr($lines[0],0,2)=='юя')

// обработка UTF-16, big endian
{print"ERROR - кодировка UTF-16, big endian не поддерживается";fclose($fp);exit;}


if(substr($lines[0],0,3)=='п»ї')

// обработка UTF-8
{ print"Кодировка UTF-8";
if(substr($lines[0],3,4)=='<h4>')
fputs($fp, strip_tags(trim(substr($lines[0],3)))."\r\n".$offset."\r\n");}
else print"Кодировка ASCII (ANSI X3.4)";

// обработка UTF-8 и ASCII
for($i=0;$i<$count;$i++)
{
if(substr($lines[$i],0,4)=='<h4>')
fputs($fp, strip_tags(trim($lines[$i]))."\r\n".$offset."\r\n");

$offset += strlen($lines[$i]);
}


fclose($fp);

?>

ModulMaker
христианин
23/07/11 08:12

# 845193

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: rigelzion, #844975] Help admins  

Спасибо!

SamuelAKim
26/08/11 20:09

# 850377

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: rigelzion, #844975] Help admins  

Сделал скрипт для создания Индексного файла (ini) модулей Словарей и Стронга. Работает с ASCII (ANSI X3.4), UTF-8 (на всякий случай, хотя не поддерживается Цитатой) и UTF-16 little endian. Кодировку определяет автоматически по BOMу. В тексте скрипта только заменить "greek.htm", "greek.idx" и "Греческий лексикон Стронга (с) Bob Jones University\r\n" на необходимые названия.

Отличный ПХПишник, можно ли его исправить, чтобы он еще и словари с заголовками на греческом и еврейском понимал и создавал.
Исправьте, пожалуйста.

rigelzion
31/08/11 21:40

# 851159

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: ВСЕМ, #820655] Help admins  

Удалено rigelzion 2011-08-31 23:15:16


rigelzion
31/08/11 22:14

# 851164

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: ВСЕМ, #820655] Help admins  

Samuel, а поподробнее вопрос можно изложить с примером (можно отправить мне на мыло).

rigelzion
25/09/11 23:30

# 856162

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: ВСЕМ, #820655] Help admins  

Обновил скрипт для создания Индексного файла (ini) модулей Словарей и Стронга - добавлена поддержка заголовков в Юникоде.
Работает с ASCII (ANSI X3.4), UTF-8 (на всякий случай, хотя не поддерживается Цитатой) и UTF-16 little endian. Кодировку определяет автоматически по BOMу.
В тексте скрипта только заменить "greek.htm", "greek.idx" и "Греческий лексикон Стронга (с) Bob Jones University\r\n" на необходимые названия.
<?
$title = "Греческий лексикон Стронга (с) Bob Jones University\r\n";
$lines = file("greek.htm");
$count = count($lines);

$fp = fopen("greek.idx", "w");

$offset = 0;

if(substr($lines[0],0,2)=='яю')

// обработка UTF-16, little endian
{echo"Кодировка UTF-16, little endian";
fwrite($fp,b"\xFF\xFE".$con);
fwrite($fp, iconv("WINDOWS-1251", "UTF-16LE", $title));

// обработка UTF-16, little endian - первая строка
if(substr($lines[0],2,7)=="<".b"\x00".'h'.b"\x00".'4'.b"\x00".'>')
{
$n=10;
while (substr($lines[0],$n,9)<>"<".b"\x00".'/'.b"\x00".'h'.b"\x00".'4'.b"\x00".'>')
{
fwrite($fp,substr ($lines[0],$n,1));
$n++;
}
fwrite($fp, (iconv("UTF-8", "UTF-16LE", "\r\n").iconv("UTF-8", "UTF-16LE", ($offset + 1)).iconv("UTF-8", "UTF-16LE", "\r\n")));
}

// обработка UTF-16, little endian - последующие строки
for($i=0;$i<$count;$i++)
{
if(substr($lines[$i],1,7)=="<".b"\x00".'h'.b"\x00".'4'.b"\x00".'>')
{
$n=9;
while (substr($lines[$i],$n,9)<>"<".b"\x00".'/'.b"\x00".'h'.b"\x00".'4'.b"\x00".'>')
{
fwrite($fp,substr ($lines[$i],$n,1));
$n++;
}
fwrite($fp, (iconv("UTF-8", "UTF-16LE", "\r\n").iconv("UTF-8", "UTF-16LE", ($offset + 1)).iconv("UTF-8", "UTF-16LE", "\r\n")));
}
$offset += strlen($lines[$i]);
}
fclose($fp);exit;}



if(substr($lines[0],0,2)=='юя')

// обработка UTF-16, big endian
{print"ERROR - кодировка UTF-16, big endian не поддерживается";fclose($fp);exit;}


if(substr($lines[0],0,3)=='п»ї')

// обработка UTF-8
{ echo"Кодировка UTF-8";
fwrite($fp,b"\xEF\xBB\xBF".$con);
fwrite($fp, iconv("WINDOWS-1251", "UTF-8", $title));
if(substr($lines[0],3,4)=='<h4>')
fwrite($fp, strip_tags(trim(substr($lines[0],3)))."\r\n".$offset."\r\n");}
else {echo"Кодировка ASCII (ANSI X3.4)";
fwrite($fp, $title);}

// обработка UTF-8 и ASCII
for($i=0;$i<$count;$i++)
{
if(substr($lines[$i],0,4)=='<h4>')
fwrite($fp, strip_tags(trim($lines[$i]))."\r\n".$offset."\r\n");

$offset += strlen($lines[$i]);
}


fclose($fp);

?>

SamuelAKim
26/09/11 08:58

# 856209

Re: Создание словарей в Unicode для "Цитаты" версии 6.0+ нов [re: rigelzion, #856162] Help admins  

Спасибо Срежа,
буду тестировать.


Страниц в этой нити: 1 | 2 | (показать все)

ОТВЕТИТЬ ВСЕМ   Просмотреть ВСЕ ветвиСледующая ветвь*Отображение Ветвями
Перейти на