Открытый христианский форум JesusChrist.ru

Библия | Книги | Словари | Софт | Аудио, BQT, Евангелизм, JCQ, Молитва

Добро пожаловать на Открытый христианский форум JesusChrist.ru. Для того чтобы писать в форуме, Вам необходимо зарегистрироваться и войти на форум через ссылку для входа.

Общие разделы
   >> "Цитата из Библии"
Просмотров: 28693 Просмотреть ВСЕ ветвиСледующая ветвь*Отображение Ветвями

В теме участвуют: cepreu (11) CONDOR (6) fflatx (6) WarmongeR (5) Dj_Dolphin (4) ModulMaker (4) ValeryZ (4) VladimirY (4) AlekId (2) atapin (2) DavidFoG (2) kalemas (2) Тимофей (1) Янис_Голубев (1)

Страниц в этой нити: 1 | 2 | 3 | 4 | 5 | 6 | (показать все)
cepreu
Баптист
07/05/10 00:40

# 763114

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: atapin, #762535] Help admins  

А адрес скиньте, пожалуйста. Я посмотрю.

atapin
ЕХБ
07/05/10 01:22

# 763118

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: cepreu, #763114] Help admins  

http://bs-catalog.com/

Но пока пользователи не могут использовать функции сохранения модулей на свой локальный компьютер, мы надеемся к концу Мая дать доступ всем пользователям к импорту/экспорту модулей.

И в принципе, если вы предоставите формат файла, который используется в Sword, (я не смотрел его раньше) то я напишу класс сохранения модулей в этом формате.
Вот вам и готовый конвертер.

cepreu
Баптист
07/05/10 14:40

# 763202

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: atapin, #763118] Help admins  

Подробно о формате модулей написано на сайте проекта: http://www.crosswire.org/sword/develop/swordmodule/.
У меня в планах написание конвертера летом (август, июль). Если вы точно решили делать функцию ковертирования на в вашем проекте, скажите мне. Я уже тогда другую тему для курсовой поищу.

DavidFoG
27/03/11 13:38

# 825712

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: cepreu, #763202] Help admins  

Появился ли на свет конвертер для Есворда?

DavidFoG
27/03/11 13:39

# 825715

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: ВСЕМ, #755573] Help admins  

Есть ли у кого то уже готовые модули Есворда на русском кроме РСТ? Буду весьма признателен.

WarmongeR
15/05/11 13:01

# 833233

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: ВСЕМ, #755573] Help admins  

Здравствуйте.
По просьбе одного из участников портала + собственное желание учиться, поглядел скрипт, который выложил Сергей.
В итоге совсем немного его подкорректировал и он стал обрабатывать в разы больше данных. Это конечно меньше желаемого, но я python не знаю.

Скоро у меня экзамены, поэтому далее, до 15 июня, я не могу заниматься изучением и доработкой скрипта.
После 15 числа, если служить не заберут, то продолжу.

Что недоработал(замечено, но не исправлено, руки не дошли):
1) Заголовок osis файла всегда одинаковое (даже не думал в эту сторону)
2) Скрипту не нравится <h2> тег. Точнее сказать, если для разделения глав используется <h2>, то скрипт почти бесполезен. (Сейчас он пропускает 1 главу в книге)
3) Скрипту не нравится <chapter>. Не обрабатывает с ним.
-------------------
4) Скрипт может съедать по 1-3 символа в начале строки. (Исправлял, но не тестил толком)
5) Много /n в скрипте (лишние байты съедает)

Скачать скрипт

Скриптом конвертил в osis, затем утилитой osis2mod с параметром -z конвертил в sword модуль, просматривал в bibletime - работало.

Конструктивная критика, доработки, предложения и тд принимаются.

fflatx
агностик
17/05/11 09:57

# 833635

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: ВСЕМ, #755573] Help admins  

Здравствуйте.
Я использую Linux.
Когда потребовалась программа для чтения библии, естественно, первым вариантом стал sword.
Но, оказалось, что очень мало модулей на русском языке.
Поиск привел на данный форум (и в данную тему), где упоминалась идея конвертации.
"Цитата" привлекла в первую очередь большим количеством ссылок на параллельные места Писания.

Стало интересно решить эту задачу.
Первоначально написал конвертер на скриптовом языке BASH (просто из любопытства - получится или нет).
Получилось, только работает крайне медленно: отдельная книга (один Html-файл) обрабатывается около 4 минут (вроде бы терпимо),
но за три часа обработалось всего 10 книг из 66.

Тогда было решено писать конвертер на компилируемом языке.
Поскольку Си я знаю плохо (только осваиваю), для более быстрого получения результата был выбран Free Pascal.
Так появился конвертер модулей. В данное время это такая довольно сырая бета. Дорабатываю.

В качестве входных данных программа принимает путь к папке с файлом bibleqt.ini, из которого берутся все основные настройки.
Там же должны находиться и html-файлы с текстом. Также можно указать (опционально) путь к папке с файлами параллельных мест (TSK).
На выходе получается два файла: xml-файл в формате OSIS и conf-файл. Проверка (валидация) xml-файла может быть выполнена с помощью утилиты xmllint.
Модуль sword получается с помощью утилиты osis2mod.


Возможности:
1. Обработка библейских текстов.
2. Обработка номеров Стронга (опционально).
3. Обработка ссылок на параллельные места (опционально).

Программа работает значительно быстрее скриптового варианта. 66 книг обрабатывается за полторы минуты.

Разумеется, программа не лишена недостатков. Большинство ограничений связано с возможностями самого Sword'а.
Некоторые другие ограничения (не связанные со Sword'ом) будут устранены в дальнейшем.


Трудности и ограничения:
1. Корректно обрабатываются только канонические книги.
Возможность обрабатывать неканонические книги присутствует, но отключена по умолчанию.
По той простой причине, что sword имеет проблемы с неканоническими книгами.
2. Не тестировал конвертацию обычных текстов (не библейских). Впрочем, данная задача не потребует больших изменений.
3. Пока имеются сложности с пользовательскими тегами, в виду отсутствия четкого стандарта у "Цитаты".
Задачу обработки тегов решаю в данное время.
4. Входные файлы должны быть в кодировке UTF-8. Программа рассчитана прежде всего на линуксоидов, а для них перекодировать сотню файлов трудностей не представляет, я думаю. Посему, перекодировкой не заморачивался. У учетом перехода "Цитаты" на Юникод эта проблема станет не актуальной.
Вообще-то, технически кодировка может быть любой, но sword все равно перекодирует в UTF-8. Поэтому для уменьшения рисков лучше перекодировать заранее.
5. Версификация. Это самая большая проблема. Sword требует версификацию. Если она не указана, по умолчанию используется KJV. Это не всегда подходит. К сожалению, (или к счастью) в "Цитате" версификация отсутствует, как таковая. Или я ошибаюсь? Наличие в bibleqt.ini параметра, отражающего используемую версификацию, упростило бы задачу.
6. Пока не знаю, как будут обрабатываться тексты на языках, отличных от латинницы и кириллицы.
Опять-таки не вижу никаких препятствий, но не проверял.
7. Полученный модуль по разному отражается в разных оболочках sword.
Ссылки на параллельные места порой занимают очень много места (всю страницу), В связи с этим они убраны в теги <note>. Это позволяет не отображать постоянно длинную цепочку ссылок на всю страницу, а показывать ее по щелчку мыши на значке сноски. Данная особенность обрабатывается не всеми оболочками. Например BibleTime не воспринимает тег <note> (по крайней мере, виденная мной версия).
Sword for Windows нормально отражает примечания и ссылки, но не воспринимает нужную версификацию, используя по умолчанию KJV.
Кстати, где-то здесь упоминались проблемы со Sword, когда на странице появляется лишняя строчка (из другой главы). Эта проблема у меня вылезает только в Sword for Windows. При этом другая оболочка совершенно нормально отображает тот же самый модуль. Так что, не последнюю роль в деле качественного отображения текстов играет оболочка.
Лучший результат показывает sword версии 1.6.1 или 1.6.2 (т.к. понимает версификацию по Синоду) с оболочкой xiphos (aka GnomeSword).


Если этот проект вызывает интерес и не смущает длинный список ограничений, то в ближайшие дни выложу исходник.
После того, как допилю обработку тегов, а заодно посмотрю, как будут обрабатываться небиблейские тексты.

CONDOR
Христианин
17/05/11 14:51
condormind.org

# 833692

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: fflatx, #833635] Help admins  

Извините, а где исходники? Есть исходники - есть предмет рассмотрения. Поэтому исходники в студию пожалуйста, а реклама подождёт :)

fflatx
агностик
18/05/11 00:20

# 833808

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: CONDOR, #833692] Help admins  

Поэтому исходники в студию пожалуйста, а реклама подождёт :)

Ну, я вообще-то ничего не продаю. А следовательно - ничего не рекламирую.
Как я уже сказал, исходник выложу, если к нему есть интерес. Судя по Вашему посту - интерес есть.
Посему, вот ссылка. Но предупреждаю: код сырой. Есть там, как минимум, один неотловленный баг. Но если Вам так не терпится, берите, пробуйте.
А вообще, писалось это просто как пилотная версия, "на посмотреть".
В процессе написания добавлялось одно, второе, третье... В результате получилось то, что получилось.
Компилируется как под Windows, так и под Linux.

P.S. Теперь существует постоянная страница, где можно скачать последнюю версию, посмотреть описание и т.д.

Исправлено пользователем fflatx 18/05/11 13:28.


WarmongeR
18/05/11 19:26

# 833947

Re: Конвертер модулей из формата "Цитата из Библии" в формат Sword нов [re: fflatx, #833808] Help admins  

1) Ссылку на скачку поправьте.
2) Комментариев в сорце нет - читать и разбираться с багами никакого нет. Да и через месяц сами не вспомните, что делает каждый блок.


Страниц в этой нити: 1 | 2 | 3 | 4 | 5 | 6 | (показать все)

ОТВЕТИТЬ ВСЕМ   Просмотреть ВСЕ ветвиСледующая ветвь*Отображение Ветвями
Перейти на