VladimirY евангельские христиане
19/06/10 21:15
# 769778
|
Номера Стронга в UTF8
|
| |
На основе работы http://code.google.com/p/open-scriptures/ переработал существующий для русской Библии в "Цитате" лексикон Стронга. Все еврейские и греческие лексемы были заменены на их нормальную запись в Unicode. Но для полноценного завершение работы необходимо провести ещё небольшую часть работы, которую мне без знания иврита и греческого сделать сложно: в словарных статьях лексикона содержатся греческие и еврейские слова, не являющиеся часть лексикона или являющиеся теми же словами, но в другой грамматической форме. Нужна помощь в завершение данной работы. Я бы предоставил номера статей лексикона, а от вас требуется вернуть используемые слова набранные в Unicode. Текущий результат работы могу любому желающему выслать на e-mail. Пишите в личку.
|
Тимофей Христианин
19/06/10 21:20 timh.ru
# 769779
|
|
> Все еврейские и греческие лексемы были заменены на их нормальную запись в Unicode. > Я бы предоставил номера статей лексикона, а от вас требуется вернуть используемые слова набранные в Unicode.
Владимир, я не понял, как именно Вы заменили еврейские и греческие лексемы на Unicode и в то же время пишете, что надо по номерам статей вернуть используемые слова... А что именно было заменено? Можно пример?
|
VladimirY евангельские христиане
19/06/10 21:25
# 769782
|
|
Слова, являющиеся частью нумерации были переведены в Unicode. Но, к примеру, в статье <0> в описании содержится греческое слово употребленное в другой грамматической форме. Вот с ним и подобными у меня и проблемы.
|
VladimirY евангельские христиане
19/06/10 21:27
# 769783
|
|
отправил пример на почту....
|
Тимофей Христианин
19/06/10 21:27 timh.ru
# 769784
|
|
Вы о тех дополнительных словах, которые не являются частью заголовка статьи?
Можно или попробовать сделать некоторый анализ - найти близкие по "латинской" форме слова и побуквенно вычислить правильное слово?
Если все слова по всем статьям собрать, то сколько "нерешенных" слов останется?
P.S: я тоже не знаю языки, но если объем небольшой, могу отправить спецам.
|
VladimirY евангельские христиане
19/06/10 21:38
# 769786
|
|
Можно или попробовать сделать некоторый анализ - найти близкие по "латинской" форме слова и побуквенно вычислить правильное слово? Написание слова можно найти в самой Цитате, открыв соответствующую статью. Если все слова по всем статьям собрать, то сколько "нерешенных" слов останется? Я думаю, что не более 30 слов. Список подготовлю.
|
VladimirY евангельские христиане
19/06/10 22:08
# 769794
|
|
К сожалению, слов намного больше. Выслал письмо со списком слов
|
VladimirY евангельские христиане
21/06/10 00:17
# 769975
|
Re: Номера Стронга в UTF8
[re: ВСЕМ, #769778] |
| |
Итак. Получается, что есть 367 проблемных слов. Из них 340 можно набрать просто добавив греческую раскладку и включив экранную клавиатуру. Есть желающие поучаствовать? Может даже кто-то возьмет на себя часть работы? Файл содержащий список проблемных слов и номер статьи, в котором оно используется готов предоставить.
P.S.: Зачем всё это надо? Цитата 6 переходит на Unicode. Данный материал планирую использовать, чтобы подготовить обновленные файлы с номерами Стронга для русской Библии в Цитате, которые бы не требовали установки дополнительных специализированных шрифтов в системе. Это позволит копировать из окна лексикона текст в любой редактор (да, и не только) без потери греческих и еврейских слов.
|
SamuelAKim
26/08/11 20:39
# 850370
|
|
Если все слова по всем статьям собрать, то сколько "нерешенных" слов останется? И сколько же их осталось?
|
SamuelAKim
26/08/11 20:41
# 850371
|
|
Данный материал планирую использовать, чтобы подготовить обновленные файлы с номерами Стронга для русской Библии в Цитате, которые бы не требовали установки дополнительных специализированных шрифтов в системе. Это позволит копировать из окна лексикона текст в любой редактор (да, и не только) без потери греческих и еврейских слов. Хвала Небесам! Бог позволил сделать это.
|
SamuelAKim
26/08/11 20:44
# 850372
|
|
Итак. Получается, что есть 367 проблемных слов. Из них 340 можно набрать просто добавив греческую раскладку и включив экранную клавиатуру. Есть желающие поучаствовать? Может даже кто-то возьмет на себя часть работы? Файл содержащий список проблемных слов и номер статьи, в котором оно используется готов предоставить. Володя, проверь по своему списку, 367 проблемных слов уже не проблемные или что-то еще не работает в новом лексиконе.
|
alex_is
19/09/11 18:27
# 854704
|
|
СпасиБО за юникодную индексацию стронга
когда планируется сделать такое же под иврит?
и когда дополнятся поля
В (KJV / AV) переводе короля Якова: В (NASB) Новой Американской Стандартной Библии: В (Vine's) словаре Вайна:
Еще вопрос - не хотите ли прицепить еще туда же инфу из Словаря Дворецкого?
Про Вейсмана уже молчу...
|
SamuelAKim
19/09/11 18:38
# 854705
|
|
А почему бы и нет, давайте Дворецкого и Вейсмана. Высылайте!
|
alex_is
19/09/11 19:05
# 854712
|
|
Вейсмана в тексте вообще полного нигде нету какая то работа начиналась на http://gurin.tomsknet.ru/alpha.html там же есть и словарь Дворецкого - может быть они поделяться текстом?
для theword.net они разрешили скопировать Дворецкого из их программы http://forum.theword.net/viewtopic.php?f=29&t=3085&sid=91ab5a0fdf6b4ca43c1e697750ed61f3
|
ModulMaker христианин
19/09/11 21:08
# 854738
|
|
Дворецкий для Цитаты уже несколько месяцев есть:) Добро пожаловать в группу Цитаты на фейсбуке.
|
alex_is
19/09/11 21:55
# 854755
|
|
про группу на фейсбуке знаю давно - почти с первого дня ее создания но не пользуюсь фейсбуком - захожу очень редко и не умею искать
|
ModulMaker христианин
19/09/11 23:54
# 854787
|
|
Вот словарь Дворецкого:
модуль-словарь
модуль-книга
А вообще, посмотрите на http://www.bqt.narod.ru/ раздел "словари". Может Вас еще что-то заинтересует. Там, к примеру, есть Morphologia Graeca (на основе базы Perseus).
п.с.
Насчет Вейсмана.
Вот тут уже есть скелет и небольшой кусок словаря.
Если найду единомышленников можно было бы заняться его распознанием из дэжавю. Я уже натаскал более-менее Fine Reader на него. Могу выслать настройки для fine reader и файл для распознавания, если кто захочет помочь в этом деле.
Исправлено пользователем ModulMaker 20/09/11 00:00.
|
alex_is
20/09/11 11:35
# 854867
|
|
Отлично конечно - для тех у кого нет словаря Alfa
Но - интересовала как раз индексация стронга на основе словаря Дворецкого
Насчет Вейсмана - имеет ли смысл заморачиваться с распознаванием его - если уже проделана основная работа силами автора Альфы?
|
ModulMaker христианин
20/09/11 17:38
# 854935
|
|
Шутить изволите?
Зачем нужна индексация по Стронгу и программа Альфа, если база Персеус (Morphologia Graeca в Цитате) выдает словарную форму для любого греческого слова (хоть в модуле НЗ, хоть Гомера, хоть Дидахи), а потом легким движением руки (двойным кликом) по словарной форме открывается статья в Дворецком (а также симфонии Винокурова, греческо-немецком словаре...).
То же самое и в лексиконе Стронга - просто кликните дважды по греческому слову в статье Стронга и увидите статью от Дворецкого. Говорю конечно о последней версии Стронга от Самуила (она в юникоде).
Заморачиваться Вейсманом стоит, ибо не имею желания чужую ломать базу данных. Альфа никогда не была бесплатной программой с открытым форматом словарей.
|
alex_is
21/09/11 13:04
# 855092
|
|
Ооо потрясающе! А я и не знал что такая есть функция в Цитате. СпасиБО.
Конечно ломать не стоит чужие базы - но если есть прецендент разрешения скопировать дворецкого из альфы в theword то возможно можно выпросить разрешение и для вейсмана
Но если вам проще самостоятельно обрабатывать Вейсмана - я не против помочь, но я полный ламер в этом вопросе
Если хотите - высылайте инструкции и материалы мне на мыло kindergod на гмайле
|
alex_is
21/09/11 13:06
# 855093
|
|
Зачем нужна индексация по Стронгу и программа Альфа, если база Персеус (Morphologia Graeca в Цитате) выдает словарную форму для любого греческого слова (хоть в модуле НЗ, хоть Гомера, хоть Дидахи) А в септуагинте у вас такое работает?
|
ModulMaker христианин
21/09/11 16:45
# 855124
|
|
Все прекрасно работает и для Септуагинты и вообще для любого древнегреческого текста в формате юникод и с диактрическими знаками.
Только грузится это чудо долго.
Сейчас доделываю A Greek-English Lexicon of the Septuagint, Revised Edition by Johan Lust, Erik Eynikel, Katrin Hauspie. Если Бог даст, будет в Цитате еще один хороший древнегреческий словарь.
|
alex_is
22/09/11 14:16
# 855284
|
|
Все прекрасно работает и для Септуагинты и вообще для любого древнегреческого текста в формате юникод Аааа. У меня то все модули от 5ой цитаты. А где взять юникодные? Конкретно итересует Септуагинта и греческий НЗ greek_westcott_hort и английский kjv
|
alex_is
22/09/11 14:18
# 855285
|
|
Если найду единомышленников можно было бы заняться его распознанием из дэжавю. Я уже натаскал более-менее Fine Reader на него. Могу выслать настройки для fine reader и файл для распознавания, если кто захочет помочь в этом деле. Так как - нужна помощь в распознавании? очень уж хочется Вейсмана иметь в цитатах и причем не мне одному...
|
ModulMaker христианин
22/09/11 18:33
# 855344
|
|
Тут можно найти все модули в юникоде: http://www.ph4.ru/bsoft_bqmod.ph4
Насчет Вейсмана, да помощь нужна. Соберу все в одну кучу и тогда создам тут на форуме тему для всех желающих поучаствовать.
|
alex_is
02/11/11 12:41
# 865557
|
|
День добрый Со словарем Дворецкого в UTF формате обнаружилась некоторая досадная проблема открываю цитату на вин7 и на хп открываю В 1722 начале 746 было 2258 5713 Слово 3056, и 2532 Слово 3056 было 2258 5713 у 4314 Бога 2316, и 2532 Слово 3056 было 2258 5713 Бог 2316. (RST Иоан.1:1)
открываю индекс стронга
Номер: 3056 Слово: λόγος Транслитерация: logos Произношение: log'-os Часть речи: Корень слова (Этимология): Синонимы: син. 3454 μῦθος, 4487 ῥῆμα, 5456 φωνή; Однокоренные: В (RST) Синодальном переводе: слово, выражение, изречение, дело, речь, рассказ, молва, слух; ;
В (KJV / AV) переводе короля Якова: В (NASB) Новой Американской Стандартной Библии: В (Vine's) словаре Вайна: Греческий лексикон Стронга (с) Bob Jones University
и щелкаю на λόγος
так вот - в вин7 и у меня и у друга выводиться словарная статья Дворецкого именно на это слово
а вот в ХП - любое другое похожее чуть чуть (причем и у меня и у друга разные) но не λόγος
|