VladimirY евангельские христиане
19/06/10 21:15
# 769778
|
Номера Стронга в UTF8
|
| |
На основе работы http://code.google.com/p/open-scriptures/ переработал существующий для русской Библии в "Цитате" лексикон Стронга. Все еврейские и греческие лексемы были заменены на их нормальную запись в Unicode. Но для полноценного завершение работы необходимо провести ещё небольшую часть работы, которую мне без знания иврита и греческого сделать сложно: в словарных статьях лексикона содержатся греческие и еврейские слова, не являющиеся часть лексикона или являющиеся теми же словами, но в другой грамматической форме. Нужна помощь в завершение данной работы. Я бы предоставил номера статей лексикона, а от вас требуется вернуть используемые слова набранные в Unicode. Текущий результат работы могу любому желающему выслать на e-mail. Пишите в личку.
|
Тимофей Христианин
19/06/10 21:20 timh.ru
# 769779
|
|
> Все еврейские и греческие лексемы были заменены на их нормальную запись в Unicode. > Я бы предоставил номера статей лексикона, а от вас требуется вернуть используемые слова набранные в Unicode.
Владимир, я не понял, как именно Вы заменили еврейские и греческие лексемы на Unicode и в то же время пишете, что надо по номерам статей вернуть используемые слова... А что именно было заменено? Можно пример?
|
VladimirY евангельские христиане
19/06/10 21:25
# 769782
|
|
Слова, являющиеся частью нумерации были переведены в Unicode. Но, к примеру, в статье <0> в описании содержится греческое слово употребленное в другой грамматической форме. Вот с ним и подобными у меня и проблемы.
|
VladimirY евангельские христиане
19/06/10 21:27
# 769783
|
|
отправил пример на почту....
|
Тимофей Христианин
19/06/10 21:27 timh.ru
# 769784
|
|
Вы о тех дополнительных словах, которые не являются частью заголовка статьи?
Можно или попробовать сделать некоторый анализ - найти близкие по "латинской" форме слова и побуквенно вычислить правильное слово?
Если все слова по всем статьям собрать, то сколько "нерешенных" слов останется?
P.S: я тоже не знаю языки, но если объем небольшой, могу отправить спецам.
|
VladimirY евангельские христиане
19/06/10 21:38
# 769786
|
|
Можно или попробовать сделать некоторый анализ - найти близкие по "латинской" форме слова и побуквенно вычислить правильное слово? Написание слова можно найти в самой Цитате, открыв соответствующую статью. Если все слова по всем статьям собрать, то сколько "нерешенных" слов останется? Я думаю, что не более 30 слов. Список подготовлю.
|
VladimirY евангельские христиане
19/06/10 22:08
# 769794
|
|
К сожалению, слов намного больше. Выслал письмо со списком слов
|
VladimirY евангельские христиане
21/06/10 00:17
# 769975
|
Re: Номера Стронга в UTF8
[re: ВСЕМ, #769778] |
| |
Итак. Получается, что есть 367 проблемных слов. Из них 340 можно набрать просто добавив греческую раскладку и включив экранную клавиатуру. Есть желающие поучаствовать? Может даже кто-то возьмет на себя часть работы? Файл содержащий список проблемных слов и номер статьи, в котором оно используется готов предоставить.
P.S.: Зачем всё это надо? Цитата 6 переходит на Unicode. Данный материал планирую использовать, чтобы подготовить обновленные файлы с номерами Стронга для русской Библии в Цитате, которые бы не требовали установки дополнительных специализированных шрифтов в системе. Это позволит копировать из окна лексикона текст в любой редактор (да, и не только) без потери греческих и еврейских слов.
|
SamuelAKim
26/08/11 20:39
# 850370
|
|
Если все слова по всем статьям собрать, то сколько "нерешенных" слов останется? И сколько же их осталось?
|
SamuelAKim
26/08/11 20:41
# 850371
|
|
Данный материал планирую использовать, чтобы подготовить обновленные файлы с номерами Стронга для русской Библии в Цитате, которые бы не требовали установки дополнительных специализированных шрифтов в системе. Это позволит копировать из окна лексикона текст в любой редактор (да, и не только) без потери греческих и еврейских слов. Хвала Небесам! Бог позволил сделать это.
|