Форумы у Лирика

Список форумов Форумы у Лирика
 АльбомАльбом   FAQFAQ   ПоискПоиск   Правила форумаПравила   Для тех, кто в БАНеСейчас в БАНе 
 РегистрацияРегистрация   ВходВход 
OCR

Эту тему просматривают:зарегистрированных: 0, скрытых: 0 и гостей: 0
Зарегистрированные пользователи: Нет
Начать новую тему   Ответить на тему   вывод темы на печать    Список форумов Форумы у Лирика -> Тех. отдел
Предыдущая тема :: Следующая тема  
Автор Сообщение
jey

цитировать



Зарегистрирован: 08.10.2004
Сообщения: 744
Откуда: Latvia

Сообщение OCR  |    Добавлено: Вс Янв 23, 2005 12:13 pm Ответить с цитатой

Кому приходилось сканировать древнерусские тексты? Есть ли рецепт для распознавания в седьмом ABBYY FineReader ?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Реклама
lirik
[Админ]
цитировать



Зарегистрирован: 19.12.2003
Сообщения: 1102
Откуда: Москва

Сообщение  |    Добавлено: Вс Янв 23, 2005 5:43 pm Ответить с цитатой

Его можно обучить, правда у меня не особо получается. Запускаете Распознавание с обучением, и на каждый ему непонятный символ указываете, что подставлять. Довольно долго, потому что в начале придется "переводить" Файнридеру все буквы.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
jey

цитировать



Зарегистрирован: 08.10.2004
Сообщения: 744
Откуда: Latvia

Сообщение  |    Добавлено: Вс Янв 23, 2005 5:47 pm Ответить с цитатой

А подставлять-то что? Где юсы взять, тиццкая сила?
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
lirik
[Админ]
цитировать



Зарегистрирован: 19.12.2003
Сообщения: 1102
Откуда: Москва

Сообщение  |    Добавлено: Вс Янв 23, 2005 6:00 pm Ответить с цитатой

только нечто похожее из символьных шрифтов.
Или, как вариант, подставлять какой-л. символ, а потом его заменить ра рисунок юса. Но, имхо, это - фигня. Проще заменять на современные буквы.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
Север

цитировать



Зарегистрирован: 19.10.2004
Сообщения: 3653

Сообщение  |    Добавлено: Вс Янв 23, 2005 10:51 pm Ответить с цитатой

оно называется то ли королевская TIMES, то ли царская, весь до революционный алфавит. Когда то очень давно где то скачивал.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
lirik
[Админ]
цитировать



Зарегистрирован: 19.12.2003
Сообщения: 1102
Откуда: Москва

Сообщение  |    Добавлено: Пн Янв 24, 2005 12:14 am Ответить с цитатой

Ну, в принципе, да - найти можно.
Вот , например - http://www.slovo.info/kirill.htm
Выглядит так - http://www.slovo.info/kaweb.htm
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
jey

цитировать



Зарегистрирован: 08.10.2004
Сообщения: 744
Откуда: Latvia

Сообщение  |    Добавлено: Пн Янв 24, 2005 12:23 am Ответить с цитатой

Спасибо, попробую - мабуть и получится. А мабуть и не получится Rolling Eyes
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
jey

цитировать



Зарегистрирован: 08.10.2004
Сообщения: 744
Откуда: Latvia

Сообщение  |    Добавлено: Пн Янв 24, 2005 12:41 am Ответить с цитатой

Не у всех получается, есть и графические фахты, показывающие это

Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
lirik
[Админ]
цитировать



Зарегистрирован: 19.12.2003
Сообщения: 1102
Откуда: Москва

Сообщение  |    Добавлено: Пн Янв 24, 2005 1:21 am Ответить с цитатой

jey писал(а):
графические фахты

Вот иманна! Вот иманна!
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Отправить e-mail Посетить сайт автора
shuherr

цитировать



Зарегистрирован: 19.01.2005
Сообщения: 31

Сообщение  |    Добавлено: Пн Янв 24, 2005 1:44 am Ответить с цитатой

НА сайте ABBY лежат дополнительные модули. В их состав входит старославянский модуль.

Я натравливаливал этим модулем Файнридер7 на Морозвскую пдф - распознавалось до 80 процентов букв. В кaчестве шрифта выбирал Lucide Unicode.

Думаю если бы скан был более качественный результат был бы много лучше.

Правда у Морозова только ять вроде. Совсем старославянский - люди делятся успешным опытом и с помощью модуля и с помощью обучающего метода. Со шрифтами да, поспрашивать надо - старославянских куча везде валяется, какие правильно сделано - надо понять.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
jey

цитировать



Зарегистрирован: 08.10.2004
Сообщения: 744
Откуда: Latvia

Сообщение  |    Добавлено: Пн Фев 21, 2005 5:42 pm Ответить с цитатой

Ерунда , однако, получается. Rolling Eyes Учил этот ФайнРидер, учил - а он бестолковый какой-то ( или я бестолковый Rolling Eyes ). Даже если научил и сделал эталон, то распознавание трехязычных страниц , включая старославянский, превращается в муку. Либо стандартные языки распознаются нормально, либо обученный, а остальное крякозябрами выходит. Потому как при обучении приходится подставлять соотвествующие буквы из кирилицы или латиницы и после распознавания менять шрифт на старославянский. Но процент брака выходит ужасающий и проще набирать старославянские вставки в тексте вручную, что не есть хорошо. Вот если б была старославянская раскладка для клавиатуры, чтоб при обучении подставлять не заменители из стандартных раскладок, а нормальные старославянские буквы - тогда другое дело. Остается надеятся, что какой-нибудь умелец сие збацает и будет щастие.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему   вывод темы на печать    Список форумов Форумы у Лирика -> Тех. отдел Часовой пояс: GMT + 3
Страница 1 из 1

 
Имя
Сообщение

 
Перейти:  
Вы можете начинать темы
Вы можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
liveinternet.ru: показано количество просмотров и посетителей
Реклама:
-