Monday, October 11th, 2010 10:56 pm
Не знает ли кто стандартной проги или плагина к распространенному графпакету, решающему такую задачу - вот перед нами текст на бумаге, сфотканный, а не отсканированный:
etobukvy


Источник света был смещен право-вверх. В реальности, понятно, градиент освещенности будет плавным.

Понятно, в чем тут проблема - в том, что в левом нижнем углу бумага темнее, чем буквы в правом верхнем. На глаз это прекрасно читается, а вот любая попытка, например, поднять контрастность оборачивается крахом (ниже под катом примеры двух таких попыток).

Я слышал, что современные версии Файнридера решают эту задачу перед распознаванием (а предыдущие ломались - требуя, чтобы бумага всюду была светлее чем 50%-серый, а буквы темнее, или наоборот), но как быть, если мне нужно распознать, а просто выровнять хотя бы примерно оттенок серого для бумаги по всей плоскости?

etobukvy1

etobukvy2
Monday, October 11th, 2010 07:15 pm (UTC)
И как, интересно? Я не хочу вручную на сотнях страниц выделять полигональные зоны.

Может, я в нем чего-то не понимаю, но в имеющихся описаниях ничего такого не вижу.
Tuesday, October 12th, 2010 03:38 am (UTC)
Если проблема равномерная, то можно сделать вручную одну страницу и создаать из этого процесса "функцию".
Tuesday, October 12th, 2010 03:40 am (UTC)
В фотошопе, в смысле. Если нужны подробности, будут.
Monday, October 11th, 2010 07:22 pm (UTC)
реальную картинку? можно было бы попробовать программу перевода в битональное изображение, написанную Межировым...

А что делает, кстати, djvu-компрессор под виндовс (он когда-то был в свободном доступе)?
Monday, October 11th, 2010 07:34 pm (UTC)
В фотошопе можно попробовать "Duplicate Layer", к верхнему layerу применить Blur и задать ему Difference blending mode.
Monday, October 11th, 2010 07:48 pm (UTC)
Плюс unsharp mask никто не отменял. Поставить радиус размытия больше размера букв, порядка характерного размера "текстуры" теней.
Thursday, October 21st, 2010 10:13 pm (UTC)
Это может создать артефакты на границах теней, отчего читабельность может пострадать. Мы в свое время делали блюр не усреднением c весами (это то, что делают фотошоповские "Blur *" фильтры), а с медианой по характерному размеру. Тогда оно выравнивается идеально. Не помню, правда, есть ли в ФШ медианный фильтр.
Monday, October 11th, 2010 09:04 pm (UTC)
В гимпе есть тул градиент, вот результат его применения с модой overlay. Ну и там есть сколько-то ручек для настройки. Это не то, что нужно?

Tuesday, October 12th, 2010 05:37 am (UTC)
Ну, эта страница относительно читаемая, но суть проблемы видна и по ней. Есть изрядно хуже читаемых.
Wednesday, October 13th, 2010 10:28 am (UTC)
Серость как-то выравнивается, но хорошо у меня сходу не получилось. К тому же, я не знаю конечных критериев. И, да, это ручная работа.
Monday, October 11th, 2010 09:19 pm (UTC)
белый или черный, отрегулировать ему прозрачность с нужным градиентом в нужном направлении, применить сложение или умножение (если прямоугольник белый или черный) и проштамповать им все кадры?
Или дежавю софт умеет то же сделать полным автоматом?
Monday, October 11th, 2010 09:55 pm (UTC)
ну тогда применить, в корел-дро, инструмент прозрачность к каждому кадру - нужно вручную сдвинуть центр прозрачности в самую засвеченную точку и вручную же уменьшить-увеличить радиус круга, добившись примерно компенсации неравномерного освещения. обвести область экрана для файн-ридера... или, еще хуже, если там нужно высокое разрешение, экспортировать полупрозрачную картинку как картинку с большим числом пикселей... морока. Наверно, есть специальные примочки, которые возьмут папку с фотографиями и превратят в книжку дежавю.
(Anonymous)
Thursday, October 21st, 2010 07:58 pm (UTC)
http://imagepost.ru/?v=250/brodsky1_1.png
http://imagepost.ru/?v=250/brodsky1_2.png
(Anonymous)
Friday, October 22nd, 2010 03:36 am (UTC)
автоматическая обработка пока под вопросом...
вот окошко настроек (понятно, что для разных страничек будет разным :| )
http://imagepost.ru/?v=251/how.png