Приложение для упрощения процесса сканирования.

gscan2pdf — небольшое Perl / GTK приложение для упрощения процесса сканирования.


gscan2pdf является графическим интерфейсом (GUI) к нескольким консольным приложениям для санирования документов и последующей обработки отсканированных материалов.


gscan2pdf работает с сканерами используя SANE (интерфейс предоставляющий стандартизированный доступ к устройствам сканирования), имеются все инструменты по созданию и правки многостраничных электронных документов. Для обработки сканированных листов бумаги (книжных страниц) используется unpaper, позволяющий обрезать, повернуть и сделать более "читаемыми", перед выполнением оптического распознавания символов (OCR).
 


Для распознавания символов gscan2pdf могут использоваться различные движки распознавания текста, "по умолчанию" используется Tesseract (консольное приложение для анализа и распознавания текста), опционально может использоваться Cuneiform (первый промышленный Open Source проект в области оптического распознавания текста), возможен экспорт распознаваемых страниц в формат TIFF (Tagged Image File Format).

 
 

gscan2pdf для работы с изображениями и файлами формата PDF (Portable Document Format) используется ImageMagick (набор консольных утилит для обработки изображений), поддержка формата DjVu обеспечивается djvulibre, при необходимости более тщательной обработки изображение (страницу документа) можно открыть в внешнем графическом редакторе (Gimp или др).

Лицензия: GNU General Public License version 2.0 (GPLv2)

Домашняя страница
Страница на sourceforge.net
Автор: posixru
http://zenway.ru/page/gscan2pdf
|