Приложение для упрощения процесса сканирования.
gscan2pdf — небольшое Perl / GTK приложение для упрощения процесса сканирования.
gscan2pdf является графическим интерфейсом (GUI) к нескольким консольным приложениям для санирования документов и последующей обработки отсканированных материалов.
gscan2pdf работает с сканерами используя SANE (интерфейс предоставляющий стандартизированный доступ к устройствам сканирования), имеются все инструменты по созданию и правки многостраничных электронных документов. Для обработки сканированных листов бумаги (книжных страниц) используется unpaper, позволяющий обрезать, повернуть и сделать более "читаемыми", перед выполнением оптического распознавания символов (OCR).
Для распознавания символов gscan2pdf могут использоваться различные движки распознавания текста, "по умолчанию" используется Tesseract (консольное приложение для анализа и распознавания текста), опционально может использоваться Cuneiform (первый промышленный Open Source проект в области оптического распознавания текста), возможен экспорт распознаваемых страниц в формат TIFF (Tagged Image File Format).
gscan2pdf для работы с изображениями и файлами формата PDF (Portable Document Format) используется ImageMagick (набор консольных утилит для обработки изображений), поддержка формата DjVu обеспечивается djvulibre, при необходимости более тщательной обработки изображение (страницу документа) можно открыть в внешнем графическом редакторе (Gimp или др).
Лицензия: GNU General Public License version 2.0 (GPLv2)
Домашняя страница
Страница на sourceforge.net
Автор: posixru
http://zenway.ru/page/gscan2pdf
|