Предназначен для потокового и ручного сканирования документов.
Объем обрабатываемых документов: до большого объема.
Результат работы хранится в форматах: PDF, PDF/A, XML, RTF, DOC, TXT, HTM
Captiva в процессе сканирования документа
Этап сканирования
Программа для сканирования текстов документов предоставляет возможность, как сканировать документы через станции сканирования, так и использовать документы из локальной сети, а также из электронной почты.
Документы могут поступать с разных станций сканирования разными пакетами.
Поддерживается разделение документов в потоке по пустым листам, листам с разделительным штрих-кодом, по фиксированному количеству страниц в документе, по ключевому слову, фразе и другое (в зависимости от указанных инструкций в сканере).
На этапе сканирования можно осуществлять:
- Потоковое сканирование, разделение и сборка документов;
- Ручной импорт файлов в пакет;
- Отложенная передача пакетов для обработки;
- Контроль и своевременная корректировка качества сканирования;
- Обработка и улучшение изображений: поворот, исправление искажений, удаление части изображения, настройка яркости, настройка контрастности и т.д.;
- Аннотирование изображений;
- Автоматическое именование документов и папок: по значению штрих-кода, автоматически;
- Интеграция с информационной системой предприятия.
Программа для сканирования текстов документов позволяет сканировать посредствам интерфейсов TWAIN и ISIS и может работать как в рамках локальной сети, так и удаленно.
Результат выполнения этапа: отсканированный документ в формате PDF, PDF/A и др.
Этап распознавания
На данном этапе предоставляются возможности:
- Поддерживается конвертация изображений из форматов JPG, TIF, BMP, PDA, PDF, DOC,XLS и др.
- Считывание штрих-кодов (одно и двухмерных).
- Поддержание распознавания различных типов текста: OCR, ICR.
- Поддержка алгоритмов шифрования.
- Установка порога качества распознавания изображений.
Результат выполнения этапа: отсканированный документ в формате XML, RTF, DOC, TXT, HTM, PDF, PDF/A и др.
Этап верификации
Этап верификации включает:
- Проверка на неуверенно распознанные символы
- Проверку полученной от сканирования информации на ожидаемые типы данных.
- Проверку полученной от сканирования информации на присутствие значений.
- Редактирование распознанного текста.
- Формирование учетной карточки документа.
- Заполнение атрибутов карточки отсканированного документа
- Автоматически
- Вручную
На этом этапе, в случае обнаружения ошибок при сканировании и всех неточностей, информация помечается специальными маркеровками для дальнейшего исправления на этапе Коррекции.
При неудовлетворительных результатах распознавания, оператор станции верификации может отправить страницу на повторную обработку.
Результат выполнения этапа: отсканированный документ в формате XML, RTF, DOC, TXT, HTM, PDF, PDF/A и др.
Этап коррекции
Оператор обрабатывает информацию, полученную на стадии верификации данных, вносит изменения в результирующую запись вручную.
После корректировки и устранения ошибок, страница будет отправлена на дальнейшую обработку или проэкспортирована
Этап экспорта
Документы экспортируются в нужном формате, отправляются по почте, отправляются в СЭД, публикуются в локальном/ сетевом ресурсе или на корпоративном портале в соответствии с заданными правилами маршрутизации.
Результат выполнения этапа: размещение/отправка итогового документа на требуемом ресурсе.
Средства интеграции с другими приложениями:
- Программный интерфейс веб-сервиса (Web Service API):XML-файлы.
использует SOAP и HTTP;
работа с удалёнными приложениями;
кросс-платформенность;
идеально для предприятий, использующих SOA (сервисно-ориентированную архитектуру).
- ASCII text файлы.
- Экспорт данных через интерфейс ODBC.
- В наличии компоненты для бесшовной интеграции с такими системами как: Documentum, SAP r/3, FileNet, SharePoint, OpenText и др.
Технические требования для программы сканирования:
- ОС: Windows 2003 и выше
- СУБД: Microsoft SQL Server
Более подробную информацию о продукте можно узнать:
EMC DOCUMENTUM – Leverage information to transform your business.
См. похожие статьи по теме:
Описание технологии распознавания текста ABBYY Recognition Server
Описание технологии распознавания текста ABBYY FlexiCapture
loading...