Thuban DocIntro

Aquí encontrarás toda la documentación referente al sistema de DocIntros de Thuban. Vas a poder aprender qué es Thuban DocIntro y cómo funciona. También vas a encontrar pasos para la documentación en las distintas bandejas de trabajo, procesadores y subprocesadores. ¡Y vas a poder ver ejemplos de configuración y casos prácticos!

¿Qué es Thuban DocIntro?

Thuban® DocIntro es una herramienta que permite automatizar el procesamiento, identificación, ordenamiento y almacenamiento de lotes masivos de archivos en diversos formatos.

Es una aplicación flexible que permite indexar y procesar documentos e información electrónica procedente de diversas fuentes.

Con Thuban® DocIntro es posible parametrizar diversos orígenes de datos (bandejas de procesamiento):

Archivos que se encuentran en directorios de red.
Bandejas de correo electrónico.
Archivos que se encuentran en otros repositorios de imágenes.
Información en base de datos (externas o no).

Además, debido a su arquitectura extensible, es posible definir otros orígenes de datos personalizados para satisfacer las necesidades de cada organización.

Dentro de cada origen de datos es posible configurar preprocesadores, procesadores y postprocesadores que realizan, entre otras cosas, envíos de e-mails, validaciones, reconocimiento de códigos de barras, entre otros.

Casos de Uso Típicos

Ingreso masivo de documentos provenientes de:

Escáners (Isla de digitalización)
Servidores de Fax
Direcciones de Correo
Carpetas de Red
Cola de mensajería MQ
Consultas a Bases de Datos

Indexación:

Por detección de códigos de barras.
Por archivos externos que contengan los índices (con la posibilidad de configurar el formato del archivo de índices a utilizar).
Mediante ejecución de Store Procedures o consultas a bases de datos.

Transformación:

Conversión de formatos.
Aplicación de algoritmos de mejora de imágenes.
Eliminación de páginas en blanco.
División/Combinación de múltiples documentos.

Funcionamiento Interno del Docintro

El servicio de DocIntro procesa documentos de manera secuencial: en ningún momento realiza procesamiento en paralelo. Por cada bandeja de trabajo activa, se procesa una cantidad de documentos predefinida, cuando se alcanza ese límite se pasa a la siguiente, y así sucesivamente.

En caso de requerir un procesamiento en paralelo, es posible definir distintos jobs para ejecutar simultáneamente más de una instancia de DocIntro. Para evitar errores inesperados, se recomienda que los distintos jobs no trabajen sobre el mismo set de bandejas.

Una bandeja es la responsable de recuperar el siguiente workitem que se va a procesar. Los workitems son la unidad de trabajo de un DocIntro, cuentan con un único archivo de imagen asociado y un mapa de campos y valores. Los valores de los campos pueden recuperarse posteriormente utilizando distintos preprocesadores de diferentes formas. Por ejemplo, realizando un parseo del nombre del documento, leyendo un código de barra de la imagen asociada, de una base de datos, etc.

Una vez creado el workitem, DocIntro genera un Contexto de Procesamiento que viaja a través de la cadena de procesadores. Además del workitem, el contexto de procesamiento contiene referencias a la bandeja de procesamiento y variables propias del contexto para la comunicación entre procesadores. En caso de que alguno de los procesadores genere un error, se invocan los procesadores asociados a dicha bandeja. Si la cadena de procesadores se ejecuta correctamente, se invoca el evento de finalización OK de la bandeja y se continúa con el siguiente archivo de la bandeja.

Explora más árticulos

Thuban DocIntro

¿Qué es Thuban DocIntro?

Casos de Uso Típicos

Funcionamiento Interno del Docintro

Explora más árticulos

Bandejas de Docintro

Procesadores

Workitem y Marshallers

Related content