Configurar Templates de Reconocimiento
La configuración de reconocimiento de imágenes es requerida para poder definir las extracciones de datos, ya que antes de extraer datos en base a la estructura de la imagen es necesario asegurarnos de que se haya identificado correctamente. Cada vez que se importa un documento desde un directorio o se captura mediante un escáner, Captika realizará un reconocimiento de las imágenes utilizando todos los templates que estén activos. Para que un documento sea reconocido, la imagen debe cumplir con todos los criterios seleccionados. Para optimizar el rendimiento de la plataforma, Captika comienza con los controles reconocimiento que demoran menos tiempo (Forma, Peso, Tamaño, Orden de página y Códigos de barra) así descarta más fácilmente las imágenes que no cumplen con alguno de los criterios. El reconocimiento por OCR es el más costoso en términos de procesamiento, por eso razón, se recomienda que se utilice sólo para los casos en que sea realmente necesario.
La configuración de reconocimiento de imágenes es requerida para poder definir las extracciones de datos, ya que antes de extraer datos en base a la estructura de la imagen es necesario asegurarnos de que se haya identificado correctamente. Cada vez que se importa un documento desde un directorio o se captura mediante un escáner, Captika realizará un reconocimiento de las imágenes utilizando todos los templates que estén activos. Para que un documento sea reconocido, la imagen debe cumplir con todos los criterios seleccionados. Para optimizar el rendimiento de la plataforma, Captika comienza con los controles reconocimiento que demoran menos tiempo (Forma, Peso, Tamaño, Orden de página y Códigos de barra) así descarta más fácilmente las imágenes que no cumplen con alguno de los criterios. El reconocimiento por OCR es el más costoso en términos de procesamiento, por eso razón, se recomienda que se utilice sólo para los casos en que sea realmente necesario.
En esta pestaña se configura el % de coincidencia con cada tipo de extracción para que actué este template.
Los pasos mas largos tendrán su pestaña de configuración exclusiva.
Por código de barras
Esta funcionalidad permite identificar una pagina mediante un código de barras. Para utilizar esta característica hay que realizar los siguientes pasos:
1.Configurar en la configuración de Captika un campo de Ambiente (Page/PageTemp) que tenga tildado el codigo de barra que se desea utilizar para capturar el documento
En el pantalla de reconocimiento seleccionar luego este campo del combo de campos Page/PageTemp y luego indicar en el campo "esta en la lista" el o los valores que debe tener para ser identificado de esta forma. Si se quiere usar un único valor de campo solo basta con escribirlo, si se quiere usar varios campos (lista) debe escribir la lista de valores separados por un pipe ( | ).
Por valor campo
Esta funcionalidad permite identificar una pagina mediante los campos configurados. En el pantalla de reconocimiento seleccionar el campo del combo de campos y luego indicar en el campo "esta en la lista" el o los valores que debe tener para ser identificado de esta forma. Si se quiere usar un único valor de campo solo basta con escribirlo, si se quiere usar varios campos (lista) debe escribir la lista de valores separados por un pipe ( | ). El valor (IsNull) permite configurar que se identifique positivamente los documentos/páginas que tengan vacío este campo.
Por orden pagina
Por peso (KB)
Por tamaño
Por reconocimiento de forma
Permite establecer patrones de reconocimiento a través de Scripting con posibilidades prácticamente ilimitadas de configuración.
Permite establecer un texto base sobre el cual verificar la similaridad del texto para identificar las paginas de los documentos Capturados.
Permite establecer tres grupos de bolsas de palabras para cada grupo puede establecerse un valor objetivo que se sumara al porcentaje ante cada acierto
Por ocr/Capa de texto