/
Reconocer por text similarity

Reconocer por text similarity

Permite establecer un texto base sobre el cual verificar la similaridad del texto para identificar las paginas de los documentos Capturados. El análisis de la similaridad se basa en tres pasos:

  • Partir cada texto en una lista de tokens (tokenizacion de las palabras)

  • Computar la similaridad de tokens usando un algoritmo de distancia

  • Emitir un score entre las dos listas de palabras (la del template y la imágen candidata)

 

Related content