Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Permite establecer un texto base sobre el cual verificar la similaridad del texto para identificar las paginas de los documentos Capturados. El análisis de la similaridad se basa en tres pasos:

  • Partir cada texto en una lista de tokens (tokenizacion de las palabras)

  • Computar la similaridad de tokens usando un algoritmo de distancia

  • Emitir un score entre las dos listas de palabras (la del template y la imágen candidata)

...