Extraccion Automatica de Metadatos con Athento
-
Upload
athento -
Category
Technology
-
view
932 -
download
8
Transcript of Extraccion Automatica de Metadatos con Athento
![Page 1: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/1.jpg)
Extracción de Información con Athento
Enero/2014
![Page 2: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/2.jpg)
Índice!Buenas Prácticas !Método 1: Análisis de Imágenes !Método 2: Expresiones Regulares !Ejemplo práctico !!!
![Page 3: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/3.jpg)
Buenas Prácticas!!!Calidad de la imagen: mínimo 300 DPI (puntos por pulgada !!!!!
![Page 4: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/4.jpg)
Buenas Prácticas!!!Calidad de los documentos (manchas, dobleces, mal escaneo) !!!!!!
![Page 5: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/5.jpg)
Buenas Prácticas!!!Formatos estándares de Imagen PDF, TIFF, PNG24, JPEG etc. !!!!!!
![Page 6: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/6.jpg)
Análisis de los datos
Tenemos que saber que datos son relevantes para el usuario !No solo es relevantes el texto (imágenes, códigos de Barra)
![Page 7: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/7.jpg)
Trabajar con Datos
Obtener datos y aplicarle reglas !Apoyarse en el ciclo de vida de Athento para agilizar el trabajo
![Page 8: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/8.jpg)
Tipos de Datos a Extraer
Tipo de Dato Técnica Método de Extracción
Texto OCR Extracción por Expresiones regulares
Imágen Recorte de Imágenes Localización de los datos
Código de Barras Búsqueda de patrones Autodetección
![Page 9: Extraccion Automatica de Metadatos con Athento](https://reader036.fdocument.pub/reader036/viewer/2022081205/55841208d8b42a34708b48f9/html5/thumbnails/9.jpg)
Why?
There is a better way to do document management”