Visión de Alto Nivel - INAOE - P
Transcript of Visión de Alto Nivel - INAOE - P
![Page 1: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/1.jpg)
1
Visión de Alto NivelVisión de Alto NivelDr. Luis Enrique Sucar
INAOE
[email protected]/~esucar
Dr. Luis Enrique Sucar
INAOE
[email protected]/~esucar
Sesión 1Introducción
Sesión 1Introducción
![Page 2: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/2.jpg)
2
IntroducciónIntroducción
![Page 3: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/3.jpg)
3
¿Qué es Visión?¿Qué es Visión?• “Visión es saber que hay y donde mediante
la vista” (Aristóteles)• “Visión es recuperar de la información de los
sentidos propiedades válidas del mundo exterior” (Gibson)
• “Visión es un proceso que produce a partir de las imágenes del mundo una descripciónque es útil para el observador y que no tiene información irrelevante” (Marr)
• “Visión es saber que hay y donde mediante la vista” (Aristóteles)
• “Visión es recuperar de la información de los sentidos propiedades válidas del mundo exterior” (Gibson)
• “Visión es un proceso que produce a partir de las imágenes del mundo una descripciónque es útil para el observador y que no tiene información irrelevante” (Marr)
![Page 4: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/4.jpg)
4
Procesamiento de ImágenesProcesamiento de Imágenes
• Remover defectos,• Remover problemas por movimiento o desenfoque,• Mejorar ciertas propiedades como color, contraste,
estructura, etc.• Agregar “colores falsos” a imágenes monocromáticas
• Remover defectos,• Remover problemas por movimiento o desenfoque,• Mejorar ciertas propiedades como color, contraste,
estructura, etc.• Agregar “colores falsos” a imágenes monocromáticas
IMAGENPROCESAMIENTOIMAGEN
![Page 5: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/5.jpg)
5
Ejemplo procesamientoEjemplo procesamiento
![Page 6: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/6.jpg)
6
Visión ComputacionalVisión Computacional
IMAGEN VISIÒNDESCRIPCIÒN
• Determinar la identidad y localización de objetos en una imagen,
• Construir una representación tridimensional de un objeto.
• Determinar la identidad y localización de objetos en una imagen,
• Construir una representación tridimensional de un objeto.
![Page 7: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/7.jpg)
7
Visión ComputacionalVisión Computacional
IMAGEN VISIÒNDESCRIPCIÒN
• Analizar un objeto para determinar su calidad,• Descomponer una imagen u objeto en diferentes
partes.
• Analizar un objeto para determinar su calidad,• Descomponer una imagen u objeto en diferentes
partes.
![Page 8: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/8.jpg)
8
Ejemplo visiónEjemplo visión
![Page 9: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/9.jpg)
9
AplicacionesAplicaciones
• Robótica móvil y vehículos autónomos• Manufactura• Interpretación de imágenes aéreas• Análisis de imágenes médicas• Interpretación de escritura y dibujos• Reconocimiento de personas, gestos y
actividades• Juegos
• Robótica móvil y vehículos autónomos• Manufactura• Interpretación de imágenes aéreas• Análisis de imágenes médicas• Interpretación de escritura y dibujos• Reconocimiento de personas, gestos y
actividades• Juegos
![Page 10: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/10.jpg)
10
AplicacionesAplicaciones
• Análisis de imágenes de microscopios y telescopios
• Compresión de imágenes para transmisión y almacenamiento
• Interfaces humano-computadora• Seguridad• Aplicaciones militares
• Análisis de imágenes de microscopios y telescopios
• Compresión de imágenes para transmisión y almacenamiento
• Interfaces humano-computadora• Seguridad• Aplicaciones militares
![Page 11: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/11.jpg)
11
Ejemplos de aplicacionesEjemplos de aplicaciones
![Page 12: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/12.jpg)
12
Vehículos autónomosVehículos autónomos
![Page 13: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/13.jpg)
13
Colores falsos (ultrasonido)Colores falsos (ultrasonido)
![Page 14: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/14.jpg)
14
Aplicaciones médicasAplicaciones médicas
![Page 15: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/15.jpg)
15
Reconocimiento de gestosReconocimiento de gestos
![Page 16: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/16.jpg)
16
Robótica móvilRobótica móvil
![Page 17: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/17.jpg)
17
Seguimiento y JuegosSeguimiento y Juegos
![Page 18: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/18.jpg)
18
RepresentaciónRepresentación
F
X
Y
Monocromática:I=f(x,y)
Monocromática:I=f(x,y)
Color:f(x,y)=[f_{rojo}(x,y),f_{azul}(x,y),f_{verde}(x,y)]
Color:f(x,y)=[f_{rojo}(x,y),f_{azul}(x,y),f_{verde}(x,y)]
![Page 19: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/19.jpg)
19
Proyección PerspectivaProyección Perspectiva
Por triángulos semejantes: y/f = Y/(F - Z)Por lo que: y=fY / (F - Z)En forma análoga: x=fX / (F - Z)
Por triángulos semejantes: y/f = Y/(F - Z)Por lo que: y=fY / (F - Z)En forma análoga: x=fX / (F - Z)
Z
y,Y
f
Lens
(X,Y,Z)
(x,y)
![Page 20: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/20.jpg)
20
ReflectanciaReflectancia
FpFo
f
ñDA
Luz incidente depende de 3 factores:• Fuente lumínica• Geometría (ángulo)• Propiedades del objeto
Luz incidente depende de 3 factores:• Fuente lumínica• Geometría (ángulo)• Propiedades del objeto
![Page 21: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/21.jpg)
21
ColorColor
Longitud de onda: 400 - 700 nmLongitud de onda: 400 - 700 nm
Percepción del color:Percepción del color:
400 700
AZUL
VERDEROJO
![Page 22: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/22.jpg)
22
Modelos de ColorModelos de ColorModelo RGB:Modelo RGB:
VERDE ROJO
AZUL
BLANCO
![Page 23: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/23.jpg)
23
Modelos de ColorModelos de ColorModelo RGB:Modelo RGB:
![Page 24: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/24.jpg)
24
R
A
V
NEGR O
BLANCO
CÚBICO
Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S
Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S
I
HS
Modelos de ColorModelos de Color
![Page 25: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/25.jpg)
25
Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S
Modelos perceptuales:• Intensidad - I• Croma (hue) - H• Saturación - S
Modelos de ColorModelos de Color
![Page 26: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/26.jpg)
26
Digitalización de imágenesDigitalización de imágenes
2424 38384343 45455656 5959 4646
50504444
![Page 27: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/27.jpg)
27
MuestreoMuestreo
DIM ENSIÓ NFOURIER
Frecuencia de muestreo: > 2 veces mayor frecuencia(teorema de Shannon)
Frecuencia de muestreo: > 2 veces mayor frecuencia(teorema de Shannon)
![Page 28: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/28.jpg)
28
Efectos de Muestreo (resolución)Efectos de Muestreo (resolución)
bbaa
cc dd
![Page 29: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/29.jpg)
29
Dispositivos de capturaDispositivos de captura
• Cámaras fotográficas,• Cámaras de televisión,• Digitalizadores,• Sensores de rango (laser),• Sensores de ultrasonido,• Rayos X, tomografía,• Resonancia magnética.
• Cámaras fotográficas,• Cámaras de televisión,• Digitalizadores,• Sensores de rango (laser),• Sensores de ultrasonido,• Rayos X, tomografía,• Resonancia magnética.
![Page 30: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/30.jpg)
30
Niveles de análisisNiveles de análisis
• Teoría computacional- ¿Qué?
• Representación y algoritmo- ¿Cómo - concepto?
• Implementación - ¿Cómo - físico?
• Teoría computacional- ¿Qué?
• Representación y algoritmo- ¿Cómo - concepto?
• Implementación - ¿Cómo - físico?
![Page 31: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/31.jpg)
31
Niveles de análisisNiveles de análisis• Procesamiento de nivel bajo• Procesamiento de nivel intermedio• Procesamiento de nivel alto
• Procesamiento de nivel bajo• Procesamiento de nivel intermedio• Procesamiento de nivel alto
óvalo
![Page 32: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/32.jpg)
32
EjemploEjemplo
1. Captura de la imagen2. Mejoramiento de la imagen3. Binarización4. Detección de orillas5. Segmentación6. Extracción de características7. Reconocimiento
1. Captura de la imagen2. Mejoramiento de la imagen3. Binarización4. Detección de orillas5. Segmentación6. Extracción de características7. Reconocimiento
![Page 33: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/33.jpg)
33
Ejemplo: identificación de placasEjemplo: identificación de placas
H
![Page 34: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/34.jpg)
34
Visión de Nivel Bajo y MedioVisión de Nivel Bajo y Medio
orillas
textura
color
3-D
ImagenSegmen-
tada
![Page 35: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/35.jpg)
35
Visión de Nivel AltoVisión de Nivel Alto
orillas
textura
color
3-D
ImagenSegmen-
tadaDescripciónsimbólica
Representacióndel mundo
![Page 36: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/36.jpg)
36
Visión de Alto NivelVisión de Alto Nivel
• Obtiene una interpretación consistente de las características obtenidas en visión de nivel bajo e intermedio
• Se basa en utilizar conocimiento de los objetos del dominio de interés
• En base al conocimiento y las características se realiza el reconocimiento
• Obtiene una interpretación consistente de las características obtenidas en visión de nivel bajo e intermedio
• Se basa en utilizar conocimiento de los objetos del dominio de interés
• En base al conocimiento y las características se realiza el reconocimiento
![Page 37: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/37.jpg)
37
Aspectos básicosAspectos básicos
• Representación - forma de modelar el mundo, en particular los objetos de interés para el sistema
• Reconocimiento - como el modelo y la descripción de la imagen(es) son utilizadas para identificar los objetos
• Representación - forma de modelar el mundo, en particular los objetos de interés para el sistema
• Reconocimiento - como el modelo y la descripción de la imagen(es) son utilizadas para identificar los objetos
![Page 38: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/38.jpg)
38
Extracción de CaracterísticasExtracción de Características
• Basadas en segmentación– Propiedades globales de la región como color,
textura, forma• Basadas en contornos
– Descripción de “forma” basada normalmente en modelos geométricos
• Basada en características locales– Descripción mediante “puntos” distintivos como
esquinas, orillas, Haar, Sift, etc.
• Basadas en segmentación– Propiedades globales de la región como color,
textura, forma• Basadas en contornos
– Descripción de “forma” basada normalmente en modelos geométricos
• Basada en características locales– Descripción mediante “puntos” distintivos como
esquinas, orillas, Haar, Sift, etc.
![Page 39: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/39.jpg)
39
RepresentacionesRepresentaciones
• Propiedades – vector de características• Estructurales – partes y sus relaciones• Geométricas – modelos en 2 o 3 dimensiones
• Propiedades – vector de características• Estructurales – partes y sus relaciones• Geométricas – modelos en 2 o 3 dimensiones
![Page 40: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/40.jpg)
40
ReconocimientoReconocimiento
• Técnicas de reconocimiento de patrones (representaciones vectoriales)– Clasificadores, aprendizaje– Métodos estadísticos– …
• Técnicas basadas en conocimiento (representaciones estructurales)– Sistemas de reglas, redes semánticas, …– Modelos gráficos probabilistas
• Técnicas de reconocimiento de patrones (representaciones vectoriales)– Clasificadores, aprendizaje– Métodos estadísticos– …
• Técnicas basadas en conocimiento (representaciones estructurales)– Sistemas de reglas, redes semánticas, …– Modelos gráficos probabilistas
![Page 41: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/41.jpg)
41
ReconocimientoReconocimiento
• Técnicas de alineamiento (representaciones geométricas)– Transformaciones y apareamiento– Grafos e isomorfismo
• Técnicas de alineamiento (representaciones geométricas)– Transformaciones y apareamiento– Grafos e isomorfismo
![Page 42: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/42.jpg)
42
Ejemplo – reconocer una personaEjemplo – reconocer una persona
• Basado en características - globales• Basado en características - globales
Área, color, forma, …
![Page 43: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/43.jpg)
43
Ejemplo – reconocer una personaEjemplo – reconocer una persona
• Basado en características - locales• Basado en características - locales
[C1], [C2], [C3], …
![Page 44: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/44.jpg)
44
Ejemplo – reconocer una personaEjemplo – reconocer una persona
• Basado en una representación estructural• Basado en una representación estructural
cara
torso brazobrazo
pierna pierna
![Page 45: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/45.jpg)
45
Ejemplo – reconocer una personaEjemplo – reconocer una persona
• Basado en alineamiento - contorno• Basado en alineamiento - contorno
![Page 46: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/46.jpg)
46
Resto del CursoResto del Curso
• Breve repaso de visión de bajo nivel– Orillas, textura, color
• Nivel Intermedio– Segmentación– Características globales– Características locales
• Breve repaso de visión de bajo nivel– Orillas, textura, color
• Nivel Intermedio– Segmentación– Características globales– Características locales
![Page 47: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/47.jpg)
47
Resto del CursoResto del Curso
• Visión de alto nivel– Modelos geométricos– Modelos basados en conocimiento– Modelos bayesianos– Relaciones y gramáticas
• Aplicaciones– Recuperación de imágenes por contenido– Visión robótica
• Visión de alto nivel– Modelos geométricos– Modelos basados en conocimiento– Modelos bayesianos– Relaciones y gramáticas
• Aplicaciones– Recuperación de imágenes por contenido– Visión robótica
![Page 48: Visión de Alto Nivel - INAOE - P](https://reader036.fdocument.pub/reader036/viewer/2022070723/62c522be101792370e455c75/html5/thumbnails/48.jpg)
48
ReferenciasReferencias
• Sucar & Gómez: Cap. 1• Ullman: Cap. 1 y 2• Forsyth & Ponce: Cap. 1
• Sucar & Gómez: Cap. 1• Ullman: Cap. 1 y 2• Forsyth & Ponce: Cap. 1