AREAS Y PROYECTOS DE INVESTIGACIÓN - ccc.inaoep.mxccc.inaoep.mx/~pgomez/temasTesis.pdf ·...
Transcript of AREAS Y PROYECTOS DE INVESTIGACIÓN - ccc.inaoep.mxccc.inaoep.mx/~pgomez/temasTesis.pdf ·...
Dra. María del Pilar Gómez Gil Coordinación de Computación
Instituto Nacional de Astrofísica, Óptica y Electrónica Oficina 8228
[email protected], [email protected] http://ccc.inaoep.mx/~pgomez
AREAS Y PROYECTOS DE INVESTIGACIÓN 2017-2018
1 (c) P. Gómez, INAOE 2017 [email protected]
Presentación disponible en:
http://ccc.inaoep.mx/~pgomez/temasTesis.pdf
V:2017-10-26
ccc.inaoep.mx/~pgomez
2 (c) P. Gómez, INAOE 2017 [email protected]
Mi participación en investigación Formo parte de: • Laboratorio de Aprendizaje Automático y
Reconocimiento de Patrones (MLPR), • Laboratorio de Procesamiento de Bio-Señales y
Computación Médica • Grupo de procesamiento de señales e Inteligencia
Computacional (PSIC) de las coordinaciones de Electrónica y de Ciencias de la computación
• Grupo de interés en aprendizaje profundo (Deep) • Digital Signal Processing and Vision Lab- Tecnológico de
Chihuahua • Grupo de Instrumentación y Óptica Biomédica (GIOB) de
la coordinación de Óptica
(c) P. Gómez, INAOE 2017 [email protected] 3
Áreas de interés de PGG
• Redes Neuronales Artificiales (RNA) aplicadas en problemas de: – Reconocimiento de patrones – Clasificación estática y temporal – Predicción – Diseño de RNA
• Otras áreas de inteligencia computacional aplicadas a dichos problemas (Lógica Difusa y Algoritmos Evolutivos)
• Análisis de señales digitales
(c) P. Gómez, INAOE 2017 [email protected] 4
Las Redes Neuronales Artificiales
• Son modelos matemáticos capaces de adaptar su comportamiento en respuesta a ejemplos presentados por el medio ambiente de manera supervisada o no supervisada (esto es aprendizaje automático!)
• Están inspiradas en la construcción del cerebro y las neuronas biológicas.
• Una red neuronal artificial es un procesador paralelo y distribuido, hecho de varios procesadores simples, que puede almacenar y utilizar conocimiento adquirido de la experiencia (Haykin 2009).
(c) P. Gómez, INAOE 2017 [email protected] 5
El Contexto de Redes Neuronales (Gómez-Gil,
2009)
(c) P. Gómez, INAOE 2017 [email protected] 6
RNA
Ejemplos (medio
ambiente) conocimiento
Entradas
Salidas
Hay muchos tipos de RNA’s… algunos “típicos”
(c) P. Gómez, INAOE 2017 [email protected] 7
8 (c) P. Gómez, INAOE 2017 [email protected]
Hay muchos tipos de RNA’s… otros mas “interesantes”…
Su topología puede ser bastante sofisticada
(c) P. Gómez-Gil, INAOE 2017 [email protected]
9
(Gómez-Gil et al, 2011) (Gómez-Gil et al, 2011 (b))
Características de mi investigación RETOS AREAS DEL
CONOCIMIENTO AREAS DE APLICACIÓN
Con respecto a DATOS: • ruidosos • clases sobre-puestas • muy pocos • difíciles de caracterizar • se requieren fusionar • etc…
•Clasificación estática •Clasificación temporal •Predicción •Teoría de RNA •Procesamiento digital de señales
•Brain Computer Interfaces • Biométrica • Diagnóstico médico • Economía y Finanzas • Astrofísica • Reconocimiento de escritura •Imágenes médicas
(c) P. Gómez, INAOE 2017 [email protected] 10
Trabajamos con señales no estacionarias
11 (c) P. Gómez, INAOE 2017 [email protected]
0 100 200 300 400 500 600 0.4
0.6
0.8
1
1.2
1.4 Mackey-Glass data for A=0.2, B=0.1, tao=17 h=0.9. 550 points of good2.dat
0 0.5
1 1.5
0 0.5
1 1.5 0.4
0.6
0.8
1
1.2
1.4
Return map of good2.dat
x(i) x(i+ 5)
x(i+
10)
Injection
regions
ATM withdraws (NN5-001) (Crone 2006)
Mackey-Glass time series (Glass 1987)
)()(1
)()(10
tbxtx
tax
dt
tdx
Case K.2
-0.4
-0.2
0
0.2
0.4
0.6
0.8
1
1 90 179 268 357 446 535 624 713 802 891 980 1069 1158 1247 1336 1425 1514 1603 1692 1781 1870 1959 2048
n
expected
prediction
Long-term prediction of an ECG
(Gomez et al., 2011)
Return map of a Mackey-Glass
time series
Adquisición y conversión digital
Pre-procesamiento
Extracción de Características
Reconocimiento
Decisión
“perro”
Pasos de un Clasificador
Gómez-Gil et al., 2017) (c) P. Gómez-Gil, INAOE 2017
¿Desempeño aceptable?
Analizar los datos y el contexto del problema
Fin
Definir/ajustar técnicas de pre-procesamiento
Definir/ajustar técnicas de reconocimiento
Definir/ajustar técnicas de extracción de características
Validar el reconocedor
Inicio
SI NO
Gómez-Gil et al., 2017)
(c) P. Gómez-Gil, INAOE 2017 [email protected]
13
Un punto sobre sobre el plan de estudios
(c) P. Gómez, INAOE 2017 [email protected] 14
PERIODO 1
(OTOÑO)
PERIODO 2
(PRIMAVERA)
PERIODO 3
(VERANO)
PERIODO 4
(OTOÑO)
PERIODO 5
(PRIMAVERA)
PERIODO &
(VERANO)
Matemáticas para
computación
Curso área prioritaria
Curso área escogida
Preparación de tesis
Preparación de tesis
Terminación de tesis
Diseño y
análisis de algoritmos
Curso área prioritaria
Curso área de soporte
Curso básico área 1
Curso otra área
Seminario
Curso básico
área 2
Curso otra área
Seminario de metodología
Seminario
Cursos deseables de cursar para mis proyectos
1. Procesamiento digital de señales 2. Inteligencia Computacional I / Redes Neuronales
Artificiales 3. Inteligencia Computacional II 4. Reconocimiento de patrones 5. Aprendizaje Computacional II 6. Procesamiento de bio-señales
(c) P. Gómez, INAOE 2017 [email protected] 15
Principales Proyectos para tesis este año
1. Análisis y clasificación de señales EEG para el diseño
de interfaces cerebro-computadora (BCI) en tiempo real
2. Análisis y diseño de modelos de predicción de series de tiempo de fenómenos naturales para pronóstico de producción de energía eléctrica
3. Aprendizaje de representaciones sobre imágenes termográficas para diagnóstico temprano de cáncer de mama
(c) P. Gómez, INAOE 2017 [email protected] 16
Proyecto: Análisis y clasificación de señales EEG en
tiempo real con aplicación a interfaces cerebro-computadora.
En colaboración con
Digital Signal Processing and Vision Lab- Tecnológico de Chihuahua y grupo PSIC
17 (c) P. Gómez, INAOE 2017 [email protected]
Interfaz cerebro-computadora
(c) P. Gómez, INAOE 2017 [email protected] 18
No exige ninguna actividad muscular
Permite controlar dispositivos
Actividad cerebral
[Carrera-León 2010]
Existe Software para análisis de ECG…
(c) P. Gómez, INAOE 2017 [email protected] 19 [Ramírez-Cortés et al. 2010]
Blinky: command identifier
20 (c) P. Gómez, INAOE 2017 [email protected]
Signal sensing and pre-
processing Feature
extraction – wavelet
modeling
Classification – neural network
Robot coding for
movement
(Lopez-Espejel, 2015)
http://spectrum.ieee.org/geek-life/hands-on/openbci-control-an-air-shark-with-your-mind
(c) P. Gómez, INAOE 2017 [email protected] 21
Ejemplo: Controlando un globo con la mente (sep. 2015):
• 2015. López-Espejel, Jessica N. “Control de movimiento de objetos a través del uso de electro-encefalogramas y redes neuronales artificiales con equipo de bajo costo. “ Tesis para obtener el título de Licenciada en Ingeniería en Ciencias de la Computación. Benemérita Universidad Autónoma de Puebla- Instituto Nacional de Astrofísica, Óptica y Electrónica, Puebla. México. To be published
• 2013. Morales-Flores E Ramírez-Cortés JM, Gómez-Gil P, Alarcón-Aquino V. "Brain Computer Interface Development Based on Recurrent Neural Networks and ANFIS Systems". Soft Computing Applications in Optimization, Control, and Recognition, Vol. 294, pp. 215-236, Edited by Melin, P and Castillo, O, doi=10.1007/978-3-642-35323-9_9. Springer Berlin Heidelberg.
• 2013. Rosas-Cholula G, Ramirez-Cortes JM, Rangel-Magdaleno J, Gomez-Gil P, Alarcon-Aquino V. “Head movement artifact removal in EEG signals using Empirical Mode Decomposition and Pearson Correlation” The 2013 International Conference on Artificial Intelligence (ICAI 2013). July 22-25, 2013. Las Vegas, Nevada USA
• 2012. Obed Carrera León, Juan Manuel Ramirez Cortés, Vicente Alarcón-Aquino, Mary Baker, David D´Croz-Baron, Pilar Gomez-Gil, “A Motor Imagery BCI Experiment using Wavelet Analysis and Spatial Patterns Feature Extraction”, 2012 IEEE Workshop on Engineering Applications, Bogotá, Colombia, May 2-4, 2012.
Publicaciones escogidas - BCI
22 (c) P. Gómez, INAOE 2017 [email protected]
Algunos retos en este proyecto
• La identificación de los eventos no puede realizarse
simplemente analizando la señal en el tiempo • Hay muchos trabajos actualmente sobre el tema,
pero sus resultados no son tan buenos como se desea
• Se requiere analizar tanto la parte de extracción de características como la de clasificación.
• Se requiere ejecutar algoritmos que funciones en tiempo real y puedan ser colocados en sistemas embebidos
(c) P. Gómez, INAOE 2017 [email protected] 23
Proyecto: Análisis y diseño de modelos de predicción de series de tiempo.
24 (c) P. Gómez, INAOE 2017 [email protected]
Serie de tiempo
• Conjunto de valores escalares, obtenidos del sensado de un fenómeno continuo en periodos de tiempo regulares, u obtenido de un fenómeno inherentemente discreto.
• Una serie de tiempo comúnmente se representa como: Ó
• Llamamos “series de tiempo no lineales” a aquellas que suponemos provienen de sistemas dinámicos no lineales
...,, 321 sss
)...3(),2(),1( sss
25 (c) P. Gómez, INAOE 2017 [email protected]
Ejemplos de series de tiempo no lineales (2/3)
26 (c) P. Gómez, INAOE 2017 [email protected]
Serie NN5-101, representando retiros diarios de cajeros automáticos
en diferentes ciudades de Inglaterra, tomada de (Crone, 2008)
Ejemplos de series de tiempo no lineales (3/3)
(c) P. Gómez, INAOE 2017 [email protected]
Cadenas, E., Rivera, W., Campos-Amezcua, R. et al. Wind
speed forecasting using the NARX model, case: La Mata,
Oaxaca, Mexico Neural Comput & Applic (2016) 27: 2417.
doi:10.1007/s00521-015-2012-y 27
La predicción de series de tiempo
• El pronóstico de series de tiempo ha sido de fuerte interés en los últimos años, debido a la gran variedad de aplicaciones en que se necesita.
• Este un problema complejo cuando se intenta aplicar sobre sistemas altamente no lineales o caóticos.
• Algunas estrategias de predicción buscan aproximar un modelo a un sistema dinámico analizando solamente la información contenida en una serie de tiempo, suponiendo que ésta es suficientemente detallada para contener toda la información requerida.
28 (c) P. Gómez, INAOE 2017 [email protected]
Modelo de predicción basado en meta-características y ensambles
(Fonseca-Delgado & Gomez-Gil, 2014)
MCCV = Monte Carlo Cross Validation
SOM = Self Organizing Map
29 (c) P. Gómez, INAOE 2017 [email protected]
Algunos retos en este proyecto
• ¿Que características presentan las series de fenómenos naturales asociados a producción de electricidad, que pueden explotarse para predecirlas?
• ¿Como puede utilizarse la información temporal embebida en la serie para conseguir una mejor predicción?
(c) P. Gómez, INAOE 2017 [email protected] 30
Publicaciones escogidas • 2014. Fonseca R, Gómez-Gil P. Temporal Validated Meta-Learning for Long-Term Forecasting of Chaotic Time Series Using Monte
Carlo Cross-Validation. Recent Advances on Hybrid Approaches for Designing. Intelligent Systems, Studies in Computational Intelligence 547, O Castillo et al. (eds.), Springer International Publishing Switzerland 2014. DOI: 10.1007/978-3-319-05170-3_24.
• 2014. Fonseca-Delgado, R, Gomez-Gil, P. “Selecting and Combining Models with Self-Organizing Maps for Long-Term Forecasting of Chaotic Time Series.” Proceedings of the 2014 International Joint Conference on Neural Network (IJCNN), part of the 2014 IEEE World Congress on Computational Intelligence, July 6-11, Beijing China, pp. 2616-2623. DOI: 10.1109/IJCNN.2014.6889454
• 2014. V. Alarcon-Aquino, J. M. Ramirez-Cortes, P. Gomez-Gil, O. Starostenko, Y. Garcia-Gonzalez. “Network Intrusion Detection Using Self-Recurrent Wavelet Neural Network with Multidimensional Radial Wavelons” Information Technology and Control. Vol. 43, No. 4, pp.347-358. DOI: http://dx.doi.org/10.5755/j01.itc.43.4.4626 Print ISNN: 1392-124X, JCR FI=0.813.
• 2014. Rigoberto Fonseca-Delgado, María del Pilar Gómez-Gil. Reporte Técnico No. CCC-14-003. “Meta-aprendizaje Auto-organizado Temporal para Predicción a Largo Plazo de Series de Tiempo Caóticas. 14 de octubre de 2014. Instituto Nacional de Astrofísica, Óptica y Electrónica. Coordinación de Ciencias de la Computación, Tonantzintla, Puebla. México.
• 2013. Fonseca-Delgado R, Gomez-Gil, P. “An assessment of ten-fold and Monte Carlo cross validations for time series forecasting.” Proceedings of the 2013 10th International Conference on Electrical Engineering, Computing Science and Automatic Control CCE 2013) Sept. 30 – Oct. 6, 2013. DOI : 10.1109/ICEEE.2013.6676075
• 2013. Fonseca R, Gómez-Gil P “Temporal self-organized meta-learning for predicting chaotic time series,” Special Issue: Advances in Pattern Recognition, Volume Editors: J.A. Olvera-López, José Francisco Martínez Trinidad, Jesús Ariel Carrasco Ochoa, J. Salas Rodríguez, Gabriella Sanniti di Baja, Research in Computing Science, Vol 61, ISSN: 1870-4069, 2013. Pp 13-22. http://www.micai.org/rcs/
• 2011. Gómez-Gil P, Ramírez-Cortés JM, Pomares Hernández SE, Alarcón-Aquino V. “A Neural Network Scheme for Long-term Forecasting of Chaotic Time Series” Neural Processing Letters, Vol. 33, No. 3, June 2011, pp. 215-233. ISSN:1370-4621 Published online: March 8, 2011. DOI: 10.1007/s11063-011-9174-0 (cited at JCR Science Edition—2009) (preliminary PDF)
• 2010. Alarcón-Aquino V, Starostenko O, Ramírez-Cortés JM, Gómez-Gil P, García-Treviño ES. “Initialisation and training procedures for wavelet networks applied to chaotic time series.” Engineering Intelligent Systems. Vol. 18, No. 1, March 2010, CRL Publishing, ISSN: 1472-8915 (cited at JCR Science Edition- 2009).
• 2010. Gómez-Gil P, García-Pedrero A and Ramírez-Cortes JM. “Composite Recurrent Neural Networks for Long-Term Prediction of Highly-Dynamic Time Series Supported by Wavelet Decomposition”, Soft Computing for Intelligent Control and Mobile Robotics, Vol. 318/2011, pp.253-268, Castillo O, Janusz K and Pedrycz W. Editors, Springer-Verlag. DOI:10.1007/978-3-642-15534-5_16.
(c) P. Gómez, INAOE 2017 [email protected] 31
Proyecto: Aprendizaje de representaciones sobre
imágenes termográficas para diagnóstico temprano de cáncer de
mama. En colaboración con el grupo GIOB de la
coordinación de óptica
32 (c) P. Gómez, INAOE 2017 [email protected]
Antecedentes
• Es la continuación de la tesis de maestría de óptica “Diagnóstico de cáncer de mama a través del procesamiento de imágenes termográficas y redes neuronales” actualmente en proceso, realizada por Daniela M. Reynoso Armenta y asesorada por el Dr. Jorge Castro Ramos y la Dra. Pilar Gómez-Gil
• Se cuenta con una base de datos obtenida sin protocolos estandarizados, ruidosa y posiblemente mal etiquetada
• Se probó aprendizaje profundo para detectar automáticamente la región de interés; se clasificó usando diferentes modelos.
• La extracción de características manual ha sido el principal reto encontrado
(c) P. Gómez-Gil, INAOE 2017 [email protected]
33
34
Ejemplos de detección automática de la región mamaria en tomografías usando R-CNN ( parte del proyecto No. 6)
\Eval_Pru_Frontal_L2Regularization(0004)\Eval_Pru_Frontal2C1
Los rectángulos negros representan zonas identificadas inicialmente,
y cubiertas para identificar la segunda zona (Reynoso-Armenta, 2017)
Imágen
es
Bon
itas
Imágen
es
Sin
téti
cas
35
(Reynoso-Armenta, 2017)
Prueba3 Característica 3, 4, 5, propuesta A y B
• Imágenes Bonitas
• Imágenes Correctas
Prueba4
Característica 3, 4, 5, propuesta A, B y C
◎Imágenes Bonitas
◎Imágenes Correctas
Ejemplo del proceso de diseño
(Reynoso-Armenta, 2017)
Principal reto
• ¿Es posible encontrar una arquitectura profunda neuronal que permita mejorar la clasificación, considerando que la toma de imágenes está no estandarizada?
(c) P. Gómez, INAOE 2017 [email protected] 37
[email protected] [email protected]
INAOE, Tonantzintla Puebla, oficina 8228 (222) 266-3100 ext. 8228
Preguntas?
38 (c) P. Gómez, INAOE 2017 [email protected]
ccc.inaoep.mx/~pgomez
Presentación disponible en:
http://ccc.inaoep.mx/~pgomez/temasTesis.pdf