MODELOS VISUALES EN EL ANÁLISIS DE LA CALIDAD DE IMAGEN
Transcript of MODELOS VISUALES EN EL ANÁLISIS DE LA CALIDAD DE IMAGEN
-
UNIVERSIDAD POLITCNICA DE MADRID ESCUELA TCNICA SUPERIOR DE INGENIEROS DE
TELECOMUNICACIN
PROYECTO FIN DE CARRERA
MODELOS VISUALES EN EL ANLISIS DE
LA CALIDAD DE IMAGEN
Ana Rosa Gallego Aguilar
Febrero 2006
-
UNIVERSIDAD POLITCNICA DE MADRID
ESCUELA TCNICA SUPERIOR DE INGENIEROS DE TELECOMUNICACIN
PROYECTO DE FIN DE CARRERA
TTULO: MODELOS VISUALES EN EL ANLISIS DE
LA CALIDAD DE IMAGEN. AUTOR: ANA ROSA GALLEGO AGUILAR. TUTOR: GABRIEL CRISTBAL PREZ. TRIBUNAL: PRESIDENTE: ANDRS DE SANTOS Y LLE. VOCAL: FERNANDO CALLE GMEZ. SECRETARIA: MARA JESS LEDESMA CARBAYO. SUPLENTE: ANTONIO GABRIEL LOMEA MORENO. FECHA DE LECTURA: CALIFICACIN:
Departamento de Ingeniera Electrnica. Instituto de ptica Daza de Valds (C.S.I.C.)
-
Resumen:
En este proyecto se van a estudiar los modelos visuales y su aplicacin concreta
en sistemas de medida de calidad de imagen. Se va desarrollar una herramienta para la
evaluacin automtica de la calidad perceptible de imgenes monocromticas que hayan
sido procesadas mediante algoritmos de compresin o de marcado de agua. Para ello se
investigan cules son los atributos visuales perceptivos de mayor relevancia en la
determinacin de la calidad de imagen. Se analizan los distintos componentes del
Sistema Visual Humano (adaptacin de luminancia, CSF, enmascaramiento, etc.) y para
cada uno de ellos se realizarn diferentes implementaciones dentro de un esquema de
medida de calidad perceptible. En base a los resultados que proporcionan los distintos
modelos de estos atributos se indican las implementaciones que resultan ms fiables.
Palabras clave:
Calidad de imagen, modelos visuales, adaptacin de luminancia, CSF, contraste,
enmascaramiento, ndices de calidad, visibilidad error.
-
Agradecimientos:
A todos los compaeros del CSIC. En especial a mi tutor Gabriel, por su paciencia, sus
indicaciones y sus consejos.
A todos los que os pasasteis por el laboratorio del CSIC para la realizacin de los test,
gracias.
A mis amigos de la facultad: Isa, Mariajo, Elena, Fede, Noelia, Andrs, Vanessa,
Raquel, Augusto y Pablo. Porque habis llenado de historias y recuerdos mis cinco
aitos en la escuela y porque todava me segus aguantando.
A Leo, Carlos y Ari por los veranos de estudio, de proyecto y de fiesta.
A Elena, Ana e Inma por estar ah siempre apoyando moralmente. A Pepa adems por
las consultas estadsticas y a Alex por los libros de medicina.
A mi familia, con todo mi cario.
-
NDICE 1. Introduccin.
1.1. Estado del Arte ............................................................................................. 4
1.2. Objetivos del Proyecto ................................................................................. 6
1.3. Estructura del Proyecto................................................................................. 7
2. Sistema Visual Humano.
2.1. Anatoma y fisiologa visual......................................................................... 10
2.1.1. El ojo ................................................................................................ 10
2.1.2. Campos receptores de la retina......................................................... 12
2.1.3. Vas visuales. Integracin de la informacin en la corteza .............. 16
2.2. Propiedades de la visin ............................................................................... 20
2.2.1. Adaptacin visual. Sensibilidad a la intensidad luminosa................ 20
2.2.2. Contraste........................................................................................... 22
2.2.3. Sensibilidad en frecuencia ................................................................ 25
2.2.4. Enmascaramiento ............................................................................. 30
2.3. Movimientos oculares y atencin visual ...................................................... 32
3. Evaluacin de la calidad en imgenes.
3.1. Calidad de imagen. Clasificacin de mtodos de medida. ........................... 35
3.2. Modelos de calidad de imagen subjetivos .................................................... 37
3.3. Modelos de calidad de imagen objetivos...................................................... 40
3.3.1. Modelos de medida de error ............................................................. 40
3.3.2. Modelos de medida de calidad perceptible....................................... 43
3.3.3. Modelos hbridos de medida de calidad ........................................... 51
3.4. Distorsin de imagen.................................................................................... 56
3.4.1. Tcnicas de compresin y artefactos. ............................................... 56
3.4.2. Marcado de agua............................................................................... 60
-
4. Implementacin de modelos visuales para la evaluacin de la calidad de
imagen.
4.1. Preprocesado. Caractersticas del monitor ................................................... 63
4.2. Adaptacin de luminancia ............................................................................ 66
4.3. Funcin de Sensibilidad al contraste (CSF) ................................................. 68
4.3.1. Modelo 1 de CSF (B.W.Rust) .......................................................... 70
4.4.2. Modelo 2 de CSF (Daly) .................................................................. 71
4.3.3. Modelo 3 de CSF (Barten) ............................................................... 74
4.4. Descomposicin en canales.......................................................................... 75
4.4.1. Filtros de Gabor................................................................................ 76
4.4.2. Transformada Cortex. Filtros anillo ................................................. 82
4.5. Clculo de contrastes.................................................................................... 85
4.6. Enmascaramiento espacial............................................................................ 89
4.6.1. Enmascaramiento con CSF como filtro............................................ 90
4.6.2. Enmascaramiento con CSF por pesos .............................................. 92
4.7. Mapas e ndices de error............................................................................... 94
5. Comportamiento y comparativa de los modelos de medida de calidad.
5.1. Validacin de modelos de medida de calidad perceptible............................ 100
5.2. Sistema de medida de calidad con CSF como filtro..................................... 109
5.3. Sistema de medida de calidad con CSF por pesos. ...................................... 120
5.4. Otros modelos............................................................................................... 127
5.4.1. Medida de calidad basada en informacin estructural(SSIM) ......... 127
5.4.2. Medida de calidad basada en distribuciones Wigner........................ 132
6. Conclusiones.
6.1. Conclusiones................................................................................................. 139
6.2. Posibles ampliaciones. ................................................................................. 141
7. Anexos.
Anexo A. Imgenes del test DSCQS y resultados MOS. ...................................... 144
Anexo B. Entorno grfico...................................................................................... 155
Anexo C. Manual de programas bsicos. .............................................................. 164
Bibliografa. ............................................................................................................... 171
-
GLOSARIO CSF Contrast Sensitivity Function. CRT Cathode Ray Tube. DCT Discrete Cosine Transform. DSIS Double Stimulus Impairment Scale. DSCQS Double Stimulus Continuous Quality Scale. DWT Discrete Wavelet Transformation. FFT Fast Fourier Transform. ITU International Telecommunication Union. JND Just Noticeable Difference. JPEG Joint Photographic Experts Group. LUT Look-Up Table. MOS Mean Opinion Score. MRI Magnetic Resonance Imaging. MSE Mean Square Error. NMSE Normalized Mean Square Error. PEM Perceptual Error Measure. PQS Picture Quality Scale. PSF Point Spread Function. PSNR Peak Signal to Noise Ratio. PWD Pseudo Wigner Distribution. SNR Signal to Noise Ratio. SSCQE Single Stimulus Continuous Quality Evaluation. SSIM Structural SIMilarity. SVH Sistema Visual Humano. VDM Visual Discrimination Model. VDP Visible Differences Predictor. WVD Wigner- Ville Distribution.
-
1
Introduccin.
Las imgenes digitales se ven afectadas por una amplia gama de distorsiones
durante su adquisicin, procesado, almacenado, transmisin y reproduccin. Todos
estos procesos, lgicamente, pueden dar como resultado una degradacin de la calidad
visual. Para aplicaciones en las que finalmente la imagen va a ser observada por
personas, el nico mtodo realmente correcto de evaluar la calidad de esa imagen sera
mediante la valoracin subjetiva que dara el observador. En la prctica la evaluacin
subjetiva mediante test resulta bastante complicada y en algunos casos, segn la
aplicacin, puede llegar a ser inabordable. La meta en la investigacin y el desarrollo de
mtricas de calidad objetivas consiste precisamente en conseguir medidas cuantitativas
que puedan valorar de forma automtica la calidad de imagen percibida.
Una mtrica de calidad de imagen objetiva puede cumplir diferentes funciones
segn su aplicacin. Por ejemplo, se puede utilizar para monitorizar y ajustar
dinmicamente la calidad de la imagen en un servidor de video digital de forma que se
adecue a los recursos disponibles. Tambin puede servir para optimizar algoritmos y
parmetros en sistemas de procesado de imgenes como en el caso de sistemas de
comunicacin en los que es posible utilizarla para optimizar el diseo de filtros y
algoritmos de codificacin y decodificacin. En todas estas aplicaciones lo que interesa
es que a pesar de la degradacin introducida el observador final perciba sta lo menos
posible. Por ello, las mtricas de calidad objetivas que resultan efectivas son las que
evalan esta calidad percibida. Para ello es necesario saber qu es lo que este
-
1. Introduccin.
2
observador percibe, siendo imprescindible conocer el funcionamiento del SVH y
modelarlo en la medida de lo posible.
Los modelos del sistema visual humano, por tanto, van a ser el fundamento para
la definicin de mtricas objetivas de calidad perceptible, pero adems, no slo van a
estar presentes como sistema de valoracin sino que lo ideal sera que las principales
caractersticas del SVH sean integradas directamente en el corazn de la herramienta
diseada. Este planteamiento adquiere una gran importancia en el desarrollo de mtodos
y sistemas de compresin ya que las capacidades limitadas de procesamiento del SVH
permiten que una imagen pueda ser modificada sin que las distorsiones introducidas
sean detectadas con lo que se podrn conseguir tasas de compresin mayores sin que se
modifique la calidad percibida de forma significativa. Por tanto, el objetivo es hacer que
las distorsiones introducidas por el compresor sean invisibles al ojo, es decir, un
compresor perceptual sin prdidas. De hecho, ya desde sus inicios en la primera reunin
del grupo de expertos JPEG 2000 en Sydney en 1997, se comenzaron los primeros
trabajos para incorporar las caractersticas del SVH como una herramienta de
optimizacin dentro del estndar. El mtodo ms habitual para mejorar la compresin
mediante tcnicas de optimizacin visual est basado en transformar las amplitudes de
la imagen a un dominio perceptivo uniforme. Puesto que la respuesta global del sistema
visual a la escala de grises puede aproximarse por una no-linealidad de tipo de raz
cbica, el proceso a realizar consistira en convertir la imagen a un dominio inverso para
cuantificar posteriormente. Esta tcnica es la base de la denominada correccin gamma
que est presente en la mayora de los monitores de video. Los otros dos elementos
claves a optimizar son el contenido de las frecuencias espaciales y el enmascaramiento.
El primero de ellos involucra el clculo de la funcin de sensibilidad al contraste (CSF)
para encontrar los pasos de cuantificacin, mientras que el segundo est relacionado con
la importancia del contexto en donde se encuentren los objetos a codificar. El fenmeno
del enmascaramiento (masking) es un efecto perceptivo bien conocido tanto para el
caso de imgenes como para el caso de seales acsticas, etc. Se debe bsicamente al
hecho de que estmulos de gran intensidad van a enmascarar a estmulos ms pequeos.
Este efecto puede ser aprovechado en compresin para concentrar los errores en
aquellas regiones en donde van a ser visualmente imperceptibles. Sin embargo, el efecto
de enmascaramiento admite mltiples interpretaciones y su comportamiento no es bien
-
1. Introduccin.
3
conocido en algunas situaciones, por lo que constituye un rea activa en la investigacin
actual del sistema visual.
En definitiva, la necesidad de compresin cada vez mayor y con una calidad
aceptable, motivada por la gran demanda actual en la transmisin y almacenamiento de
la informacin visual ha impulsado, como se ha comentado, la incorporacin de los
modelos visuales a la mayora de algoritmos de compresin [10, 12, 22, 25, 26, 35]. En
general, la compresin es del todo necesaria ya que las imgenes digitales son de
tamao considerable. Esto se agrava en el caso de aplicaciones con imgenes mdicas.
Por ejemplo, en el contexto de la radiologa, la medida final de la calidad de una imagen
reside en lo til que es la imagen para conseguir un diagnstico certero y preciso. El
verdadero test para un radilogo es la deteccin precisa de incluso pequeas
anormalidades. Es por ello que el mantenimiento de la mayor fidelidad posible en la
representacin de las imgenes es crucial en la prctica radiolgica y no se pueden
tolerar artefactos ni prdida de calidad. Se necesitan, por tanto, esquemas de compresin
sin prdidas lo que hace que el problema del tamao de la imagen mdica sea crtico en
cuanto a su almacenamiento, consulta, etc. Por tanto, si en general los modelos de SVH
son tiles para alcanzar tasas de compresin elevadas con las menores prdidas de
calidad posible en el caso de las imgenes mdicas resultan tanto ms tiles puesto que
lo que se busca es un sistema de compresin sin prdidas perceptibles.
Finalmente, no se puede olvidar que las aplicaciones de los modelos del SVH en
entornos de compresin o en cualquier otro no tendra sentido si no se pudiese evaluar a
posteriori el valor de calidad percibida de la imagen. En conclusin, se van a necesitar
las mtricas de calidad objetiva perceptible para evaluar si se han conseguido los
objetivos deseados despus del procesado de la imagen.
-
1.1. Estado del arte.
4
1.1. Estado del arte.
A lo largo de muchos aos de investigacin en el procesado visual, uno de los
problemas fundamentales ha sido la ausencia de una mtrica universalmente aceptada
que proporcione una medida de la calidad de una imagen con unas prestaciones
aceptables en un amplio rango de situaciones. Los test subjetivos son usados
normalmente para obtener la estimacin ms precisa de la calidad de imagen. Sin
embargo, llevar a cabo estos test en la prctica resulta muy pesado en cuanto a la carga
temporal que conlleva, aparte de resultar caros y difciles de repetir puesto que
requieren unas condiciones de visualizacin especiales. Debido a estos inconvenientes
se hace necesario el uso de mtricas de calidad objetivas. De estas, las ms conocidas, y
que se siguen empleando en casi todos los casos, son medidas simples matemticas
basadas en la relacin seal/ruido de pico (PSNR) o el error cuadrtico medio (MSE). A
pesar de ser las ms utilizadas est comprobado que dichas medidas no guardan ninguna
relacin directa con la calidad de la imagen percibida. La bsqueda y desarrollo de
mtricas ms robustas que proporcionen medidas de calidad acordes con la percibida es
actualmente un rea activa de investigacin. De hecho, se han definido un gran nmero
de posibles mtricas que incorporan de una u otra manera factores perceptivos. El
desarrollo de estas mtricas objetivas basadas en modelos del SVH ha sido posible
gracias a los avances en el conocimiento del SVH y su funcionamiento. En general lo
que se suele modelar es el procesado a bajo nivel desde el ojo hasta la corteza visual
primaria. Las propiedades del SVH o caractersticas visuales que incorporan
normalmente estas mtricas son la adaptacin de luminancia, la funcin de sensibilidad
al contraste (CSF) y el enmascaramiento. La forma en la que se lleva a cabo esta
incorporacin es mediante modelos de las caractersticas visuales mencionadas que se
obtienen gracias a los datos experimentales conseguidos mediante la realizacin de test
psicofsicos de deteccin de umbral con estmulos simples.
Los distintos modelos de medida de calidad perceptible existentes, puesto que se
han definido teniendo en cuenta las caractersticas del SVH, van a compartir una
estructura bsica similar y luego, dependiendo de la aplicacin para la que fueron
propuestos tendrn diversas particularidades. En general en todos ellos se pueden
encontrar una etapa de calibrado, un filtrado de la imagen a diferentes frecuencias
espaciales y orientaciones, ajustes segn la sensibilidad al contraste, mecanismos para
-
1.1. Estado del arte.
5
modelar el enmascaramiento y una etapa final que obtiene el error o bien como un
nmero que describe la calidad de la imagen o bien como un mapa de detectabilidad de
la distorsin o ambos.
La implementacin de estas mtricas es en muchos casos compleja, son bastante
elaboradas y con un coste computacional elevado. El grado de complejidad depende de
las caractersticas visuales que se contemplen dentro de la mtrica y el modelo escogido
para las mismas. Dos de los modelos de referencia para la mayor parte de mtricas que
se han desarrollado ya que resultan bastante generales y robustos son el Visible
Difference Predictor (VDP) de Daly [7] y el Visual Discrimination Model (VDM) de
Lubin [19]. Sin embargo, estos modelos presentan algunas limitaciones como son el no
tener en cuenta caractersticas del SVH de alto nivel (extraccin de caractersticas,
procesos cognitivos, reconocimiento de patrones, atencin visual), que se disean
para condiciones de visibilidad del estmulo cercanas al umbral (los experimentos
psicofsicos en los que se basan son en condiciones de deteccin umbral) y otras que se
vern con ms detalle a lo largo del proyecto. Es por ello, que algunos modelos han
intentado incorporar caractersticas del procesado del SVH de alto nivel [26] o
directamente buscar nuevas mtricas que de alguna forma simulen ciertas caractersticas
de la percepcin sin llegar a incorporar los modelos visuales [30, 31].
En definitiva este es un rea con distintos frentes de investigacin abiertos
puesto que an no hay una mtrica aceptada estndar para la evaluacin de la calidad
percibida de imagen. Adems, el estudio del comportamiento de las mtricas ya
existentes es complicado ya que la validacin de las mismas ha de hacerse mediante test
subjetivos sobre un conjunto de imgenes dadas con lo que, en cualquier caso, su
evaluacin es parcial.
-
1.2. Objetivos.
6
1.2. Objetivos.
El objetivo fundamental es investigar cuales son los atributos visuales
perceptivos ms importantes que juegan un papel decisivo en la determinacin de la
calidad de una imagen, como interactan y se correlacionan entre si. En definitiva, se
trata de analizar los modelos visuales en la evaluacin de la calidad de imagen.
En concreto, la realizacin de este anlisis se va a llevar a cabo con dos
propsitos determinados que en realidad van a surgir como resultado directo de la
investigacin realizada en el mbito de los modelos y mtricas de calidad de imagen. En
primer lugar se trata de desarrollar una herramienta de trabajo en forma de entorno
grfico que sea global, amplia y abierta. Global en el sentido de que incluya todo tipo de
mtricas para la evaluacin de la imagen y no slo las que se basan modelos de SVH.
De esta forma se van a poder comparar y contrastar los resultados obtenidos mediante
los distintos sistemas de medida de calidad sacando las pertinentes conclusiones en
cuanto a tiempos de ejecucin, precisin de los resultados, adecuacin de los mtodos a
los distintos tipos de imgenes, etc. Amplia en el sentido de abarcar el mayor nmero de
modelos posibles para los distintos componentes del SVH de manera que una vez
centrados en los modelos visuales sea posible tambin obtener distintas conclusiones en
cuanto a qu modelos en concreto o combinacin de ellos obtienen mejores resultados.
Por ltimo, se trata de que sea una herramienta abierta que facilite la incorporacin
futura de nuevos mtodos o modelos de forma sencilla, que se pueda implementar en
cualquier sistema sin ms que realizar algunos ajustes y que sirva para una gama amplia
de imgenes. En segundo lugar, se pretende desarrollar un modelo que permita explicar
como un observador humano combina los atributos visuales para lograr una valoracin
de la calidad de imagen percibida. El desarrollo de una mtrica perceptible permitir
tener una herramienta de tipo observador ideal que proporcione una medida de la
calidad ms prxima a la que se obtendra a travs de un observador humano. Este
modelo de medida de calidad de imagen se implementar de forma dinmica dentro del
entorno grfico antes mencionado.
En el presente proyecto se desarrollan por tanto herramientas para la evaluacin
automtica de la calidad subjetiva de imgenes monocromticas. En concreto, las
imgenes que se pretenden analizar y que resultan de mayor inters sern aquellas que
-
1.3. Estructura del proyecto.
7
hayan sido procesadas mediante algoritmos de compresin o de marcado de agua. En
particular sern objeto de estudio por una parte las imgenes mdicas de video-
microscopa y radiolgicas (MRI, PET, etc.) y por otra y para que el estudio resulte lo
ms completo posible se utilizarn imgenes conocidas y de uso comn en entornos de
compresin.
1.3. Estructura del proyecto.
La organizacin de este proyecto para conseguir los objetivos que se han
planteado va a estar claramente dividida en tres bloques: investigacin, implementacin
y evaluacin.
En primer lugar, se necesitar una investigacin y anlisis del SVH y de sus
componentes. Este estudio previo se desarrolla en el captulo 2, donde se examinan las
caractersticas de comportamiento del SVH. Para comprender su funcionamiento se
realizar una descripcin de la anatoma y fisiologa visual y posteriormente se
determinarn las distintas propiedades de la visin y su respuesta. Esta es la base sobre
la que despus se podrn realizar modelos de medida de calidad perceptible. Adems,
ser necesario aportar un marco general en cuanto a modelos ya existentes. La
descripcin de algunos de los modelos de medida de calidad de imagen, su estructura
bsica y los distintos problemas y ventajas que llevan asociados se hace en el captulo 3.
Tambin se definen y clasifican aqu los distintos tipos de mtricas de calidad de
imagen y lo que es ms importante, se define el concepto de calidad que se tendr en
cuenta en este proyecto. Finalmente, se da una visin general en cuanto al tipo de
distorsiones con las que van a tratar estos mtodos.
En segundo lugar, para la construccin de un modelo de medida de calidad
perceptible se van a llevar a cabo distintas implementaciones de los componentes del
SVH (adaptacin, CSF, enmascaramiento, etc.). El captulo 4 rene para cada uno de
ellos las propuestas que se han desarrollado mediante la herramienta MATLAB,
explicando cmo se relacionan y unen entre s los distintos bloques que componen el
modelo.
-
1.3. Estructura del proyecto.
8
En tercer lugar se van mostrar y analizar los resultados obtenidos para las
diferentes imgenes y distorsiones que son evaluadas con los sistemas de medida de
calidad implementados. En el captulo 5 se describe primero el mtodo DSCQS que
sirve para la validacin de los modelos y despus se examinan los resultados para los
modelos de medida de calidad perceptible y los de otras mtricas hbridas ya descritas
dentro de la clasificacin del captulo 3. En el captulo 6 se resumen las conclusiones
obtenidas y se sealan posibles ampliaciones y mejoras.
Finalmente, en el anexo A se van a mostrar los valores subjetivos que se han
obtenido mediante la realizacin del test DSCQS y las imgenes utilizadas. El anexo B
describe el entorno grfico que se ha construido y su utilizacin. En el anexo C se
enumeran y explican brevemente los programas y funciones ms importantes generadas
mediante MATLAB para el desarrollo de este proyecto as como su relacin.
-
.
9
Sistema Visual Humano.
La calidad de una imagen puede verse influenciada por diversos factores entre
los que pueden destacarse las tcnicas de adquisicin, de procesamiento y de
visualizacin a las que se somete a esa imagen. En la mayora de los casos el resultado
obtenido va a ser contemplado por un observador que formar parte activa en la
evaluacin de la imagen final. Por ello, para poder dar una medida de calidad acorde
con la percibida por ese observador es necesario estudiar el SVH y los mecanismos de
percepcin, entendindose como tal los procesos de extraccin de la informacin y la
formacin de representaciones sobre las que pueda operar el sistema cognitivo.
En el estudio de la visin se pueden diferenciar claramente dos etapas. Por un
lado, se realiza un procesado a bajo nivel que no utiliza informacin de experiencias
pasadas, ni razonamiento. Este es el procesado que incluyen la mayor parte de las
mtricas de calidad de imagen basadas en las caractersticas del SVH y es en el que se
centra este captulo. Por otra parte, el procesado de alto nivel utiliza recursos como la
atencin y la memoria, siendo estos de un mayor nivel de complejidad y por tanto
mucho ms difciles de modelar.
En este captulo, en resumen, se pretende analizar las caractersticas de
comportamiento del SVH, comprendiendo su funcionamiento y determinando, en la
medida de lo posible, su respuesta. Esta ser la base sobre la que despus se podrn
modelar mtricas de calidad perceptible. Se inserta salto continuo a seccin siguiente.
-
2.1. Anatoma y fisiologa visual.
10
2.1. Anatoma y fisiologa visual.
2.1.1. El ojo. Es el rgano del SVH en el que comienza el procesamiento visual y cuyo
funcionamiento bsico consiste en recoger la luz y enfocarla en su superficie posterior,
transformando energa luminosa en elctrica. Es sensible a las radiaciones
electromagnticas con longitudes de onda comprendidas entre los 400 y los 780 nm
aproximadamente.
La figura 2.1 muestra una seccin del globo ocular, con una forma prcticamente
esfrica y de unos 20 mm de dimetro. En la figura, se pueden apreciar los componentes
principales de los que se compone el ojo, que van a ser enumerados a continuacin,
explicando su funcionamiento y caractersticas ms relevantes.
Figura 2.1: Seccin vertical del ojo.
La esclertica es el tejido duro, blanco y fibroso que conforma la parte exterior
del globo ocular. Es opaca y se conoce comnmente como el blanco del ojo. La parte
delantera y central del ojo es la crnea. Se trata de una membrana transparente y dura
cuya funcin principal consiste en refractar la luz. Adems, la crnea tiene una cierta
curvatura que contribuye a dirigir la luz y concentrarla en una pequea apertura redonda
(de 2 a 8 mm de dimetro) situada en el centro del ojo y que permite que la luz pase al
interior del mismo, la pupila. Esta a su vez est rodeada por el iris, un msculo circular
que permite regular la cantidad de luz que entra en el ojo, de forma que si la intensidad
luminosa es elevada se contraer haciendo menor el dimetro de la pupila y viceversa.
-
2.1. Anatoma y fisiologa visual.
11
La parte anterior del iris es la que contiene el pigmento visible que caracteriza el color
de ojos.
Tras el iris se encuentra el cristalino que est formado por una serie de capas
concntricas con distintos ndices de refraccin que actan como una lente flexible
enfocando la luz en el fondo del ojo. El cristalino absorbe cerca del 8% de la luz visible
del espectro, incrementndose esta absorcin en las zonas del infrarrojo y del
ultravioleta, pudiendo llegar a daarse el ojo por un exceso de radiacin en estas
frecuencias. Entre la crnea y el cristalino se encuentra una sustancia lquida, clara y
transparente denominada humor acuoso.
La retina recubre la parte interior del ojo y es en ella donde se enfoca la luz
incidente. La luz se convierte aqu en seales nerviosas mediante clulas sensibles a la
luz. Entre el cristalino y la retina se encuentra el humor vtreo que es una sustancia
gelatinosa transparente e incolora. El humor vtreo llena todo el espacio entre el
cristalino y la retina y ocupa alrededor de 2/3 del volumen ocular. Para poder enfocar
objetos cercanos y lejanos es necesario que el ojo humano cambie la forma del
cristalino. Este proceso, que se denomina acomodacin, es controlado mediante un
grupo de msculos situados alrededor del iris y sucede prcticamente en tiempo real.
Una vez realizada esta acomodacin, la luz se proyecta en la retina y es transformada en
impulsos elctricos mediante dos tipos de fotorreceptores que reciben el nombre de
conos y bastones.
Los conos se distribuyen fundamentalmente por la zona central de la retina
denominada fvea, son sensibles al color y responsables de la visin fotpica.
Proporcionan una visin en detalle y pueden ser de tres tipos segn la respuesta que
presentan al contenido de la radiacin. Es un sistema que funciona con tres receptores
de color distintos, dando lugar a la teora tricromtica para la percepcin del color. Cada
ojo posee entre 6 y 7 millones de conos y su umbral de visibilidad se sita alrededor de
1L (micro-lumen).
Los bastones proporcionan informacin general del campo visual. Son sensibles
a valores muy bajos de iluminacin con umbrales de 1nL, de tal forma que hacen
posible la visin nocturna o con poca iluminacin pero sin informacin de color. Son
-
2.1. Anatoma y fisiologa visual.
12
responsables, por tanto, de la visin escotpica. El nmero de bastones es de 75 a 150
millones.
Figura 2.2: Distribucin de conos y bastones en la retina.
Como puede apreciarse en la figura 2.2 la distribucin de estos fotorreceptores
en la retina es poco uniforme y ms o menos simtrica respecto a la fvea. Esta
distribucin hace que tengamos un amplio ngulo de visin y una resolucin espacial
elevada a nivel local que se resuelve con el continuo movimiento del ojo enfocando los
objetos de inters en la fvea.
El disco ptico se caracteriza por ser la nica zona de la retina en la que no hay
fotorreceptores, constituyendo, por tanto, un punto ciego. De aqu parten los vasos
sanguneos que riegan la retina y adems en esta zona convergen los axones formando
el nervio ptico que parte con la informacin que ser enviada al cerebro.
2.1.2. Campos receptores de la retina. Un campo receptor es un rea de la retina formada por fotorreceptores (conos y
bastones) cuyas respuestas influyen en clulas ms avanzadas del procesamiento visual:
las clulas ganglionares. La figura 2.3 muestra una seccin de la retina con las clulas
que la forman y su conexionado. Como puede observarse, entre las clulas ganglionares
y los fotorreceptores existen otros tres tipos de clulas: horizontales, amacrinas y
bipolares.
-
2.1. Anatoma y fisiologa visual.
13
Las clulas horizontales unen los fotorreceptores y las clulas bipolares
mediante conexiones relativamente largas y paralelas a las capas de la retina. Las
clulas amacrinas funcionan de forma similar pero como puente de unin entre clulas
bipolares y ganglionares.
Las clulas bipolares pueden recibir la informacin directamente de los conos y
bastones o a travs de las clulas horizontales y posteriormente se manda a las clulas
ganglionares o bien de forma directa o a travs de las clulas amacrinas. La
informacin, por tanto, puede seguir diversos caminos dentro del conexionado de las
distintas clulas retinianas.
Este esquema general es vlido para toda la retina con algunas puntualizaciones.
En la fvea cada cono se conecta con una clula bipolar y esta a su vez con una
ganglionar siguiendo el camino ms directo. A medida que nos alejamos de la fvea
ms receptores convergern en clulas bipolares y mayor nmero de estas en
ganglionares.
Figura 2.3: Seccin simplificada de la retina (longitud aproximada de de mm).
Las clulas bipolares se dividen en dos clases: de centro off y on. Se debe
aclarar que las nicas clulas que disparan impulsos en la retina son las ganglionares, y
al hablar aqu de centro on u off nos referimos a si responden a la luz o a la
oscuridad. As, el proceso da comienzo en los receptores, que se encuentran activos en
FOTORRECEPTOR
HORIZONTALES
BIPOLARES
AMACRINAS
GANGLIONALES
AL NERVIO OPTICO
LUZ
-
2.1. Anatoma y fisiologa visual.
14
la oscuridad (la luz los hiperpolariza apagndolos). Entre el receptor y la clula bipolar
de centro on aparece una sinapsis inhibidora que mantiene la clula inactiva en la
oscuridad, y la luz, apagando el receptor, elimina esta inhibicin de la clula haciendo
que se liberen neurotransmisores en los terminales de la misma. Si la clula bipolar es
de centro off, la sinapsis es excitadora, la clula est activada en la oscuridad y
disminuye la liberacin de neurotransmisores cuando se somete a la luz. La periferia de
este tipo de clulas se origina a travs de la informacin que suministran las clulas
horizontales que tienen sinapsis excitadoras con las bipolares on e inhibidoras con las
off (efecto de la luz en la periferia excitador).
De las clulas amacrinas se conocen ms de 20 tipos diferentes en cuanto a su
anatoma y pueden desarrollar diversas funciones entre las que se encuentran respuestas
especficas a objetos en movimiento.
Las clulas ganglionares tienen un comportamiento similar a las bipolares y se
han identificado tambin dos clases: clulas ganglionares de centro encendido
(excitadoras u on) y clulas de centro apagado (inhibidoras u off). Las clulas
ganglionares de centro encendido se activan cuando el centro de su campo receptor se
encuentra excitado y la periferia del mismo no. En las clulas de centro apagado
suceder a la inversa. De esta manera, si las dos partes del campo receptor reciben el
tipo de estimulacin que necesitan, sus efectos se suman y se alcanza un nivel de
activacin mximo en la ganglionar, pero si el estmulo produce efectos opuestos en el
centro y en la periferia, las dos regiones compiten entre s y la clula ganglionar
correspondiente se mantiene casi inactiva. Esta interaccin es conocida como inhibicin
lateral. La inhibicin lateral es uno de los procesos ms importantes en la explicacin
de muchos fenmenos perceptivos, y en concreto, este particular funcionamiento hace
que ya en las primeras etapas de la visin se pierda prcticamente la informacin de
intensidad luminosa en niveles absolutos, a favor de una percepcin del contraste.
De la descripcin que se ha hecho hasta ahora se podra pensar que los campos
receptores forman un mosaico de pequeos crculos retinianos, pero no es as, los
campos receptores de clulas ganglionares vecinas se solapan como puede apreciarse en
la figura 2.4 b. Un fotorreceptor puede influir sobre varias clulas ganglionares estando
situado en el centro del campo receptor de algunas y en la periferia de otras. Por tanto,
-
2.1. Anatoma y fisiologa visual.
15
excitar a varias clulas a travs de sus centros si son clulas de centro encendido y a
travs de sus periferias si son clulas de centro apagado.
Figura 2.4: Campos receptores. a. Campos receptores de clula ganglionar de centro
encendido y centro apagado respectivamente. b. Campos receptores de dos clulas ganglionares vecinas.
Adems, los campos receptores difieren en tamao de una clula ganglionar a
otra. En concreto, los centros de los campos receptores son ms pequeos en la fvea y
se hacen mayores a medida que nos alejamos de ella. Esto, nuevamente, explica el
hecho de que nuestra agudeza visual, la capacidad de distinguir objetos pequeos, sea
mayor en la fvea. El tamao del campo receptor est pues relacionado con la
frecuencia espacial de forma que clulas con campos receptores grandes respondern a
bajas frecuencias espaciales y viceversa. De acuerdo con esto se puede hacer una nueva
clasificacin de las clulas ganglionares en magno (10% clulas) que son las que poseen
campos receptores grandes y parvo (90% clulas) con un campo receptor pequeo. Las
clulas magno responden al movimiento y a objetos grandes, son rpidas y de alta
sensibilidad al contraste. Las parvo son lentas y estn implicadas en la deteccin del
color y del detalle.
En conclusin, los mensajes que el ojo enva hacia el cerebro a travs del nervio
ptico tienen poco que ver con intensidad absoluta ya que las clulas ganglionares no
responden bien a cambios de luz difusa. Lo que la clula seala es el resultado de una
comparacin entre la cantidad de luz que impacta en un cierto punto de la retina con la
cantidad media de luz que ilumina su periferia inmediata. Esto permite ver el mismo
objeto en condiciones de iluminacin completamente distintas. Por ejemplo, si leemos
un peridico a plena luz del sol o en una habitacin poco iluminada lo que vemos son
letras negras sobre un fondo blanco. Sin embargo, si tuvisemos en cuenta la luz que
a b
-
2.1. Anatoma y fisiologa visual.
16
reflejan, las letras negras a plena luz reflejaran ms que el papel blanco en la
habitacin.
2.1.3. Vas visuales. Integracin de la informacin en la corteza.
La va visual de un cerebro humano es el camino que sigue la informacin visual
desde el ojo hasta que llega a la corteza visual primaria.
Figura 2.5: Vas pticas hacia la corteza visual. Las fibras que salen del ojo formando el nervio ptico llegan sin interrupcin al
quiasma ptico y a partir de ah se dirigen a distintas zonas del cerebro. La mayora de
ellas (80% aproximadamente) enva la informacin a travs del tracto ptico al ncleo
geniculado lateral, el resto es informacin para el control de funciones de movimiento
ocular y reflejo pupilar a la luz (cerebro medio, colculo superior) y tambin para
procesos de sincronizacin de ritmos biolgicos (hipotlamo).
En el quiasma ptico se cruzan los nervios pticos de forma que a cada ncleo
geniculado lateral le llega informacin procedente de ambos ojos pero que se
corresponde con la mitad del campo visual opuesta. Es decir, al ncleo geniculado
lateral derecho le llega toda la informacin visual correspondiente con el campo visual
izquierdo. El campo visual es la zona del espacio que puede ser percibida para una
posicin fija del ojo. El campo visual izquierdo se refiere a la zona del espacio a la
izquierda del punto al que estemos mirando. De esta forma, cada hemisferio cerebral se
encarga de la mitad opuesta del entorno.
-
2.1. Anatoma y fisiologa visual.
17
Cada cuerpo geniculado lateral se encuentra dividido en 6 capas y una clula de
una capa cualquiera recibe informacin de un solo ojo. As, por ejemplo, en el caso del
cuerpo geniculado lateral izquierdo la secuencia al ir de arriba hacia abajo sera:
proyeccin de la hemirretina izquierda del ojo derecho, izquierdo, derecho, izquierdo,
izquierdo y derecho.
Figura 2.6: Seccin de cuerpo geniculado lateral. Adems, como puede apreciarse en la figura 2.6, las capas se pueden dividir en
parvocelulares (dorsales) y magnocelulares (ventrales) segn el tamao de las clulas
que las forman y su respuesta al estmulo visual. Las capas se encuentran alineadas
segn la zona del campo visual o ms concretamente de la zona de la retina de la que
reciben la informacin, es decir, las conexiones estn organizadas topogrficamente.
Esta representacin topogrfica tambin se mantendr en la corteza visual primaria. As
si se produjera alguna lesin en una porcin pequea de la corteza visual se
correspondera con una ceguera en algn punto del campo visual.
La informacin visual sale de los cuerpos geniculados laterales mediante unas
bandas anchas denominadas radiaciones pticas que la encaminan hasta la corteza
visual primaria (V1). La corteza visual primaria es una capa de clulas de unos 2mm
de grosor en la parte occipital del cerebro. Contiene aproximadamente 200 millones de
clulas frente a los 1,5 del cuerpo geniculado lateral. Estas clulas fueron clasificadas
por Hubel [16] en clulas simples y complejas.
Parvocelulares
Magnocelulares
-
2.1. Anatoma y fisiologa visual.
18
Las clulas simples tienen campos receptores de tipo on y off pero con
patrones de excitacin e inhibicin como los mostrados en la figura 2.7 a. Estmulos que
cubran una mayor rea excitadora darn lugar a mayores respuestas y los que cubran
regiones excitadoras e inhibidoras a la vez producirn respuestas menores puesto que
hay una cancelacin mutua. Estas clulas poseen, adems, tres o cuatro geometras
diferentes con todas las orientaciones y posiciones dentro del campo visual posibles.
Son, por tanto, las primeras clulas que presentan sensibilidad a la orientacin.
Las clulas complejas son mucho ms numerosas que las simples, constituyendo
el 75% [16] de las clulas de la corteza visual primaria. Responden a estmulos lineales
orientados estacionarios y en movimiento (donde presentan una mayor respuesta). Una
clula compleja recibe informacin de varias simples de la misma orientacin y cuyos
campos receptores se solapan sobre el campo recetor de la clula compleja como
muestra la figura 2.7 b. Si una lnea excita una clula simple se producir una respuesta
en la compleja, si la lnea est en movimiento, la activacin sucesiva de clulas simples
hace que la respuesta en la clula compleja sea sostenida. Adems, entre un 10% y un
20% de las clulas complejas de la corteza visual primaria muestran una fuerte
selectividad direccional. En algunas clulas de la corteza aparece un efecto de
inhibicin final. Este fenmeno consiste en que la clula responde mximamente a una
lnea con una determinada longitud y hacerla mayor no aumentar la respuesta. Una
explicacin para las clulas con inhibicin final sera la aferencia de clulas complejas
excitadoras e inhibidoras sobre otras clulas complejas [16].
Figura 2.7: Campos receptores. a. Mapas tpicos de campos receptores de clulas simples. b. Posible campo receptor y diagrama de conexin de clula compleja.
Clulas simples
Clulas complejas
a b
-
2.1. Anatoma y fisiologa visual.
19
Finalmente, y por primera vez en todo el proceso de percepcin, aparecen
clulas en la corteza visual primaria que reciben aferencias de ambos ojos, es decir, hay
una convergencia binocular que permitir construir una nica imagen de la escena. En
general todas las gradaciones de dominancia ocular relativa estn presentes (desde
clulas monopolizadas por el ojo izquierdo pasando por clulas con igual influencia de
ambos ojos hasta clulas con respuesta al ojo derecho).
La corteza visual primaria se estratifica en 6 capas. Las ms densas son la 4C y
la 6 mientras que la 1 apenas contiene clulas nerviosas y est formada en su mayor
parte por axones. En la figura 2.8 se pueden observar las principales conexiones
efectuadas entre el cuerpo geniculado lateral y las distintas capas de la corteza visual
primaria, as como las conexiones entre capas y con otras regiones del cerebro.
Figura 2.8: Estructura e interconexiones en la corteza visual primaria.
Las clulas que forman la corteza visual primaria se encuentran dispuestas en
columnas verticales relacionadas con la orientacin del estmulo. Adems, se produce
tambin una agrupacin de clulas sensibles a una determinada frecuencia espacial. Se
configuran as detectores de frecuencia espacialmente orientada con las clulas del V1.
Se debe tener en cuenta que hay tambin otras capas de la corteza (desde V2 a V5) que
participan en el proceso visual realizando diversas tareas. As, por ejemplo, la zona V4
estara relacionada con el procesamiento del color.
1
2, 3
4A
4B
5
4C
6
Capas Magnocelulares
Capas Parvocelulares
Otras reas de la corteza
Estructuras profundas del cerebro
-
2.2. Propiedades de la visin.
20
En conclusin, el sistema visual humano que se ha descrito es modular y
paralelo. Se podran diferenciar bsicamente tres etapas. La primera de ellas sera la
ptica (equivalente a un enfoque), la segunda la retiniana (transduccin de la seal
luminosa en determinados impulsos elctricos) y finalmente el procesado cerebral.
2.2. Propiedades de la visin.
A continuacin se van a analizar algunos de los mecanismos ms relevantes de
la visin. Se pretende realizar una caracterizacin del SVH en cuanto a su sensibilidad y
respuesta al estmulo.
2.2.1. Adaptacin visual. Sensibilidad a la intensidad luminosa.
La magnitud del estmulo percibido por el cerebro ser mayor cuanto mayor sea
la magnitud del estmulo luminoso que se proyecta en la retina. En este apartado se
examinar cmo es esta relacin y qu rango abarca.
El rango de niveles de intensidad luminosa que se presentan en la naturaleza y a
los que el SVH se tiene que adaptar es muy amplio, alrededor de 1010. Sin embargo,
simultneamente, el SVH es capaz de discriminar slo unos pocos niveles. La
adaptacin se realiza para un nivel de intensidad luminosa Io dentro de todos los
posibles del rango. Para este Io, se pueden discriminar unos 50 valores distintos de
intensidad luminosa. Por tanto, habr un nivel por debajo del cual no se distingan otros
niveles, que se veran como negro y de igual forma suceder con la percepcin del
blanco. A medida que el ojo recorre otros niveles Io del rango total, va definiendo
niveles de negro y blanco de forma anloga.
La adaptacin proporciona la capacidad de ver en condiciones de muy distinta
iluminacin. A pesar de ello, hay que tener en cuenta que la percepcin visual va a
variar mucho dependiendo de la iluminacin con la que nos encontremos. As, como ya
se ha comentado, en condiciones de baja iluminacin se detectan muy bien las
diferencias de luminosidad, pero la distincin del color y del detalle es pobre y suceder
-
2.2. Propiedades de la visin.
21
justo al contrario en condiciones de elevada luminosidad. Adems, el proceso de
adaptacin que realiza el SVH no es instantneo y es ms costosa temporalmente la
adaptacin de luz a oscuridad.
En cuanto a la relacin entre el estmulo percibido y el valor real del mismo se
obtiene una respuesta no lineal. Para calcularla se considera una zona iluminada con una
intensidad I y otra con I+I, como muestra la figura 2.9 a. Se va a medir el valor
necesario de I para que el observador vea dos zonas diferenciadas partiendo de un I
inicial igual a cero. El valor as obtenido de I es la mnima diferencia notable (JND).
Este experimento se realiza sobre un amplio margen de intensidades (en visin fotpica,
con valores sobre 10 cd/m2) dando como resultado la curva de la figura 2.9 b. Se
observa una relacin II constante y de valor 0.02 que no depende del nivel de
intensidad en el que se trabaja.
Figura 2.9: Medida de la respuesta del SVH a cambios de intensidad.
Si nos planteamos la misma medida pero para las condiciones indicadas por la
figura 2.9 c. obtenemos curvas de respuesta que son constantes en un margen mucho
menor pero que para un valor fijado Ioi es comparable al margen dinmico de muchos
sistemas de procesado electrnico de imgenes.
a b
c d
-
2.2. Propiedades de la visin.
22
A la relacin cteII=
se le conoce como ley de Weber y se verifica tambin
para otros sentidos como el odo, el olfato, el gusto y el tacto. Este resultado es de
especial inters en el estudio de la percepcin de ruido en imgenes. Basndonos en l
podemos explicar porqu un nivel uniforme de ruido aleatorio es menos visible en las
regiones ms luminosas de la imagen. As, para que el ruido sea perceptible con un
fondo de imagen de nivel de intensidad luminosa I1 ser preciso un valor I1 y para un
I2 < I1 entonces el valor I2
-
2.2. Propiedades de la visin.
23
Figura 2.10: Fenmenos relativos al procesamiento de contraste. a. Bandas de Mach. b. Contraste simultneo.
El problema se ha resuelto en primer lugar con imgenes simples (patrones)
como por ejemplo funciones sinusoidales o discos de luminancia. Para este tipo de
imgenes se utilizan dos definiciones de contraste diferentes. Por una parte, Michelson
defini el contraste de este tipo de imgenes como:
minmax
minmax
LLLL
CMichelson +
=
donde Lmax y Lmin son los valores mximos y mnimos de luminancia. Weber propone
otra definicin para medir el contraste local de un objeto simple (blanco) sobre un fondo
uniforme:
LLCWeber
=
donde L es el incremento o decremento de la luminancia del blanco comparada con la
luminancia del fondo L.
La diferencia entre ambas definiciones es clara y se hace ms obvia si
expresamos el contraste de Michelson en la siguiente forma:
LLLCMichelson +
=
donde L = (Lmax - Lmin)/2 y L = Lmin. Estas dos medidas de contraste no coinciden a
pesar de que pueden proporcionar valores parecidos para estmulos simples de bajo
contraste y ambas definen el contraste como un radio adimensional de la variacin de
luminancia respecto a la luminancia media de fondo. Sin embargo para contrastes ms
elevados obtenemos dos medidas de contraste diferentes y lo que es ms, estas dos
-
2.2. Propiedades de la visin.
24
definiciones ni siquiera comparten el mismo rango. Mientras que el CMichelson tiene un
margen de valores entre 0 y 1 el CWeber vara entre -1 e .
Adems, se plantean otros problemas derivados del hecho de que tanto el
CMichelson como el CWeber se definen para imgenes simples y de forma global. En
imgenes ms complejas sera ms apropiada una definicin local del contraste puesto
que la luminancia (y con ella tambin el contraste) vara en toda la imagen. Por tanto,
las frmulas anteriores no sern validas para el clculo de contraste en imgenes
complejas como las que se tratan en cualquier modelo de visin. Estas medidas tampoco
tienen en cuenta que la sensibilidad al contraste del SVH es dependiente de la
frecuencia, sobre todo si nos encontramos en condiciones umbrales de visibilidad.
Para solucionar estos problemas Peli [23] propone un clculo del contraste por
bandas de frecuencia. Es un contraste local y limitado en banda que tiene en cuenta el
nivel medio de luminancia local para la obtencin de un valor en cada punto. Puesto que
el clculo del contraste se efecta por bandas es necesario disponer primero de una
versin filtrada de la imagen. Ms adelante se tendrn en cuenta las distintas
implementaciones que se pueden hacer al realizar este banco de filtros y la importancia
que pueda tener esta eleccin. El contraste en una banda frecuencial k determinada se
representa por:
( )),(),(
,jiljib
jiC kk
Peli =
donde bk(i,j) es la imagen filtrada para una determinada banda k y l(i,j) es una versin
paso bajo de la imagen que contiene toda la energa por debajo de la banda k en la que
se est realizando el clculo del contraste. Obtenemos de esta forma un valor de
contraste que no slo depende de la energa en esa banda sino tambin de la luminancia
de fondo local. La frmula as planteada no tendra en cuenta la distinta sensibilidad al
contraste del SVH dependiendo de la orientacin, por lo que se podra ampliar sin ms
que hacer un filtrado de la imagen para distintas frecuencias y orientaciones.
Otras posibles mtricas de contraste para imgenes complejas realizan una
modificacin del contraste de Michelson adaptndolo al filtrado previo de la imagen
como se muestra en la siguiente ecuacin:
-
2.2. Propiedades de la visin.
25
( )k
kkk b
bjibjiC
=
),(,
donde bk(i,j) es la imagen filtrada para una banda k y bk es la media de esa banda. El
problema que plantea esta redefinicin del contraste es que esta media es cero para
todas las bandas de frecuencia excepto para la banda base. Por ello, se deben hacer
algunas modificaciones a esta frmula. Daly [7] propone un clculo global y otro local
del contraste:
( )K
kkGlobal b
jibjiC
),(, = ( )
),(),(
,jibjib
jiCK
kkLocal
=
donde bK(i,j) es la banda base y Kb es la media de la misma.
El contraste en un pxel de una imagen determinada tambin puede calcularse en
funcin de la luminancia de los pxeles que hay en su vecindario. Esta tcnica [29]
considera los valores mximos y mnimos de luminancia en los pxeles vecinos a la
izquierda y derecha del pxel para el que se calcula el contraste. Tanto en este caso,
como en todos los anteriores, se debe tener en cuenta que la definicin que se hace del
contraste debe ser consecuente con la implementacin del modelo visual que se est
llevando a cabo as como con el objetivo que va a tener este modelado.
Finalmente, una vez expuesta la variedad de medidas de contraste de las que se
dispone, quedara por preguntarse cul de ellas tiene una mayor correspondencia con la
percepcin del contraste del SVH. Para ello se hace necesario el uso de test psicofsicos
que evalen esta relacin. Este tipo de comparativa se estudi en [24] entre las mtricas
propuestas por Michelson, King-Smith y Kulikowski ( fondofondoKK lllC /)( max = ) y una
modificacin del contraste de Peli sugerida por Lubin. Los patrones que se utilizaron
son Gabores y el resultado de los tests realizados mantiene que la frmula de Peli para
el clculo del contraste es la que mejor se adapta a los resultados subjetivos.
2.2.3. Sensibilidad en frecuencia.
El estudio de la anatoma y fisiologa del SVH ha permitido que se conozca que
la percepcin del estmulo depende de la frecuencia del mismo. Tradicionalmente una
de las caracterizaciones ms importantes que se hacen del SVH consiste en la mxima
-
2.2. Propiedades de la visin.
26
frecuencia que es capaz de detectar o diferenciar y que se denomina agudeza visual.
Este dato proporciona nicamente un lmite y es insuficiente si se quiere conocer la
variacin en la detectabilidad de un estmulo en funcin de su frecuencia espacial. Con
este objetivo se empez a medir la funcin de sensibilidad al contraste (CSF) que refleja
la sensibilidad o capacidad de deteccin del SVH a estmulos de distinta frecuencia. La
CSF fue determinada por primera vez en 1956 por Schade pero su uso no se generaliz
hasta que las tcnicas de Fourier empiezan a utilizarse en visin en los aos 70.
Puesto que lo que se pretende medir es la respuesta del SVH a distintas
frecuencias, el procedimiento de medida consistira en mantener un estmulo de
contraste constante y variarlo en frecuencia para ver como el SVH atena cada
frecuencia. Sin embargo, esto resulta imposible puesto que no podemos medir el
contraste de la imagen percibida por lo que es necesario realizar el procedimiento justo
al contrario. La medida se realiza para cada frecuencia variando el contraste del
estmulo de entrada y lo que mantenemos constante es la salida, es decir, la imagen
percibida.
Un procedimiento experimental para calcular la CSF consistira, por ejemplo, en
ir reduciendo el contraste de un estmulo sinusoidal en el que la luminancia media se
mantiene constante hasta que se alcanza el umbral (el estmulo deja de ser visible). El
inverso de este valor umbral es el valor de la sensibilidad para esa frecuencia. Al
realizar este proceso para las diferentes frecuencias obtenemos la CSF. Se pueden hacer
varias consideraciones sobre este mtodo de medida. En primer lugar, la CSF as
calculada sera vlida para estmulos simples, no para imgenes complejas. Aunque
cualquier estmulo complejo pueda ser analizado como una serie de estmulos
sinusoidales, el problema reside en que el SVH es no lineal y por ello, la respuesta
obtenida vara y no se puede calcular como una combinacin lineal. En segundo lugar,
este mtodo es de clculo de umbrales de deteccin y es vlido slo en condiciones
umbral, la forma de la CSF para condiciones por encima del umbral no se corresponde
con esta medida. Para condiciones por encima del umbral habra que llevar a cabo otro
tipo de tests, con el inconveniente de que son experimentos menos estables y de mayor
dificultad de medida, por lo que no suelen utilizarse.
Existen muchas medidas experimentales de la CSF, la mayora de ellas para
estmulos monocromticos. En [22] se dispone de un resumen de algunas de las CSFs
-
2.2. Propiedades de la visin.
27
existentes y los parmetros que se han tenido en cuenta en la medida. La forma tpica de
la CSF puede observarse en la figura 2.11 y es la de un filtro paso banda con un pico
que se sita entre los 4 y 8 ciclos/grado para niveles de iluminacin fotpicos. Se
produce una fuerte atenuacin en altas frecuencias debida a factores pticos como
imperfecciones en la crnea y cristalina, difracciones en la pupila Adems, el
muestreo espacial que realizan los fotorreceptores de la retina impone un lmite a partir
del cual no se detectan frecuencias espaciales mayores (agudeza visual). La atenuacin
que aparece en bajas frecuencias se debe a las interacciones inhibitorias de centro-
periferia que se producen en los campos receptores. La medida del valor de la CSF en
frecuencia cero es imposible para el mtodo de medida que se ha explicado con
anterioridad y segn los parmetros que se hayan escogido al realizar los experimentos
para la obtencin de la CSF se dar una frecuencia mnima a partir de la cual se empieza
a medir.
Figura 2.11: CSF del sistema visual (Campbell & Green, 1965). La forma que la CSF adopta depende de muy diversos parmetros. Por una parte
habra que considerar los parmetros del estmulo que se presenta para la medida y las
condiciones en las que esta se realiza y por otra los que son inherentes al sistema visual.
La descripcin e importancia de los mismos ha sido analizada de diversa manera en
muchos estudios [1, 22, 26] y a continuacin se enumeran brevemente comentando
cmo afectan a la CSF.
Nmero de ciclos presentes en el test: este parmetro afecta a la zona de bajas
frecuencias. Se ha comprobado que existe un nmero de ciclos crticos por debajo del
cual la visibilidad del estmulo aumenta si aumentamos el nmero de ciclos que se le
-
2.2. Propiedades de la visin.
28
presentan al observador y este efecto no depender de la frecuencia espacial. Por tanto,
puesto que el tamao del test suele ser fijo para todas las frecuencias que se miden en el
experimento el problema se plantear precisamente en bajas frecuencias donde no se
representa el suficiente nmero de ciclos para que la medida sea independiente de este
efecto. Para corregirlo se debe variar el tamao del test en bajas frecuencias para que el
nmero de periodos de la seal representada est por encima de este valor crtico, al
hacerlo se obtienen curvas de CSF con caracterstica paso bajo en lugar de paso banda.
Luminancia: influye notablemente en el aspecto de la curva. La sensibilidad
aumenta al aumentar la luminancia media, el pico de la CSF se desplaza hacia
frecuencias mayores y la agudeza visual es mayor. As, con niveles de iluminacin
bajos (menores de 10 cd/m2), la curva se acerca ms a un paso bajo con un pico de
sensibilidad en torno a 1 2 ciclos/grado y para niveles mayores de luminosidad
presenta una caracterstica paso banda con el pico alrededor de 6 ciclos/grado.
Tamao del test: si se incrementa el tamao la sensibilidad aumentar. Esto
sucede hasta que se alcanza un valor crtico a partir del cual aunque aumentemos ms el
tamao del test no se obtiene una mayor sensibilidad (considerando que hay un nmero
de ciclos suficientes para que la medida sea correcta). El tamao crtico depender de la
frecuencia [22] y se ha demostrado que no tiene efecto sobre la medida para valores de
contraste por encima de 01. Adems, la extensin espacial del estmulo dentro del rea
de medida (ocupacin total o parcial de la misma) modifica tambin la forma de la
curva [26].
Orientacin: la CSF es una funcin anistropa. La sensibilidad es mayor para
estmulos orientados horizontalmente o verticalmente que para orientaciones oblicuas
(45). Este efecto oblicuo no repercute en bajas frecuencias y se hace patente para
valores de frecuencia espacial mayores de 10 ciclos/grado tpicamente.
Excentricidad: como norma general la CSF suele determinarse para visin en la
fvea, donde la sensibilidad es mayor. A medida que aumenta la excentricidad la
sensibilidad al contraste decrece y este decrecimiento es ms rpido cuanto mayor es la
frecuencia espacial del estmulo.
Color: si calculamos la CSF para el rojo, verde y azul obtenemos tres curvas
diferenciadas y que son distintas de la CSF acromtica.
-
2.2. Propiedades de la visin.
29
Tiempo de exposicin: cuanto mayor sea el tiempo del que dispone el observador
para determinar el umbral, la sensibilidad obtenida ser mayor. Esto sucede hasta que se
alcanza un valor (unos cientos de msg) a partir del cual ya no surge este efecto.
Presentacin temporal del estmulo: para presentaciones graduales del estmulo la
CSF presenta una caracterstica ms paso banda y con un valor de pico algo mayor que
en presentaciones del estmulo abruptas
Frecuencia temporal: lleva a un concepto de CSF espacio-temporal. La CSF
espacial es mayor para frecuencias temporales medias (3 a 10 ciclos/sg) y decrece a
ambos lados.
Parmetros inherentes al observador: son la posicin de mejor enfoque del ojo, el
tamao de la pupila y la edad. Al variarlos estamos analizando sistemas diferentes y por
tanto obtendremos curvas de sensibilidad distintas.
Otro parmetro de importancia en el clculo de la CSF es la distancia de
observacin para la que se realizan las medidas, ya que esto va a fijar la frecuencia
espacial del estmulo, expresada en unidades de ciclos por grado. Si el observador se
aleja de la imagen, un periodo del estmulo va a corresponder a un ngulo visual menor
y por tanto la frecuencia espacial representada ser mayor sin que se haya modificado
en nada el estmulo presentado. Por tanto, las medidas que se toman de la CSF se hacen
para una distancia de observacin determinada.
Es necesario destacar que aunque se ha expuesto nicamente y de forma muy
sencilla un mtodo de medida de la CSF umbral, ste, por supuesto, no es el nico
mtodo de medida. Existe una gran variedad de mtodos entre los que se encuentran los
tests impresos [1], que aunque no son muy precisos tienen como ventaja su gran
sencillez. Adems, dentro de la medida de CSF umbral se pueden seguir distintos
mtodos psicofsicos. En definitiva, la eleccin de uno u otro mtodo depender de la
aplicacin en la que se vaya a utilizar la CSF y de la precisin o las caractersticas
especiales que se requieran para la misma. As, un posible uso de la CSF sera, por
ejemplo, la deteccin y seguimiento de algunas afecciones visuales que tienen un efecto
determinado en la forma de la curva, y que presenta como ventaja que es un mtodo no
invasivo y de deteccin temprana. En este caso bastara con medir la CSF para el
paciente bajo observacin. Otra posible utilizacin de la CSF, sera dentro de un
-
2.2. Propiedades de la visin.
30
modelado del SVH genrico, lo que reviste una mayor complejidad puesto que no existe
una CSF universal. Ms adelante, en la aplicacin de la CSF dentro de modelos
visuales para el anlisis de la calidad se vern algunos de los problemas que se plantean
derivados de este hecho.
2.2.4. Enmascaramiento.
El enmascaramiento es el fenmeno por el cual disminuye la visibilidad de una
seal en presencia de otra que esconde o enmascara a la primera. No se debe olvidar que
el mtodo utilizado para la obtencin de los umbrales de visibilidad trabaja con
estmulos muy simples de una sola frecuencia y sobre campos de intensidad constante.
Desde este punto de partida, el enmascaramiento es un paso ms de complejidad en el
modelado del SVH que ha sido observado y estudiado ampliamente por fisilogos y
psicofsicos.
El objetivo principal ser conocer cmo varan los umbrales de visibilidad del
estmulo cuando se encuentran en el entorno cambios espaciales y tambin temporales
de luminancia. Se dan entonces dos fenmenos de enmascaramiento claramente
diferenciados:
Enmascaramiento temporal: asociado a la reduccin visual que se produce sobre
el estmulo cuando est rodeado de cambios temporales de luminancia. El estudio de
este tipo de enmascaramiento es complicado debido a que habra que tener en cuenta las
caractersticas de movimiento del ojo, es decir, hay una dependencia con la velocidad de
movimiento retiniana. Adems, habra que considerar si el estmulo en movimiento es
seguido o no por el ojo, lo que depende del inters particular del observador, siendo esto
muy difcil de analizar.
Por otra parte, est demostrado que cuando hay un cambio de escena, la
resolucin espacial puede ser reducida drsticamente sin que se llegue a percibir
siempre que se restablezca la resolucin original en un periodo breve de tiempo (en
torno a 100 msg).
-
2.2. Propiedades de la visin.
31
Enmascaramiento espacial: est asociado a los cambios espaciales de luminancia
que se producen alrededor del estmulo. Recibe tambin el nombre de enmascaramiento
de contraste ya que el efecto del enmascaramiento ser menor en regiones uniformes
que en zonas de gran contraste. As, si se considera cualquier imagen natural a la que se
le aade un ruido aleatorio uniforme, la visibilidad del ruido en los bordes y texturas
que presenta la imagen ser menor que en zonas uniformes.
El fenmeno del enmascaramiento espacial se estudia mediante test psicofsicos
en los que se evala la influencia del contraste, de la frecuencia y de la orientacin tanto
del estmulo (enmascarado) como de la seal de fondo (mscara). Las seales utilizadas
suelen ser sinusoides y Gabores. Estos experimentos han demostrado que el umbral de
deteccin que proporcionaba la CSF va incrementando a medida que el efecto del
enmascaramiento se hace mayor, lo que ocurre cuando el contraste de la seal que
enmascara se aumenta.
El comportamiento tpico se muestra en la figura 2.12. CT representa el valor de
contraste para que el estmulo sea visible y CM el contraste de la seal que enmascara.
Para un valor pequeo de CM, el umbral de visibilidad del estmulo CT viene dado por la
CSF y se representa como C0. Este valor se mantiene hasta que se alcanza un punto en
el que CM = C0. A partir de ah un incremento en CM hace que se eleve el umbral de
deteccin, es decir, se necesitara aumentar el contraste del estmulo para que fuera
visible. La lnea discontinua de la figura ha sido observada en algunos de los
experimentos psicofsicos y proporciona una medida por debajo del valor dado por la
CSF, sin embargo, este efecto slo se observa cuando la seal y el ruido estn en fase.
Figura 2.12: Curva de umbrales de elevacin causados por enmascaramiento espacial.
C0
C0 log CM
log CT
-
2.3. Movimientos oculares y atencin visual.
32
El valor de la pendiente depende tanto de la complejidad y conocimiento del
estmulo que se tengan, como del tipo de seal utilizada para el enmascaramiento. Si se
conocen datos de la orientacin, tamao, frecuencia y localizacin del estmulo ser ms
fcil reconocerlo y por tanto la pendiente de la curva ser menor. El valor de vara
entre 06 y 1 dependiendo de que el tipo de seal utilizada para el enmascaramiento sea
una sinusoide o un ruido limitado en banda. Adems, aparece un efecto de aprendizaje.
Si a un observador se le muestra el mismo patrn de ruido repetidas veces, el valor de
decae puesto que ser capaz de reconocerlo con un valor menor de contraste.
La frecuencia espacial y la orientacin tambin influyen en el grado de
enmascaramiento, que ser mximo cuando se produzca una coincidencia entre la
frecuencia de la seal que enmascara y el estmulo enmascarado
2.3. Movimientos oculares y atencin visual.
La cantidad de informacin con la que debe tratar el SVH y que se encuentra en
el entorno visual hace que sean necesarios mecanismos selectores de informacin. As,
la atencin puede ser considerada como un conjunto de redes de reas neuronales que
llevan a cabo operaciones especficas de procesamiento de informacin. Dentro de estas
operaciones especficas se encontrara la deteccin o seleccin de objetivos dentro de la
escena, que se corresponder con determinados movimientos oculares.
Si se analiza la forma que tienen los ojos de explorar el entorno visual se van a
encontrar tres tipos de movimientos oculares, atendiendo a la funcionalidad de los
mismos:
1) Movimientos para el mantenimiento de la mirada: son aquellos que compensan
el movimiento de la cabeza o de los objetos para que permanezca la mirada fija sobre el
objeto.
2) Movimientos para el desplazamiento de la mirada: permiten pasar la atencin de
un objeto a otro. Fundamentalmente, se dan tres tipos: sacdicos, persecuciones o de
seguimiento y vergencias.
3) Movimientos de fijacin o micromovimientos: trmores, microsacdicos y
fluctuaciones.
-
2.3. Movimientos oculares y atencin visual.
33
Si se considera el proceso seguido al visualizar una imagen esttica se observa un
primer paso en el que se fija la posicin de un objeto o detalle por un breve periodo de
tiempo (100-500 msg) para, posteriormente, realizar un salto a una nueva posicin, este
salto es el que se ha denominado movimiento sacdico. Por tanto, la exploracin visual
que se hace de una escena esttica no es un movimiento continuo como cabra esperar,
sino una sucesin de saltos de un punto de inters a otro. Adems, cuando se tiene fijada
una posicin los ojos no permanecen quietos, se realizan movimientos muy pequeos y
constantes, microsacdicos. Estos micromovimientos son continuados y de direccin
aleatoria y su importancia radica en que permiten que se vean los objetos estacionarios.
De hecho si se mantuviese una imagen estable en la retina, en vez de obtener una mayor
agudeza visual (se evitara el emborronamiento asociado al movimiento de la imagen
que producen los movimientos oculares), lo que sucede es que los receptores de la retina
se saturan y la imagen desaparece.
La particular forma de ver imgenes estticas dando saltos de un punto de la
imagen a otra hace que se ponga de manifiesto la importancia que tiene el estudio de la
atencin visual. De hecho, aunque es posible prestar atencin a una parte de la escena
sin que se produzca un movimiento ocular, el caso contrario es imposible: cualquier
movimiento sacdico viene precedido por un cambio de atencin a esa posicin
concreta. As, parece poco probable que en la visualizacin de una imagen, se haga un
salto al vaco, es decir, en una sacada se fije un punto que corresponde con fondo o con
un punto que carece de cambios abruptos de luminancia.
El estudio de la atencin visual controlando los puntos de parada de la visin
resulta de gran inters y proporciona gran cantidad de informacin acerca de los objetos
y detalles que son relevantes para el observador. Los factores que influyen en la
atencin visual [26] son muchos y variados, entre ellos se pueden destacar el tamao,
color, contraste, forma, bordes, texturas y por supuesto el movimiento.
Se han descrito brevemente los movimientos oculares y su relacin con el
proceso de atencin y los factores que influyen en el mismo ya que su incorporacin a
los modelos del SVH puede resultar de gran inters en su aplicacin a mtricas de
calidad perceptible.
-
34
Evaluacin de la calidad en imgenes.
En este captulo se har un breve repaso de algunos de los modelos existentes de
medida de calidad de imagen, comentando su estructura bsica y los distintos problemas
y ventajas que llevan asociados. Es necesario, para ello, definir previamente algunos
conceptos elementales que sentarn las bases sobre las que se han construido estos
modelos de medida. Se llevar a cabo, por tanto, una primera serie de definiciones y
clasificaciones de los modelos, que despus ser desarrollada en posteriores apartados
con ms detalle. En cualquier caso, no es un anlisis en profundidad de los diferentes
modelos, sino una explicacin breve con los detalles de mayor relevancia dentro de cada
mtodo particular. Se proporciona as un marco general en el que se circunscribe este
proyecto y para una compresin ms completa de los diferentes modelos que existen en
la literatura se debe consultar la bibliografa.
Por otra parte, se pretende dar una visin general en cuanto al tipo de
distorsiones con las que van a tratar estos mtodos, haciendo especial hincapi en la
compresin de imgenes y las tcnicas de marcado de agua. Se va a explicar en qu
consisten estas tcnicas y cmo afectan a la imagen en cuanto a los artefactos que se
generan. Esto es necesario no slo porque en este proyecto se van a tratar precisamente
este tipo de imgenes, sino tambin por la relevancia que tienen estndares como JPEG
o JPEG2000 y la importancia que estn adquiriendo en mbitos diversos las marcas de
agua.
-
3.1. Calidad de imagen. Clasificacin de mtodos de medida.
35
3.1. Calidad de imagen. Clasificacin de mtodos de medida.
En primer lugar, se debe establecer una definicin de calidad de imagen. Es
imprescindible comprender lo que significa este trmino para el observador ya que la
forma de disear los modelos de medida se debe corresponder previamente con lo que
se entiende por calidad. Se define calidad como propiedad o conjunto de propiedades
inherentes a una cosa. Este concepto, llevado a imgenes, se entendera como la
capacidad que una imagen tiene de representar el objeto original, es decir, la exactitud o
parecido entre ambos. Dentro de los modelos de medida de calidad, en lugar de tener
una imagen y un objeto, la definicin se extiende a dos imgenes de las cuales una es
considerada la de referencia u original (hace las veces de objeto) y otra sobre la que se
ha efectuado alguna operacin de compresin, marcado de agua, etc. En este caso, la
medida de calidad de imagen es una medida de semejanza entre la imagen original y la
distorsionada. Por tanto, para poder evaluar la calidad de una imagen en todos los
modelos que aparecen en este captulo ser necesario disponer de la imagen original. El
desarrollo de modelos de medida de calidad en los que no exista imagen de referencia, o
slo exista parcialmente, es realmente dificultoso y est fuera del contexto de este
proyecto, aunque el sistema visual sea capaz de ello.
La definicin de calidad de imagen que se ha dado corresponde con lo que se
conoce comnmente como fidelidad de imagen y presenta tambin algunos
inconvenientes. En realidad, no est claro que la visibilidad del error est relacionada
con prdida de calidad y de hecho, algunas distorsiones que pueden ser claramente
visibles no son, a pesar de ello, molestas al observador. Por ejemplo, si se considera la
medida de calidad entre dos imgenes, una de las cuales es la multiplicacin de los
valores de luminancia de la otra imagen por un factor global, la diferencia visual entre
ambas ser obvia aunque el observador no aprecie tal diferencia como prdida de
calidad.
En segundo lugar, en cuanto a la clasificacin de los modelos de medida, se van
a diferenciar dos grupos principales: mtricas de calidad de imagen subjetivas
(utilizando observadores) y objetivas (medidas matemticas). Dentro de las objetivas se
har una nueva clasificacin atendiendo nicamente a si se incorpora o no el SVH
-
3.1. Calidad de imagen. Clasificacin de mtodos de medida.
36
descrito previamente en el captulo 2. As, la clasificacin resultante quedar como
muestra el siguiente esquema:
Los modelos de medida de error obtienen una medida de calidad sin tener en
cuenta las caractersticas especiales del SVH. Esta sera una medida objetiva, relativa a
la diferencia entre las imgenes en s y no a nuestro modo de percibir. En un segundo
grupo se incluyen aquellos que incorporan en mayor o menor medida las caractersticas
propias del SVH y denominamos a este segundo grupo modelos de medida de calidad
perceptible. Finalmente, se hace un tercer grupo de modelos hbridos de medida de
calidad, en el que se describen algunos mtodos de medida que a pesar de no incluir un
modelo de SVH tratan de obtener valores que se adecuen a la calidad que el observador
percibe explotando otras cualidades relativas a la percepcin.
Por ltimo, se van a enumerar algunas de las caractersticas o propiedades de los
modelos de calidad sobre las que se puede evaluar la bondad del mtodo seleccionado.
Entre ellas se pueden destacar las siguientes:
Velocidad: es deseable que el valor de calidad que resulta de la
utilizacin del mtodo se obtenga de forma rpida. Esto adquiere un especial inters
cuando se va a hacer uso de la medida de calidad para mejorar los procesos o
algoritmos de compresin, cuantificacin...
Coste: el computacional depende de la velocidad y de la complejidad de
los algoritmos para la obtencin de un resultado. Adems, se deben considerar otros
costes adicionales ya que para la validacin o evaluacin del mtodo es necesario llevar
a cabo test psicofsicos que tienen una serie de requisitos temporales y tambin en
cuanto a nmero y caractersticas de los observadores.
- Modelos de medida de calidad de imagen
Subjetivos
Objetivos
De error
De calidad perceptible
Hbridos
-
3.2. Modelos de calidad de imagen subjetivos.
37
Complejidad: est estrechamente ligada con la velocidad y el coste. Lo
ideal sera encontrar un mtodo lo ms sencillo posible que diese una medida de calidad
igual a la percibida. En general, resultados ms prximos a los obtenidos por un
observador se consiguen al incorporar caractersticas propias del SVH, lo que
forzosamente implica que el mtodo sea complejo.
Portabilidad: los resultados que proporciona el mtodo no deben alterarse
si se repiten las medidas en diferentes entornos o tiempos.
Precisin: referida a como representa el resultado del mtodo de medida
la percepcin de calidad que tendra el observador.
Robustez: se pretende obtener resultados vlidos sobre un amplio margen
de variacin de los parmetros asociados a la medida (tipo de imagen, tipo de
distorsin, condiciones de visibilidad, etc.), es decir, se buscan mtodos robustos.
Forma del resultado: pueden ser valores numricos (ndices de calidad) o
mapas de visibilidad del error. Segn la aplicacin a la que est destinado un mtodo de
medida ser conveniente una forma u otra y en general, lo ideal es que el mtodo pueda
proporcionar ambas salidas.
3.2. Modelos de calidad de imagen subjetivos.
Los modelos de medida subjetivos son aquellos en los que el valor de calidad es
evaluado directamente por un observador al que se le muestran las imgenes. En la
recomendacin ITU-R BT.500-10 (Methodology for the subjective assessment of the
quality of televisin pictures) [17] se regulan algunos de los test para la evaluacin
subjetiva de imgenes estticas y de video. La norma incluye criterios para la seleccin
del material de test y de los observadores, las condiciones de visibilidad, los
procedimientos de evaluacin y el anlisis de los datos. Los tres procedimientos de
evaluacin ms comunes son:
Escala de artefactos por doble estmulo (DSIS). Se muestra a los
observadores la imagen o secuencia original seguida de la distorsionada una sola vez. Se
pide a los observadores que califiquen la imagen o secuencia que presenta los artefactos
con respecto a la original dentro de una escala discreta compuesta por cinco valores:
-
3.2. Modelos de calidad de imagen subjetivos.
38
imperceptible, perceptible pero no molesto, ligeramente molesto, molesto y muy
molesto.
Doble estmulo y escala continua de calidad (DSCQS). Se muestra a los
observadores dos imgenes o secuencias, una de ellas de referencia y la otra test. El
orden en el que aparecen es aleatorio, no sabiendo el observador cual de ellas es la
referencia. Adems, el par de imgenes o secuencias se presenta varias veces antes de
que el observador emita su valoracin. sta consiste en puntuar ambas imgenes dentro
de una escala continua dividida en secciones a las que se les adjudica los calificativos:
excelente, buena, justa, pobre y mala. La escala numrica equivalente es de 0 a 100 y se
computan las diferencias dentro de cada par de imgenes evaluadas. Esta diferencia
hace que se elimine parte de la subjetividad referida a la experiencia y al contenido de la
imagen.
Estmulo simple y evaluacin de calidad continua (SSCQE). Se muestra
a los observadores un programa de entre 20 y 30 minutos de duracin que ha sido
procesado por el sistema bajo test. La referencia no se muestra y se evala la calidad
instantnea percibida de forma continua en una escala DSCQS. Esta tcnica se
introduce para evaluar imgenes en las que la calidad vara con el tiempo y depende de
la escena (compresin digital de video).
La utilizacin de uno u otro mtodo depende del problema que se pretende
evaluar. La norma muestra una tabla con algunos de los problemas ms usuales y los
test que llevaran asociados. As, el mtodo DSIS es usado para medir la robustez de un
sistema, es decir, para evaluar distorsiones visibles como pueden ser los artefactos
causados por errores de transmisin. El mtodo de DSCQS evala un sistema con
respecto a otro de referencia y funciona bien para calidades similares ya que es bastante
sensitivo a las pequeas diferencias. El SSCQE sirve, por ejemplo, para medir la
fidelidad entre dos secuencias de video distorsionadas.
Una de las principales caractersticas de estos mtodos es que son los que dan un
valor de calidad ms preciso en la actualidad puesto que ste se saca directamente de la
opinin del observador. Sin embargo, la realizacin de este tipo de test lleva asociado
diversos inconvenientes y se debe tener en cuenta que en los datos obtenidos siempre
habr un cierto grado de error. A continuacin se enumeran varios de los problemas que
plantea su utilizacin:
-
3.2. Modelos de calidad de imagen subjetivos.
39
- Suponen un coste elevado en tiempo y personas. Conseguir un conjunto de resultados aceptable puede llevar varias