Editor: José Ramón Zubizarreta Autores: Luis Bendezú ... Social Universidad Alberto Hurtado –...
Transcript of Editor: José Ramón Zubizarreta Autores: Luis Bendezú ... Social Universidad Alberto Hurtado –...
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
1
La Encuesta Panel CASEN: Metodología y Calidad de los Datos
Versión 1.0
Editor: José Ramón Zubizarreta
Autores: Luis Bendezú, Angela Denis, Carmen Luz Sánchez,
Pamela Ugalde y José Ramón Zubizarreta
Director de Proyecto: José Joaquín Prieto
Santiago de Chile, Noviembre de 2007
Observatorio SocialUniversidad Alberto Hurtado
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
2
Observatorio Social Universidad Alberto Hurtado
El Observatorio Social de la Universidad Alberto Hurtado (OSUAH) busca crear un
espacio interdisciplinario de observación, reflexión e intervención social que aporten al
desarrollo del país. En particular, busca contribuir de manera concreta al diseño de
políticas sociales que ayuden a superar la pobreza y a avanzar hacia una sociedad más
justa en todos los ámbitos.
El OSUAH a través de sus cuatro unidades –Unidad de Encuestas, Unidad de
Investigación Social Aplicada, Unidad de Desarrollo Social, y Unidad de Comunicación y
Extensión– ha levantado información cuantitativa y cualitativa de calidad, y ha
desarrollado estudios relevantes. En este quehacer el OSUAH se ha especializado en la
producción y análisis de encuestas longitudinales, las cuáles nos permiten medir cambio
de manera más rigurosa y así comprender mejor los fenómenos sociales. Entre otras, el
OSUAH ha realizado la ola 2006 de la encuesta Panel CASEN y la ola 2007 de la
encuesta Panel Sistema de Protección Chile Solidario. Recientemente le ha sido
adjudicada la realización de la nueva encuesta Panel CASEN, que se realizará año a año
con una muestra nacional de más de 7.500 hogares.
En la metodología de encuestas longitudinales el OSUAH cuenta con la asesoría de
investigadores y profesores del Institute of Social and Economic Research (ISER) de la
Universidad de Essex, Inglaterra. En el ISER está radicado el British Household Panel
Survey y, a partir de poco tiempo más, el United Kingdom Longitudinal Household Survey,
que pasará a ser la encuesta de hogares tipo panel más grande del mundo.
El desarrollo de la metodología de encuestas longitudinales en el OSUAH se enmarca en
la Unidad de Investigación Social Aplicada (UISA), cuyo Coordinador es Juan Cristóbal
Prieto ([email protected]). Las bases de datos de la Panel CASEN 1996, 2001, 2006 y su
documentación se encuentran disponibles en http://www.osuah.cl/encuestapanelcasen/
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
3
Tabla de Contenidos
1 Introducción ............................................................................................................... 5 2 Resumen del diseño de la encuesta .......................................................................... 7 3 Diseño muestral ....................................................................................................... 11
3.1 Población objetivo ............................................................................................ 11 3.2 Marco de la muestra......................................................................................... 11 3.3 Tipo de muestreo ............................................................................................. 12
3.3.1 Comunas auto-representadas................................................................... 12 3.3.2 Comunas co-representadas...................................................................... 13 3.3.3 Selección de hogares y personas ............................................................. 13
3.4 Tamaño muestral ............................................................................................. 13 3.5 Variables del diseño muestral en la base de datos........................................... 14
4 La unidad de análisis de la encuesta........................................................................ 15 5 Cuestionario............................................................................................................. 17
5.1 Hoja de Ruta .................................................................................................... 17 5.2 Módulos Temáticos .......................................................................................... 18
5.2.1 Módulo de Residentes .............................................................................. 18 5.2.2 Módulo de Educación ............................................................................... 19 5.2.3 Módulo de Empleo.................................................................................... 20 5.2.4 Módulo de Ingresos y Activos financieros ................................................. 21 5.2.5 Módulo de Salud....................................................................................... 21 5.2.6 Módulo de Historia Laboral ....................................................................... 22 5.2.7 Módulo Participación ................................................................................ 23 5.2.8 Módulo Vivienda ....................................................................................... 23
6 Recolección de los datos ......................................................................................... 24 6.1 Trabajo en Terreno........................................................................................... 24
6.1.1 Equipo de Terreno .................................................................................... 24 6.1.2 Capacitación del Equipo de Terreno......................................................... 25 6.1.3 Pretest ...................................................................................................... 26 6.1.4 Fechas del Trabajo en Terreno................................................................. 27 6.1.5 Procedimientos de terreno........................................................................ 27 6.1.6 Supervisión y control de calidad ............................................................... 28
6.2 Resultados de la etapa de terreno.................................................................... 28 7 Preparación de los datos.......................................................................................... 29
7.1 Digitación ......................................................................................................... 30 7.2 Controles de Calidad........................................................................................ 30
7.2.1 Verificación de la información de cada ola. ............................................... 30 7.2.2 Consolidación Información cada ola. ........................................................ 31 7.2.3 Verificación de la información longitudinal ................................................ 32
8 Magnitud y naturaleza de la atrición......................................................................... 34 8.1 La atrición en la muestra: análisis descriptivo................................................... 34
8.1.1 Algunas definiciones................................................................................. 34 8.1.2 Magnitud de la atrición.............................................................................. 35
8.2 Análisis multivariado......................................................................................... 37 9 Procedimientos de ajuste estadístico ....................................................................... 39
9.1 Construcción de los pesos................................................................................ 39
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
4
9.1.1 Pesos para ola 1....................................................................................... 40 9.1.2 Pesos longitudinales................................................................................. 40 9.1.3 Pesos de corte transversal ....................................................................... 43
9.2 Imputación........................................................................................................ 44 9.2.1 Imputación de ingresos por Ocupación Principal ...................................... 45 9.2.2 Imputación de ingresos por Jubilación y Rentas Vitalicias ........................ 46 9.2.3 Imputación de ingresos por Alquiler .......................................................... 47 9.2.4 Imputación de las variables Sexo, Edad y Nivel Educativo ....................... 47
9.3 Errores de medición ......................................................................................... 47 9.4 Construcción de ingresos y Ajuste por Cuentas Nacionales............................. 48
10 Errores muestrales............................................................................................... 50 11 Acceso a los datos y a su documentación............................................................ 53
11.1 Organización de la bases de datos................................................................... 53 11.2 Documentación ................................................................................................ 54
12 Confidencialidad de los datos............................................................................... 55 13 Seguridad de los datos......................................................................................... 55 Bibliografía....................................................................................................................... 57 Apéndices........................................................................................................................ 58
Tabla 1: Total de Personas Encuestadas en las Tres Olas de la Encuesta .................. 9 Tabla 2: Distribución de la Muestra Inicial (1996) por Regiones ................................. 14 Tabla 3: Distribución del Equipo de Terreno............................................................... 24 Tabla 4: Total de Personas en Cada Ola de la Encuesta ........................................... 36 Tabla 5: Atrición de la Muestra por Regiones ............................................................. 36 Tabla 2: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIª Región ........ 58 Tabla 3: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIIª Región........ 59 Tabla 4: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región........ 60 Tabla 5: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta ..... 61 Tabla 6: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta ..... 62 Tabla 7: Total de Hogares en Cada Ola de la Encuesta............................................. 64 Tabla 8: Atrición de la Muestra por Región por Zona.................................................. 64 Tabla 9: Muestra Inicial versus Estructura de la Muestra de Casos de Atrición .......... 65 Tabla 10: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región........ 67 Tabla 11: Distribución de los Pesos de la encuesta CASEN 1996................................ 69 Tabla 12: Distribución de los Pesos de la encuesta Panel CASEN, 1996..................... 69 Tabla 13: Distribución de los Pesos de la encuesta Panel CASEN, 2001..................... 69 Tabla 14: Distribución de los Pesos de la encuesta Panel CASEN, 2006..................... 70
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
5
1 Introducción
La ola 2006 de la encuesta Panel CASEN es un proyecto conjunto de la Fundación para
la Superación de la Pobreza (FSP), el Ministerio de Planificación (Mideplan) y el
Observatorio Social de la Universidad Alberto Hurtado (OSUAH). Con esta nueva
medición, el objetivo principal que persiguen las tres instituciones es llevar más allá el
entendimiento de las condiciones de vida de los hogares chilenos y, en particular, de los
problemas de la pobreza y vulnerabilidad para diseñar mejores políticas sociales.
La encuesta Panel CASEN nació en 2001 en Mideplan con el seguimiento a una muestra
representativa de los hogares de las regiones III, VII, VIII y Metropolitana, a partir de la
encuesta CASEN 1996. El aporte que supone la ola 2006 de la encuesta es grande en el
contexto de Chile y de los países menos desarrollados, por el tamaño de su muestra y por
el período de tiempo que abarca: diez años. En efecto, según Yaqub (2000) sólo 5 de 44
países de bajo desarrollo humano y 7 de los 66 países de desarrollo humano intermedio
cuentan con datos de este tipo de encuestas, y ninguna de éstas cubre un período de
este largo. Recuentos similares y más recientes como el de Lawson et al. (2003), del
Institute of Social and Economic Research en la Universidad de Essex,1 en Inglaterra, y
del Institute of Social Research en la Universidad de Michigan,2 en Estados Unidos, no
reflejan un adelanto en estas cifras.
¿Pero cuáles son las ventajas de los datos de las encuestas de hogares tipo panel por
sobre los datos de las de corte transversal? Mediante las encuestas de hogares de corte
transversal es posible obtener una "fotografía" de la población y caracterizar a los hogares
en un determinado momento del tiempo. Al repetir esta fotografía una y otra vez, podemos
determinar cambios brutos en el período y examinar las transformaciones en las
características de los hogares en el estado de interés de estudio. No obstante, esta
información no es suficiente para conocer el cambio neto ni para indagar en las causas
que llevaron a los hogares a salir de ese estado o caer en él. Las encuestas de hogares
tipo panel, en cambio, al tomar una "película" al nivel de la unidad de observación hacen
posible que abordemos estas cuestiones. Con esta información podemos analizar los 1 Keeping Track: A guide to longitudinal resources. 2 Panel Studies Around the World.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
6
factores que provocaron el cambio y obtener un enfoque dinámico de constitución de
procesos más que de caracterización de determinados grupos en un punto del tiempo.
En términos de Jenkins (2003) una encuesta de hogares tipo panel "permite describir
fenómenos que son intrínsecamente longitudinales, entender mejor procesos
socioeconómicos y comportamientos y, como resultado de esto, diseñar mejores
instrumentos de política." Las ventajas de los datos de este tipo de encuestas por sobre
las de corte transversal son varias:
− Estudiar transiciones entre estados;
− Analizar el efecto de determinadas intervenciones;
− Implementar modelos de comportamiento;
− Controlar por variables no observables;
− Controlar por efectos específicos.
No obstante, las encuestas de hogares tipo panel presentan complicaciones adicionales a
las de corte transversal. Entre ellas figura la no respuesta entre ola y ola, que puede
afectar la representatividad de la muestra. Por otra parte, procedimientos de ajustes
estadísticos como la construcción de los pesos e imputación también presentan
características especiales en las encuestas de hogares tipo panel. Dada su relevancia,
estos temas han de ser explicitados en documentos que hagan interlocutor entre las
bases de datos y el investigador. De lo contrario los datos pueden perder sentido y
resultar en una pérdida de tiempo y esfuerzo por parte del investigador, e incluso conducir
a error en el análisis.
El presente documento, “La Encuesta Panel CASEN: Metodología y Calidad de los
Datos”, forma parte de un conjunto más amplio de cinco documentos que intentan
responder a esta problemática. Aparte de éste, los otros documentos son:
− “La encuesta Panel CASEN: Cuestionarios”;
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
7
− “La encuesta Panel CASEN: Libro de Códigos”;
− “La encuesta Panel CASEN: Manual del Usuario”;
− “Análisis de la Atrición en la Muestra de la Encuesta Panel CASEN”.
Este trabajo de documentación es de vital importancia para el logro de los objetivos
planteados entre las instituciones a cargo de este estudio: proveer un mayor acceso a la
información socioeconómica en Chile y a su documentación.
Queremos destacar que este trabajo se ha visto enriquecido por los excelentes
comentarios de los profesores Stephen Jenkins y Peter Lynn del ISER de la Universidad
de Essex, y Steve Heeringa del ISR de la Universidad de Michigan. Por esto les estamos
muy agradecidos.
En el OSUAH, en particular queremos agradecer a Alina Oyarzún y Berta Teitelboim de
Mideplan, y a Leonardo Moreno y Mauricio Rosenbluth de la FSP, sin los cuales este
panel de hogares no se hubiera comenzado en 2001, y no se hubiera continuado en 2006.
Esperamos que las ventajas de las encuestas de hogares tipo panel se maximicen en el
caso de la encuesta Panel CASEN, y que su análisis contribuya al diseño de las políticas
sociales y al debate público en el país.
2 Resumen del diseño de la encuesta
Como se mencionó anteriormente, el principal objetivo de la encuesta Panel CASEN es
entender mejor las dinámicas de cambio de las condiciones de vida de los hogares
chilenos de las regiones III, VII, VIII y Metropolitana y, en particular, los problemas de
pobreza y vulnerabilidad que los aquejan. La encuesta Panel CASEN se plantea como un
instrumento multidisciplinario en el marco de las ciencias sociales, de manera que sirva al
diseño de mejores políticas sociales.
La encuesta Panel CASEN no fue concebida como tal sino hasta su segunda ola en 2001,
cuando se realizó un seguimiento a una muestra de 5.209 hogares de la encuesta CASEN
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
8
1996, de las cuatro regiones en cuestión. Para ahondar en los factores que inciden en la
reproducción y superación de la pobreza, en dicha muestra se sobre-representó a los
hogares de las comunas pobres de 1996. Esto último no implica que la muestra no sea
representativa de la población total de hogares de las cuatro regiones, sino simplemente
que es posible obtener estimaciones más precisas para las personas en hogares con
estas características en 1996.
A través de las reglas de seguimiento, niveles adecuados de respuesta entre ola y ola y la
construcción de pesos, la encuesta se ha mantenido representativa de la población de
residentes en hogares en 1996 al cabo de diez años.
Las reglas de seguimiento proveen un mecanismo para medir el cambio en la muestra y
asegurar que ésta se mantenga representativa, tanto en un sentido longitudinal como de
corte transversal, de la población objetivo en el tiempo. De esta manera, en una encuesta
de hogares tipo panel se puede proveer representación continua de la población, al
capturar cambios como los de los nacimientos, de los jóvenes que dejan el hogar de sus
padres, y divorcios.3
Para explicar en qué consisten las reglas seguimiento, es útil definir antes a los Miembros
Originales de la Muestra (MOM) como a todas las personas en los hogares de la muestra
inicial en 1996, y a los Miembros Temporales de la Muestra (MTM) como a las personas
que en las olas posteriores a las primera pasaron a residir con un MOM en 2001 y/ó 2006.
En la encuesta Panel CASEN las reglas de seguimiento consisten básicamente en
encuestar en las olas posteriores a la primera a todos los MOM –siempre y cuando fuera
dentro de las cuatro regiones de estudio– sin importar si pasaron a residir en un hogar
distinto. Por otro lado, los MTM forman parte del estudio mientras residan con un MOM,
sin seguirlos en caso de que pasen a formar un hogar distinto que no cuente con un
MOM. Esto implica que:
− Si un MOM se traslada a otro hogar con una o más personas nuevas, éstas son
tratadas como MTM y se recoge información de ellas mientras vivan con el MOM.
3 Fenómenos como la inmigración sólo no serían capturados por estas reglas de seguimiento.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
9
− Si una o más personas nuevas se trasladan a vivir con un MOM, éstas se transforman
en MTM, y se recoge información de ellas mientras vivan con el MOM.
Conforme a estas reglas, los totales de personas MOM y MTM que se encuestaron en
cada ola de la encuesta son los siguientes:
Tabla 1: Total de Personas Encuestadas en las Tres Olas de la Encuesta
20.94215.038
10.287
3.819
4.281
0
5.000
10.000
15.000
20.000
25.000
1996 2001 2006
Año
Tota
l
MOM MTM
Un total de 20.942, 18.857 y 14.568 personas fueron encuestadas en 1996, 2001 y 2006
respectivamente. Éstas corresponden a las muestras relevantes para realizar un análisis
de corte transversal de la encuesta. Ahora bien, para conducir un análisis longitudinal las
muestras a considerar son los MOM encuestados en 1996 y 2001, y 1996, 2001 y 2006.
El tamaño total de estas muestras es de 15.038 y 10.287 personas, respectivamente. Esta
disminución en el tamaño de la muestra inicial, se traduce en una atrición de un 28,2%
entre 1996 y 2001, y de un 50,9% entre 1996 y 2006. Un análisis preliminar de la atrición
en la muestra de la encuesta se presenta en la Sección 8.
Con respecto a los cuestionarios, la estructura de éstos es esencialmente la misma a lo
largo de las tres olas de la encuesta. El principal cambio que se introdujo fue en la ola
2006, con la incorporación del Módulo de Historia Laboral con preguntas retrospectivas de
los años 2001 a 2006 inclusive. Los módulos que constituyen el cuestionario son los
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
10
siguientes: Residentes; Educación; Empleo; Ingresos; Salud; Historia Laboral;
Participación; Vivienda.
La recolección de los datos se realizó mediante encuestas proxy a un miembro del hogar.
Preferentemente, este informante fue el jefe de hogar o su cónyuge y, en su defecto, un
miembro del hogar mayor de 18 años. Como se señaló anteriormente, el trabajo en
terreno de la primera ola de la encuesta, correspondió al de la encuesta CASEN 1996.
Tanto este trabajo como la segunda ola fueron realizados por la Unidad de Encuestas del
Departamento de Economía de la Universidad de Chile. El trabajo en terreno de la tercera
ola fue realizado por el Observatorio Social de la Universidad Alberto Hurtado.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
11
3 Diseño muestral
La muestra inicial de la encuesta Panel CASEN fue seleccionada de la encuesta CASEN
1996 y por lo tanto comparte diversos aspectos de su diseño muestral.
Las diferencias entre ambos diseños son esencialmente el tamaño de sus muestras y la
sobre representación de hogares pobres en la encuesta Panel CASEN. En efecto, por una
parte en la encuesta Panel CASEN no hay comunas auto-representadas, y por otra en
esta encuesta se sobre representó a los hogares pobres seleccionando una mayor
cantidad de hogares de las comunas pobres. Como se explica más adelante en la sección
9.1, esto se corrige mediante la construcción de pesos.
Ahora pasaremos revista de los aspectos fundamentales del diseño muestral.
3.1 Población objetivo
La población objetivo de la encuesta Panel CASEN son todas las personas residentes en
hogares privados de las de las regiones III, VII, VIII y Metropolitana, en múltiples
momentos del tiempo, correspondiendo éstos a las olas de recolección de los datos:
1996, 2001 y 2006.
3.2 Marco de la muestra
Al ser la muestra de la encuesta Panel CASEN una muestra aleatoria de la encuesta
CASEN 1996, se puede decir que su marco es el mismo y que corresponde a los
antecedentes del Censo de Población y Vivienda del año 1992. Este marco contempla la
división político-administrativa del país de regiones, provincias y comunas.
Adicionalmente, establece las siguientes subdivisiones al interior de las comunas:
− En las zonas urbanas se distinguen los distritos censales, que se dividen en zonas
censales, que se dividen en manzanas, que se dividen, por último, en sectores de
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
12
empadronamiento (es decir, zonas urbanas: distritos censales > zonas censales >
manzanas > sectores de empadronamiento);
− En las zonas rurales se distinguen los distritos censales, que se dividen en
localidades, que se dividen en entidades y éstas en sectores de empadronamiento (es
decir, zonas rurales: distritos censales > localidades > entidades > sectores de
empadronamiento).
El tipo de muestreo sigue esta estratificación.
3.3 Tipo de muestreo
El tipo de muestreo de la encuesta CASEN 1996 y el de la Panel CASEN es estratificado,
por conglomerados, polietápico. La selección de las unidades muestrales en la encuesta
CASEN 1996 se realizó de las siguientes maneras:
3.3.1 Comunas auto-representadas
Para auto-representar las comunas de interés, se procedió a seleccionar dentro de cada
comuna un sector de empadronamiento censal (conglomerados de viviendas) como
Unidad Primaria de Muestreo (UPM). En las zonas urbanas éstos corresponden a una
manzana o parte de ella. En las zonas rurales éstos corresponden como un conjunto de
viviendas próximas que el encuestador pueda encuestar en un día.
A continuación, dentro de la UPM seleccionada, se procedió a seleccionar como Unidad
Secundaria de Muestreo (USM) una vivienda particular ocupada en forma permanente.
Conforme a la estratificación geográfica descrita anteriormente, se trata de una selección
bietápica en que los conglomerados son, en una primera etapa, una manzana o parte de
ella, y luego una vivienda.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
13
3.3.2 Comunas co-representadas
En las comunas co-representadas, la selección se realizó en tres etapas. Primeramente,
se seleccionó como UPM la zona urbana o rural de las comunas co-representadas.
Posteriormente, dentro de cada una de las UPM seleccionadas, se seleccionó como USM
un sector de empadronamiento censal (conglomerados de viviendas), que al igual que en
las comunas auto-representadas, está definido en las zonas urbanas como una manzana
o parte de ella y en las zonas urbanas como un conjunto de viviendas próximas tal que el
encuestador pueda encuestar en un solo día. A su vez dentro de cada USM, se
seleccionó como UTM una vivienda particular ocupada en forma permanente.
3.3.3 Selección de hogares y personas
Tanto en el caso de las comunas auto-representadas como co-representadas, se
seleccionó a todos los hogares y personas residentes en la dirección. Por consiguiente,
los pesos del hogar y los de las personas son los mismos.
3.4 Tamaño muestral
Para la ola 1 se seleccionaron 5.209 hogares de la encuesta CASEN 1996. Esto se
traduce en una muestra de 20.942 personas. Recordemos que estos son Miembros
Originales de la Muestra (MOM). Según se detalla en Teitelboim (2002) este tamaño de
muestra fue determinado pensando en obtener una muestra de no menos de 4.500
hogares en la ola 2. Dado que no se contaba experiencias previas de encuestas de
hogares tipo panel, se realizó una encuesta piloto para determinar este tamaño inicial. En
las olas posteriores de la encuesta re-encuestaron a todos los MOM independientemente
del hogar en que residieran mientras lo fuera dentro de las cuatro regiones de estudio. La
distribución regional de muestra inicial a nivel de hogares y de personas se detalla en la
Tabla 2 a continuación.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
14
Tabla 2: Distribución de la Muestra Inicial (1996) por Regiones
Región Hogares PersonasIII 307 1.254VII 880 3.524VIII 1.826 7.325
Metropolitana 2.196 8.839Total 5.209 20.942
La distribución de la muestra inicial a nivel comunal por región se detalla en las Tabla 1 a
4 del Apéndice.
3.5 Variables del diseño muestral en la base de datos
Dado este carácter complejo del diseño muestral se hacen relevantes las variables que
reflejan este diseño: pesos, estratos y conglomerados. Los estratos y conglomerados del
diseño corresponden a los heredados de la encuesta CASEN 1996, es decir, los estratos
corresponden a las zonas urbanas y rurales de las comunas autorrepresentadas y
correpresentadas según corresponda, y los conglomerados corresponden a los
segmentos de dicho diseño muestral. Un análisis correcto de los datos utiliza estas
variables en las estimaciones. Si bien el uso de los pesos basta para obtener los
estimadores, el cálculo correcto de las desviaciones estándar necesita las variables
estrato y conglomerado. Los softwares estadísticos son capaces de manejar estas
variables al hacer los cálculos correspondientes. Por ello la base de datos incluye las
variables del diseño muestral complejo.
Sin embargo, en el análisis de sub-poblaciones es posible que no se cumpla el requisito
de tener al menos dos conglomerados por estrato, de modo de poder estimar la varianza
de los estimadores. En este caso, una alternativa posible es colapsar y combinar estratos
de modo de poder hacer el cálculo correspondiente, aunque a costa de una
sobreestimación de la varianza. Si bien las últimas versiones de los softwares permiten
manejar estos casos con otros métodos, por simplicidad para el analista se incluye en la
base de datos una segunda variable de estratos, que corresponde a los estratos
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
15
originales colapsados en 8 estratos (cruce de las 4 regiones de estudio por zona urbano –
rural).
La construcción de pesos y su uso en el análisis se comenta más adelante.
4 La unidad de análisis de la encuesta
Las ventajas de los datos longitudinales por sobre los de corte transversal son conocidas
y se pueden resumir en lo siguiente: medir cambio rigurosamente. No obstante, esta
misma rigurosidad exige entender bien el concepto de hogar en el tiempo. A diferencia de
los individuos, los hogares pueden cambiar de "forma" y surge la pregunta de hasta que
punto un hogar es comparable a otro hogar en dos momentos distintos. Se tiene que la
definición de hogar es lo suficientemente precisa para un punto del tiempo, pero no a lo
largo de él.
En efecto, en el tiempo los hogares pueden cambiar de composición al ganar o perder
miembros, al dividirse o, en el sentido contrario, al dos o más hogares pasar formar uno
sólo. El definir un hogar longitudinal, por ejemplo, hogar longitudinal = hogar que se
mantiene con los mismos miembros que en las olas anteriores, se dejaría fuera un
número importante de casos y de información relevante. Para este ejemplo, la encuesta
Panel CASEN o cualquier otro panel de hogares, pasaría a ser representativo de "los
hogares de 1996 de las regiones III, VI, VII y Metropolitana que en 2001 y 2006 no
cambiaron en absoluto de composición". Esto, sin lugar a dudas restringe mucho el
análisis.
Por otra parte, en el estudio del cambio de variables socioeconómicas de interés, como el
ingreso, definir un hogar longitudinal es todavía menos recomendable si consideramos
que los cambios en los ingresos de los hogares obedecen en una medida a cambios en
los ingresos del trabajo y en otra a cambios demográficos en el hogar. Según Duncan
(1984) una comprensión de la dinámica del bienestar de los hogares depende de la
comprensión de las dinámicas de las personas que componen el hogar.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
16
Al ser los hogares un concepto ambiguo en el tiempo, pero el nivel socioeconómico de
ellos no, la persona es recomendable como unidad de análisis pues no cambia y puede
ser asociada al bienestar socioeconómico de un hogar en el tiempo. Por estas razones se
acostumbra a tomar el individuo como la unidad de análisis y el hogar como una unidad
de medición. Con el individuo como unidad de análisis, los cambios en la composición del
hogar se convierten en variables explicativas en modelos de cambio en el bienestar
socioeconómico de hogares que son observados para esos individuos. Esto es lo que se
sugiere para el análisis de la encuesta Panel CASEN.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
17
5 Cuestionario
Para no perder comparabilidad, el cuestionario de la encuesta Panel CASEN en la ola
2006 fue similar en estructura al cuestionario de las olas 1996 y 2001. El principal cambio
que se introdujo fue la incorporación del Módulo de Historia Laboral, con preguntas
retrospectivas de los años 2001 a 2006 inclusive. Para su incorporación, se eliminó un
número mínimo de preguntas del Módulo de Salud que registraban un bajo rendimiento en
las olas anteriores. Por otro lado, siguiendo las modificaciones en la encuesta CASEN, el
módulo de ingresos también cambió en la tercera ola. Es importante que el investigador
considere que el orden de las preguntas y las alternativas pueden ser distintas al
momento de realizar el análisis.
El cuestionario de la encuesta Panel CASEN se puede dividir adecuadamente en dos
partes: la Hoja de Ruta y los Módulos Temáticos, cuyo contenido describimos a
continuación.
5.1 Hoja de Ruta
La Hoja de Ruta del cuestionario tiene una extensión de dos páginas, y contiene la
información necesaria para ubicar a los MOM e identificarlos correctamente. Para esto, en
una primera parte de la Hoja de Ruta, se encuentra el Nombre, Dirección y Teléfono de
los MOM, y el protocolo para comenzar la encuesta. En una segunda parte de ésta, se
encuentra la información de los MOM y la de las personas con las que vivían en 2001:
Nombre, Relación con el Jefe de Hogar en noviembre de 2001, Sexo, Edad, Núcleo
Familiar, Relación con el Jefe de Núcleo, Estado Civil. Cualquier persona que se haya
incorporado al hogar o el cambio de domicilio de un MOM se registra a continuación,
explicitando los detalles de la incorporación o cambio de domicilio.
Algunos datos de la Hoja de Ruta se transcriben en la Carátula del cuestionario con los
Módulos Temáticos, junto a la Fecha, Hora y Resultado de la entrevista, y el nombre del
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
18
Encuestador.4 Dada la importancia crucial de la información de la Hoja de Ruta para
consolidar la información de las personas en las tres olas, nuestros encuestadores
completaron su información con especial cuidado.
5.2 Módulos Temáticos
La parte de los Módulos Temáticos corresponde al grueso del formulario, en que se
recoge información de tópicos diversos acerca del hogar. Específicamente, el instrumento
de la ola 2006 consta de ocho módulos, según se indica a continuación:
i. Residentes;
ii. Educación;
iii. Empleo;
iv. Ingresos;
v. Salud;
vi. Historia Laboral;
vii. Participación;
viii. Vivienda.
Los objetivos y la duración de cada uno de estos módulos se explicitan a continuación
junto a algunas observaciones relevantes.
5.2.1 Módulo de Residentes
4 En las etapas posteriores de Supervisión, Digitación y Validación de la encuesta, la Carátula se completa con los nombres del Supervisor, Digitador y Codificador, además de los requerimientos de Encuesta Completa, Flujo lógico, Letra Legible e Entrevistado Idóneo.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
19
Objetivos:
− Conocer los cambios en la estructura del hogar;
− Conocer los cambios en la tipología del hogar;
− Indagar en los motivos por cuales se integran nuevos miembros a un hogar;
− Conocer los cambios en el ciclo de vida del hogar;
− Indagar sobre la situación de los hogares en que vivieron los entrevistados durante su
niñez, con el fin de medir su influencia sobre la actual situación socioeconómica que
enfrentan;
− Conocer los cambios en el patrimonio del hogar.
El tiempo promedio de aplicación de este módulo es de aproximadamente 5 minutos.
5.2.2 Módulo de Educación
Objetivos:
− Conocer los principales cambios en los niveles de escolaridad de cada miembro del
hogar;
− Indagar en las trayectorias educativas de los miembros del hogar, considerando la
asistencia a un establecimiento educacional y el nivel educacional alcanzado;
− Indagar en los motivos de no asistencia y expectativas dada esa situación;
− Indagar sobre los cambios que se producen en el acceso a educación y el tipo de
establecimiento al cual se asiste;
− Indagar sobre la relación existente entre el nivel de escolaridad de los padres del jefe
de núcleo y su cónyuge o pareja y el nivel de escolaridad alcanzado por ellos;
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
20
− Indagar sobre la relación existente entre el nivel de escolaridad del jefe de núcleo y su
pareja y sus expectativas acerca del nivel educacional que lograrán sus hijos.
El módulo educación tiene una duración promedio de aplicación de 6 minutos
aproximadamente.
5.2.3 Módulo de Empleo
Objetivos:
− Tasa de participación;
− Número de personas en edad activa por hogar;
− Cantidad de perceptores de ingresos por hogar;
− Tasa de dependencia;
− Número de ocupados por hogar;
− Tasa de desocupación;
− Número de desocupados por hogar;
− Proporción de ocupados en categorías ocupacionales;
− Proporción de los ocupados según grupos ocupacionales;
− Proporción de los ocupados en cada rama de la actividad económica;
− Proporción de ocupados cotizando en sistema previsional;
− Proporción de asalariados con contrato escrito de trabajo;
− Proporción de ocupados en pequeñas empresas;
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
21
− Estudiar el cambio de la situación laboral de la población en el periodo 1996-2006.
Este módulo tiene un tiempo promedio de aplicación de 8 minutos aproximadamente.
5.2.4 Módulo de Ingresos y Activos financieros
Objetivos:
− Conocer la estructura de ingreso de los hogares;
− Ingresos de los asalariados (trabajadores dependientes en ocupación principal);
− Ingresos de empleadores y trabajadores por cuenta propia o independientes;
− Otros ingresos de origen privado;
− Previsión;
− Transferencias del estado;
− Indagar en la percepción de la situación económica de las personas durante el periodo
2001-2006 y para los próximos tres años;
− Conocer la red social a la que acuden las personas frente a un problema económico.
Este módulo se realizó en un tiempo promedio de 12 minutos aproximadamente.
5.2.5 Módulo de Salud
Objetivos:
− Conocer la red social a la que acude y acudiría frente a un problema de salud que
demande gran cantidad de recursos;
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
22
− Estimar gasto de las personas ante enfermedades de alto costo (catastróficas);
− Estimar impacto sobre la capacidad de trabajar;
− Captar la percepción de los encuestados sobre su estado de salud.
Como se señaló anteriormente, el Módulo de Salud fue acortado en 2006. En parte por
esto es que su tiempo de aplicación promedio asciende a 3 minutos.
5.2.6 Módulo de Historia Laboral
Objetivos:
− Identificar la trayectoria laboral del Jefe de hogar y del Primer o Segundo Perceptor de
ingresos;
− Estudiar el cambio de la situación laboral y ocupacional del jefe de hogar y primer ó
segundo perceptor de ingresos en el periodo 2001 – 2006, e identificar ciertos
determinantes laborales de los cambios en la situación de pobreza;
− Analizar los cambios de situación laboral y cómo estos se relacionan con otro tipo de
crisis (hitos familiares, económicos, de salud);
− Analizar la cantidad y duración de periodos de cesantía;
− Analizar cambios de función (movilidad) dentro de una misma ocupación.
Este módulo se aplica al jefe de hogar, y al primer o segundo perceptor de ingresos. Esto
quiere decir que se recolectó la información, en primer lugar, del jefe de hogar, y luego, si
éste era además el primer perceptor de ingresos, se encuestó también al segundo
perceptor, y en los casos (menos comunes) en que el jefe de hogar no fuese el primer
perceptor de ingresos, se identificó al primer perceptor y se le encuestó.
Este módulo tiene una duración promedio de aplicación de 12 minutos aproximadamente.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
23
5.2.7 Módulo Participación
Objetivos:
− Indagar en la participación formal (pertenencia) e informal del Jefe de hogar en
organizaciones públicas y privadas;
− Indagar en las motivaciones de la participación.
El módulo participación se aplica únicamente al jefe de hogar, y consta de 4 preguntas,
por lo que el tiempo promedio de aplicación es de aproximadamente 2 minutos.
5.2.8 Módulo Vivienda
Objetivos:
− Caracterizar el allegamiento funcional;
− Conocer los cambios en la habitabilidad de las viviendas;
− Conocer la capacidad de los hogares de los diferentes estratos socioeconómicos para
mejorar la habitabilidad de sus viviendas;
− Indagar sobre la percepción del entorno de su barrio o localidad.
En el caso de las preguntas que indagan acerca de los aspectos de la vivienda que ocupa
el hogar, el encuestador hace las preguntas al jefe de hogar, y el tiempo de aplicación
promedio alcanza los 4 minutos.
El tiempo total de aplicación del cuestionario de la encuesta Panel CASEN en la ola 2006
fue de aproximadamente 52 minutos.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
24
6 Recolección de los datos
Al igual que en las olas anteriores de la encuesta, en la tercera ola la recolección de los
datos se realizó mediante encuestas proxy. Esto quiere que un sólo miembro del hogar
fue encuestado entregando éste información de todo el hogar. En la medida de lo posible,
este informante fue el jefe de hogar o su cónyuge, y en su defecto lo fue un miembro
mayor de 18 años.
6.1 Trabajo en Terreno
El trabajo en terreno de la encuesta se desarrolló en las regiones Tercera, Séptima,
Octava y Metropolitana. A continuación se describen los principales aspectos del trabajo
en terreno.
6.1.1 Equipo de Terreno
El equipo de terreno está compuesto por Jefes Regionales, Jefes de Grupo,
Encuestadores y Supervisores. La siguiente tabla describe la distribución del equipo de
terreno en las diferentes regiones.
Tabla 3: Distribución del Equipo de Terreno
Región Sede Jefe Regional Jefes de Grupo Encuestadores SupervisoresIII Copiapó 1 - 7 1VII Talca 1 1 12 1VII Linares - 1 12 1VIII Chillan 1 1 13 1VIII Los Ángeles - 1 7 1VIII Concepción - 1 22 3XIII Santiago 1 2 36 4
Total 4 7 109 12
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
25
Todo el equipo de Jefes Regionales y Jefes de Grupo contaba con una vasta experiencia
en trabajo terreno en encuestas sociales.
La primera selección de Encuestadores se realizó a partir de su inscripción en la página
web del OSUAH: http://www.osuah.cl/inscripcion_encuestadores.php. En esta selección
se dio preferencia a aquéllos que contaban con más experiencia en encuestas de hogares
similares a la implementada.
6.1.2 Capacitación del Equipo de Terreno
La capacitación de los Jefes Regionales y Jefes de Grupo se realizó en Santiago, durante
dos días en jornadas de ocho horas diarias.
Una vez terminada esta capacitación, donde se revisaron y aclararon todas las dudas de
los diferentes módulos, se fijaron las fechas de capacitación de los encuestadores en las
cuatro regiones de estudio. Estas capacitaciones quedaron a cargo de cada Jefe Regional
en las diferentes sedes, y se realizaron también durante dos días en jornadas de ocho
horas cada una. En regiones se contó con la asistencia de personal del equipo de planta
del OSUAH, que viajó a prestar colaboración y supervisar que los instructivos fueran
dados de acuerdo a los parámetros establecidos.
Específicamente las capacitaciones se realizaron en las siguientes fechas:
− Región Metropolitana: 30, 31 de Octubre y 1 de Noviembre de 2006.
− III Región: 30, 31 de Octubre y 1 de Noviembre de 2006.
− VII Región: 27, 28 y 29 de Octubre de 2006.
− VIII Región: 30, 31 de Octubre y 1 de Noviembre de 2006.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
26
6.1.3 Pretest
En Septiembre de 2006 se realizó el Pre-Test de 100 casos en Región Metropolitana (70
urbanos y 30 rurales) con la participación de 8 encuestadores.
La fase de desarrollo del Pre Test es la etapa más importante previa a la aplicación del
instrumento final de recolección de información. Para la Encuesta Panel 2006, el objetivo
del Pre Test fue probar el cuestionario en términos de diseño, contenido y aplicación, lo
que se realizó a partir del trabajo en terreno (encuestaje), la Hoja de Reporte, un Focus
Group con encuestadores y análisis de frecuencias y cruces de variables de interés.
Todos los elementos señalados en el objetivo intentan evaluar el diseño y contenido del
instrumento de medición, para luego reparar los errores o dificultades encontradas,
logrando aplicar, en la etapa de terreno final, un cuestionario limpio y depurado, que
permitiera entregar resultados exentos de, en la mayor medida posible, errores de
medición producto del cuestionario.
El objetivo recién planteado se desarrolló a partir de los siguientes objetivos específicos:
− Identificar posibles dificultades de acceso a las viviendas y entrevistados, generando
sugerencias para facilitar este proceso
− Estimar la duración promedio de la aplicación del cuestionario
− Evaluar la actitud, nivel de concentración y retención de los entrevistados al responder
− Identificar las posibles dificultades de comprensión que puedan presentar algunas
preguntas, conceptos o categorías de respuesta para los entrevistados y formular
recomendaciones de reemplazo y/o modificaciones
− Identificar problemas relativos al diseño y diagramación del cuestionario, y realizar
propuestas de reemplazo y/o modificaciones
− Testear aspectos operativos del trabajo en terreno.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
27
6.1.4 Fechas del Trabajo en Terreno
El levantamiento de datos se dividió en 2 etapas: la primera se llevó a cabo desde el 4
Noviembre de 2006 hasta el 30 Diciembre del mismo año, y la segunda etapa se realizó
entre el 18 de Enero y el 10 de Febrero de 2007. En esta segunda etapa del trabajo en
terreno se alcanzaron los niveles de respuesta proyectados.
6.1.5 Procedimientos de terreno
Dado el carácter longitudinal de la encuesta, se procedió a buscar los hogares
efectivamente encuestados en 2001, para lo cuál el encuestador visitó la dirección
disponible del hogar.
Siempre que el hogar mantenía la dirección original se visitaba hasta que se conseguía la
encuesta, en algunos casos se visitó hasta en 4 oportunidades una dirección para lograr
la entrevista, sin embargo hubo otros casos en que después de reiteradas visitas no se
pudo lograr la entrevista pues nunca se encontró a los moradores.
En las viviendas donde se crearon hogares nuevos si estos residían en la misma dirección
se procedía a encuestarlos inmediatamente, si se habían ido a una nueva dirección se
preguntaba en la dirección original el paradero o nueva dirección de este hogar para ir a
realizarle la encuesta, siempre y cuando la nueva dirección se encontrara en la misma
región.
Como estrategia de recuperar datos de hogares (originales o nuevos) que ya no residían
en la dirección del año 2001 se preguntaba a los actuales moradores o vecinos si alguien
conocía la nueva dirección de este hogar. De no obtener información, en algunos casos,
con el nombre del Jefe de hogar se trataba de ubicar en las guías de teléfonos el número,
para poder concertar una entrevista. Si ya agotando estos procedimientos no se podía
obtener información de la nueva dirección del hogar el encuestador informaba a su jefe de
grupo y este procedía a registrar la encuesta como no lograda.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
28
Las encuestas se pagaron a $ 3.800 en la primera etapa y a $ 4.000 en la segunda y
además, como incentivo extraordinario en la primera etapa, cada 5 encuestas se dio un
bono de $ 1.000. En la segunda etapa este bono se incrementó a $ 2.000 por cada 5
encuestas, como método para incentivar a los encuestadores y obtener una tasa mayor
de logro.
6.1.6 Supervisión y control de calidad
El procedimiento de supervisión consiste en la revisión de una parte de las encuestas
aplicadas por cada encuestador. Para esto el Jefe de grupo entrega al supervisor una lista
de direcciones a controlar. Éste, una vez en terreno, aplica un cuestionario reducido en la
dirección que le fue entregada, el cual consiste en sólo algunas preguntas de cada
módulo. Terminado el control hace entrega en la oficina de su trabajo y el Jefe de Grupo
procede a comparar los datos de la encuesta con los del control.
Los controles en la primera etapa se realizaron desde el 11 de Noviembre al 31 de
Diciembre, y en la segunda etapa entre el 20 de Enero y el 12 de Febrero del 2007.
Los resultados de las supervisiones no arrojaron grandes diferencias ni falseos de
encuesta, demostrando así la buena calidad de los encuestadores y el compromiso con
este estudio.
6.2 Resultados de la etapa de terreno
Para informar sobre el avance del trabajo de terreno se confeccionó una página Web
donde los jefes regionales informaban día a día el avance de las encuestas logradas y no
logradas, ingresando un código de resultado de las visitas a cada dirección.
El porcentaje de logro de entrevistas fue alrededor de un 73% de la muestra, que
corresponde a los hogares efectivamente encuestados el año 2001, de acuerdo a las
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
29
reglas de seguimiento utilizadas. Por otro lado la tasa de nacimiento de nuevos hogares
fue de un 10% aproximadamente.
Entre las razones más frecuentes de no logro de encuestas, está que el hogar cambió de
residencia a un lugar desconocido, o que cambió a una región o comuna que no entraba
en la muestra; hay que recordar que se visitó los hogares panel después de 5 años por lo
que el porcentaje de pérdida de entrevistas está de acuerdo a rangos más o menos
predecibles. Además un 4% de la muestra no tenía las direcciones completas, y un poco
más de un 2% de los hogares fueron contactados pero no accedieron a contestar la
encuesta.
Otro problema para ubicar las direcciones, sobre todo en las zonas rurales, fue no contar
con cartografía adecuada de ubicación de las viviendas, sólo disponíamos de croquis de
la encuesta de 2001, los que en algunos casos no eran de mucha ayuda. En algunas
encuestas rurales se ubicó la dirección preguntando en la localidad a encuestar por los
nombres de los habitantes del hogar.
7 Preparación de los datos
Es el conjunto de tareas que se realizaron con posterioridad al término del trabajo de
campo, el objetivo principal de esta actividad consiste en asegurar la disponibilidad de
toda la información consignada en los formularios de encuesta y que dicha información
cumpla con las reglas de completitud y relaciones de consistencia que se establecen
durante la ejecución de esta actividad.
El producto de esta actividad está constituido por un archivo magnético con la información
de las encuestas realizadas.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
30
7.1 Digitación
Para llevar a cabo este proceso se contó con personas de experiencia demostrable, que
se han desempeñado satisfactoriamente en estudios similares tales como CASEN y
versiones anteriores de esta encuesta.
En cuanto a la infraestructura computacional, se contó con computadores personales para
llevar a cabo esta tarea, conectados en red y un computador de características
superiores, que cumple la función de servidor, y en el cual se almacenó la información
digitada en un Motor de Base de Datos.
Además se seleccionó en forma aleatoria un 10% de las encuestas para la realización del
proceso de Re-Digitación, posteriormente se realizó un contraste con la información
digitada en ambas oportunidades y se confeccionó un informe, con el propósito de
conocer la calidad de la labor desempeñada por los digitadores(as).
7.2 Controles de Calidad
Se realizaron todas las tareas de procesamiento de información necesarias con el
propósito de disponer finalmente de información de calidad y paralelamente disponer, en
cualquier instante del período de ejecución del estudio, de información acerca del estado
de avance de cada proceso.
7.2.1 Verificación de la información de cada ola.
Esta tarea consiste en un proceso de contraste entre los formularios de encuesta
recolectados desde terreno, la información consignada en la Base de Datos y lo
efectivamente digitado.
Para la verificación de la información, se debió realizar previamente dos sub-tareas, a
saber, la primera, fue generar un documento que describiera un conjunto de relaciones
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
31
entre las variables de la encuesta que se deben cumplir, y construir con estas relaciones
lo que normalmente se denomina la Malla de Validación.
El programa de validación no es más que el mismo programa de ingreso de la información
que se potencia incorporando el módulo de validación, por lo tanto las funcionalidades
disponibles para el Digitador(a) estuvieron del mismo modo disponibles para el
Validador(a).
Su funcionamiento consiste en la revisión secuencial de cada una de las encuestas antes
digitadas, para las cuales se realiza inicialmente un chequeo de rango o recorrido de
todas las variables y en caso que alguna no cumpla con lo establecido se alerta al
validador, normalmente se indica marcando con un color diferente (rojo) los recuadros de
ingreso de las variables cuestionadas. Una vez contrastada y corregida la respuesta con
lo que indica el formulario de encuesta se procede a ejecutar idéntico proceso.
En el momento en que la encuesta no indica la presencia de errores de rango se procede
automáticamente con la revisión del cumplimiento de las relaciones especificadas en la
Malla de Validación, este proceso normalmente se denomina chequeo de consistencias y
su funcionamiento es similar al anterior. En este caso se genera una lista con todas las
relaciones que no se cumplen, el Validador contrasta la información digitada con la que
está en el formulario de encuesta, corrige en caso que corresponda y procede a ejecutar
nuevamente el mismo proceso, hasta que la encuesta sea aprobada.
7.2.2 Consolidación Información cada ola.
La consolidación de la información para las 2 primeras olas se llevó a cabo por el Centro
de Microdatos de la Universidad de Chile. Sólo la consolidación de las olas 1996, y 2001
con la del 2006 se llevó a cabo por el OSUAH.
El procedimiento consta de 2 partes: primero se identifican los hogares y luego se
identifican individuos.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
32
Para identificar los hogares de las 3 olas se genera un identificador por hogar. En este
procedimiento la unidad de análisis es la encuesta. Mediante ésta se crea la variable que
identifica tanto hogares antiguos (que aparecen en las encuestas anteriores), como los
nuevos (hogares que se formaron a partir de los hogares de olas anteriores). Una vez que
se tiene el identificador del hogar, constituido por un conjunto de variables que
permanecen constantes en el tiempo, se procede a parear la información de las dos
primeras olas con la del '06. Debe quedar claro que éste es un paso intermedio, ya que se
tiene la información pareada por hogares, pero no a nivel de individuos.
La segunda parte busca compaginar la información a nivel individual. Para lograr el
matching perfecto entre los individuos del hogar, se procede a parear la información de
acuerdo a 3 variables de control: nombre, sexo y edad. Para las 2 primeras variables se
busca encontrar una coincidencia exacta entre las 3 olas. El control por edad se realiza
buscando una consistencia en el tiempo, en otras palabras, se busca que la edad vaya
aumentando en el tiempo tomando la primera ola como punto referencial.
Una vez que se cuenta con la información consolidada para las 3 olas se procede al
análisis longitudinal.
7.2.3 Verificación de la información longitudinal
En el proceso de verificación de la información longitudinal se busca corroborar la
existencia de consistencia en el tiempo entre los datos consolidados como también indicar
y corregir errores cuando estos existan.
El procedimiento comienza con la revisión de las partidas de preguntas que exigen una
coherencia en el tiempo (edad, sexo, escolaridad, entre otras). El análisis se limita sólo a
variables que objetivamente no pueden mostrar un cambio sustancial entre diferentes
olas. Por lo tanto se realizan 2 tipos de análisis: primero se abordan variables que no
deben cambiar en el tiempo (sexo) y luego se revisan las qué sólo pueden cambiar dentro
de un rango admisible (edad, escolaridad, entre otras). El criterio para definir el rango
admisible de variación se define en base al tiempo transcurrido entre olas y la variable en
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
33
análisis. Por ejemplo, el rango admisible para la variación de la edad entre olas
adyacentes es de 4 a 6 años y el de escolaridad es de 0 a 7 años.
Una vez identificados los errores se procederá a la creación de banderas (variables
dummy) que le indicarán al investigador donde está presente el error (en que individuo) y
en qué pregunta (por ejemplo, edad). Además para cada variable que se analizó se creó
una nueva variable corregida que presenta la consistencia longitudinal deseada. El criterio
de corrección se hizo en base a las olas restantes. Si una ola presenta error, se corrige
mediante la consistencia que existe entre las olas restantes. Los casos que presenten
incoherencia en las 3 olas se les asigna missing. Debe quedar claro que no se están
corrigiendo los datos de la base original, si no que se crea una nueva variable que
presenta la consistencia longitudinal deseada.
Los resultados de este procedimiento son: el grado de error en la obtención de la
información longitudinal entre una ola y otra, banderas que señalicen inconsistencia
temporal en los datos del individuo y por último la creación de una nueva variable
corregida que presenta consistencia temporal.
Sin embargo, cabe destacar que las fuentes del error pueden ser diversas y están fuera
del análisis de este proceso.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
34
8 Magnitud y naturaleza de la atrición
La atrición en encuestas longitudinales se refiere a la no respuesta, en las olas
posteriores a la primera, de los Miembros Originales de la Muestra (MOM). Desde el
punto de vista del análisis de los datos, la atrición presenta dos problemas: por una parte,
el menor número de observaciones disminuye la eficiencia de los estimadores y, por otra,
si las características de los MOM que no vuelven a ser encuestados difieren
sistemáticamente de las características de los que sí vuelven a serlo, entonces la atrición
es selectiva y las estimaciones pueden resultar además sesgadas. Por este segundo
problema en particular es que la atrición debe ser analizada en todo tipo de encuesta
longitudinal.
En esta primera versión de del documento “La Encuesta Panel CASEN: Metodología y
Calidad de los Datos”, no se pretende abordar de manera exhaustiva el problema de la
atrición. Tal es el objetivo de otro documento que se presentará en compañía a este,
titulado “Análisis de la Atrición en la Encuesta Panel CASEN”. Las conclusiones de este
último documento se incluirán en una segunda versión de este documento.
El resto de la sección se organiza en dos partes: en la primera se presenta un análisis
descriptivo de la atrición en la muestra, y en la segunda se aísla el efecto de cada una de
las variables mediante un análisis multivariado.
8.1 La atrición en la muestra: análisis descriptivo
8.1.1 Algunas definiciones
Antes de comenzar el análisis, cabe precisar bien qué es lo que entenderemos por
atrición, ya que existen distintas maneras de definirla en encuestas longitudinales. En la
tercera ola de la encuesta Panel CASEN se podría haber intentado encuestar a todos los
MOM sin importar si hubieran respondido o no en la segunda ola. Sin embargo, el
intervalo de cinco años entre mediciones y que no se mantuviera contacto alguno con los
MOM durante él, hacía muy poco probable que se justificara la implementación de esa
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
35
política de encuestaje. Por esta razón, la atrición se definió como la no respuesta en una
sola ola (wave non-response).
El análisis de la atrición en este tipo de encuestas se puede realizar de múltiples maneras,
incluyendo comparaciones con fuentes externas como el Censo o encuestas de gran
escala. Otra alternativa es comparar las características de la muestra total de los MOM en
la ola inicial, con las características, también medidas en la ola inicial de la muestra de los
MOM que pasaron a ser casos de atrición. De manera similar a Lynn (2006), en el análisis
de la atrición de la encuesta Panel CASEN optamos por lo último por las siguientes
razones:
− Se aísla el efecto de la atrición. De otra manera otros factores como los errores
muestrales, de cobertura y de medición podrían estar interviniendo, al tratarse de
encuestas con metodologías considerablemente distintas.
− Existe una mayor cantidad de datos disponibles para realizar comparaciones. En
efecto, de otro modo cabe la duda de qué tan comparables son los datos debido a
efectos del cuestionario, del encuestador y de la organización a cargo de la encuesta,
lo que se manifiesta en sus protocolos para velar por la calidad de los datos.
8.1.2 Magnitud de la atrición
En la Tabla 4 a continuación se presenta el total de personas encuestadas en cada ola del
panel.5
5 Una tabla similar al nivel de hogares se presenta es la Tabla 7 de los Apéndices.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
36
Tabla 4: Total de Personas en Cada Ola de la Encuesta
Región 1996 2001 2006III 1.254 1.176 921VII 3.524 3.239 2.815VIII 7.325 6.739 5.205XIII 8.839 7.433 5.627
Total 20.942 18.587 14.568
Total Personas (muestra de corte transversal)
Se aprecia que en 1996, 2001 y 2006 se encuestaron, respectivamente, a 20.948, 18.851
y 14.996 personas. Estos totales corresponden a las muestras de corte transversal, que
son las apropiadas para el análisis de cada uno de estos años por separado. Para el
análisis longitudinal de la encuesta, en cambio, se deben considerar los totales de las
muestras longitudinales. Es decir, de los MOM que volvieron a ser encuestados en 2001,
y en 2001 y 2006. Éstos se exponen en la Tabla 5 a continuación.
Tabla 5: Atrición de la Muestra por Regiones
Región 1996 2001 2006 1996-2001 2001-2006III 1.254 943 653 24,8% 47,9%VII 3.524 2.685 2.024 23,8% 42,6%VIII 7.325 5.480 3.686 25,2% 49,7%XIII 8.839 5.930 3.924 32,9% 55,6%
Total 20.948 15.038 10.287 28,2% 50,9%
Total muestra longitudinal Atrición
A partir de la tabla notamos que la magnitud de la atrición entre 1996 y 2001 alcanzó un
valor de un 28,2%, y entre 1996 y 2006, un valor de 50,9%. La región que presenta las
tasas más altas de atrición es la Metropolitana. Una tabulación similar, pero generada
además por zona se puede encontrar en la Tabla 8 de los Apéndice. De esta se
desprende que la atrición es más grande en las zonas urbanas de las regiones, excepto
en la Tercera Región, donde se observa el patrón opuesto.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
37
En la Tabla 9 de los apéndices se compara el valor de proporciones y medias de algunas
variables de interés, medidas en 1996, para la muestra inicial de todos los MOM y para la
muestra de todos los MOM que fueron casos de atrición. Estos valores están ponderados
con los pesos de la ola 1. Se aprecian diferencias significativas a un nivel del 5% en las
siguientes variables:
− Edad.
− Estado Civil.
− Situación de la Vivienda que Ocupa.
− Región.
− Zona.
− Escolaridad.
− Decil de Ingreso Autónomo.
− Contrato.
8.2 Análisis multivariado
Muchas de las variables asociadas con la atrición están correlacionadas. Por ejemplo, los
adultos jóvenes tienden a ser solteros, y las personas de los deciles más ricos tienden a
tener mayores niveles de escolaridad. Para saber cuál de estos factores es el que
realmente está explicando la atrición, es necesario realizar análisis multivariado. Así es
posible aislar el efecto de cada una de estas variables. El foco de este análisis, luego, es
distinguir qué características de las personas medidas en la ola 1 están asociadas con la
atrición en las olas posteriores de la encuesta.
Los resultados de los distintos modelos lobit que se ajustaron se presentan en la Tabla 10
de los apéndices.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
38
Este análisis sugiere que la atrición fue selectiva en las personas con las siguientes
características en la ola base:
− Edades entre 20 y 29 años; entre 60 y 74 años; y entre 75 años y más.
− Estado Civil: Conviviente; Viudo; Soltero.
− Hogares de mayor tamaño.
− Vivienda Arrendada, Cedida por Servicios, Cedida por Familiar, Usufructo.
− Región: Octava; Metropolitana.
− Zona: Urbano.
− Mayor Escolaridad.
− Decil de Ingreso Autónomo: Decil 7; Decil 8; Decil 9; Decil 10.
Estas diferencias aparecen ser ampliamente corregidas mediante la construcción de
pesos que compensar por la atrición (Sección 9.1).
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
39
9 Procedimientos de ajuste estadístico
9.1 Construcción de los pesos
En las encuestas de hogares en general, los pesos se utilizan para compensar por las
distintas probabilidades de selección o por cierto tipo de datos faltantes. En respuesta al
diseño muestral, en encuestas de hogares de corte transversal los pesos se acostumbran
construir en tres etapas:
− construcción de pesos, que compensan por las distintas probabilidades de selección;
− ajuste por la no respuesta, que compensa por aquellas unidades del diseño muestral
inicial que no fue posible encuestar;
− post estratificación, en que se logra que la muestra ponderada calce con los niveles de
la distribución de la población de estudio para ciertas variables conocidas.
Cabe decir que las dos últimas etapas se pueden resumir en la de post estratificación.
Como es de suponer, la construcción de los pesos en encuestas de hogares tipo panel
presenta complejidades adicionales a las de las encuestas de hogares de corte
transversal. En efecto, los problemas surgen de:
− la cantidad de poblaciones de inferencia, correspondientes a todas las combinaciones
posibles de las n olas realizadas ( 12 −n);
− las diferentes opciones de manejo de la atrición;
− las diferentes opciones de incorporación al análisis de aquellos miembros de un hogar
que no fueron inicialmente muestreados, pero que en olas posteriores a la primera
viven con una persona que sí lo fue.
Notemos que estas complejidades surgen estrictamente de la naturaleza longitudinal de
estas encuestas. Conforme a esto, la construcción de los pesos en encuestas de hogares
tipo panel puede dividirse en dos etapas: una primera que coincide con el desarrollo de
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
40
los pesos de una encuesta de corte transversal, en la primera ola de la encuesta, y otra
en que se toman en cuenta las complejidades anteriores.
Como en la mayoría de las encuestas de hogares tipo panel, para esta encuesta se
desarrollaron pesos tanto para el análisis longitudinal como para el de corte transversal de
la muestra. Como se señala a continuación, estos pesos parten de la construcción de los
pesos para la ola 1.
9.1.1 Pesos para ola 1
Una sobre representación de hogares con una cierta característica, como es el caso de la
encuesta Panel CASEN con los hogares pobres, se compensa mediante el cálculo de un
peso dado por el inverso de la probabilidad de selección del hogar. A continuación, se
ajusta por la no respuesta o por los niveles de la distribución de la población de estudio
para ciertas variables de conocidas.
Como la muestra de la encuesta Panel CASEN se obtuvo a partir de la encuesta CASEN
1996, en que los pesos ya estaban construidos, una alternativa, que tiene implícitos los
procedimientos mencionados, es ajustar estos pesos por un factor que dé cuenta del
proceso de selección de los hogares. Como en la encuesta Panel CASEN se
seleccionaron hogares de todas las comunas de las cuatro regiones en estudio, este
factor está dado por el cuociente entre la suma de los pesos de todas las personas de una
cierta comuna, a partir de la encuesta CASEN 1996, sobre la suma de los pesos de las
personas de la comuna seleccionadas para la encuesta Panel CASEN .
En la Tabla 12 de los apéndices se puede ver un resumen de estadísticos de estos pesos
resultantes para la ola 1
9.1.2 Pesos longitudinales
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
41
Para obtener los pesos para el análisis longitudinal a partir de los pesos de la ola 1, queda
corregir por la atrición en la segunda y tercera ola. Siguiendo a Kalton y Brick (2000),
podemos mencionar cuatro métodos para realizar este ajuste:
− Weighting classes, en que se definen celdas de acuerdo a un conjunto de variables
auxiliares y se calcula un factor de ajuste para cada celda como el inverso de la tasa
de respuesta ponderada (en la celda); el peso anterior se multiplica por este factor de
ajuste.
− Classification tree algorithm, en que no sólo se elijen las variables auxiliares por las
cuales corregir, sino que también las celdas. Las celdas se pueden continuar
extendiendo hasta alcanzar un tamaño mínimo.
− Regresiones logísticas, en que el factor de ajuste se calcula como el inverso de la
probabilidad predicha de respuesta. Señalemos que si todas las variables auxiliares
en un modelo de regresión son categóricas, este procedimiento es análogo a los
anteriores.
− Generalised raking, en que a partir de la definición de distintas funciones de distancia
se minimiza la distancia entre los pesos no ajustados y ajustados. Este método puede
ser aplicado para hacer calzar la distribución marginal de probabilidad de los que
responden en la ola t con la distribución marginal de probabilidad de los que
responden y no responden también en la ola t.
Como la teoría no da razones para preferir un método sobre otro, nos inclinamos por
realizar el ajuste mediante regresiones logísticas para tener mayor comparabilidad con los
estudios internacionales, que tienden a privilegiar este método.
Se construyeron dos pesos longitudinales:
• pesos_long_96_01, que se definen para los miembros originales de la muestra
que se encuestan tanto en 1996 como en 2001. Se incluyen además los niños que
nacieron entre ambas olas que son hijos de miembros originales de la muestra.
Estos pesos se construyen corrigiendo por la probabilidad de respuesta los pesos
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
42
de corte transversal de 1996 y luego postestratificando para reobtener la
distribución de la muestra inicial de ciertas variables de interés.
• Pesos_long_96_01_06, peso definido similarmente al anterior pero que incluye
sólo a las personas encuestadas efectivamente las tres olas, más los hijos de
miembros originales que nacieron entre las olas. Estos pesos se construyen
corrigiendo por la probabilidad de respuesta entre 2001 y 2006, los pesos
longitudinales 96 -01 y luego postestratificando para reobtener la distribución de la
muestra longitudinal 96-01 de ciertas variables de interés.
Los hijos de miembros originales de la muestra se consideran también miembros
originales, y por ello tienen asignado un peso longitudinal (tanto en pesos_long_96_01
como en pesos_long_96_01_06). Éste corresponde al promedio de los pesos
longitudinales de sus padres, en caso que ambos sean MOMs, o al peso longitudinal,
luego de corregir por no respuesta, del padre o madre según corresponda. Existen niños
que nacieron entre olas pero que no son MOMs, y corresponden a niños cuyos padres no
son MOMs, sino que viven con alguno de ellos, y niños que no viven con sus padres.
Para corregir la atrición, se modeló la probabilidad de respuesta mediante modelos probit
que incluyeron las variables región, zona, tramo etáreo, género, estado civil, ocupación,
tipo de contrato, variables dicotómicas para el último nivel de educación alcanzado
(básica, media, técnica o universitaria), años de escolaridad, situación de la vivienda, decil
de ingreso del hogar, ingreso per capita del hogar6, hogar unipersonal, número de
personas del hogar y número de menores de doce años del hogar. En el caso del servicio
doméstico se usó ingreso total de la persona7 en lugar de ingreso per capita del hogar y la
variable decil se construyó para el servicio doméstico usando este ingreso.
En el probit de atrición entre 1996 y 2001 se usaron los pesos de corte transversal de
1996 y en el probit de atrición entre 2001 y 2006 se usaron los pesos longitudinales de
2001 (pesos_long_96_01).
6 Se usaron los ingresos imputados, tanto en ingreso per capita como para la construcción de los deciles. 7 Se usó el ingreso total imputado.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
43
Como se mencionó, se multiplicó el peso de la ola 1 por el inverso de la probabilidad
predicha de respuesta en 2001 y, posteriormente, en 2006. Para evitar valores extremos
en los pesos, se truncaron a un valor de 0,5 aquellas probabilidades de respuesta con un
valor inferior.8 En las Tablas 13 y 14 de los apéndices se puede ver un resumen de
estadísticos de estos pesos resultantes.
9.1.3 Pesos de corte transversal
Las encuestas de hogares tipo panel se suelen comenzar con una muestra representativa
de hogares. A partir de ésta se siguen a todos sus integrantes sin importar si pasan a vivir
en un hogar distinto, mientras estén dentro de las regiones de estudio. Entonces surge la
cuestión de cómo incluir en el análisis a aquellas personas que no integraban el hogar en
la muestra inicial del estudio, pero que en las olas posteriores pasaron a vivir con
personas que sí lo hacían. Lavallée (1995) propuso un esquema de pesos para
incorporarlos en el análisis de corte transversal. Este descansa sobre el supuesto de que
las personas que pasaron a residir con los MOM pudieron haber sido seleccionadas en la
ola inicial con idéntica probabilidad de selecciones a ellos. Por consiguiente la sumatoria
de los pesos longitudinales del los MOMs9 que pertenecen al hogar se reparte en partes
iguales en todos los miembros del hogar, dividiendo esta suma por el número de personas
del hogar que formaban parte de la población al momento de la ola 1, es decir, se
excluyen los nacidos posteriormente a la ola 1. Luego estos pesos fueron post
estratificados de acuerdo a las proyecciones del INE para 2001 y 2006, según variables
región, género y grupo etáreo.10
En las Tablas 13 y 14 de los apéndices se presenta un resumen de estadísticos de estos
pesos.
8 Los pesos longitudinales se ponderan de manera que entreguen el tamaño de la muestra, sin considerar los hijos de los MOMs nacidos luego de la primera ola. 9 Excluyendo los niños hijos de MOMs que aparecen en olas posteriores a la primera. 10 Los pesos de corta transversal para 2001 y 2006 se ponderan de manera que entreguen los totales proyectados por el INE para las cuatro regiones de estudio.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
44
9.2 Imputación
En todo tipo de encuestas existe el riesgo de que un individuo no reporte toda la
información que le es solicitada. El resultado de esto son los llamados datos faltantes.11
De manera análoga a la no respuesta unitaria, en este caso importa la magnitud y
naturaleza de los datos que faltan. En efecto, por una parte la menor cantidad de
observaciones reduce la eficiencia de los estimadores. Por otra parte, en términos
estadísticos hacer nada con estos datos faltantes descansa sobre el supuesto de que
distribuyen aleatoriamente y que, por ende, no se introduce sesgo en las estimaciones.
Ante este problema, surgen dos opciones: la primera consistiría en eliminar al individuo
del análisis posterior a realizar, con lo que también se descartarían las preguntas válidas
que sí respondió el encuestado pero que conduciría estimaciones menos eficientes de los
parámetros de interés, como se señaló. La segunda opción consiste en imputar dicho
dato, es decir, reemplazar el valor faltante por otro que, de acuerdo a una serie de
criterios, debería corresponderle a dicho encuestado.
Las metodologías para hacer esto son bastante numerosas. Sin embargo, la mayoría de
éstas ha sido desarrollada para encuestas de corte transversal. En el caso de las
encuestas de hogares tipo panel, la imputación de corte transversal se restringe a
emplear datos sólo de una ola, mientras que la imputación longitudinal se aprovecha de
las ventajas derivadas de la existencia de distintas fuentes de información para el mismo
hogar a lo largo del tiempo.
Muchos de los métodos de imputación en paneles han sido adaptados a partir de
metodologías diseñadas para encuestas de corte transversal. Por ejemplo, puede
realizarse imputación mediante el metódo Hotdeck, regresiones y Nearest Neighbor. En
cuanto a los métodos diseñados especialmente para encuestas de tipo panel, destaca el
método de Little y Su.
11 Missing data.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
45
Si bien podrían existir diferencias dependiendo del uso de un método u otro, es de
esperar que las diferencias no sean significativas, puesto que el número de valores
imputados en las tres olas fue bastante reducido,.
En el caso de la imputación en la Encuesta Panel CASEN, se optó por seguir el criterio de
comparabilidad con la encuesta a partir de la cual se originó el panel (CASEN 1996). Por
ello, se dejó de lado el criterio de imputación longitudinal por uno de corte transversal. En
vista de ello, se optó por imputar cuatro corrientes de ingreso para las tres olas:
− Ingreso por ocupación principal.
− Ingreso por jubilación y rentas vitalicias.
− Ingreso por alquiler imputado.
Para cada una de ellas, se definieron grupos en base a una serie de variables
provenientes de la misma encuesta. Dentro de cada grupo, si existía un individuo con
valores a ser imputados, se le asignaba el promedio del grupo. Sin embargo, existieron
casos en donde no se pudo encontrar a individuos con valores completos dentro de cada
grupo, por lo que se le asignó el valor correspondiente a los datos perdidos.
Adicionalmente, y como se mencionó anteriormente en la sección 7.2.3 se realizó una
consistencia longitudinal para tres variables: edad, sexo y nivel educativo. De encontrarse
inconsistencias luego de analizar las tres olas, se procedió a crear una nueva variable
imputada. A continuación se describe con mayor detalle el procedimiento seguido para
realizar las imputaciones entre las tres olas.
9.2.1 Imputación de ingresos por Ocupación Principal
En primer lugar, se distinguió entre ingresos por ocupación principal de los asalariados e
independientes. Para cada uno de éstos se construyeron las siguientes variables, a fin de
formar los grupos:
− Región: variable r_x de la base de datos.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
46
− Sexo: variable r2_x de la base de datos.
− Condición de actividad: se crearon catorce categorías para aquellos individuos
mayores de 12 años que se encontraban ocupados o desocupados por algún motivo
(dueña de casa, enfermo, estudiante, jubilado, entre otros).
− Condición de jefe de hogar: variable dicotómica igual a uno si el individuo es jefe de
hogar y cero en otro caso.
− Ocupación principal: definida a partir de la variable o10_x (oficio que desempeña). Se
redujo la clasificación de cuatro dígitos (CIUO-88) a 10 categorías.
− Nivel educativo: se definieron cuatro grupos a partir de la variable e9t_x (tipo de
educación).
− Rama de actividad: definida a partir de la variable o11_x (CIIU a cuatro dígitos). Se
crearon 9 categorías (CIIU a un dígito).
Para cada uno de los grupos creados a partir de la interacción de dichas variables, se
calculó la media, asignándosela a aquellos individuos que también pertenecían al grupo
pero cuyo valor de ingresos por ocupación principal era igual a missing.
9.2.2 Imputación de ingresos por Jubilación y Rentas Vitalicias
Para estas dos corrientes de ingreso, se definieron los grupos a partir de cuatro variables:
− Región;
− Relación con el jefe de hogar;
− Sexo del entrevistado;
− Nivel educativo.
El procedimiento de imputación fue similar al descrito en la corriente anterior.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
47
9.2.3 Imputación de ingresos por Alquiler
Para esta corriente de ingreso, se definieron grupos a partir de dos variables:
− Propiedad de la vivienda: se definieron 3 categorías a partir de la variable v14_x
(situación de la vivienda que ocupa el hogar). Estas categorías fueron propia (pagada
o pagándose), propiedad conjunta y otros.
− Tipo de vivienda: igual a la variable v13_x
El procedimiento de imputación fue similar al descrito en el ingreso por ocupación
principal. Notar que la variable alquiler imputado sólo se construye para los hogares
propietario de su vivienda.
9.2.4 Imputación de las variables Sexo, Edad y Nivel Educativo
En el caso de estas tres variables, se realizó una consistencia longitudinal (ver sección
7.2.3). Para aquellos individuos donde se encontraron inconsistencias, se generaron dos
nuevos conjuntos de variables. El primero de ellos se compone de dummies que toman el
valor de uno si se detectó una inconsistencia: error_esc_ola, error_sexo_ola y
error_edad_ola. El segundo grupo de variables corresponde a las variables imputadas:
r3cor_ola, r2cor_ola y esc1_ola, donde "ola" corresponde a las tres olas del panel.
9.3 Errores de medición
El error de medición es la diferencia entre el valor medido y el valor real (pero
desconocido) de una cierta variable. Existen diversas razones para explicar esta
diferencia:
− El encuestado puede no entender bien la pregunta;
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
48
− El encuestado puede no recordar con exactitud la información necesaria para
responder la pregunta;
− El encuestado puede cometer errores de juicio o de estimación al transformar la
información que recuerda para responder una pregunta;
− El encuestado puede responder de forma inexacta, ya sea de manera intencional o no;
− El encuestador puede confundir al entrevistado al dar más información de la
especificada, leer los ítems en distinto orden, etc.;
− El encuestador puede equivocarse al registrar la respuesta;
− La respuesta registrada en el cuestionario puede ser ilegible en la etapa de digitación;
− Puede ocurrir un error en la etapa de digitación;
− Si la respuesta requiere codificación, puede ser aplicado un código incorrecto;
− También pueden ocurrir otros errores en las etapas de edición y procesamiento de la
información.
Por ende, tanto las encuestas de corte transversal como las de tipo longitudinal están
afectas a este tipo de errores. Ahora bien, en las encuestas longitudinales estos errores
pueden ser más perjudiciales que en las de corte transversal, en particular al estudiar
transiciones entre estados. Por esto se sugiere al investigador definir transiciones más
robustas para estudiar transiciones (por ejemplo, definir salidas de la pobreza como un
cambio en la categoría de pobreza más un incremento del ingreso de al menos un 10%).
9.4 Construcción de ingresos y Ajuste por Cuentas Nacionales
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
49
En cada una de las olas se construyeron los ingresos de las personas y de los hogares a
partir de la información recolectada en la encuesta. En la base de datos se encuentran las
variables de ingresos construidas y las preguntas originales del cuestionario para que el
investigador que lo desee pueda acceder directamente a ellas.
Como se mencionó anteriormente, se realizó la imputación de cuatro partidas de ingresos
siguiendo los lineamientos de la metodología usada en las encuestas CASEN. Estas
variable corregidas por no respuesta, y las que se construyen a partir de ellas, se
distinguen en la base de datos por el sufijo “cor”. En este caso también se encuentran
tanto las variables con y sin corregir en la base de datos.
En las encuesta CASEN se realiza además un ajuste por Cuentas Nacionales a las
variables de ingreso. En líneas generales, este ajuste consiste en comparar los ingresos
agregados de la información de la encuesta con los ingresos agregados reportados por
las Cuentas Nacionales del Banco Central, para cinco partidas de ingresos: ingreso de los
asalariados, ingresos de los independientes, alquiler imputado, seguridad social y rentas
de la propiedad. Con esta información se construyen factores que corresponde al
cuociente entre lo entregado por ambas fuentes y se corrigen los ingresos de la encuesta
de modo que sumen el valor registrado en las Cuentas Nacionales.
En el caso de la encuesta Panel CASEN 1996-2001-2006 esta metodología tiene varios
alcances. Por una parte, se cuenta con factores de ajuste de la CASEN 1996, CASEN
2000 y CASEN 2006, pero sólo la primera de ellas está relacionada con la encuesta
Panel. Usar factores construidos para otra encuesta, con otros hogares encuestados y por
ende otros ingresos registrados, constituye un salto demasiando grande. Más aún, en el
caso de la CASEN 2000, las Cuentas Nacionales correspondientes son también las del
año 2000. Incluso para 1996, los factores que usa la encuesta CASEN se construyeron
usando toda la encuesta, y no sólo una submuestra ni las cuatro regiones de estudio en
este caso. Por otro lado, dado el carácter longitudinal de la encuesta, es cuestionable
pensar que a una misma persona u hogar que es reencuestado en el tiempo, le
corresponda un factor de ajuste distinto por ejemplo, en alquiler, incluso a pesar de que su
vivienda puede ser la misma.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
50
Por estas razones, los ingresos de la encuesta Panel CASEN 1996-2001-2006 se
encuentran sin este ajuste. A pesar de lo anterior, se agrega en la base de datos el
ingreso total de los hogares corregido por imputación y ajustado por cuentas nacionales
con los factores de las encuestas CASEN 1996, 2000 y 2006 para cada ola.12 De estas
manera el investigador que quiera ver la diferencia en los valores reportados con y sin
ajuste puede hacerlo, pero teniendo presente que esta metodología no es correcta de
aplicar en este caso, y que conclusiones de la metodología en esta encuesta no pueden
ser generalizadas directamente a las encuestas CASEN.
10 Errores muestrales
La precisión de las estimaciones obtenidas a partir de una población dada se mide
mediante los errores estándar de las mismas. De manera análoga al error de medición, el
error total de una estimación obtenida es igual a la diferencia entre el estimado y el valor
real. Dicha diferencia se encuentra compuesta por dos partes: el error sistemático y el
error aleatorio. El primer tipo de errores se relaciona con el marco muestral, el
encuestador y la tasa de no respuesta. Por otra parte, el componente aleatorio comprende
el error muestral, que se encuentra estrechamente relacionado con el hecho de que no se
está encuestado a toda la población, sino a un subconjunto de la misma. En líneas
generales, el diseño muestral empleado en una encuesta como la Panel CASEN influye
en la precisión de las estimaciones que se vayan a obtener, sean éstos promedios,
proporciones o totales.
Según Deaton (1989), el diseño muestral ideal sería poder tener una muestra basada en
muestreo aleatorio simple. Sin embargo, existen una serie de factores que impiden lograr
este objetivo. Entre los principales se encuentran:
− Factores presupuestarios;
12 Excepto la imputación de rentas de la propiedad debido a que no consiste en la aplicación de un factor sino
en la creación de una variables para el 20% de la población de mayores ingresos del total de la diferencia entre Cuentas Nacionales y la Encuesta. Imputar el total de la diferencia registrado por otra encuesta a esta, nos parece un supuesto demasiado fuerte de asumir.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
51
− Factores geográficos (grado de dispersión de la población en determinado territorio).
Esto hace que los costos de realizar un muestreo aleatorio simple sean excesivos. Por
consiguiente, en la mayoría de encuestas se emplean diseños muestrales complejos, que
intentan recoger dos factores que pueden resultar contradictorios a primera vista:
aprovechar la homogeneidad de ciertos grupos poblacionales dentro del territorio a
encuestar sin perder la heterogeneidad existente en los mismos. En el caso de la
encuesta Panel CASEN, el diseño muestral fue explicitado en la sección 3.
La influencia de este diseño muestral en el cálculo de los errores estándar puede
corregirse mediante el cálculo de los efectos de diseño. De acuerdo a Kish (1965), el
efecto de diseño es igual al razón de la varianza obtenida mediante el diseño muestral
complejo sobre la varianza que se hubiese obtenido a partir de un muestreo aleatorio
simple. Es decir:
( )( ) ( )( )( )( )
. .
. .c
srs
s e f xdeft f x
s e f x=
Despejando la varianza del diseño muestral complejo, tenemos que:
( )( ) ( )( ) ( )( ). . . .c srss e f x s e f x deft f x= ×
En términos de la homogeneidad de las unidades primarias de muestreo, el deft complejo
puede expresarse de la siguiente forma:
( )( ) ( )1 1deft f x b roh= + − ×
Donde roh, el ratio de homogeneidad, es una aproximación a la correlación intra-
conglomerados, que representa una medida de la agrupación de características similares
dentro de cada unidad primaria de muestreo, mientras que b denota el número promedio
de elementos por unidad primaria de muestreo. La fórmula arriba mencionada muestra la
relación directa existente entre el número de unidades muestrales por conglomerado y la
magnitud de la varianza. Los intervalos de confianza pueden ser obtenidos fácilmente
considerando una distribución normal. En este sentido, puede obtenerse un intervalo al
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
52
95% (o al margen de error que se desee obtener). Los softwares estadísticos incluyen hoy
formas de incluir las variables de diseño muestral, calculan directamente las varianzas y
pueden entregar también los efectos de diseño.
La estimación de la varianza es importante dado que indica la precisión de los
estimadores, llevando a intervalos de confianza que permiten evaluar hipótesis respecto
de una serie de parámetros. Cualquier procedimiento de estimación debe tener en cuenta
cuatro características (Brogan, 1992):
− La mayor parte de los estimadores no son funciones lineales (es común emplear ratios
de dos estimadores lineales).
− Los estimadores están ponderados.
− El plan de muestreo generalmente ha empleado un diseño muestral estratificado
previo a la selección de las unidades primarias de muestreo.
− Los elementos seleccionados por lo general no son independientes dadas las
características de un muestreo por conglomerados.
Estas cuatro características hacen que generalmente no sea posible obtener una forma
cerrada para la varianza estimada con diseños muestrales complejos. Por consiguiente, la
literatura sobre estimación de varianzas en estos contextos contiene distintas
aproximaciones que podrían emplearse.
En el caso de la encuesta Panel CASEN, se ha proporcionado toda la información
necesaria para construir intervalos de confianza asociados a cualquier estimación que
contemplen su diseño muestral complejo. Para ello, en los módulos del 1 al 5 de las bases
de datos se pueden encontrar las variables estrato y conglomerado.
En particular, en el programa computacional Stata, para calcular los errores muestrales
deben llevarse a cabo las siguientes instrucciones:
svyset [pw=varpeso], strata(estrato) psu(conglomerado)
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
53
donde varpeso representa el conjunto de pesos longitudinales o de corte transversal,
dependiendo del análisis que se vaya a realizar, que también están incluidos en dichos
módulos.
Con respecto a las metodologías a usar para el cálculo de los errores estándar, es preciso
mencionar que el Stata puede construir los errores estándar mediante al menos dos
metodologías. La primera consiste en linealizar los errores estándar del estimador a partir
de una aproximación de Taylor, mientras que la segunda implica un proceso de
remuestreo mediante el método de jackknife. La opción por defecto en Stata es la de
linealizar los errores.
11 Acceso a los datos y a su documentación
Un acceso deficiente a la información socioeconómica y a su documentación tiene efectos
negativos en la investigación social y en el diseño de políticas sociales, haciendo que
éstas se orienten a la información disponible y que la calidad de las bases de datos no
mejore ni se exploten a cabalidad. A su vez, estos efectos negativos se traducen en que
sean menos las personas pensando los problemas de la sociedad, y que éstas muchas
veces repliquen sus esfuerzos al no estar claros los procedimientos que se siguieron para
obtener y configurar la información. Desde de nuestra visión, transparentar esta
información es esencial para promover investigación de calidad. Así, a través de
información de fácil acceso y debidamente documentada, esperamos avanzar en este
sentido.
11.1 Organización de la bases de datos
Dado el tamaño de la base de datos con las tres olas de la encuesta, se optó por dividirla
en ocho módulos:
− Módulo 1: Características de los residentes, patrimonio y vivienda.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
54
− Módulo 2: Educación.
− Módulo 3: Empleo, excluye el módulo de historia laboral.
− Módulo 4: Ingresos. Contiene variables imputadas y construidas para hogares.
Asimismo, están los indicadores que identifican a un hogar como indigente, pobre o no
pobre.
− Módulo 5: Salud.
− Módulo 6: Hitos.
− Módulo 7: Participación.
− Módulo 8: Historia Laboral.
Los cinco primeros módulos contienen información de las tres olas del panel, al nivel del
individuo y del hogar. Los módulos 6, 7 y 8 fueron realizados en la ola 2006, por lo que
únicamente contienen la información de dicho corte transversal. De estos módulos, sólo
los dos primeros contienen información al nivel del hogar, mientras que el módulo 8
contiene información para el primer y segundo perceptor de ingresos.
A partir de estos módulos es posible realizar análisis longitudinal y transversal de los
temas que abordan por separado, ya que contienen los identificadores y pesos
necesarios. Para consolidar los distintos módulos, cada uno de ellos cuenta con
identificadores de personas. Los detalles de esta operación, así como otros
procedimientos necesarios para utilizar las bases de datos, se encuentran en el
documento “La Encuesta Panel CASEN: Manual del Usuario”.
11.2 Documentación
Una completa documentación es necesaria para el análisis de todo tipo de encuestas.
Ahora bien, en encuestas de hogares tipo panel esta documentación es todavía más
necesaria por las complejidades adicionales que presentan por sobre sus homólogas de
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
55
corte transversal. De no proveerse un adecuado contexto de los datos e indicaciones
adicionales, es muy fácil que el análisis termine en resultados equivocados.
Por esta razón, en la encuesta Panel CASEN se ha procurado entregar los datos con una
documentación de los más altos estándares. Para esto, se han preparado, además del
presente documento "La Encuesta Panel CASEN: Metodología y Calidad de los Datos",
otros titulados:
− “La encuesta Panel CASEN: Resultados de la Tercera Ola”;
− “La encuesta Panel CASEN: Libro de Códigos”;
− “La encuesta Panel CASEN: Manual del Usuario”;
− “Análisis de la Atrición en la Muestra de la Encuesta Panel CASEN”;
Toda esta información está disponible en la página web del Observatorio Social.
12 Confidencialidad de los datos
Para asegurar que las personas que participaron en la encuesta Panel CASEN no puedan
ser identificadas, se hicieron confidenciales datos de la encuesta como el nombre y la
dirección.
13 Seguridad de los datos
A continuación se exponen algunos requerimientos para asegurar la confidencialidad de
los datos:
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
56
− Si usted cambia de empleador, debe informar a las tres instituciones a través del
OSUAH. Los datos se entregan a un individuo y no a una organización, por lo que los
datos se pueden mover con el individuo dependiendo del proyecto de investigación de
éste. Por lo mismo no se puede dejar los datos con el empleador.
− Si el investigador cambia de proyecto de investigación, debe registrar este en el
OSUAH para seguir empleando los datos. De esta manera es posible saber el uso que
están dando los datos.
− La base de datos de la encuesta Panel CASEN debe ser guardada en un computador
protegido con clave.
− El usuario no debe entregar los datos a una persona que no ha sido autorizada. De lo
contrario será penalizada por la ley.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
57
Bibliografía
Brogan, D. (2005): "Sampling Error Estimation for Survey Data" en Household Sample
Surveys in Developing and Transition Countries, Nueva York: Naciones Unidas.
Deaton et al (1986): "Collecting Panel Data in Developing Countries: Does It Make Sense",
LSMS Working Paper.
Kalton, G., y M. Brick, (2000): “Weighting in household panel surveys” en Rose, D. (ed.),
Researching Social and Economic Change: the uses of household panel studies, 96-111,
London and New York: Routledge.
Lavallée, P. (1995): “Cross-sectional weighting of longitudinal surveys of individuals and
households using the weight share method”, Survey Methodology, 21, 25-32.
Institute of Social and Economic Research, University of Essex: “Keeping Track: A guide
to longitudinal resources”, http://www.iser.essex.ac.uk/ulsc/resources/keeptrack.php.
Institute of Social Research, University of Michigan. “Panel Studies Around the World”,
http://psidonline.isr.umich.edu/Guide/PanelStudies.aspx
Jenkins, S. P. (2003): "The value of longitudinal data",
http://melbourneinstitute.com/hilda/conf/conf2003/pdffiles/SJenkins.pdf.
Kish, L. (1965): Survey Sampling, Nueva York: Wiley.
Lawson, D. A. McKay y K. Moore (2003): “PanelDatasetsVersion1-July%202003”
http://www.chronicpoverty.org/pdfs/PanelDatasetsVersion1-July%202003.pdf.
Yaqub, S. (2000): "Poverty Dynamics in Developing Countries", Development
Bibliography 16, Institute of Development Studies, University of Sussex.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
58
Apéndices
Tabla 1: Distribución de la Muestra Inicial (1996) a Nivel Comunal, IIIª Región Comuna Hogares Personas
Chanaral 47 190Diego de Almagro 18 54Copiapo 63 262Caldera 11 39Tierra Amarilla 19 82Vallenar 99 403Freirina 17 73Alto del Carmen 33 151
Total 307 1.254
Tabla 2: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIª Región
Comuna Hogares PersonasCuricó 75 295Teno 54 214Romeral 12 61Molina 69 284Santa Familia 14 50Talca 87 349Pelarco 29 121San Clemente 85 340Constitucion 92 375Curepto 17 66Linares 87 349Colbún 13 55Longaví 18 77Parral 75 305Villa Alegre 14 66San Javier 49 196Cauquenes 90 321
Total 880 3.524
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
59
Tabla 3: Distribución de la Muestra Inicial (1996) a Nivel Comunal, VIIIª Región
Comuna Hogares PersonasChillán 93 368San Carlos 109 405Cohihueco 79 320El Carmen 13 57Yungay 17 75Trehuaco 26 85Quirihue 25 93Los Angeles 89 345Quilaco 23 79Mulchén 66 282Negrete 28 122Nacimiento 58 234Laja 99 408Concepción 104 349Talcahuano 108 426Penco 124 502Tome 110 456Santa Juana 27 97Lota 135 577Coronel 115 469Lebu 90 328Arauco 83 356Curanilahue 100 427Cañete 91 404Contulmo 14 61
Total 1.826 7.325
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
60
Tabla 4: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región
Comuna Hogares PersonasSantiago 66 194Independencia 59 226Conchalí 92 375Recoleta 94 378Providencia 11 48Lo Barnechea 11 37Las Condes 46 209Ñuñoa 49 172La Reina 46 169Macul 77 317Peñalolén 17 66La Florida 70 292La Granja 98 389La Pintana 139 581San Ramón 100 429San Miguel 60 209La Cisterna 75 307El Bosque 96 374Aguirre Cerda 77 297Lo Espejo 21 85Estación Central 89 343Cerrillos 13 49Maipú 62 251Quinta Normal 15 62Lo Prado 79 332Pudahuel 93 376Cerro Navia 96 402Renca 17 67Colina 85 357Puente Alto 87 384San Bernardo 84 363Paine 30 129Calera de Tango 10 40Melipilla 64 261María Pinto 10 52Curacavi 9 29Talagante 21 74Peñaflor 15 53Isla Maipo 13 61
Total 2.196 8.839
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
61
Tabla 5: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta
Buenos días (tardes) señor(a), mi nombre es _____________________ y estoy trabajando en un estudio socioeconómico de hogares que realiza la Universidad Alberto Hurtado con las mismas familias que entrevistamos el año 2001 en esta Región. Necesito saber si vive aquí todavía la familia de don(doña) _______________. Luego usted debe confirmar con la información de 1996 y 2001 a los demás miembros del hogar. Es muy importante que realice este procedimiento, pues podría ocurrir que el Jefe de hogar del año 2001 se llamara Juan Soto, y don Juan Soto se haya cambiado de domicilio y en el año 2006 haya un nuevo Jefe de hogar que se llame Juan Pérez. Ya que en la Hoja de ruta solo se entrega el nombre de pila (sin apellido) el alcance de nombre podría generar un gran error, pues usted encuestaría a un hogar que no debe encuestar. Es por esto que debe verificar con los nombres de los otros miembros del hogar si efectivamente es el hogar que se busca.
1. Si � Pase a Pregunta 1a
2. No � Pase a Pregunta 2a
Pregunta 1a El suyo es uno de los hogares elegidos para continuar nuestro estudio, y no podemos reemplazarlo. Este trabajo nos permitirá obtener información de cómo viven las familias chilenas y con ella diseñar mejores políticas sociales. Sus respuestas no serán conocidas ya que se respetará absolutamente su anonimato. Agradecemos desde ya su gentileza y buena disposición. Específicamente necesito hacerle esta entrevista al Jefe de hogar o a la Dueña de casa.
Pregunta 1b ¿Han llegado nuevos miembros al hogar en los últimos 5 años? Utilizando la Tabla 1 (que aparece en la segunda página de la hoja de ruta) usted debe señalar el nombre de las personas que estaban presentes en el año 2001, y después anotar a los nuevos integrantes en los espacios disponibles en la Tabla. Luego debe preguntar:
¿Qué mes y qué año llegaron al Hogar? Consigne Mes y Año.
¿Cuál fue la razón? Pregunta 1c ¿Se han ido miembros del hogar durante los últimos 5 años? Utilizando la Tabla 1 (que aparece en la segunda página de la hoja de ruta) usted debe señalar el nombre de las personas que estaban presentes en el año 2001, y ahora ya no se encuentran. Luego debe preguntar:
¿Qué mes y qué año se fueron del Hogar? Consigne Mes y Año.
¿Cuál fue la razón? Registre esta información en la columna 11 de la Tabla 1. Si usted ha llegado hasta esta instancia quiere decir que el hogar debe ser encuestado, por lo tanto, inicie la aplicación del cuestionario. Para los casos en que la persona haya respondido “No” en la primera pregunta de indagación usted deberá aplicar la pregunta 2a: Pregunta 2a ¿Sabe usted donde se cambió esta familia o dónde vive algún pariente o amigo que me
pueda indicar dónde residen actualmente? Esta pregunta corresponde realizarla solamente en los casos que la familia que estamos buscando ya no vive en esa dirección.
1. Si � Escriba la información en el recuadro disponible
2. No � Agradecer amablemente y dejar un teléfono por si alguien del barrio tuviera alguna información de la familia de don /doña _________________________.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
62
Tabla 6: Cuestionario de la encuesta Panel CASEN: Extracto de la Hoja de Ruta
Existen ciertas variables o combinación de respuestas que sabemos no pueden darse.
Aquellos casos observados representan casos de estos denominados errores de
medición, que pueden deberse a alguna de las diferentes razones enunciadas
anteriormente.
Algunos de estos errores se observan en los datos de las dos primeras olas:
Sexo: 0,9% de los casos clasificados diferente en ambas ocasiones.
Edad: 10,04% de las personas tienen edades cuya diferencia cae fuera del rango 4 a 6
años (considerando que entre las dos primeras olas el tiempo transcurrido es de 5 años).
Estado civil: casados, separados, divorciados o viudos no pueden pasar al estado soltero,
situación que se observa en un 0,82% de los individuos con respuestas en ambas
ocasiones.
Educación: se encontraron 1.422 casos de inconsistencias, que representan el 9,42% de
los individuos. Las inconsistencias que se consideran son:
Transición de algún nivel de educación a ninguno, 156 casos
Transición a Preparatoria, de algún nivel de educación del sistema nuevo (igual o superior
a básica) o de niveles superiores en el sistema antiguo, 557 casos.
Transición a Básica, de un nivel superior en el sistema nuevo o del equivalente a
Humanidades en el sistema antiguo, 335 casos.
Transición a Humanidades, de un nivel del sistema nuevo igual o superior al equivalente a
Educación Media, 110 casos.
Transición a Educación Media, de un nivel igual o superior a CFT incompleto, 176 casos.
Transición de la Educación Superior a un Técnico del sistema antiguo, 25 casos.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
63
Transiciones dentro de la educación superior completas que pasan a un nivel menor, 63
casos.
Estos análisis son gruesos dado que no incluyen los años de escolaridad, sólo los
cambios de categoría. Un análisis más fino sin duda significaría mayores niveles de error.
Empleo: se registran 10 casos en que la persona declaró en 2001 no tener experiencia
laboral, pero sin embargo declaró en 1996 haber trabajado la semana pasada (6 casos) o
tener experiencia laboral (4 casos). Dado que en 2001, 785 personas respondieron la
pregunta sobre experiencia, estos errores equivalen al 1,3% de los casos.
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
64
Tabla 7: Total de Hogares en Cada Ola de la Encuesta
Región 1996 2001 2006III 307 277 230VII 880 837 774VIII 1.826 1.707 1.369XIII 2.196 1.827 1.396
Total 5.209 4.648 3.769
Total Hogares (muestra de corte transversal)
Tabla 8: Atrición de la Muestra por Región por Zona
Región/Zona 1996 2001 2006III Urbana 853 668 456III Rural 401 275 197
VII Urbana 2.240 1.710 1.213VII Rural 1.284 975 811
VIII Urbana 5.755 4.255 2.864VIII Rural 1.570 1.225 822
XIII Urbana 8.376 5.551 3.660XIII Rural 463 379 264
Total 20.942 15.038 10.287
Total muestra longitudinal
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
65
Tabla 9: Muestra Inicial versus Estructura de la Muestra de Casos de Atrición
Variables 1996 Muestra inicial completa Muestra de casos de atriciónGénero
Hombre 0,483 0,477Mujer 0,517 0,523
EdadEntre 0 y 9 años 0,190 0,201Entre 10 y 19 años 0,180 0,183Entre 20 y 29 años 0,165 0,118Entre 30 y 44 años 0,231 0,250Entre 45 y 59 años 0,130 0,158Entre 60 y 74 años 0,078 0,07975 años y más 0,025 0,010
Estado civilCasado 0,359 0,402Conviviente 0,053 0,050Anulado 0,002 0,001Separado 0,029 0,028Viudo 0,040 0,031Soltero 0,518 0,489
Tamaño del hogar 4,720 4,744Situación de la vivienda que ocupa
Propia pagada 0,522 0,599Propia pagándose 0,147 0,168Propiedad conjunta 0,017 0,022Arrendada 0,165 0,068Cedida por servicios 0,030 0,020Cedida por familiar 0,105 0,109Usufructo 0,007 0,007Ocupación irregular 0,006 0,008
RegiónIII 0,029 0,032VII 0,100 0,117VIII 0,212 0,221Metropolitana 0,659 0,631
ZonaUrbano 0,888 0,865Rural 0,112 0,135
Escolaridad 8,492 7,612Decil de ingreso autónomo
Decil 1 0,102 0,108Decil 2 0,098 0,114Decil 3 0,100 0,104Decil 4 0,101 0,112Decil 5 0,112 0,122Decil 6 0,089 0,110Decil 7 0,100 0,097Decil 8 0,099 0,093
Personas
Continúa
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
66
Continuación Tabla 9
Decil 9 0,101 0,080Decil 10 0,099 0,059
OcupaciónOcupado 0,372 0,358Desocupado 0,628 0,642
ContratoContrato indefinido 0,184 0,164Contrato no indefinido 0,031 0,028No sabe si su contrato es indefinido 0,005 0,003No ha firmado contrato 0,776 0,800No se acuerda 0,005 0,005
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
67
Tabla 10: Distribución de la Muestra Inicial (1996) a Nivel Comunal, XIIIª Región
Variable 1 2 3 5 6 7 8Género (0 = Hombre) -0.012 -0.015 -0.015 -0.014 -0.015 -0.013 -0.018 -0.020
(0.95) (1.23) (1.24) (1.07) (1.19) (1.03) (1.41) (1.42)Edad (0 = Entre 0 y 9 años)
Entre 10 y 19 años 0.016 0.017 0.018 0.041* 0.042** -0.078*** -0.036 -0.036(0.80) (0.85) (0.87) (1.94) (2.00) (3.08) (1.40) (1.39)
Entre 20 y 29 años 0.149*** 0.189*** 0.188*** 0.227*** 0.227*** 0.065** 0.095*** 0.097***(7.48) (8.99) (8.95) (10.94) (10.94) (2.20) (3.21) (3.16)
Entre 30 y 44 años -0.011 0.072*** 0.072*** 0.113*** 0.116*** -0.039 -0.024 -0.020(0.57) (2.99) (2.95) (4.61) (4.74) (1.30) (0.79) (0.63)
Entre 45 y 59 años -0.074*** 0.015 0.014 0.097*** 0.100*** -0.026 -0.049 -0.044(3.37) (0.53) (0.49) (3.45) (3.55) (0.81) (1.46) (1.26)
Entre 60 y 74 años 0.021 0.094*** 0.092*** 0.194*** 0.197*** 0.109*** 0.088** 0.089**(0.79) (3.00) (2.89) (6.12) (6.19) (3.16) (2.48) (2.50)
75 años y más 0.280*** 0.318*** 0.317*** 0.379*** 0.383*** 0.343*** 0.336*** 0.337***(6.35) (6.84) (6.76) (9.05) (9.05) (7.28) (6.79) (6.89)
Estado civil (0 = Casado)Conviviente - 0.072** 0.072** 0.046* 0.046* 0.079*** 0.085*** 0.084***
- (2.47) (2.46) (1.78) (1.79) (3.07) (3.33) (3.30)Anulado - 0.207** 0.205** 0.215** 0.211** 0.193** 0.160 0.161
- (2.16) (2.14) (2.36) (2.29) (2.07) (1.58) (1.59)Separado - 0.065* 0.064* 0.080** 0.075** 0.074** 0.057 0.058
- (1.75) (1.73) (2.22) (2.05) (2.01) (1.51) (1.51)Viudo - 0.087** 0.087** 0.081** 0.081** 0.103*** 0.086** 0.086**
- (2.46) (2.45) (2.46) (2.47) (3.09) (2.51) (2.48)Soltero - 0.114*** 0.114*** 0.151*** 0.154*** 0.158*** 0.124*** 0.123***
- (5.90) (5.90) (7.48) (7.64) (7.86) (6.10) (6.07)Tamaño del hogar - - -0.002 0.006* 0.008** 0.010*** 0.016*** 0.016***
- - (0.55) (1.79) (2.20) (2.83) (4.72) (4.74)Situación de la vivienda que ocupa (0 = Propia pagada)
Propia pagándose - - - 0.037* 0.024 0.026 0.036* 0.036*- - - (1.90) (1.23) (1.31) (1.86) (1.87)
Propiedad conjunta - - - -0.044 -0.033 -0.020 0.014 0.016- - - (0.98) (0.71) (0.44) (0.31) (0.36)
Arrendada - - - 0.353*** 0.346*** 0.346*** 0.359*** 0.359***- - - (17.39) (16.83) (17.00) (18.69) (18.71)
Cedida por servicios - - - 0.233*** 0.269*** 0.274*** 0.285*** 0.285***- - - (10.38) (12.59) (12.73) (13.12) (13.09)
Cedida por familiar - - - 0.085*** 0.089*** 0.104*** 0.142*** 0.142***- - - (4.77) (5.05) (5.79) (7.64) (7.62)
Usufructo - - - 0.136*** 0.174*** 0.187*** 0.211*** 0.212***- - - (2.86) (3.70) (4.00) (4.63) (4.64)
Ocupación irregular - - - -0.029 -0.021 0.000 0.029 0.032- - - (0.26) (0.18) (0.00) (0.26) (0.28)
Región (0 = Metropolitana)III - - - - -0.052** -0.049** -0.039* -0.038*
- - - - (2.26) (2.14) (1.74) (1.74)VII - - - - -0.076***-0.063*** -0.037** -0.037**
- - - - (5.14) (4.21) (2.44) (2.43)
Ajuste
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
68
Continúa
Continuación Tabla 10
VIII - - - - -0.008 0.002 0.029** 0.028**- - - - (0.60) (0.15) (2.15) (2.06)
Zona (0 = Urbano) - - - - -0.078***-0.045*** -0.033** -0.033**- - - - (5.39) (2.98) (2.19) (2.14)
Escolaridad - - - - - 0.017*** 0.011*** 0.011***- - - - - (9.02) (5.15) (5.03)
Decil (0 = Decil 1)Decil 2 - - - - - - 0.001 0.001
- - - - - - (0.06) (0.03)Decil 3 - - - - - - 0.030 0.030
- - - - - - (1.21) (1.21)Decil 4 - - - - - - -0.010 -0.010
- - - - - - (0.35) (0.36)Decil 5 - - - - - - 0.011 0.011
- - - - - - (0.41) (0.42)Decil 6 - - - - - - -0.028 -0.028
- - - - - - (1.06) (1.07)Decil 7 - - - - - - 0.102*** 0.103***
- - - - - - (3.90) (3.95)Decil 8 - - - - - - 0.093*** 0.094***
- - - - - - (3.58) (3.60)Decil 9 - - - - - - 0.152*** 0.153***
- - - - - - (5.31) (5.37)Decil 10 - - - - - - 0.232*** 0.234***
- - - - - - (6.83) (6.92)Ocupación (0 = Desocupado) - - - - - - - -0.015
- - - - - - - (0.69)Contrato (0 = Contrato indefinido)
Contrato no indefinido - - - - - - - 0.042- - - - - - - (1.14)
No sabe si su contrato es indefinido - - - - - - - 0.104- - - - - - - (1.28)
No ha firmado contrato - - - - - - - -0.005- - - - - - - (0.23)
No se acuerda - - - - - - - -0.061- - - - - - - (0.84)
Pseudo-R2 0,0181 0,0222 0,0222 0,0765 0,0804 0,0886 0,1028 0,1031Observaciones 20.992 20.992 20.992 20.992 20.992 20.992 20.992 20.992
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
69
Tabla 11: Distribución de los Pesos de la encuesta CASEN 1996
CASEN 1996Corte transversal
Media 138,6Desviación estándar 180,3Percentil 1 11Percentil 5 25Mediana 91Percentil 95 355Percentil 99 905Observaciones 62.467
Tabla 12: Distribución de los Pesos de la encuesta Panel CASEN, 1996
Panel CASEN 1996Corte transversal
Media 412,7Desviación estándar 623,4Percentil 1 24Percentil 5 56Mediana 246Percentil 95 842Percentil 99 1.133Observaciones 20.942
Tabla 13: Distribución de los Pesos de la encuesta Panel CASEN, 2001
Longitudinal Corte transversalMedia 559,8 540,3Desviación estándar 946,1 830,3Percentil 1 29,9 21,1Percentil 5 69,2 47,2Mediana 306,4 256,6Percentil 95 1641,6 1516,3Percentil 99 4814,6 4310,7Observaciones 16.347 18.587
Panel CASEN 2001
Observatorio Social Universidad Alberto Hurtado – www.osuah.cl – [email protected] Almirante Barroso 37 – Santiago Centro. Teléfono: (56-2) 698-7013 Fax: (56-2) 692-0360
70
Tabla 14: Distribución de los Pesos de la encuesta Panel CASEN, 2006
Longitudinal Corte transversalMedia 798,4 658,3Desviación estándar 1.419,9 1262,4Percentil 1 39 25,3Percentil 5 94 52,4Mediana 408 307,8Percentil 95 2.461 2.109Percentil 99 7.163 5.604Observaciones 11.976 14.568
Panel CASEN 2006