- Compartir
- Encuéntranos en:
Perú - Encuesta Demográfica y de Salud Familiar 2004 - 2007
ID del Estudio | 001-PER-INEI-ENDES-2004-2007 |
Año | 2006 |
País | Perú |
Productor(es) |
Instituto Nacional de Estadística e Informática (INEI) - Presidencia del Consejo de Ministros (PCM) Dirección Técnica de Demografía e Indicadores Sociales (DTDIS) - INEI |
Financiamiento | Agencia de los Estados Unidos para el Desarrollo Internacional - USAID - |
Colección(es) | |
Metadatos | Descargar DDI Descargar RDF |
Creado el | 06 Mar, 2017 |
Última modificación | 06 Mar, 2017 |
Visitas a la página | 363793 |
Descargas | 1882 |
- Materiales Relacionados
- Descripción de la operación estadística
- Descripción de Variables
- Obtener Microdatos
Muestreo
Procedimiento de muestreo
MARCO MUESTRAL
El marco muestral de las ENDES tiene de base la información de los Censos de Población y Vivienda de 1993, investigación que provee un listado de centros poblados con información censal, lo que permite el diseño muestral para cualquier muestra utilizando dicho marco de unidades. Este marco ha sido actualizado con la información básica y la cartografía del Precenso de 1999. En la ENDES Continua 2004-2007, el marco muestral estuvo constituido por el listado de centros poblados de los conglomerados que fueron seleccionados al azar de la ENDES 2000 para ser entrevistados en el primer, segundo y tercer año de la ENCUESTA Continua.
El diseño de las ENDES es multietápico, es decir, se elaboró un marco para cada una de las siguientes etapas:
- Primera Etapa: La selección de las unidades primarias de muestreo (UPM), se realizó a partir de la información proveniente del Censo de Población y Vivienda de 1993;
- Segunda Etapa: Selección de unidades secundarias de muestreo (USM), se utilizó información estadística y cartografía proveniente de la Actualización Cartográfica y el Registro de Edificios y Viviendas de 1999.
- Tercera Etapa: Selección de unidades terciarias de muestreo (UTM), se utilizó información estadística y cartográfica proveniente del Registro de Edificios y Viviendas y de la Actualización Cartográfica urbana y rural; realizadas como actividades preparatorias a la operación de campo de la ENDES Continua, para cada Ciclo.
UNIDADES DE MUESTREO
En el Área Urbana:
- La Unidad Primaria de Muestreo (UPM), representada por el centro poblado urbano con 2 mil y más habitantes.
- La Unidad Secundaria de Muestreo (USM), representada por la manzana o grupo de manzanas que en conjunto tienen 100 viviendas particulares en promedio.
- La Unidad Terciaria de Muestreo (UTM), es la vivienda particular que integra la USM seleccionada.
En el Área Rural:
- La Unidad Primaria de Muestreo (UPM), representada por el centro poblado con 500 o menos de 2 mil habitantes y el ámbito rural del distrito que agrupa a todas las AER (Área de Empadronamiento Rural).
- La Unidad Secundaria de Muestreo (USM), representada por la manzana o grupo de manzanas que en conjunto tienen 100 viviendas particulares o el AER que tiene en promedio 100 viviendas particulares.
- La Unidad Terciaria de Muestreo (UTM), es la vivienda particular que integra la USM o AER seleccionado.
TIPO DE DISEÑO
La muestra es probabilística, de áreas, estratificada, trietápica y auto ponderada, sin reemplazo.
- La muestra es probabilística porque las unidades de muestreo han sido seleccionadas mediante métodos aleatorios, lo cual permite efectuar inferencias a la población sobre la base de la teoría de probabilidades.
- La muestra es de áreas, porque la probabilidad de cada vivienda de ser seleccionada está asociada a áreas geográficas (conglomerados) dentro de cada departamento de estudio.
- La muestra es estratificada, porque previamente a la selección, la población se ha dividido en estratos, con el objeto de mejorar su representatividad.
- La muestra es trietápica. En la primera y la segunda fase se utiliza la selección sistemática con probabilidad proporcional al tamaño de viviendas (PPT) y en la tercera etapa (selección de viviendas) es sistemática simple con arranque aleatorio.
- La muestra es auto ponderada, porque la probabilidad de selección (conocida y diferente de cero) es la misma para cada una de las unidades últimas de selección (viviendas particulares) dentro de cada departamento de estudio.
TAMAÑO MUESTRAL
--------------------------
La muestra ENDES Continua está conformada por 1414 conglomerados los cuales han sido divididos en 5 submuestras representativas, seleccionadas al azar, con el fin de obtener resultados de periodicidad anual, semestral y trimestral.
Del total de conglomerados, 569 están localizados en ciudades (sedes) capitales de departamento; 273 se localizan en el resto urbano y 572 en el área rural. Cada departamento excepto Lima, tiene un promedio de 50 conglomerados. Lima tiene 226 conglomerados, entendiéndose que Lima está comprendida por Lima Metropolitana, Lima provincias y la Provincia Constitucional del Callao.
En cada departamento, la muestra total de conglomerados ha sido dividida aleatoriamente en 5 submuestras, cada una de 10 conglomerados en promedio.
Durante los 5 años que dure la ENDES Continua, la muestra tendrá la característica siguiente:
- A nivel nacional, cada mes se visitarán 28 conglomerados en promedio.
- A nivel nacional, cada trimestre se visitarán 94 conglomerados en promedio.
- A nivel nacional, cada semestre se visitarán 141 conglomerados en promedio.
- A nivel nacional, cada año se visitarán 283 conglomerados en promedio.
La muestra de la ENDES Continua 2004-2007 está conformada por 1,131 conglomerados seleccionados, 283 trabajadas en el 2004, 284 en el 2005, 283 en el 2006 y 281 en el 2007.
Para la muestra total, el número de hogares fue 29 336, de los cuales sólo 27 628 fueron entrevistados. En los hogares entrevistados, se encontró un total de 26 093 mujeres elegibles, 16 036 en el área urbana y 10 057 en el área rural, y de las cuales se obtuvo un total de 25 489 entrevistas completas. La muestra seleccionada representa la totalidad de la población total del país.
Desviaciones del diseño muestral
De los 29 mil 336 hogares que fueron seleccionados, se logró entrevistar a 27 mil 628 hogares y de 27 mil 839 hogares ocupados, obteniendo una tasa de respuesta de hogares de 99,2% para la ENDES Continua 2004-2007, ésta tasa de respuesta varía ligeramente de acuerdo al área de residencia, siendo las tasas de respuesta en el área urbana y rural de 99,1% y 99,4%, respectivamente.
Los resultados de las entrevistas indican también que el 5,1% de los hogares no fueron entrevistados porque la vivienda se encontraba desocupada, cuando se le hizo la visita.
Por otro lado de un total de 26 mil 93 mujeres elegibles se logró entrevistar 25 mil 489, obteniéndose una tasa de respuesta individual de 97.7% . La mayor tasa de respuesta se logró en el área rural con 98.3%, siendo la tasa de respuesta de 97.3% en el área urbana.
Tasa de respuesta
- Los resultados de las entrevistas realizadas a los hogares, indican que se obtuvo una tasa de no respuesta de 0,8%, que representa a los hogares que se encontraron ocupados, pero que no respondieron a la entrevista.
- Los resultados de las entrevistas individuales realizadas a mujeres elegibles, nos indican que la tasa de no respuesta fue de 2,3% y está compuesta por las mujeres ausentes, rechazo a la entrevista, entrevista parcial, incapacidad para ser entrevistada y otras "no respuestas".
Expansores / Ponderadores
FACTOR DE PONDERACIÓN
EL Diseño de la Encuesta Demográfica y de Salud Familiar ENDES, es un diseño de muestra compleja, que se caracterizan por admitir la posibilidad de que la muestra resultante pueda contener algún sesgo respecto a la población de referencia, sesgo que puede deberse a la selección de unidades con probabilidades desiguales, tanto en la primera etapa como en la segunda etapa de selección; es decir, de los Conglomerados o UPM como de las Unidades Secundarias Muestreo o Viviendas en cada UPM seleccionada, con probabilidad proporcional a su tamaño (PPT); y, a la falta de respuesta en el momento de la entrevista.
En tal sentido, los factores de ponderación devuelven a las USM y UPM seleccionadas las probabilidades desiguales de selección permitiendo recomponer la estructura de la población de referencia, al cual también se incorpora el ajuste por la falta de respuesta; garantizando así la adecuada estimación de los indicadores programados.
La elaboración o cálculos de los ponderadores es realizada en las etapas que se indican a continuación:
Calculo del factor básico de muestreo
Cálculo del factor de no respuesta.
I. Calculo del factor básico de muestreo.-
-------------------------------------------------
a. Elaboración a nivel de cada departamento por ámbito de residencia de la matriz de conglomerados con información del total de viviendas particulares como de las viviendas particulares ocupadas con datos poblacionales del Marco Maestro de Muestreo, que para el caso, procede de los Censos Nacionales: XI de Población y VI de Vivienda, levantados en el 2007. Así mismo, el total de viviendas particulares y de viviendas particulares de los conglomerados seleccionados, proveniente de la Actualización Cartográfica y del Directorio de Viviendas y Establecimientos realizada en los conglomerados o UPM seleccionadas. Información básica con la cual se efectuó la seleccion de las UPM y las USM.
i) En la selección de las UPM (Conglomerados)
Pi = (a*mi / S(mi))
Donde:
Pi : Probabilidad de selección del i_ésimo conglomerado (UPM).
a : Número de conglomerados seleccionados en el sub estrato del departamento.
mi : Total de viviendas ocupadas en el i-ésimo conglomerado, según CPV 2007.
S(mi) : Total de viviendas en el sub_estrato del departamento, según CPV 2007.
ii) En la selección de las USM (Vivienda)
Pj ( i ) = (ni / Ni)
Donde:
Pj ( i ): Probabilidad de selección de la j_ésimo vivienda (USM) dentro del i_ésimo conglomerado (UPM).
ni : Número de viviendas seleccionadas en el i-ésimo UPM (Conglomerado) incluida en la muestra.
Ni : Número total de viviendas actualizadas del i-ésimo UPM (conglomerado).
b. Cálculo de la Fracción Muestral Total. La fracción de muestreo total es la probabilidad integral de selección de las viviendas donde se realizará la implementación de la encuesta, la misma que es el producto de la multiplicación de la probabilidad de selección de las UPM y las USM, cuya expresión matemática se presenta a continuación:
Pij = Pi * Pj ( i )
Donde:
Pij : Probabilidad de selección total de la j_esima vivienda en el i_esimo conglomerado.
Pj : Probabilidad de selección del i_ésimo conglomerado (UPM).
Pj ( i ) : Probabilidad de selección del j_ésimo vivienda (USM) dentro del i_ésimo conglomerado (UPM).
c. Cálculo del factor básico de muestreo. El factor básico de muestreo es el inverso de la probabilidad total de selección
Wij = 1 / Pij
II. Calculo del factor de no respuesta.-
-------------------------------------------------
Todas las encuestas de hogares, en particular la ENDES, están sujetas, en mayor o menor medida, a que en alguna de las unidades de análisis seleccionadas no sea factible implementar la encuesta ya sea porque ésta se encuentra ausente o no desea participar en ella; es decir formar parte de la muestra; las cuales se denominan No respuesta de la unidad seleccionada. Tema que es considerado de importancia en atención a siguientes consideraciones:
- La no respuesta puede introducir un sesgo o error de medida, debido a que quienes responden o son entrevistados pueden diferir de quienes no responden o no son entrevistados en características importantes. Y por tanto, una gran precisión no garantiza ausencia de error.
- La no respuesta reduce la precisión de las estimaciones, ya que habrá menos casos disponibles para el análisis.
En la ENDES, en atención a la necesidad de preservar la ponderación básica total de la vivienda que atiende la representatividad del estrato y reducir el sesgo de la estimación que pudiera generar la no respuesta, se efectúa un ajuste por no respuesta a nivel de cada sub estrato dentro de cada departamento; cuyo procedimiento se orienta por la expresión matemática que se presenta a continuación:
a. De la no respuesta de viviendas:
W ij, nr = (Ci / C'i) * (Ai / A'i)
Donde:
Wij,nr : Factor de ajuste por la falta de respuesta de la vivienda en el i_ésimo conglomerado
Ci : Número total de conglomerados seleccionados en el sub estrato del departamento.
C'i : Número total de conglomerados encontrados en el sub estrato del departamento (base de datos).
Ai : Número total de viviendas seleccionadas en el sub estrato del departamento.
A'i : Número total de viviendas entrevistadas completas en el sub estrato del departamento (base de datos).
b. De la no respuesta entre la Mujeres en Edad Fértil:
Wm ij, nr = Mi / M'i
Donde:
Mi : Número total de MEF de facto encontradas en el sub estrato del departamento.
M'i : Número total de MEF elegibles de facto con entrevista completa en el sub estrato del departamento.
c. De la no respuesta entre personas de 15 o más años de edad
Wp ij, nr = pi / pí
Donde:
pi : Número total de personas de 15 o más años encontradas en el sub estrato del departamento.
p'i : Número total de personas de 15 o más años elegibles de facto con entrevista completa en el sub estrato del departamento.
III. Cálculo de los factores finales.-
--------------------------------------------
La estimación de los factores finales tienen como punto de partida el cálculo del ponderador estandarizado de vivienda el cual sirve de base para la posterior estimación de los factores para las Mujeres en edad fértil; y, de la Personas de 40 años o más de edad.
A. Cálculo del factor de ponderación final de la Vivienda
El cálculo del factor de ponderación final de vivienda, comprende la aplicación de los siguientes pasos:
a.1 Cálculo de los insumos para la elaboración del factor de ponderación final de la vivienda:
i) Factor de ponderación de vivienda ajustado por la no respuesta, el cual se obtiene aplicando la expresión matemática que se presenta a continuación:
Wij = W ij.b * W ij, nr
Donde:
W ij.b: Factor básico de muestreo de la vivienda.
W ij, nr: Factor de no respuesta de vivienda.
ii) Total de vivienda con entrevistas completas a nivel de cada conglomerado.
iii) Estimación de las Viviendas ponderadas brutas que son el resultado de la multiplicación del factor de ponderación de viviendas ajustado por la no respuesta por el total de viviendas con entrevistas completas en el conglomerado.
NV ij = W ij * Hc i
Donde:
NV ij: Viviendas ponderados brutos (viviendas expandidas a nivel nacional) en el i_ésimo conglomerado.
W ij: Factor de ponderación final de vivienda ajustado por la no respuesta en el i_ésimo conglomerado.
H i: Total de viviendas con entrevista completa en el i_ésimo conglomerado.
a.2 Cálculo del factor final de ponderación de vivienda, el cual se obtiene aplicando la expresión matemática que se presenta a continuación:
Wf ij = W ij * S (Hci) / S (NVi)
Donde:
Wf ij: Factor final de ponderación de la vivienda.
S (Hci) : Suma total de viviendas con entrevista completa en la muestra
S (NVi) : Suma total de Viviendas ponderados brutos en la muestra
W ij : Factor de ponderación de vivienda ajustada por la no respuesta
B. Cálculo del factor de ponderación final de las Mujeres en edad fértil
El cálculo del factor de ponderación final de las mujeres en edad fértil comprende la aplicación de los siguientes pasos:
a.1 Cálculo de los insumos para la elaboración del factor de ponderación final de las mujeres en edad fértil:
i) Factor de ponderación de las mujeres en edad fértil ajustado por la no respuesta, el cual se obtiene aplicando la expresión matemática que se presenta a continuación:
Wm ij = Wf ij * Wm ij, nr
Donde:
Wf ij: Factor de ponderación final de la vivienda.
Wm ij, nr: Factor de no respuesta de las mujeres en edad fértil.
ii) Total de mujeres en edad fértil con entrevistas completas a nivel de cada conglomerado.
iii) Estimación de las mujeres en edad fértil ponderadas brutas que son el resultado de la multiplicación del factor de ponderación de de las mujeres en edad fértil ajustado por la no respuesta por el total de mujeres en edad fértil con entrevistas completas en el conglomerado.
Nm ij = Wm ij * Mc i
Donde:
Nm ij: Mujeres en edad fértil ponderados brutos en el i_ésimo conglomerado.
Wm ij: Factor de ponderación para cada MEF ajustado por la no respuesta para cada vivienda en el i_ésimo conglomerado.
Mc i: Total de Mujeres en edad fértil con entrevistas completas en el i_ésimo conglomerado.
b.1 Cálculo del factor final de ponderación de las mujeres en edad fértil, el cual se obtiene aplicando la expresión matemática que se presenta a continuación:
Wmf ij = Wm ij * [S (Mc i) / S (Nm i)]
Donde:
Wmf ij : Factor final de ponderación de las mujeres en edad fértil.
S M c i: Suma total de mujeres en edad fértil con entrevista completa en la muestra
S Nm i: Suma total de las mujeres en edad fértil ponderados brutos en la muestra
C. Cálculo del factor de ponderación final de las personas de 15 a más años de edad
El cálculo del factor de ponderación final de las personas de 15 a más años de edad, comprende la aplicación de los siguientes pasos:
a.1 Cálculo de los insumos para la elaboración del factor de ponderación final de las personas de 15 a más años de edad:
i) Factor de ponderación de las personas de 15 a más años de edad ajustada por la no respuesta, el cual se obtiene aplicando la expresión matemática que se presenta a continuación:
Wp ij = Wf ij * Wp ij, nr
Donde:
Wf ij: Factor de ponderación total de las personas de 15 a más años de edad estandarizado
Wp ij, nr : Factor de ajuste por la no respuesta de las personas de 15 a más años de edad en el i_ésimo conglomerado
ii) Total de personas de 15 a más años de edad con entrevistas completas a nivel de cada conglomerado.
iii. Estimación de las personas de 15 a más años de edad ponderadas brutas que son el resultado de la multiplicación del factor de ponderación de personas de 15 a más años de edad ajustado por la no respuesta por el total de personas de 15 a más años de edad con entrevistas completas en el conglomerado.
NP ij = Wp ij * Pc i
Donde:
NP ij: Personas de 15 a más años de edad ponderados brutos en el i_ésimo conglomerado.
Wp ij: Factor de ponderación final para las personas de 15 a más años de edad en el i_ésimo conglomerado.
Pc i: Total de personas de 15 a más años de edad con entrevistas completas a nivel de cada conglomerado.
b.1 Cálculo del factor final de ponderación de personas de 15 a más años de edad, el cual se obtiene aplicando la expresión matemática que se presenta a continuación:
Wpf ij = Wp ij * [S (pc i) / S (Np i)]
Donde:
Wpf ij: Factor final de ponderación de las personas de 15 a más años de edad.
S (pc i): Suma total de personas de 15 a más años de edad con entrevista completa en la muestra
S (Np i): Suma total de personas de 15 a más años de edad ponderados brutos en la muestra
Wp ij: Factor de ponderación ajustado por la norespuesta de las personas de 15 a más años de edad.
IV. Variables de ponderación en la Data:
-----------------------------------------------
Se debe tener en cuenta que:
- Los factores de ponderación deben ser divididos entre 1 000 000
- Nº Total sin ponderar = Nº Total ponderado
Las variables para ponderar son
- HV005, se encuentran en el archivo de Hogar y Personas (RECH0)
- V005 en el archivo de mujeres y niños (REC0111)
Adicionalmente para la ENDES Continua 2004-2007, se calcula el factor de ajuste por trimestre, utilizada para ajustar el peso final de viviendas y de mujeres con el fin de que la estructura de la ENDES 2000 se refleje de manera proporcional en cada uno de los trimestre distribuidos por regiones naturales tanto del área urbana como de la rural.