- Compartir
- Encuéntranos en:
Perú - Encuesta Demográfica y de Salud Familiar 2004 - 2007
ID del Estudio | 001-PER-INEI-ENDES-2004-2007 |
Año | 2006 |
PaÃs | Perú |
Productor(es) |
Instituto Nacional de EstadÃstica e Informática (INEI) - Presidencia del Consejo de Ministros (PCM) Dirección Técnica de DemografÃa e Indicadores Sociales (DTDIS) - INEI |
Financiamiento | Agencia de los Estados Unidos para el Desarrollo Internacional - USAID - |
Colección(es) | |
Metadatos | Descargar DDI Descargar RDF |
Creado el | 06 Mar, 2017 |
Última modificación | 06 Mar, 2017 |
Visitas a la página | 363747 |
Descargas | 1881 |
- Materiales Relacionados
- Descripción de la operación estadÃstica
- Descripción de Variables
- Obtener Microdatos
Indicadores de la Calidad/Evaluación de la Calidad
Estimación del error muestral ERRORES DE MUESTREO: Por tratarse de una encuesta por muestreo, las estimaciones de la ENDES Continua 2004-2007 están afectadas por dos tipos de errores: los errores no muestrales, que son aquellos que se producen durante las labores de recolección y procesamiento de la información y los errores de muestreo, que resultan del hecho de haberse entrevistado sólo una muestra y no la población total. El primer tipo de error incluye la falta de cobertura de todas las mujeres seleccionadas, errores en la formulación de las preguntas y en el registro de las respuestas, confusión o incapacidad de las mujeres para dar la información y errores de codificación o de procesamiento. Al igual que para las encuestas anteriores de 1991-92, 1996 y 2000, para la ENDES Continua 2004-2007 se trató de reducir a un mÃnimo este tipo de errores a través de una serie de procedimientos que se emplean en toda encuesta bien diseñada y ejecutada, como son: el diseño cuidadoso y numerosas pruebas del cuestionario, intensa capacitación de las entrevistadoras, supervisión intensa y permanente del trabajo de campo, revisión de los cuestionarios en el campo por parte de las crÃticas, supervisión apropiada en la etapa de codificación, y procesamiento de los datos y limpieza cuidadosa del archivo con retroalimentación a las supervisoras, crÃticas y entrevistadoras a partir de los cuadros de control de calidad. Los elementos de juicio disponibles señalan que este tipo de errores se mantuvo dentro de márgenes razonables en la ENDES Continua 2004-2007. La muestra de hogares visitados para la ENDES Continua 2004-2007 no es sino una de la gran cantidad de muestras del mismo tamaño que serÃa posible seleccionar de la población de interés utilizando el diseño empleado. Cada una de ellas habrÃa dado resultados en alguna medida diferentes de los arrojados por la muestra usada. La variabilidad que se observarÃa entre todas las muestras posibles constituye el error de muestreo, el cual no se conoce pero puede ser estimado a partir de los datos suministrados por la muestra realmente seleccionada. El error de muestreo se mide por medio del error estándar. El error estándar de un promedio, porcentaje, diferencia o cualquier otra estadÃstica calculada con los datos de la muestra se define como la raÃz cuadrada de la varianza de la estadÃstica y es una medida de su variación en todas las muestras posibles. En consecuencia, el error estándar mide el grado de precisión con que el promedio, porcentaje, o estadÃstica basado en la muestra, se aproxima al resultado que se habrÃa obtenido si se hubiera entrevistado a todas las mujeres de la población bajo las mismas condiciones. El error estándar puede ser usado para calcular intervalos dentro de los cuales hay una determinada confianza de que se encuentra el valor poblacional. AsÃ, si se toma cierta estadÃstica calculada de la muestra (un porcentaje, por ejemplo) y se le suma y resta dos veces su error estándar, se obtiene un intervalo al cual se le asigna una confianza de 95% de que contiene, en este caso, el porcentaje poblacional. Si las personas entrevistadas en la ENDES Continua 2004-2007 hubieran sido seleccionadas en forma simple al azar, podrÃan utilizarse directamente las fórmulas muy conocidas que aparecen en los textos de estadÃstica para el cálculo del error estándar y de los lÃmites de confianza y para la realización de pruebas de hipótesis. Sin embargo, como se ha señalado, el diseño empleado es complejo, por lo cual se requiere utilizar fórmulas especiales que consideran los efectos de la estratificación y la conglomeración. El programa DHS ha incorporado en sus programas computarizados la metodologÃa apropiada para el análisis estadÃstico de muestras complejas como la de la ENDES Continua 2004-2007. Este subprograma maneja el porcentaje o promedio de interés como una razón estadÃstica r = y/x, en donde tanto el numerador [y] como el denominador [x] son variables aleatorias. El cálculo de la varianza de r se hace utilizando una aproximación lineal de Taylor con la fórmula que seguidamente se indica y el error estándar se calcula tomando la raÃz cuadrada de esa varianza: Además del error estándar, también se calcula el llamado efecto del diseño, EDIS, el cual se define como la razón entre el error estándar correspondiente al diseño empleado (EE) y el error estándar que se obtiene tratando la muestra como si hubiera sido aleatoria simple (EEmas): EDIS= EE / EEmas. Un valor de EDIS igual a 1.0 indicarÃa que el diseño utilizado es tan eficiente como uno simple al azar del mismo tamaño, mientras que un valor superior a 1.0 indicarÃa que el uso de conglomerados produjo una varianza superior a la que se habrÃa obtenido con una muestra simple al azar del mismo tamaño. | |
Otros indicadores de calidad Los errores de muestreo para las estimaciones de las tasas de fecundidad y de mortalidad, fueron calculados siguiendo el procedimiento de estimación del método Jackknife de replicaciones balanceadas, el cual consiste en obtener un número de replicaciones igual al número de segmentos censales. Cada replicación hace uso de todos los segmentos censales encuestados menos uno, siendo este diferente del usado en las replicaciones anteriores. En la ENDES Continua 2004-2007 hay 1130 conglomerados. Por ende 1130 replicas fueron creadas. El error estándar de una tasa r se calcula como la raÃz cuadrada de la varianza . donde: - r es la estimación de la tasa usando 1,000 segmentos censales, - r(i) es la estimación de la tasa usando 999 segmentos censales de la replicación i-esima, y - k es el número total de segmentos censales (1,000). Los conglomerados de la ENDES Continua 2004-2007 son una sub-selección aleatoria de los conglomerados de la ENDES 2000. Fueron seleccionados asi para incrementar el nivel de confianza de las comparaciones entre las dos encuestas. Para la ENDES Continua 2004-2007 se seleccionaron los hogares al interior de los conglomerados sin tener en consideración si fueron seleccionados para la ENDES 2000. Por tal motivo, las dos encuestas están emparejadas parcialmente al nivel de conglomerado. Para el cálculo de los errores muestrales para las tendencias en indicadores seleccionados entre las dos encuestas, se requiere calcular la varianza del indicador para la ENDES 2000, calcular la varianza para la ENDES Continua 2004-2007, calcular la varianza del indicador en la parte emparejada de la ENDES 2000 y la varianza de la diferencia en el indicador entre la ENDES 2000 y la ENDES Continua 2004-2007, sobre la parte emparejada. Si denominamos con r1 y r2 un indicador medido con la ENDES 2000 y con la ENDES Continua 2004-2007, respectivamente, la varianza de la diferencia d = r2 - r1 es dado por: Se calculan las varianzas var(r1) y var(r2) como se ha indicado anteriormente. La covarianza se calcula solamente a nivel de los conglomerados emparejados. Asumiendo que rm1 es el indicador calculado sobre la parte emparejada de la ENDES 2000, se puede estimar la covarianza cov(r2,r1) con la fórmula: donde n y m son los números de conglomerados en la muestra total de la ENDES 2000 y en la parte emparejada, respectivamente. Reemplazando la estimación de la covarianza cov(r2,r1) en la fórmula para la varianza de la diferencia, se tiene: Como no se puede calcular la diferencia entre dos razones, en el software ISSA, se desarrolló una rutina en SAS. La varianza de la diferencia entre dos razones se calculó utilizando el método de linearización de Taylor. Para la computación de var(dm) = var(r2 - rm1) se empleó la siguiente fórmula: |