Colombia - Evaluación de operaciones de la política de atención humanitaria a población en situación de desplazamiento
ID de Referencia | DNP-DSEPP-PAH-2014 |
Año | 2014 |
País | Colombia |
Productor(es) | Departamento Nacional de Planeación - DNP |
Patrocinador(es) | Departamento Nacional de Planeación - DNP - Financiar parcialmente el programa de crédito de Fortalecimiento de la Información Pública, Seguimiento y Evaluación para la Gestión por Resultados en Colombia |
Colección(es) | |
metadata |
![]() |
Creado el | Jul 28, 2015 |
Última modificación | Mar 31, 2016 |
Visitas a la página | 263733 |
Descargas | 2554 |
- Materiales Relacionados
- Descripción de la operación estadística
- Diccionario de Datos
- Obtener Microdatos
Muestreo
Procedimiento de muestreo
La población de referencia para la evaluación estará compuesta por las personas atendidas desde 2012 en el marco de la política de atención humanitaria. Este tipo de apoyo se brinda a población desplazada, siendo 1.035.435, hogares los que solicitaron la atención humanitaria entre los años 2012 y 2013, de los cuales 435.327 hogares están en los municipios de la muestra, de estos, existe evidencia en la tabla de datos que han generado 784.482 solicitudes de atención humanitaria, esto es, 1.8 solicitudes en promedio por familia. Se plantea tener una muestra de 1.840 hogares diferentes de la población desplazada incluida en el Registro Único de Victimas -RUV- que han solicitado atención humanitaria y que han sido tramitados y evaluados en los años 2012 y 2013. Las unidades de muestreo serán los municipios, seguido de sectores cartográficos y las manzanas. Los hogares de las manzanas seleccionadas, serán las unidades de observación.
La muestra de hogares se obtuvo a partir de la implementación de un muestreo multietápico estratificado. Con marcos de muestreo en cada etapa, se comenzó con una selección de municipios a nivel nacional y se realizó la selección de los hogares en la última etapa, a partir de un muestreo de lista (Marco de Lista)
En el diseño del muestreo se definió un error menor o igual al 3% e igualmente un nivel de confianza del 95% para la inferencia, para alcanzar una representatividad de los hogares desplazados que han solicitado atención humanitaria en los años 2012 y 2013. Adicionalmente, se definió un deff de 2.66, el cual se obtuvo de investigaciones anteriores que tenían relación con el estudio de interés de esta evaluación, el coeficiente de correlación empírico fue de 0.03872.
Por otro lado, para afrontar la posibilidad de que en calquiera de las etapas del diseño de muestreo se presente "no respuesta" por parte de las unidades de osbervación, se contempló una sobre muestra de 30% de familias, para así prever problemas al contactar familias y problemas de subregistro en los datos de contacto.
Tasa de respuesta
En el presente estudio se enfrentó la posibilidad de que se presentaran dos tipos de no respuesta: uno si las personas de los hogares seleccionados se negaban a responder algunas de las preguntas del instrumento. Otro, de no encontrarse a la familia seleccionada.
Cuando la no-respuesta se presenta en algunas preguntas, existen métodos de imputación para simular los valores faltantes con base en modelos basados en la información disponible de los demás encuestados. Särndal recomienda no olvidar que la imputación de un dato faltante son por definición “datos artificiales” y tienen un error, llamado “error de imputación”. Software estadístico como STATA, SAS, R y SPSS, entre otros, incluyen, técnicas como la imputación múltiple (IM). El término imputación hace referencia a que valores faltantes son reemplazados con un conjunto de valores plausibles a partir de la información que se pudo recolectar en los otros registros de la muestra, incluso, usando información existente en el universo. La técnica de imputación múltiple consta de 3 pasos:
1. Imputación.
2. Análisis de datos completos (Estimación).
3. Agrupación.
Esta técnica busca solucionar los problemas de la imputación simple, relacionados con la introducción de sesgos y la distorsión de la potencia de las pruebas de hipótesis. La técnica de IM se basa en métodos bayesianos, a través de los cuales, utiliza procesos de simulación de Monte Carlo para así sustituir los datos faltantes (paso 1). En cada simulación se analiza la matriz de datos completos a partir de metodologías estadísticas convencionales (paso 2), y finalmente, se combinan los resultados de las dos etapas anteriores, con el fin de producir estimadores robustos, junto a su error estándar, intervalos de confianza y otro procesos inferenciales.
Es importante hacer una revisión de los datos y de las tasas de no respuesta para evitar que se presenten mayores problemas con la imputación. Adicional a esto, se asumen los siguientes supuestos: (i) El esquema de datos faltantes es aleatorio, lo que significa que el patrón no depende de la misma variable a imputar, (ii) El modelo utilizado para generar los datos imputados sea adecuado, en el sentido de que exista correlación entre la variable a imputar y el vector de covariables, y (iii) El modelo de análisis guarde relación con el utilizado para llevar a cabo la imputación.
En el otro escenario, cuando la sobre muestra no logra cubrir el fenómeno de ausencia de respuesta, es necesario llevar a cabo una calibración de los factores de expansión. La calibración se basa en dos principios básicos, por un lado, (1) ser muy similares a los pesos muestrales planteados durante el diseño muestral, y por el otro lado, (2) utilizar información auxiliar para lograr que los resultados del muestreo puedan ser expandidos a la población de estudio. Los dos objetivos principales que se persiguen con la calibración son, en primer lugar la reducción de la varianza de los estimadores, y en segundo lugar, la reducción del sesgo debido a la no respuesta.
En las encuestas por muestreo aleatorio suelen presentarse generalmente problemas de no respuesta, la probabilidad final de selección que tuvo cada registro seleccionado y encuestado no restituye el universo completo de donde salió la muestra. Además, la no respuesta puede no tener un comportamiento aleatorio lo que induciría a tener estimaciones sesgadas por no contemplar está perdida diferencial. Se hace necesario hacer un ajuste a los factores básicos de expansión, con el objeto de poder tener estimaciones al total del universo de referencia, buscando reducir los sesgos que se pudieran ocasionar por la presencia de la no respuesta.
Este ajuste a los factores de expansión se conoce como Calibración, y lo que se busca es afectar los pesos muestrales en la menor medida, pero que al final la restitución se realice sobre el total del universo, con ayuda de información auxiliar que exista de los registros de la muestra y/o del universo. Existen varios métodos entre lineales y logísticos, que buscan construir un conjunto de nuevos pesos, similares en tamaño a los que resultaron del inverso de la probabilidad de selección y que cumplan con la ecuación de calibración.
El objetivo que se persigue con este proceso es poder expandir los resultados de los r respondientes, los cuales son un subconjunto de la muestra inicialmente planteada s, al total de la población U. El escenario perfecto es aquel en el que se cuente con información auxiliar para todos los elementos seleccionados en la última etapa y para los diferentes niveles de conglomeración seleccionadas en el muestreo multietápico. Estevao & Särndall (2002) proponen 10 escenarios que contemplan todos los posibles casos en que puede implementarse un estimador de calibración dependiendo la información auxiliar disponible para un muestreo en dos fases.
Expansores / Ponderadores
En el diseño del muestreo se definió un error menor o igual al 3% e igualmente un nivel de confianza del 95% para la inferencia, para alcanzar una representatividad de los hogares desplazados que han solicitado atención humanitaria en los años 2012 y 2013. Adicionalmente, se definió un deff de 2.66, el cual se obtuvo de investigaciones anteriores que tenían relación con el estudio de interés de esta evaluación, el coeficiente de correlación empírico fue de 0.03872.