Colombia - Encuesta de Percepción Ciudadana del Plan Nacional de Desarrollo 2014-2018, Encuesta de percepción ciudadana Levantamiento 3
ID de Referencia | DNP-DSEPP-EPC-20162 |
Año | 2016 |
País | Colombia |
Productor(es) | Departamento Nacional de Planeación - DNP |
Patrocinador(es) | Departamento Nacional de Planeación - DNP - |
Colección(es) | |
metadata |
![]() |
Creado el | Sep 06, 2018 |
Última modificación | Sep 07, 2018 |
Visitas a la página | 150366 |
Descargas | 544 |
- Materiales Relacionados
- Descripción de la operación estadística
- Diccionario de Datos
- Obtener Microdatos
Muestreo
Procedimiento de muestreo
a) Marco muestral.
Para la selección de los municipios, el DNP tuvo en cuenta la división político-administrativa del país (Divipola) y las proyecciones de población 2006-2020, junto con las proyecciones municipales de población 2005-2011, por sexo y grupos de edad, del DANE. Adicionalmente, esta información es la fuente para la conformación del marco muestral de centros poblados.
De otra parte, para la selección de las unidades de muestreo al interior de los municipios o de los centros poblados, se utilizará el inventario cartográfico a nivel de manzana, obtenido a partir de la información del último Censo Nacional de Población y Vivienda (2005).
Dado que no se cuenta con un listado actualizado de viviendas y hogares por manzana, se hace necesario construirlo a través de un recuento inicialmente de viviendas y luego, en las viviendas seleccionadas, se identificarán todos los hogares y dentro de éstos, se identificarán todas las personas que se consideren residentes habituales, para seleccionar posteriormente, una persona por hogar.
b) Tipo de muestreo.
El diseño probabilístico se define como: multietápico, estratificado por región y zona (urbano - rural) y de elementos (personas 18 años o más).
La estratificación de los municipios en regiones fue realizada por el DNP y se mantendrá para todos los levantamientos, así como los municipios de inclusión forzosa. Se interpreta que el criterio más importante para la conformación de los estratos fue el geográfico.
Habitualmente, los diseños de probabilidad proporcional son mucho más eficientes que los diseños no proporcionales, así como los diseños con tamaño fijo de muestra son más eficientes que los diseños de tamaño aleatorio de muestra. De acuerdo con estos principios del muestreo, en general el diseño probabilístico sugerido parte de una estrategia eficiente (en términos de sesgo y mínima varianza), para un estudio poblacional con la complejidad del que nos ocupa.
Con respecto a los algoritmos, para la selección de los municipios, dado el diseño proporcional a la cantidad de personas mayores a 18 años sin reemplazo (PiPT), se implementó el método de Sunter. Para la selección de centros poblados, viviendas, hogares y personas se implementará el algoritmo de Fan-Muller-Rezucha. Y para la selección de manzanas se utilizará el algoritmo coordinado negativo con el fin de poder incluir manzanas de reemplazo, en caso de ser necesario (debido a las imperfecciones del marco o para mitigar el efecto de la no respuesta), sin generar sesgos y sin necesidad de implementar una selección condicional o por fases, ya que se sigue el orden de inclusión aleatorio determinado desde la selección inicial.
c) Definición del tamaño de muestra.
El tamaño de muestra a nivel de las unidades primarias (municipios) y las unidades finales (personas), es la misma sugerida por el DNP en el anexo técnico y que fue ratificada dentro de la propuesta. Es decir, 110 municipios y 9710 personas a encuestar.
En principio, bajo un razonamiento en el que se equilibra la mayor dispersión posible a un costo razonable, a nivel de los centros poblados se sugiere encuestar máximo, en cada uno de ellos, a 15 personas.
Finalmente, dado que la selección al interior de los municipios es de manzanas (y no de sectores cartográficos como fue planteado en el anexo técnico), la propuesta es seleccionar una muestra en promedio de cinco personas a encuestar por manzana en igual cantidad de viviendas y hogares.
Desviaciones del diseño muestral
No se presentó pérdida a nivel de las UPM (municipios). De otra parte, a nivel de las USM en la zona rural, es decir, de los centros poblados, no se incluyeron ésto en los siguientes municipios debido a que la alcaldía certifica que actualmente no existen:
Tunja (Boyacá), Copacabana (Antioquia), Soledad (Atlántico), Providencia (Nariño), Bucaramanga (Santander), Palmas del Socorro (Santander) y Restrepo (Meta).
A nivel de las manzanas (UTM) se seleccionó una muestra de 2.388 pero debido a los problemas de obsolescencia del marco geoestadístico del DANE, fue necesario incrementarla a 2.692, es decir, un 12.7%. Ahora, sólo en el 92.4% (2.487) se logró realizar el recuento.
En las manzanas seleccionadas, en donde fue posible realizar el respectivo recuento (2.487), se identificaron 65.473 unidades de uso residencial o mixto y de éstas se seleccionaron 18.590, de las cuales en el 37.6% (6.985) no fue posible identificar hogares porque rechazaron o después de realizar por lo menos tres visitas en días y horarios diferentes, los residentes se encontraban ausentes.
En las viviendas en donde se logró identificar hogares, se listaron 10.832, de los cuales en el 10.3% (1.116), no fue posible identificar a los residentes habituales de 18 años o más que los conformaban, por: ausencia (584), rechazo (399) y ocupados (133).
Finalmente, se seleccionaron 10.489 personas de 18 años o más, en los hogares que accedieron a suministrar datos básicos de identificación. De éstas, se encuestaron 9.716, es decir, el 92.6%.
Tasa de respuesta
De acuerdo con las variables incluidas en el formulario de encuesta que se definieron para responder a los objetivos y preguntas orientadoras que el DNP defina por eje, se construyeron indicadores sobre la percepción general relacionada con los temas de estudio del PND en el levantamiento ralizado. Los resultados se presentaron como estimaciones de parámetros tipo Total, Razones (promedios, proporciones, etc.) y sus respectivas medidas de calidad (error estándar, error estándar relativo, límites de confianza al 95% y Deff).
Con respecto al cálculo de los factores, las expresiones generales de los factores por subestrato (urbano y rural), para cada persona encuestada, fue construída a partir del inverso de cada una de las probabilidades de inclusión, por etapa de muestreo. De otra parte, para corregir el sesgo en la estimación inducido por los no respondientes a partir del ajuste de los factores de expansión con base en un factor de no respuesta, se utilizó el factor de ajuste por No Cobertura o No Respuesta (Bautista L., 1998). Este factor se multiplicó por el factor básico final para generar el Factor de Expansión Ajustado por No Cobertura. Así mismo, se utilizó la metodología de calibración para realizar ajustes por estructura poblacional y reducir la varianza de los estimadores. Por lo anterior, se construyó una matriz poblacional por subregión con distribución de la población de 18 años o más por zona (cabecera y centros poblados), con base en la población proyectada a 2016, DANE y, se generaron los pesos finales los cuales se construyen a partir de los pesos iniciales ajustados a partir de un vector de información.
Especificamente, se implementó la técnica de calibración, de acuerdo con el alcance establecido en el informe metodológico. Para esto, se utilizó el procedimiento Calibrate para generar los pesos calibrados y se implemento el método lineal (predeterminado) propuesto por Deville y Särndal (1992) para la estimación.
Expansores / Ponderadores
Con respecto al procesamiento de la información, ésta se realizó utilizando paquete Stata (Versión 14) y calculando las medidas de calidad (Error estándar (EE), margen de error (EE*1.96), límites del IC al 95%, Deff y Error estándar relativo (cve)) asociadas.
Se determinó que la matriz para calibración estuviera conformada por las siguientes variables: subregión (10), zona (2), nivel socioeconómico (4), sexo (2). El nivel socioeconómico (colapsando los estratos 5 y 6) y el sexo se incluyen como variables de calibración para corregir el desequilibrio en éstas dentro de la muestra encuestada. El código utilizado para este propósito fue:
matrix
M=[190198,953738,981061,599539,178340,894279,919899,562162,5651,173588,335833,331789,220852,163069,315482,311683,207469,55371,141237,449466,437024,274443,134994,429596,417704,262311,29393,257648,209396,111901,89640,251720,204578,109327,87577,9561,842785,541485,199222,106768,846167,542528,200276,107531,314166,270182,727849,445328,192735,266313,720175,440331,189702,58093,217945,290786,97784,35402,219423,292108,98098,35499,42211,221374,418341,317017,134427,211721,399933,302928,128326,109461,108096,151121,92837,20297,109477,152977,93490,20403,20252,328330,283835,151553,45828,324490,278556,148454,45745,147596,5299,52015,28094,9341,316241,57479,42488,104566,20413,146210]
calibrate, marginals(ID_1 ID_2 ID_3 ID_4 ID_5 ID_6 ID_7 ID_8 ID_9 ID_10 ID_11 ID_12 ID_13 ID_14 ID_15 ID_16 ID_17 ID_18 ID_19 ID_20 ID_21 ID_22 ID_23 ID_24 ID_25 ID_26 ID_27 ID_28 ID_29 ID_30 ID_31 ID_32 ID_33 ID_34 ID_35 ID_36 ID_37 ID_38 ID_39 ID_40 ID_41 ID_42 ID_43 ID_44 ID_45 ID_46 ID_47 ID_48 ID_49 ID_50 ID_51 ID_52 ID_53 ID_54 ID_55 ID_56 ID_57 ID_58 ID_59 ID_60 ID_61 ID_62 ID_63 ID_64 ID_65 ID_66 ID_67 ID_68 ID_69 ID_70 ID_71 ID_72 ID_73 ID_74 ID_75 ID_76 ID_77 ID_78 ID_79 ID_80 ID_81 ID_82 ID_83 ID_84 ID_85 ID_86 ID_87 ID_88 ID_89 ID_90 ID_91 ID_92 ID_93 ID_94 ID_95 ID_96 ID_97 ID_98 ID_99 ID_100)
poptot(M) entrywt(FEX_FIN) exitwt(FEX_CALIB)
De otra parte, para la estimación puntual y los márgenes de calidad respectivos, se utilizó el procedimiento survey (comando svy), cuyo código implementado fue:
*Declaración del diseño
svyset CTO_1C [pweight= FEX_CALIB ], fpc(N_mpio) strata (ID_H) singleunit(certain) || Llave_CP, fpc(N_CP) strata (Clase) || NIM, fpc(N_mz)|| NIM, fpc(Nm_part_mz)|| llave_viv, fpc(N_viviendas) || llave_viv, fpc(N_hogares) || _n ,fpc(N_personas)
*Para generación de cuadros:
· Todos los desagregaciones excepto subregión:
svy, vce(linearized): tabulate (Pregunta) (Dominio) ,col se deff cv obs
· Para generar cuadros por subregión:
svy, vce(linearized): tabulate Subregion (Pregunta),row se deff cv obs
De otra parte, por cada variable de análisis se generaron ocho cuadros de salida, los cuales se relacionan con los siguientes niveles de desagregación: zona, sexo, grupo etario, nivel socioeconómico, ocupación, subregiones, regiones y nivel de ingreso.