Colombia - Evaluación de operaciones y resultados al instrumento de titulación de baldíos a familias campesinas en el período comprendido entre 1995 y 2013
ID de Referencia | COL-DNP-TBFC-2015 |
Año | 2015 |
País | Colombia |
Productor(es) | Departamento Nacional de Planeación - DNP |
Patrocinador(es) | DNP - - |
Colección(es) | |
metadata | Documentación en PDF |
Creado el | Dec 12, 2016 |
Última modificación | Dec 12, 2016 |
Visitas a la página | 198440 |
Descargas | 1215 |
- Materiales Relacionados
- Descripción de la operación estadística
- Diccionario de Datos
- Obtener Microdatos
Muestreo
Procedimiento de muestreo
Diseño de muestreo
A. Definición y descripción del marco de muestreo: Base de datos del INCODER con la información sobre titulación de baldíos a familias campesinas en el periodo comprendido entre 2008 y 2013 suministrada por el DNP, y cruzada con las bases de datos de SISBEN III y el Registro Único de Víctimas (RUV) para obtener datos de ubicación actualizadas de los beneficiarios.
El marco muestral final, acordado por el Comité técnico de la evaluación, corresponde a los baldíos adjudicados entre 2008 y 2013 que cuenta con datos de ubicación válidos (dirección de residencia y teléfono de 7 o 11 dígitos).
B. Diseño de muestreo general: Muestreo probabilístico, estratificado (regiones), de conglomerados (municipios y baldíos), con selección proporcional al tamaño de municipios (PPT) y selección aleatoria de baldíos, en tres etapas.
C. Definición del diseño de muestreo en cada una de las etapas o fases
-Estratificación: es decir, clasificando, previamente a la selección, las diferentes unidades de muestreo, en función de variables independientes conocidas. La estratificación es la técnica por excelencia para la optimación de un diseño de muestreo, pues permite la obtención de errores mínimos de muestreo. En el caso particular del proyecto, la variable de estratificación es la regionalización de municipios de acuerdo con los criterios definidos en la sección de desarrollo metodológico en lo referido al enfoque territorial. Particularmente se definieron como criterios relevantes para la regionalización los siguientes: Desconcentración, descentralización, tercerización, conflicto armado, macroregiones de focalización del proceso de restitución de tierras e incidencia del despojo y abandono forzado de tierras.
-Etapa I: por cada región de interés (estratos), se seleccionarán municipios (UPM), mediante un diseño PPT, teniendo como variable guía de diseño: "Baldíos Titulados".
-Etapa II: por cada municipio seleccionado (UPM), se seleccionarán aleatoriamente sin reemplazo (MAS) "" baldíos (USM).
-Etapa III: por cada baldío seleccionado:
· Si sólo hay un predio-familia, ésta queda seleccionada
· Si hay 2 o más predios-familias, se seleccionará aleatoriamente (MAS) un (01) predio-familia
D. Definición de los algoritmos de selección utilizados en todas las etapas:
-Etapa I: algoritmo método acumulativo total (procedimientos de lista-secuencial) implementado en el paquete "TeachingSampling" de R, mediante la función "S.STPPS"
-Etapa II: algoritmo "selection-rejection" (lista-secuencial) implementado en el paquete "TeachingSampling" de R, mediante la función "S.SI"
-Etapa III: algoritmo "selection-rejection" (lista-secuencial) implementado en el paquete "TeachingSampling" de R, mediante la función "S.SI"
E. Descripción de la metodología de estratificación: la estratificación por regiones corresponde a un ejercicio temático, en el cual se definen zonas de alto impacto en cuanto a situación de orden público y/o restitución de tierras. En particular en estas zonas hay gran concentración de titulación de baldíos. Así mismo, estas regiones se complementan con regiones de la encuesta de Calidad de Vida (DANE) y ésta información se tomó como la variable auxiliar para regionalización.
F. Definición del nivel de precisión: 1% de error muestral y 95% de confianza para alcanzar la representatividad sobre la población de las familias campesinas objeto de estudio a nivel nacional, con base en la estimación de una proporción del 50% usando los parámetros de la formulación del tamaño de muestra.
Nivel de desagregación de la información: se espera que los indicadores propuestos tengan el nivel de precisión deseado para el total de la muestra y, siempre y cuando los coeficientes de variación lo permitan, desagregar por regiones de interés. El cuadro de cve's para cada escenario simulado (uno para proporciones y otro para promedios, con "N" conocido), se encuentra en el documento Diseño muestral A Baldíos.
Cálculo del tamaño de la muestra
A. Cálculo y justificación del tamaño de muestra de las unidades de observación: La estimación de un tamaño muestral adecuado, tiene su fundamento en la selección de una variable guía de diseño. Para el objeto de estudio, se seleccionó la variable de dicotómica, la cual es una variable que posee una distribución binomial. La estimación del tamaño de muestra, bajo la premisa de estimación del Error Estándar Relativo (EsRel) se encuentra en el documento Diseño muestral A Baldíos.
B. Definición y justificación del efecto de diseño (DEFF): Para garantizar la precisión en la inferencia inducida por este diseño de muestreo, y basado en simulaciones del diseño con los algoritmos del programa TeachinSamplig, sobre las variables: Baldíos Titulados, Área Titulada, y Área Titulada Promedio; se definió un DEFF de 0,023.
C. Cálculo y justificación del tamaño de muestra de las unidades de muestreo en cada etapa, estrato o fase: los tamaños de muestra fueron determinados a partir de los requerimientos de confianza y máximo error muestral esperado. El tamaño de muestra total será de 1.700 familias campesinas distribuidas en 30 municipios.
Los tamaños de muestra en cada etapa fueron definidos en función del diseño muestral establecido, con el deff hallado y con el ejercicio de estimación de los errores muestrales esperados en los indicadores de interés.
Tamaño de la muestra :
Muestra 1700
Encuestas realizadas 1730
Desviaciones del diseño muestral
Muestra 1700
Encuestas realizadas 1730
Ausentes 267
Traslados 96
Rechazos 3
No ubicados 612
A la muestra incial se tuvo que hacer reemplazos debido a que en muchos casos 612 no se ubico a la persona que se le adjudico el predio o se encontrabas ausentes y no fue posible hablar con ellos.
Tasa de respuesta
Estimadores insesgados: La estimación de los parámetros de interés son inducidos por el diseño de muestreo establecido para el proyecto, es por esto que los estimadores deben ser acordes con el estimador de Hansen-Hurtwitz.
Factores de expansión generales: El factor de expansión es inducido por el diseño de muestreo establecido para el proyecto, acordes con el estimador de Hansen-Hurtwitz y se definen como la multiplicación de los factores de las diferentes etapas de diseño
Factores de expansión en cada etapa, estrato o fase: El factor de expansión es inducido por el diseño de muestreo establecido para el proyecto, acordes con el estimador de Hansen-Hurtwitz
Estimación insesgada de la varianza de los estimadores: La estimación la varianza está definida de acuerdo con el diseño de muestreo establecido para el proyecto, en por esto que los estimadores deben ser acordes con el estimador de Hansen-Hurtwitz
Detalles computacionales: para los ejercicios de estimación se utilizará el paquete “TeachingSampling” de R con las funciones “E.SI” y “E.STPPS”.
Expansores / Ponderadores
Nivel de precisión: 1% de error muestral y 95% de confianza para alcanzar la representatividad sobre la población de las familias campesinas objeto de estudio a nivel nacional, con base en la estimación de una proporción del 50% usando los parámetros de la formulación del tamaño de muestra.
Nivel de desagregación de la información: se espera que los indicadores propuestos tengan el nivel de precisión deseado para el total de la muestra y, siempre y cuando los coeficientes de variación lo permitan, desagregar por regiones de interés. A continuación se presenta el cuadro de cve's para cada escenario simulado (uno para proporciones y otro para promedios, con “N” conocido).