Colombia - Realizar una evaluación de impacto de las cohortes 2012 y 2013 del programa Transfórmate Tú Mujer, financiadas con recursos del Sistema General de Regalías, con el fin de medir el efecto causal sobre el bienestar económico, el empoderamiento políti
ID de Referencia | DNP-DSEPP-TTM-2017 |
Año | 2017 |
País | Colombia |
Productor(es) |
Departamento Nacional de Planeación - DNP Cristina Querubín - Centro Nacional de Consultoría |
Patrocinador(es) | Departamento Nacional de Planeación - DNP - |
Colección(es) | |
metadata |
![]() |
Creado el | Apr 06, 2018 |
Última modificación | May 30, 2018 |
Visitas a la página | 142012 |
Descargas | 806 |
- Materiales Relacionados
- Descripción de la operación estadística
- Diccionario de Datos
- Obtener Microdatos
Muestreo
Procedimiento de muestreo
Marco muestral:
El marco muestral es el dispositivo que permite identificar y ubicar a todos los elementos de la población. En el presente estudio se utilizará, para la selección de la unidad primaria de muestreo, el listado de municipios de la División Política Administrativa - DIVIPOLA, del DANE para los departamentos de Atlántico, Bolívar y Magdalena. En el caso de las unidades secundarias se utilizará el listado de las mujeres beneficiarias en el programa Transfórmate Tú Mujer (selección de las mujeres del grupo de tratamiento) y así mismo los registros administrativos de la población beneficiaria del SISBEN para la selección de las mujeres que harán parte del grupo control.
Diseño muestral general:
El tipo de muestreo es probabilístico, estratificado y bietápico de elementos. El muestreo es probabilístico debido a que las unidades de muestreo en cada una de las etapas tienen una probabilidad conocida y mayor que cero de ser seleccionadas. Es estratificado porque se consideran particiones poblacionales, definidas como conjuntos de elementos cuya unión conforma el universo, que no se traslapan y donde todos son diferentes de vacío, esto tratando de lograr homogeneidad dentro de ellas y heterogeneidad entre ellas.
Muestreo en cada etapa y estrato:
Las unidades primarias de muestreo (UPM) corresponden a los municipios de los departamentos de Atlántico, Bolívar y Magdalena; se considerarán estos departamentos como los estratos de las UPM.
Las unidades secundarias de muestreo (USM) corresponden a las mujeres mayores de 18 años inscritas en el SISBEN. Las USM son estratificadas en un grupo control y un grupo tratamiento, en este último se encuentran las mujeres beneficiarias del programa Transfórmate Tú Mujer. Al interior del grupo de tratamiento se selecciona la muestra empleando un muestreo aleatorio simple, una vez seleccionada esta se procede a aplicar el método de emparejamiento para seleccionar las unidades del grupo control.
Tasa de respuesta
a. Parámetros a estimar
Con base en las variables que se van a incluir en la encuesta y con las cuales se buscará responder a los objetivos y las preguntas orientadoras, se construirán los parámetros que permitan evaluar los siguientes aspectos:
• Impacto del programa sobre los ingresos, gastos, empleabilidad, formalidad y actividad productiva de las beneficiarias.
• Impacto del programa sobre el empoderamiento de las mujeres en sus hogares y negocios.
• Impacto del programa sobre la salud psicosocial de las mujeres.
• Impactos del programa sobre la participación política de las mujeres
• Impacto del programa sobre la calidad de vida de los hogares de las beneficiarias y en especial de sus hijos.
• Impacto del programa sobre la asociatividad y las iniciativas de emprendimiento colectivo de las mujeres.
• Discusión sobre posibles efectos del programa en la equidad de género en el departamento.
• Condiciones de la mujer en los municipios participantes en el programa.
• Calidad de vida de los hogares de las beneficiarias.
Los parámetros de interés son: el total poblacional, la razón poblacional, el promedio poblacional, la proporción poblacional, la diferencia de medias de una variable de interés entre el grupo de mujeres participantes en el programa y las mujeres del grupo control. Varios de estos parámetros son descritos más detalladamente en Särndal (1992) y Gutiérrez (2009).
• Total poblacional: se define como la suma de la variable de interés en el universo. se calcula como:
U hace referencia al universo.
• Razón poblacional: se calcula como como el cociente de totales, el primer total asociado a una variable de interés y el segundo total asociado a una variable de interés z. Se calcula como:
donde es el total poblacional asociado a la variable y es el total asociado a la variable z.
• Promedio poblacional: se define como la suma de la variable de interés sobre el número de datos, se calcula como:
• Proporción poblacional: la proporción poblacional es un promedio sobre una variable dicotómica que toma 1 si el individuo k-ésimo tiene el atributo de interés, una proporción se calcula como:
• Diferencia de medias: la diferencia de medias entre dos poblaciones se define como la resta de los promedios de los dos grupos, en el caso de este estudio es de interés calcular la diferencia de medias de una variable de interés en el grupo de mujeres participantes en el progama con la media de la misma variable de interés en el grupo de controles . La diferencia de medias puede permitir ver los efectos de un tratamiento o de un programa si los individuos del grupo control están emparejados con los individuos del grupo control, es decir si existe balanceamiento de las variables en ambos grupos (diferencia estadística no significativa en las otras variables diferentes al tratamiento, Rosembaum (2010)). La diferencia de medias puede calcularse como:
con y donde denota el valor de la variable respuesta para un individuo que pertenezca al grupo de tratados y denota el valor de la variable respuesta para un individuo en el grupo de control. representa el número total de individuos en el grupo contro y el número total de individuos en el grupo tratamiento.
La diferencia de medias puede calcularse a partir de la siguiente regresión:
Donde es el valor de la variable de interés para el k-ésimo individuo en el j-ésimo grupo, : Media global de la variable de interés., : El efecto del tratamiento sobre la variable de interés. : Es el componente de error aleatorio para el k-ésimo individuo en el j-ésimo grupo. El modelo anterior tiene como supuesto que , además los residuales se distribuyen normal con media cero, son homoscedásticos e independientes entre ellos. Angrist (2010)
Los parámetros del anterior modelo se estimarían en este caso para mujeres mayores de 18 años que estén inscritas en el SIBEN ubicadas en Atlántico, Bolivar y Magdalena.
• El valor esperado de la variable resultado para un individuo que sea parte del grupo control es .
• El valor esperado de la variable resultado para un individuo que sea parte del grupo de mujeres participantes en el programa Transfórmate Tu Mujeres es
Por lo tanto puede verse como la diferencia de medias de la variable de interés entre tratamientos y controles. Angrist (2010). Cuando se disponen de todos los datos poblaciones, el modelo anterior se conoce como el modelo poblacional, en la práctica este modelo se estimará utilizando los datos muestrales y teniendo en cuenta el diseño muestral.
El anterior modelo se puede escribirse en forma matricial como:
De acá, . Para una mejor ilustración, se presenta el modelo de forma matricial:
b. Expresiones de los estimadores insesgados o aproximadamente insesgados
· Estimación de un total
Para estimar el total poblacional se utiliza el estimador de Horvitz-Thompson (Särndal, 1992).
Para estimar el total de una variable de interés para el grupo de mujeres de interés se utilizan las siguientes expresiones:
Con
Resumiendo, puede obtenerse el total así:
Donde
• : denota el subíndice del estrato (departamentos considerados en el estudio, es decir Atlántico, Bolivar y Magdalena).
• H denota el número total de estratos de municipios, para este estudio H = 3.
• : Probabilidad de inclusión del -ésimo municipio en el estrato .
• : total estimado de la variable de interés y en el i-ésimo municipio del estrato .
• : Número de mujeres del municipio i (dentro del estrato h) en el grupo g.
• : Número de mujeres seleccionadas en la muestra del municipio i (dentro del estrato h) en el grupo g.
• g: denota las mujeres participantes del tratamiento, g = 1. En las del grupo control, g = 0.
· Estimación de una razón
Para estimar una razón basta estimar el total asociado al numerador y al denominador, una razón se calcula como:
Para el cálculo de los totales se utiliza la expresión utilizada para estimar un total poblacional.
· Estimación del promedio
Para estimar un promedio basta con aplicar las expresiones para estimar una razón considerando , es decir, , por tanto , en donde y , para estimar ambos totales se usa la expresión para la estimación del total población.
· Estimación de una proporción
Una proporción es un promedio sobre una variable dicotómica definida como 1, si el individuo k-ésimo es éxito en la variable de interés, y 0, si no.
Para estimar la proporción y su varianza, se siguen los mismos principios que en la estimación de un promedio. Pero usando un valor de dicotómico definido así:
De tal modo que:
• Estimación de la diferencia de medias
En la definición de parámetros se especificó que para estimar la diferencia de medias basta con estimar el valor de del siguiente modelo de regresión:
Se especificó también que el modelo anterior puede escribirse como un modelo lineal de la siguiente forma:
El propósito ahora será estimar con los datos muestrales el siguiente modelo:
Para estimar los coeficientes de regresión se utilizan la siguiente expresión:
Con X la matriz de diseño del modelo, Y el vector de observaciones de la variable de interés y W una matriz diagonal que contiene los inversos de las probabilidades de inclusión asociados al diseño muestral:
c. Factores de expansión general
Como consecuencia del diseño de muestreo planteado y las propiedades de independencia e invarianza del mismo, los factores de expansión en cada estrato resultan del producto de los inversos de las probabilidades de inclusión de las unidades de muestreo en cada etapa.
Como el muestreo tiene dos etapas, el factor de expansión básico está dado por:
Con la probabilidad de inclusión del municipio I, mientras que es la probabilidad de inclusión de la mujer k.
d. Factores de expansión en cada etapa, estrato o fase
En el caso de estratos de las UPM que son municipios, por ser un diseño de muestreo para la probabilidad de inclusión es:
Esta asignación de probabilidades da garantías de que las estimaciones de la varianza siempre son no negativas. De este modo, el factor de expansión de un municipio I del estrato h es:
En el caso de la segunda etapa, por ser un muestreo aleatorio simple, la probabilidad de inclusión de la mujer k del municipio I es:
: es el número de mujeres en el grupo g (si g = 1, el grupo de mujeres participantes en el tratamiento, g = 0 las mujeres del grupo control), del municipio i (el cual está contenido en el departamento /estrato h). Por su parte corresponde al tamaño de la muestra de mujeres en el grupo g del municipio i del estrato h. Por tanto, el factor de expansión de la mujer k es:
e. Expresiones de estimadores insegados o aproximadamente insesgados de la varianza de los estimadores propuestos.
Estimación de la varianza del estimador del total
Puede estimarse la varianza del total de una variable de interés como:
· Varianza estimada del estimador en la primera etapa con diseño
Con
Siendo
el número de municipios seleccionados en el estrato h.
La estimación del método de la varianza en la primera etapa se base en la propuesta de Deville y Tille (2005), ver Gutiérrez (2009).
· Varianza estimada del estimador en la segunda etapa con diseño
, con
es la varianza de la variable de interés en el grupo g (g = 1 tratados, g = 0 controles) del municipio i (el cual está en el estrato h).
La varianza estimada del estimador es la suma de las varianzas estimadas en cada etapa.
Estimador de la varianza de una razón
Para estimar la varianza de una razón basta con construir la variable
y aplicar la misma fórmula de estimación de la varianza del total ya explicada anteriormente, pero trabajando en lugar de la variable con definida anteriormente.
La expresión para estimar la varianza de una razón es como sigue:
· La varianza estimada del estimador de la razón en la primera etapa con diseño está dada por:
Con
y
Donde , , y el número de municipios seleccionados en el estrato h.
· La varianza estimada del estimador de la razón en la segunda etapa con diseño está dada por:
, con
Donde es la varianza de la variable definida anteriormente en el grupo g (g = 1 tratados, g = 0 controles) del municipio i (el cual está en el estrato h).
La varianza estimada del estimador de una razón es la suma de las varianzas estimadas en cada etapa, es decir,
+
Estimación de la varianza de un promedio
Para estimar la varianza de un promedio se usa la misma expresión utilizada para la estimación de la varianza del total, pero se utiliza en lugar de la variable . es la estimación del tamaño poblacional.
La estimación del promedio puede verse como un caso particular de la estimación de una razón.
· La varianza estimada del estimador de un promedio en la primera etapa con diseño está dada por:
Con
y
donde y el número de municipios seleccionados en el estrato h.
· Varianza estimada del estimador de la razón en la segunda etapa con diseño
, con
es la varianza de la variable definida anteriormente en el grupo g (g = 1 tratados, g = 0 controles) del municipio i (el cual está en el estrato h).
La varianza estimada del estimador del promedio es la suma de las varianzas estimadas en cada etapa, es decir,
+
Estimación de la varianza de una proporción
Para estimar la varianza de un promedio se usa la misma expresión utilizada para la estimación de la varianza del total, pero se utiliza en lugar de la variable . La estimación de la proporción poblacional puede verse como un caso particular de un promedio en donde la variable es dicotómica.
· Varianza estimada del estimador de la razón en la primera etapa con diseño
Con
Siendo y
el número de municipios seleccionados en el estrato h.
· Varianza estimada del estimador de la razón en la segunda etapa con diseño
, con
es la varianza de la variable definida anteriormente en el grupo g (g = 1 tratados, g = 0 controles) del municipio i (el cual está en el estrato h).
La varianza estimada del estimador es la suma de las varianzas estimadas en cada etapa.
Estimación de la varianza de la diferencia de medias
Para estimar la varianza de los coeficientes de regresión se utiliza la siguiente expresión de Särndal (1992):
donde es una matriz cuyos elementos están dados por
donde y y se define forma análoga a .
Una vez calculada la varianza de los se estima la varianza de la diferencia de medias definidos anteriormente.