Diseño Estadístico

Diseño de la muestra

El diseño muestral de las Encuestas sobre Migración en las Fronteras Norte y Sur de México (EMIF norte y EMIF sur) tiene por objetivo estimar el volumen de los flujos migratorios y las características de los individuos que participan en éstos. Un flujo para su medición es definido como el conjunto de desplazamientos humanos que pasa por un espacio geográfico y un periodo de tiempo determinado. En las encuestas se estipula que este periodo es de un trimestre.

Después de cerca de 20 años en los que se empleó un diseño de muestreo polietápico para seleccionar la muestra y obtener las estimaciones (se puede consultar [el siguiente documento], se decidió reestructurar el diseño muestral y adecuarlo a uno estratificado con sólo dos etapas. Este cambio surgió como parte de la evaluación conjunta de un grupo de trabajo constituido por expertos del Centro de Investigación en Matemáticas (CIMAT) e integrantes del proyecto de las EMIF’S.

Entre los argumentos que presentó el grupo de trabajo para justificar el cambio destaca que en el diseño anterior había etapas de muestreo donde la probabilidad de selección era uno y existían procedimientos de asignación proporcional de la muestra en las otras etapas. Esto llevó a plantear que dichos niveles se debían incorporar como parte de una sola estratificación, lo que resulta en una simplificación importante del diseño muestral. A continuación se describe brevemente el nuevo diseño.

En la construcción del marco muestral se consideran dos ejes: temporal y espacial. El eje temporal se define como el número de días naturales en el trimestre que puede ser 90, 91 y 92 (o menos si se sabe que en ciertos días no hay flujo); a su vez cada uno de los días se divide en 1, 2 o 3 turnos, dependiendo de la cantidad del flujo y su distribución en las 24 horas del día. El segundo eje está conformado por un listado de todos los puntos cercanos a la frontera por donde transitan los migrantes; este listado es producto de ejercicios exhaustivos en los que se visita, durante una semana, toda la región fronteriza, se identifican los lugares de cruce y se mide el total del flujo.

La conjugación de los ejes espacial y temporal define el marco muestral de la encuesta, véase cuadro 1. Cada una de las celdas en el cuadro representa una combinación de tiempo y espacio, a la que nombramos jornada. En términos del marco muestral cada jornada es un punto muestral.


Cuadro 1 Esquema del marco muestral

Eje temporal
DIA 1 DIA 2 ... DIA 91
T1 T2 T3 T1 T2 T3 T1 T2 T3 T1 T2 T3
Eje espacial
Punto 1
Punto 2
Punto 3
Punto 4
Punto 5
Punto 6
...
Punto n-1
Punto n

Nota: T= turno



Cada una de las jornadas tiene una probabilidad conocida y distinta de cero de ser seleccionada, por lo que es posible obtener una muestra aleatoria de éstas, hacer la observación y estimar con cierto grado de confiabilidad y precisión el total del flujo. De igual forma se pueden estimar parámetros asociados a las características de los individuos que conforman el flujo. Para estimar estos parámetros se realiza una selección aleatoria de los individuos a nivel jornada, es decir, se hace una segunda etapa de muestreo, en la que la unidad de selección son los individuos que realizan los desplazamientos.

Tamaño de la muestra y su distribución

Primera etapa de muestreo

En la primera etapa de muestreo cada flujo analizado tiene un tamaño de muestra independiente que se define por criterios estadísticos y presupuestales (ver cuadro 2).

La selección de jornadas en cada flujo se basa en un diseño muestral estratificado. Con este diseño se busca aprovechar el conocimiento previo sobre el fenómeno estudiado para subdividir el marco muestral en estratos que se caracterizan por una mayor homogeneidad entre elementos al interior del estrato.

Cada estrato se define por la combinación punto-turno (sin considerar el día). Por ejemplo, un estrato incluye todas las jornadas que están definidas por el intervalo de 8:00 a 16:00 horas en la puerta de arribo de una central de autobuses. De esta forma, en cada flujo analizado hay tantos estratos como combinaciones punto-turno y tantas jornadas en cada estrato como días en el trimestre (exceptuando aquellos días del trimestre en los que sabemos que no habrá flujo, esto sucede principalmente en los flujos de devueltos).


Cuadro 2 Total de estratos, jornadas, tamaño de muestra por flujo, Emif Norte y Emif Sur.

Flujo de migrantes Número de estratos Número total de jornadas
(1)
Número de jornadas en Muestra Número de Individuos contactados
(2)
Cuestionarios completos Promedio
trimestral
(3)
Emif
Norte
Procedente del Norte 98 8,820 368 18,228 1,961
Procedente del Sur 86 7,740 377 16,606 2,142
Devuelto por las Autoridades Migratorias de Estados Unidos 20 1,748 153 1,046 1,046
Procedente de Estados Unidos por Aeropuertos 13 1,170 300 21,844 2,604
Emif
Sur
Procedente de Guatemala 18 1,620 145 13,875 2,689
Procedente de México/Estados Unidos 14 1,260 188 20,700 3,899
Devuelto
por Autoridades Mexicanas
4 312 142 2,122 2,122
Devuelto
por Autoridades Estadounidenses
3 169 78 1,606 1,606

Notas:
(1) El número de jornadas por estrato varía de trimestre a trimestre, según el número de días que corresponda, puede ser 90, 91 o 92. En el caso de los flujos de Devueltos, el número de jornadas varía según los días de la semana en que los institutos de migración realizan devoluciones.
(2) Es el número de individuos contactados para aplicar la cédula filtro, o directamente el cuestionario cuando así proceda. Este valor varía dependiendo del trimestre y año.
(3) Es el total de cuestionaros logrados después de identificar a la población sujeto de estudio que accede completar el cuestionario. Este valor varía dependiendo del trimestre y año.


Para la selección de las jornadas primero se distribuye el tamaño de muestra entre los estratos: a cada uno de éstos se le asignan dos jornadas; las restantes se distribuyen proporcionalmente según la distribución del flujo de migrantes entre los estratos. Posteriormente, al interior de cada estrato se eligen aleatoriamente y con igual probabilidad, los días del trimestre en los que se realiza el trabajo de campo. El número de días seleccionado es igual al tamaño de muestra asignado al estrato.

Segunda etapa de muestreo

La segunda etapa de muestreo se efectúa al interior de la jornada, a nivel individuo. La selección es aleatoria y se define por el momento en el cual el individuo llega al punto. Para comprender mejor este proceso conviene señalar que el trabajo de campo de la EMIF está diseñado para que dos personas colaboren durante las jornadas seleccionadas. Cada una de ellas realiza una de dos tareas: A) enumerar y B) aplicar la cédula filtro y el cuestionario.

Tarea A: enumerar. Es muy importante en la metodología de la EMIF registrar el número total de personas que pasaron por el flujo durante la jornada, ya que es un insumo indispensable para posteriormente estimar el número total de migrantes. Por esto, se realiza un conteo de forma continua: un enumerador se coloca en un punto desde donde pueda observar constantemente el flujo, se le recomienda imaginar una línea recta en el piso y contar a todas las personas que cruzan por ésta.

Tarea B: encuestar. La otra tarea esencial en el trabajo de campo es la aplicación de la encuesta, la cual se compone en general por dos secciones: la primera de ellas es la denominada cédula filtro, un conjunto de ocho o nueve preguntas breves que el encuestador debe aplicar a un individuo seleccionado al azar con la finalidad de saber si forma parte o no de la población objetivo. En caso de identificar a un migrante, el encuestador debe aplicar la segunda sección que corresponde a un cuestionario más extenso cuyas preguntas varían dependiendo del flujo analizado (ver diagrama 1).

La implementación de estas tareas puede variar dependiendo de las circunstancias de cada flujo. Por ejemplo, en el flujo de migrantes mexicanos devueltos por autoridades estadounidenses o centroamericanos devueltos por autoridades mexicanas, no se aplica la cédula filtro pues todos los individuos son sujetos de estudio; por otra parte, en algunos espacios o puntos de cruce las condiciones difieren de tal forma que es necesario modificar la implementación de las tareas A y B.


Diagrama 1