5  Calibración

La estrategia de la calibración está compuesta por un conjunto de prácticas que aspiran a lograr objetivos similares al proceso del balanceo del cubo pero con métodos cualitativamente diferentes. La principal diferencia radica en que la calibración se realiza ex-post la ejecución de la muestra (o sea, en el momento de la estimación) y no ex-ante (o sea, en el momento del diseño) (Deville y Tillé 2004, pág. 907). Esto es una diferencia fundamental que emparenta a la calibración con el enfoque del “Model Assisted” y la aleja del “Design Based1. En efecto, tanto el balanceo como la calibración pueden considerarse prácticas relativamente generales que, en su interior, incluyen otras prácticas más específicas. Esto es lo que habilita a afirmar que, por ejemplo, la estratificación es un caso particular del balanceo así como la post-estratificación es un caso particular de la calibración (Tillé 2011, pág. 223).

Otra diferencia entre el balanceo y la calibración es que para realizar la calibración en algunas situaciones (esto depende de la técnica específica seleccionada) solo es necesario los totales de la población y no, como en el balanceo, los valores de cada unidad que compone esa población.

Las características anteriores hacen que el proceso de calibración sea muy útil en momentos en donde existe conocimientos sobre algunos totales de la población y no se haya podido controlar mucho el proceso de diseño de la muestra (p.e. diseños no probabilistas) o diseños probabilistas pero con una alta tasa de no respuesta. Estas características hacen al proceso de calibración algo muy deseado para muchas investigaciones contemporáneas en donde pueda admitirse que se conocen algunos parámetros poblacionales y, por ejemplo, se ha realizado una muestra que se difundió de manera virtual a través de un link que circuló por diferentes redes sociales. Esto deja en pie la discusión sobre que “tan buenos” podrán ser los resultados de esa investigación, pero no parece haber muchas dudas que la investigación del ejemplo anterior será mejor si se le realiza un proceso de calibración mientras que será peor si no se realiza ese proceso.2

En cuanto a su pertinencia, siempre que haya disponibilidad de tiempo (y el saber necesario para realizarlo) es aconsejable realizar una calibración. Esto es cierto al menos porque el balanceo tiene el problema del redondeo (las muestras son muestras de números enteros) y la calibración no, ya que puede construirse calibradores con números racionales. Por esta misma razón, aun cuando se haya realizado una muestra con un diseño por balanceo, es recomendable calibrar con los totales de las variables que se usaron en el proceso de balanceo.

Detalladas algunas diferencias entre la calibración y el balanceo ahora se pasa a diferenciar la calibración (de una muestra) de la imputación (de variables específicas).

Por último, a veces se suele asimilar como sinónimos en término calibración con el término post-estratificación. Más arriba ya se había comentado que el segundo puede considerarse como un caso particular (aunque quizás el más difundido) del primero en donde solo se utilizan variables categóricas (estratos) para el proceso de la calibración. Lo mismo puede afirmarse del método menos difundido del “raking” que permite la calibración de múltiples variables categóricas sin la necesidad de realizar cruces entre ellas con el riesgo de no tener casos en la muestra de algunas de las celdas de los múltiples cruces (Lumley 2010, pág. 139). Por esta razón, aquí usaremos directamente el método de la calibración por ser el más general, ya que permite la inclusión tanto de variables categóricas como continuas y no presenta los riesgos de la post-calibración en cuanto a la posible ausencia de casos frutos de los cruces de las variables categóricas.

A continuación vamos a trabajar con 2 ejemplos alternativos. Uno, en donde la calibración se realiza sobre la muestra aleatoria simple y otra que se realiza sobre la muestra balanceada y bien distribuida. En función de lo visto anteriormente (sec-azar_simple, sec-cubo y sec-bien_distribuido) ya sabemos que ambas calibraciones van a partir desde un punto de inicio diferente. Veremos que tanta distancia entre sí y con respecto a los parámetros poblaciones van a tener los respectivos puntos de llegada (esto es, las estimaciones de ambas muestras) luego de realizar la calibración. En otras palabras, la muestra balanceada y bien distribuida ya se encontraba (en general) bastante cerca de los parámetros poblacionales por lo que, a priori, cuenta con alguna ventaja desde su puesto de largada.

5.1 Calibración muestra azar simple

Comenzaremos haciendo la calibración sobre nuestra muestra realizada por azar simple y su resultado lo comparemos con la respectiva muestra de azar simple (sin calibrar) y con los respectivos parámetros poblacionales. Vamos a ver que, en comparación con otras técnicas, la mayor flexibilidad de la calibración se paga con una mayor especificación de los parámetros de sus funciones3.

Para eso vamos a recuperar el objeto con el cual le informábamos a R que habíamos realizado una muestra aleatoria simple (sec-azar_simple). Ese va a ser nuestro primer insumo al cual le vamos a realizar la calibración y para eso es importante el proceso de la selección y armado de las covariables. Esta parte es similar en espíritu a lo realizado en el proceso de balanceo, pero la parte operativa tiene pequeñas diferencias como se observa en el siguiente código.

Sample:  [1] "(Intercept)"          "matricula"            "ambitoRural Disperso"
 [4] "ambitoRural Agrupado" "region02"             "region03"            
 [7] "region04"             "region05"             "region06"            
[10] "region07"             "region08"             "region09"            
[13] "region10"             "region11"             "region12"            
[16] "region13"             "region14"             "region15"            
[19] "region16"             "region17"             "region18"            
[22] "region19"             "region20"             "region21"            
[25] "region22"             "region23"             "region24"            
[28] "region25"            
Popltn:  [1] ""  ""  "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n"
[20] "n" "n" "n" "n" "n" "n" "n" "n" "n"
Tabla 5.1: Calibración muestra azar simple
Característica
AS Calibrado
AS sin calibrar
Poblacion
N = 4.1681 95% CI N = 4.1681 95% CI N = 4.1682
matricula 267 (0) 267, 267 276,6 (2,9) 271, 282 267,9
secciones 11 (0) 11, 11 11,6 (0,1) 11, 12 11,2
sondeo_primero 57 (0) 56, 57 56,2 (0,2) 56, 57 57,3
    Desconocido 568
472
560
sondeo_segundo 70 (0) 69, 70 69,8 (0,2) 69, 70 69,5
    Desconocido 647
556
570
region




    01 4,5% (n=7) 4,5%, 4,5% 2,3% (n=7) 2,0%, 2,7% 4,5% (189)
    02 5,4% (n=19) 5,4%, 5,4% 6,3% (n=19) 5,8%, 6,9% 5,4% (223)
    03 5,0% (n=16) 5,0%, 5,0% 5,3% (n=16) 4,9%, 5,8% 5,0% (210)
    04 5,1% (n=21) 5,1%, 5,1% 7,0% (n=21) 6,5%, 7,6% 5,1% (213)
    05 4,7% (n=8) 4,7%, 4,7% 2,7% (n=8) 2,3%, 3,0% 4,7% (194)
    06 3,6% (n=11) 3,6%, 3,6% 3,7% (n=11) 3,3%, 4,1% 3,6% (148)
    07 3,3% (n=11) 3,3%, 3,3% 3,7% (n=11) 3,3%, 4,1% 3,3% (138)
    08 3,6% (n=16) 3,6%, 3,6% 5,3% (n=16) 4,9%, 5,8% 3,6% (149)
    09 4,9% (n=20) 4,9%, 4,9% 6,7% (n=20) 6,1%, 7,2% 4,9% (205)
    10 5,4% (n=20) 5,4%, 5,4% 6,7% (n=20) 6,1%, 7,2% 5,4% (224)
    11 4,0% (n=13) 4,0%, 4,0% 4,3% (n=13) 3,9%, 4,8% 4,0% (166)
    12 3,7% (n=7) 3,7%, 3,7% 2,3% (n=7) 2,0%, 2,7% 3,7% (155)
    13 3,1% (n=8) 3,1%, 3,1% 2,7% (n=8) 2,3%, 3,0% 3,1% (131)
    14 4,1% (n=12) 4,1%, 4,1% 4,0% (n=12) 3,6%, 4,4% 4,1% (169)
    15 4,2% (n=10) 4,2%, 4,2% 3,3% (n=10) 3,0%, 3,7% 4,2% (174)
    16 3,0% (n=6) 3,0%, 3,0% 2,0% (n=6) 1,7%, 2,3% 3,0% (125)
    17 3,2% (n=10) 3,2%, 3,2% 3,3% (n=10) 3,0%, 3,7% 3,2% (133)
    18 3,8% (n=9) 3,8%, 3,8% 3,0% (n=9) 2,7%, 3,4% 3,8% (160)
    19 2,8% (n=8) 2,8%, 2,8% 2,7% (n=8) 2,3%, 3,0% 2,8% (118)
    20 3,8% (n=11) 3,8%, 3,8% 3,7% (n=11) 3,3%, 4,1% 3,8% (159)
    21 2,8% (n=6) 2,8%, 2,8% 2,0% (n=6) 1,7%, 2,3% 2,8% (117)
    22 3,7% (n=12) 3,7%, 3,7% 4,0% (n=12) 3,6%, 4,4% 3,7% (153)
    23 3,7% (n=14) 3,7%, 3,7% 4,7% (n=14) 4,2%, 5,1% 3,7% (153)
    24 4,7% (n=9) 4,7%, 4,7% 3,0% (n=9) 2,7%, 3,4% 4,7% (196)
    25 4,0% (n=16) 4,0%, 4,0% 5,3% (n=16) 4,9%, 5,8% 4,0% (166)
ambito




    Urbano 65% (n=201) 65%, 65% 67,0% (n=201) 66%, 68% 65,4% (2.727)
    Rural Disperso 26% (n=61) 26%, 26% 20,3% (n=61) 19%, 21% 25,7% (1.073)
    Rural Agrupado 8,8% (n=38) 8,8%, 8,8% 12,7% (n=38) 12%, 13% 8,8% (368)
    Desconocido



9
    Desconocido



9
Abreviacion: CI = Intervalo de confianza
1 Media (SE); % (n=n (unweighted))
2 Media; % (n)

Como puede observarse en Tabla tbl-azar_simple_calibrado la calibración ha mejorado sensiblemente la muestra de azar simple en casi todas las variables, aún en aquellas que no se usaron activamente en la matriz de calibración. En efecto, en la mayoría de las variables los valores de la muestra calibrada se acercan mucho a los parámetros poblacionales.

Un paso adicional que se puede realizar si luego se quiere trabajar en una planilla de cálculo o, más en general, por fuera de R, es agregar los respectivos ponderadores del proceso de calibración al objeto para así tenerlos como una variable más. En este sentido, la base de datos con los casos seleccionados de la muestras ahora pasaría a tener 2 variables especiales que servirían para el proceso de expansión de la muestra a la población. Uno, un ponderador que ya existía luego de haber realizado el azar simple (y que era igual para todos los casos) y otro recientemente agregado, el calibrador, que es específico para cada caso.

Tabla 5.2: Ponderadores y calibradores. Base muestra azar simple.
matricula secciones ambito sondeo_primero sondeo_segundo pond_weight cal_weight
100 6 Urbano 42.46154 52.88889 13.89333 12.51390
122 6 Urbano 57.11538 50.27273 13.89333 14.50510
78 6 Urbano 79.93750 75.41667 13.89333 23.16509

5.2 Calibración muestra bien distribuida

En el caso de la calibración de la muestra bien distribuida el proceso de calibración es similar con la diferencia que cambia el insumo al cual se le realiza la calibración. Aquí el código es un poco más simple porque se reutiliza la matriz de covariables construida para la calibración de la muestra de azar simple.

Sample:  [1] "(Intercept)"          "matricula"            "ambitoRural Disperso"
 [4] "ambitoRural Agrupado" "region02"             "region03"            
 [7] "region04"             "region05"             "region06"            
[10] "region07"             "region08"             "region09"            
[13] "region10"             "region11"             "region12"            
[16] "region13"             "region14"             "region15"            
[19] "region16"             "region17"             "region18"            
[22] "region19"             "region20"             "region21"            
[25] "region22"             "region23"             "region24"            
[28] "region25"            
Popltn:  [1] ""  ""  "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n" "n"
[20] "n" "n" "n" "n" "n" "n" "n" "n" "n"
Tabla 5.3: Calibración muestra bien distribuida
Característica
BD calibrado
BD sin calibrar
Poblacion
N = 4.1681 95% CI N = 4.1562 N = 4.1683
matricula 267 (0) 267, 267 268,0 (2,8) 267,9
secciones 11 (0) 11, 11 11,1 (0,1) 11,2
sondeo_primero 58 (0) 58, 58 58,0 (0,2) 57,3
    Desconocido 478

560
sondeo_segundo 69 (0) 68, 69 68,5 (0,2) 69,5
    Desconocido 543

570
region



    01 4,5% (n=13) 4,5%, 4,5% 4,3% (n=13) 4,5% (189)
    02 5,4% (n=17) 5,4%, 5,4% 5,7% (n=17) 5,4% (223)
    03 5,0% (n=15) 5,0%, 5,0% 5,0% (n=15) 5,0% (210)
    04 5,1% (n=15) 5,1%, 5,1% 5,0% (n=15) 5,1% (213)
    05 4,7% (n=13) 4,7%, 4,7% 4,3% (n=13) 4,7% (194)
    06 3,6% (n=11) 3,6%, 3,6% 3,7% (n=11) 3,6% (148)
    07 3,3% (n=10) 3,3%, 3,3% 3,3% (n=10) 3,3% (138)
    08 3,6% (n=11) 3,6%, 3,6% 3,7% (n=11) 3,6% (149)
    09 4,9% (n=16) 4,9%, 4,9% 5,3% (n=16) 4,9% (205)
    10 5,4% (n=16) 5,4%, 5,4% 5,3% (n=16) 5,4% (224)
    11 4,0% (n=11) 4,0%, 4,0% 3,7% (n=11) 4,0% (166)
    12 3,7% (n=12) 3,7%, 3,7% 4,0% (n=12) 3,7% (155)
    13 3,1% (n=8) 3,1%, 3,1% 2,7% (n=8) 3,1% (131)
    14 4,1% (n=11) 4,1%, 4,1% 3,7% (n=11) 4,1% (169)
    15 4,2% (n=15) 4,2%, 4,2% 5,0% (n=15) 4,2% (174)
    16 3,0% (n=7) 3,0%, 3,0% 2,3% (n=7) 3,0% (125)
    17 3,2% (n=11) 3,2%, 3,2% 3,7% (n=11) 3,2% (133)
    18 3,8% (n=11) 3,8%, 3,8% 3,7% (n=11) 3,8% (160)
    19 2,8% (n=9) 2,8%, 2,8% 3,0% (n=9) 2,8% (118)
    20 3,8% (n=10) 3,8%, 3,8% 3,3% (n=10) 3,8% (159)
    21 2,8% (n=10) 2,8%, 2,8% 3,3% (n=10) 2,8% (117)
    22 3,7% (n=12) 3,7%, 3,7% 4,0% (n=12) 3,7% (153)
    23 3,7% (n=12) 3,7%, 3,7% 4,0% (n=12) 3,7% (153)
    24 4,7% (n=14) 4,7%, 4,7% 4,7% (n=14) 4,7% (196)
    25 4,0% (n=10) 4,0%, 4,0% 3,3% (n=10) 4,0% (166)
ambito



    Urbano 65% (n=195) 65%, 65% 65,0% (n=195) 65,4% (2.727)
    Rural Disperso 26% (n=80) 26%, 26% 26,7% (n=80) 25,7% (1.073)
    Rural Agrupado 8,8% (n=25) 8,8%, 8,8% 8,3% (n=25) 8,8% (368)
    Desconocido


9
    Desconocido


9
Abreviacion: CI = Intervalo de confianza
1 Media (SE); % (n=n (unweighted))
2 Media (DE); % (n sin ponderar)
3 Media; % (n)

Al igual que con la calibración de la base de la muestra de azar simple, aquí vamos a extraer los calibradores para luego agregarlos a la base de datos.

Es interesante destacar, como se observa en la Tabla tbl-base_muestra_BD_cal (y a diferencia de lo visto en la Tabla tbl-azar_simple_calibrado) que acá no sólo los calibradores son diferentes entre sí sino que también lo eran ponderadores de la muestra bien distribuida.

Tabla 5.4: Ponderadores y calibradores. Base muestra bien distribuida.
matricula secciones ambito sondeo_primero sondeo_segundo pond_weight cal_weight
533 24 Urbano 58.11111 70.60484 13.85333 14.46208
668 24 Urbano 38.02857 73.39394 13.85333 14.32084
340 14 Urbano 60.08219 85.81707 13.85333 14.66400

5.3 Comparación calibración muestra balanceada y azar simple

Finalmente vamos a realizar una comparación entre los resultados de los procesos de calibración antes realizados y los respectivos parámetros poblacionales. Esto es lo que precisamente se observa en la Tabla tbl-comp_calibraciones.

Tabla 5.5: Comparación entre calibración de las muestras bien distribuidas, de azar simple y los respectivos parámetros poblacionales
Característica
BD calibrado
AS calibrado
Poblacion
N = 4.1681 95% CI N = 4.1681 95% CI N = 4.1682
matricula 267 (0) 267, 267 267 (0) 267, 267 267,9
secciones 11 (0) 11, 11 11 (0) 11, 11 11,2
sondeo_primero 58 (0) 58, 58 57 (0) 56, 57 57,3
    Desconocido 478
568
560
sondeo_segundo 69 (0) 68, 69 70 (0) 69, 70 69,5
    Desconocido 543
647
570
region




    01 4,5% (n=13) 4,5%, 4,5% 4,5% (n=7) 4,5%, 4,5% 4,5% (189)
    02 5,4% (n=17) 5,4%, 5,4% 5,4% (n=19) 5,4%, 5,4% 5,4% (223)
    03 5,0% (n=15) 5,0%, 5,0% 5,0% (n=16) 5,0%, 5,0% 5,0% (210)
    04 5,1% (n=15) 5,1%, 5,1% 5,1% (n=21) 5,1%, 5,1% 5,1% (213)
    05 4,7% (n=13) 4,7%, 4,7% 4,7% (n=8) 4,7%, 4,7% 4,7% (194)
    06 3,6% (n=11) 3,6%, 3,6% 3,6% (n=11) 3,6%, 3,6% 3,6% (148)
    07 3,3% (n=10) 3,3%, 3,3% 3,3% (n=11) 3,3%, 3,3% 3,3% (138)
    08 3,6% (n=11) 3,6%, 3,6% 3,6% (n=16) 3,6%, 3,6% 3,6% (149)
    09 4,9% (n=16) 4,9%, 4,9% 4,9% (n=20) 4,9%, 4,9% 4,9% (205)
    10 5,4% (n=16) 5,4%, 5,4% 5,4% (n=20) 5,4%, 5,4% 5,4% (224)
    11 4,0% (n=11) 4,0%, 4,0% 4,0% (n=13) 4,0%, 4,0% 4,0% (166)
    12 3,7% (n=12) 3,7%, 3,7% 3,7% (n=7) 3,7%, 3,7% 3,7% (155)
    13 3,1% (n=8) 3,1%, 3,1% 3,1% (n=8) 3,1%, 3,1% 3,1% (131)
    14 4,1% (n=11) 4,1%, 4,1% 4,1% (n=12) 4,1%, 4,1% 4,1% (169)
    15 4,2% (n=15) 4,2%, 4,2% 4,2% (n=10) 4,2%, 4,2% 4,2% (174)
    16 3,0% (n=7) 3,0%, 3,0% 3,0% (n=6) 3,0%, 3,0% 3,0% (125)
    17 3,2% (n=11) 3,2%, 3,2% 3,2% (n=10) 3,2%, 3,2% 3,2% (133)
    18 3,8% (n=11) 3,8%, 3,8% 3,8% (n=9) 3,8%, 3,8% 3,8% (160)
    19 2,8% (n=9) 2,8%, 2,8% 2,8% (n=8) 2,8%, 2,8% 2,8% (118)
    20 3,8% (n=10) 3,8%, 3,8% 3,8% (n=11) 3,8%, 3,8% 3,8% (159)
    21 2,8% (n=10) 2,8%, 2,8% 2,8% (n=6) 2,8%, 2,8% 2,8% (117)
    22 3,7% (n=12) 3,7%, 3,7% 3,7% (n=12) 3,7%, 3,7% 3,7% (153)
    23 3,7% (n=12) 3,7%, 3,7% 3,7% (n=14) 3,7%, 3,7% 3,7% (153)
    24 4,7% (n=14) 4,7%, 4,7% 4,7% (n=9) 4,7%, 4,7% 4,7% (196)
    25 4,0% (n=10) 4,0%, 4,0% 4,0% (n=16) 4,0%, 4,0% 4,0% (166)
ambito




    Urbano 65% (n=195) 65%, 65% 65% (n=201) 65%, 65% 65,4% (2.727)
    Rural Disperso 26% (n=80) 26%, 26% 26% (n=61) 26%, 26% 25,7% (1.073)
    Rural Agrupado 8,8% (n=25) 8,8%, 8,8% 8,8% (n=38) 8,8%, 8,8% 8,8% (368)
    Desconocido



9
    Desconocido



9
Abreviacion: CI = Intervalo de confianza
1 Media (SE); % (n=n (unweighted))
2 Media; % (n)

En la Tabla tbl-comp_calibraciones puede observarse como ambas estrategias de calibración parecen igual de eficaces ya que ambas arrojan resultados muy similares entre sí y, a su vez, muy similares con los parámetros poblacionales. En este contexto se recuerda que, si bien los valores finales son muy similares, la mejora realizada en el proceso de calibración es mayor sobre el diseño de azar simple ya que esa muestra no era tan precisa como la muestra bien distribuida y, por lo tanto, existía la oportunidad de mejorar bastante.

Deville, Jean, y Yves Tillé. 2004. «Efficient balanced sampling: The cube method». Biometrika 91 (4): 893-912.
Elliott, Michael, y Richard Valliant. 2017. «Inference for nonprobability samples». Statistical Science 32 (2): 249-64.
Lumley, Thomas. 2010. Complex surveys. A guide to analysis using R. John Wiley & Sons.
Lundström, Sixten, y Carl Erik Särndal. 2009. Calibration of weights in surveys with nonresponse and frame imperfections. (Bilbao), enero 26.
Tillé, Yves. 2010. Balanced sampling by means of the cube method. (Euskal).
Tillé, Yves. 2011. «Ten years of balanced sampling with the cube method: An appraisal». Survey Methodology 37 (2): 215-26.

  1. En cambio el balanceo, si bien en su origen tiene una fuerte vinculación con el enfoque del “Model Assisted”, no se encuentra tan alejado del “design based” dado que el algoritmo del cubo selecciona muestras balanceadas dentro del conjunto de muestras aleatorias (Tillé 2010, pág. 39).↩︎

  2. Este tipo de discusiones ha enfrentado (y por ahora continúa enfrentando) a los representantes de los enfoques de la “design based sample” y del “model assisted”. Los primeros suelen dudar de los beneficios de aplicar la calibración sobre diseños no probabilísticos aunque no suelen tener objeciones cuando la calibración se realiza sobre diseños probabilísticos (Elliott y Valliant 2017). En el fondo lo que está en juego son los grados de garantía que ofrece cada técnica acerca de la representatividad y esto no solo incluya la discusión sobre las heterogeneidades observables (algo mantenido por ambos enfoques) sino también sobre las heterogeneidades no observables (algo históricamente mantenido por el enfoque de la “design”).↩︎

  3. En otras palabras, si ya se sabe de antemano que se va a realizar una post-estratificación es más simple utilizar una función específica para post-estratificar (p.e. la función “poststratify” de la librería survey o “poststrata” de la librería sampling).↩︎