3.3 El marco de error total de la encuesta

Total de errores encuesta de error = + representación errores de medición.

Las estimaciones que provienen de encuestas por muestreo a menudo son imperfectas. Es decir, generalmente hay una diferencia entre la estimación producida por una encuesta por muestreo (p. Ej., La altura promedio estimada de los estudiantes en una escuela) y el valor real en la población (p. Ej., La altura media real de los estudiantes en una escuela). Algunas veces estos errores son tan pequeños que no son importantes, pero a veces, desafortunadamente, pueden ser grandes y consecuentes. En un intento por comprender, medir y reducir errores, los investigadores gradualmente crearon un marco conceptual único y global para los errores que pueden surgir en las encuestas por muestreo: el marco total de error de encuesta (Groves and Lyberg 2010) . Aunque el desarrollo de este marco comenzó en la década de 1940, creo que nos ofrece dos ideas útiles para la investigación de encuestas en la era digital.

En primer lugar, el marco total de error de encuesta aclara que hay dos tipos de errores: sesgo y varianza . A grandes rasgos, el sesgo es un error sistemático y la varianza es un error aleatorio. En otras palabras, imagine ejecutar 1,000 repeticiones de la misma encuesta de muestra y luego observar la distribución de las estimaciones de estas 1,000 repeticiones. El sesgo es la diferencia entre la media de estas estimaciones duplicadas y el valor verdadero. La varianza es la variabilidad de estas estimaciones. Todo lo demás es igual, nos gustaría un procedimiento sin sesgo y pequeña varianza. Desafortunadamente, para muchos problemas reales, tales procedimientos de no-polarización y de varianza pequeña no existen, lo que coloca a los investigadores en la difícil posición de decidir cómo equilibrar los problemas introducidos por el sesgo y la varianza. Algunos investigadores prefieren instintivamente los procedimientos imparciales, pero un enfoque único en el sesgo puede ser un error. Si el objetivo es producir una estimación lo más cercana posible a la verdad (es decir, con el menor error posible), entonces podría estar mejor con un procedimiento que tiene un pequeño sesgo y una pequeña variación que con uno que es imparcial pero tiene una gran varianza (figura 3.1). En otras palabras, el marco de error de encuesta total muestra que al evaluar los procedimientos de investigación de encuesta, debe considerar tanto el sesgo como la varianza.

Figura 3.1: Sesgo y varianza. Idealmente, los investigadores tendrían un procedimiento de estimación sin sesgo y baja varianza. En realidad, a menudo tienen que tomar decisiones que crean una disyuntiva entre el sesgo y la varianza. Aunque algunos investigadores prefieren instintivamente los procedimientos imparciales, a veces un pequeño sesgo, un procedimiento de varianza pequeña puede producir estimaciones más precisas que un procedimiento imparcial que tiene una gran varianza.

Figura 3.1: Sesgo y varianza. Idealmente, los investigadores tendrían un procedimiento de estimación sin sesgo y baja varianza. En realidad, a menudo tienen que tomar decisiones que crean una disyuntiva entre el sesgo y la varianza. Aunque algunos investigadores prefieren instintivamente los procedimientos imparciales, a veces un pequeño sesgo, un procedimiento de varianza pequeña puede producir estimaciones más precisas que un procedimiento imparcial que tiene una gran varianza.

La segunda idea principal del marco de error de encuesta total, que organizará gran parte de este capítulo, es que existen dos fuentes de errores: problemas relacionados con con quién hablas ( representación ) y problemas relacionados con lo que aprendes de esas conversaciones ( medición ) Por ejemplo, podría estar interesado en estimar las actitudes sobre la privacidad en línea entre los adultos que viven en Francia. Hacer estas estimaciones requiere dos tipos diferentes de inferencia. En primer lugar, a partir de las respuestas dadas por los encuestados, debe inferir sus actitudes sobre la privacidad en línea (que es un problema de medición). En segundo lugar, de las actitudes inferidas entre los encuestados, debe inferir las actitudes en la población como un todo (que es un problema de representación). El muestreo perfecto con malas preguntas de la encuesta producirá malas estimaciones, al igual que un muestreo incorrecto con preguntas de encuesta perfectas. En otras palabras, las buenas estimaciones requieren enfoques sólidos para la medición y la representación. Dado ese trasfondo, revisaré cómo los investigadores de la encuesta han pensado sobre la representación y la medición en el pasado. Luego, mostraré cómo las ideas sobre representación y medición pueden guiar la investigación de encuestas de edad digital.