5.1 Introducción

Wikipedia es increíble. Una colaboración masiva de voluntarios creó una fantástica enciclopedia que está disponible para todos. La clave del éxito de Wikipedia no era el conocimiento nuevo; más bien, era una nueva forma de colaboración. La era digital, afortunadamente, permite muchas formas nuevas de colaboración. Por lo tanto, ahora deberíamos preguntarnos: ¿Qué problemas científicos masivos -problemas que no podríamos resolver individualmente- podemos ahora abordar juntos?

La colaboración en la investigación no es nada nuevo, por supuesto. Lo que es nuevo, sin embargo, es que la era digital permite la colaboración con un conjunto mucho más grande y más diverso de personas: los miles de millones de personas en todo el mundo con acceso a Internet. Espero que estas nuevas colaboraciones de masas darán resultados sorprendentes no sólo por el número de personas involucradas, sino también debido a sus diversas habilidades y perspectivas. ¿Cómo podemos incorporar a todos con una conexión a Internet en nuestro proceso de investigación? ¿Qué podrías hacer con 100 asistentes de investigación? ¿Qué hay de 100.000 colaboradores cualificados?

Existen muchas formas de colaboración masiva, y los científicos informáticos suelen organizarlas en un gran número de categorías en función de sus características técnicas (Quinn and Bederson 2011) . En este capítulo, sin embargo, voy a categorizar proyectos de colaboración masiva basados ​​en cómo se pueden usar para la investigación social. En particular, creo que es útil distinguir grosso modo entre tres tipos de proyectos: computación humana , llamada abierta y recopilación de datos distribuidos (figura 5.1).

Describiré cada uno de estos tipos con mayor detalle más adelante en el capítulo, pero por ahora permítanme describir cada uno brevemente. Los proyectos de computación humana son ideales para problemas de tareas fáciles a gran escala, como el etiquetado de un millón de imágenes. Estos son proyectos que en el pasado podrían haber sido realizados por asistentes de investigación de pregrado. Las contribuciones no requieren habilidades relacionadas con tareas, y el resultado final suele ser un promedio de todas las contribuciones. Un ejemplo clásico de un proyecto de computación humana es Galaxy Zoo, donde cien mil voluntarios ayudaron a los astrónomos a clasificar un millón de galaxias. Los proyectos de convocatoria abierta , por otro lado, son ideales para problemas en los que se buscan respuestas novedosas e inesperadas a preguntas formuladas con claridad. Estos son proyectos que en el pasado podrían haber involucrado preguntar a colegas. Las contribuciones provienen de personas que tienen habilidades especiales relacionadas con las tareas, y el resultado final suele ser la mejor de todas las contribuciones. Un ejemplo clásico de una llamada abierta es el Premio Netflix, donde miles de científicos y hackers trabajaron para desarrollar nuevos algoritmos para predecir las calificaciones de las películas de los clientes. Finalmente, los proyectos de recopilación de datos distribuidos son ideales para la recopilación de datos a gran escala. Estos son proyectos que en el pasado podrían haber sido realizados por asistentes de investigación de pregrado o compañías de investigación de encuestas. Las contribuciones generalmente provienen de personas que tienen acceso a ubicaciones que los investigadores no tienen, y el producto final es una simple recopilación de las contribuciones. Un ejemplo clásico de una recopilación de datos distribuidos es eBird, en el que cientos de miles de voluntarios aportan informes sobre las aves que ven.

Figura 5.1: Esquema de colaboración masiva. Este capítulo está organizado en torno a tres formas principales de colaboración masiva: cómputo humano, convocatoria abierta y recopilación de datos distribuidos. En términos más generales, la colaboración masiva combina ideas de campos como la ciencia ciudadana, el crowdsourcing y la inteligencia colectiva.

Figura 5.1: Esquema colaboración masiva. En este capítulo se organiza alrededor de tres formas principales de la colaboración masiva: la computación humana, llamada abierta, y recolección de datos distribuida. De manera más general, la colaboración masiva combina ideas de campos como la ciencia ciudadana, el crowdsourcing, y la inteligencia colectiva.

La colaboración masiva tiene una larga y rica historia en campos como la astronomía (Marshall, Lintott, and Fletcher 2015) y la ecología (Dickinson, Zuckerberg, and Bonter 2010) , pero todavía no es común en la investigación social. Sin embargo, al describir proyectos exitosos de otros campos y proporcionar algunos principios clave de organización, espero convencerte de dos cosas. En primer lugar, la colaboración masiva se puede aprovechar para la investigación social. Y, en segundo lugar, los investigadores que utilizan la colaboración masiva podrán resolver problemas que anteriormente parecían imposibles. Aunque la colaboración masiva a menudo se promueve como una forma de ahorrar dinero, es mucho más que eso. Como mostraré, la colaboración masiva no solo nos permite realizar investigaciones más baratas , sino que nos permite investigar mejor .

En los capítulos anteriores, ha visto lo que se puede aprender interactuando con las personas de tres maneras diferentes: observando su comportamiento (Capítulo 2), haciéndoles preguntas (Capítulo 3) e inscribiéndolos en experimentos (Capítulo 4). En este capítulo, le mostraré lo que se puede aprender involucrando a las personas como colaboradores de la investigación. Para cada una de las tres formas principales de colaboración masiva, describiré un ejemplo prototípico, ilustraré puntos adicionales importantes con más ejemplos y finalmente describiré cómo esta forma de colaboración masiva podría usarse para la investigación social. El capítulo concluirá con cinco principios que pueden ayudarlo a diseñar su propio proyecto de colaboración masiva.