5.2 calcul humain

Les projets de calcul humain prennent un gros problème, le décomposent en éléments simples, les envoient à de nombreux travailleurs, puis regroupent les résultats.

Les projets de calcul humain combinent les efforts de nombreuses personnes qui travaillent sur des microtasks simples afin de résoudre des problèmes impossibles à résoudre pour une personne. Vous pourriez avoir un problème de recherche adapté au calcul humain si vous avez déjà pensé: "Je pourrais résoudre ce problème si j'avais un millier d'assistants de recherche."

L'exemple prototypique d'un projet de calcul humain est Galaxy Zoo. Dans le cadre de ce projet, plus de cent mille volontaires ont classé des images d'environ un million de galaxies avec une précision similaire à celle des astronomes professionnels. Cette échelle accrue fournie par la collaboration de masse a conduit à de nouvelles découvertes sur la façon dont les galaxies se forment, et elle a donné naissance à une toute nouvelle classe de galaxies appelées «pois verts».

Bien que le zoo Galaxy puisse sembler loin de la recherche sociale, il existe de nombreuses situations où les chercheurs en sciences sociales veulent coder, classer ou étiqueter des images ou des textes. Dans certains cas, cette analyse peut être faite par des ordinateurs, mais il existe encore certaines formes d'analyse qui sont difficiles pour les ordinateurs mais faciles pour les gens. Ce sont ces microtasks faciles à manipuler mais faciles à utiliser que nous pouvons confier à des projets de calcul humain.

Non seulement la micro-tâche de Galaxy Zoo est générale, mais la structure du projet est générale. Galaxy Zoo, et d'autres projets de calcul humain, utilisent généralement une stratégie split-apply-combine (Wickham 2011) , et une fois que vous aurez compris cette stratégie, vous pourrez l'utiliser pour résoudre de nombreux problèmes. Tout d'abord, un gros problème est divisé en beaucoup de petits morceaux de problème. Ensuite, le travail humain est appliqué à chaque petit morceau de problème, indépendamment des autres morceaux. Enfin, les résultats de ce travail sont combinés pour produire une solution consensuelle. Compte tenu de ce contexte, voyons comment la stratégie split-apply-combine a été utilisée dans Galaxy Zoo.