5.4.2 PhotoCity

PhotoCity resuelve los problemas de calidad de datos y toma de muestras en la recopilación de datos distribuida.

Sitios web como Flickr y Facebook permiten a las personas compartir fotos con sus amigos y familiares, y también crean enormes repositorios de fotos que pueden usarse para otros fines. Por ejemplo, Sameer Agarwal y sus colegas (2011) intentaron utilizar estas fotos para "Construir Roma en un día" mediante la reutilización de 150,000 imágenes de Roma para crear una reconstrucción 3D de la ciudad. Para algunos edificios fuertemente fotografiados, como el Coliseo (figura 5.10), los investigadores tuvieron un éxito parcial, pero las reconstrucciones sufrieron porque la mayoría de las fotos fueron tomadas desde las mismas perspectivas icónicas, dejando partes de los edificios sin fotografía. Por lo tanto, las imágenes de los depósitos de fotos no fueron suficientes. Pero, ¿qué pasa si los voluntarios pueden alistarse para recolectar las fotos necesarias para enriquecer las que ya están disponibles? Pensando en la analogía del arte en el capítulo 1, ¿qué pasaría si las imágenes preparadas pudieran enriquecerse con imágenes personalizadas?

Figura 5.10: Una reconstrucción en 3D del Coliseo a partir de un gran conjunto de imágenes 2D del proyecto Construyendo Roma en un día. Los triángulos representan las ubicaciones desde las cuales se tomaron las fotografías. Reproducido con permiso de la versión html de Agarwal et al. (2011).

Figura 5.10: Una reconstrucción en 3D del Coliseo a partir de un gran conjunto de imágenes 2D del proyecto "Construyendo Roma en un día". Los triángulos representan las ubicaciones desde las cuales se tomaron las fotografías. Reproducido con permiso de la versión html de Agarwal et al. (2011) .

Con el fin de permitir la recolección específica de grandes cantidades de fotos, Kathleen Tuite y sus colegas desarrollaron PhotoCity, un juego de carga de fotos. PhotoCity convirtió la tarea potencialmente laboriosa de recopilación de datos (cargar fotos) en una actividad similar a un juego que involucraba equipos, castillos y banderas (figura 5.11), y se implementó por primera vez para crear una reconstrucción tridimensional de dos universidades: la Universidad de Cornell y la Universidad de Washington. Los investigadores comenzaron el proceso cargando fotos semilla de algunos edificios. Luego, los jugadores de cada campus inspeccionaron el estado actual de la reconstrucción y ganaron puntos al subir imágenes que mejoraron la reconstrucción. Por ejemplo, si la reconstrucción actual de la Biblioteca de Uris (en Cornell) fuera muy desigual, un jugador podría ganar puntos al subir nuevas imágenes de la misma. Dos características de este proceso de carga son muy importantes. En primer lugar, la cantidad de puntos que un jugador recibió se basó en la cantidad que su fotografía agregó a la reconstrucción. En segundo lugar, las fotos que se cargaron se superpusieron con la reconstrucción existente para poder validarlas. Al final, los investigadores pudieron crear modelos 3D de edificios de alta resolución en ambos campus (figura 5.12).

Figura 5.11: PhotoCity convirtió la tarea potencialmente laboriosa de recopilar datos (es decir, cargar fotos) y convertirla en un juego. Reproducido con permiso de Tuite et al. (2011), figura 2.

Figura 5.11: PhotoCity convirtió la tarea potencialmente laboriosa de recopilar datos (es decir, cargar fotos) y convertirla en un juego. Reproducido con permiso de Tuite et al. (2011) , figura 2.

Figura 5.12: El juego PhotoCity permitió a los investigadores y participantes crear modelos 3D de edificios de alta calidad utilizando fotos cargadas por los participantes. Reproducido con permiso de Tuite et al. (2011), figura 8.

Figura 5.12: El juego PhotoCity permitió a los investigadores y participantes crear modelos 3D de edificios de alta calidad utilizando fotos cargadas por los participantes. Reproducido con permiso de Tuite et al. (2011) , figura 8.

El diseño de PhotoCity resolvió dos problemas que a menudo surgen en la recopilación de datos distribuidos: validación de datos y muestreo. En primer lugar, las fotos se validaron comparándolas con las fotos anteriores, que a su vez se compararon con las fotos anteriores hasta las fotos iniciales que los investigadores cargaron. En otras palabras, debido a esta redundancia incorporada, fue muy difícil para alguien subir una foto del edificio equivocado, ya sea accidental o intencionalmente. Esta característica de diseño significaba que el sistema se protegía contra datos incorrectos. En segundo lugar, el sistema de puntuación capacitó naturalmente a los participantes para recopilar los datos más valiosos, no los más convenientes. De hecho, estas son algunas de las estrategias que los jugadores describieron usar para ganar más puntos, lo que equivale a recopilar datos más valiosos (Tuite et al. 2011) :

  • "[Intenté] aproximar la hora del día y la iluminación que se tomaron algunas fotos; esto ayudaría a prevenir el rechazo por el juego. Dicho esto, los días nublados fueron el mejor con diferencia cuando se trata de esquinas porque menos contraste ayudó a la figura juego cabo la geometría de mis fotos ".
  • "Cuando estaba soleado, utilicé características de anti-vibración de mi cámara para permitir que me toman fotos mientras camina por una zona en particular. Esto me permitió tomar fotos nítidas al no tener que parar mi zancada. También bonificación: menos gente me miraba "!
  • "Tomar muchas fotos de un edificio con la cámara de 5 megapíxeles, y luego volver a casa a presentar, a veces hasta 5 gigas en un brote de fin de semana, fue la estrategia primaria de captura de fotos. Organización de fotografías en las carpetas de discos duros externos de una región a la escuela, la construcción, a continuación, la cara del edificio ofrece un buen jerarquía para estructurar las subidas ".

Estas declaraciones muestran que cuando los participantes reciben los comentarios adecuados, pueden llegar a ser bastante expertos en la recopilación de datos de interés para los investigadores.

En general, el proyecto PhotoCity muestra que el muestreo y la calidad de los datos no son problemas insuperables en la recopilación de datos distribuidos. Además, muestra que los proyectos de recopilación de datos distribuidos no están limitados a tareas que la gente ya está haciendo de todos modos, como observar pájaros. Con el diseño correcto, se puede alentar a los voluntarios a hacer otras cosas también.