2.4.1.2 formación de Amizade entre os estudantes

Investigadores usaron rexistros de correo-e e rexistros administrativos para comprender a formación de amizade. Esta investigación require xestionar a incompletude do big data.

En moitas ocasións, os investigadores non teñen a sorte de ter todo o que queren recollidas automaticamente nun só lugar. Dous problemas comúns son información incompleta sobre as persoas e unha incompatibilidade entre construcións teóricas e datos. Ambos os problemas foron abordados por Kossinets e Watts (2009) , como parte dos seus esforzos para comprender como as redes sociais evolucionar.

Grosso modo, os investigadores pensan que a evolución rede social é impulsada por tres características: 1) a estrutura das relacións existentes 2) actividades compartidas (por exemplo, dormitorios, clases) e 3) demografía. Comprender as interrelacións entre estes tres factores require datos de rede lonxitudinais combinados con información sobre demografía e actividades dos individuos. Estudos anteriores algunhas destas características, pero ningún tivo os tres.

Kossinets e Watts comezou as súas investigacións, adquirindo os rexistros de correo-e a partir dunha gran universidade. Con todo, estes rexistros de correo só estaban incompletos, non inclúen todo o necesario para comprender os diversos factores que impulsan a evolución da rede. Polo tanto, Kossinets e Watts fundiu estes rexistros por correo electrónico, con outras dúas fontes de información: información demográfica recollida pola Universidade e información sobre as actividades compartidas (por exemplo, información residencia de estudantes e unha lista completa das matrículas en cursos). Xa que estas tres fontes de información, cada un dos cales era incompleta, foron mesturados Kossinets e Watts tiña unha estrutura de datos poderosa para a evolución da rede entendemento.

Pero había un último reto que tivo que superar. Kossinets e Watts quería estudar a forma como a rede social nesta universidade evolucionou para que precisaban dun xeito de utilizar os rexistros de correo-e unha estimación do que estaba ligado ao que no momento en que. Como discutido na anteriormente (Sección 2.3.2.1), este tipo de operacionalização das construcións teóricas é un gran reto cando se utiliza vestixios dixitais para a investigación social. Ao final, Kossinets e Watts decidiu que dúas persoas foron considerados conectados en tempo de \ (t \) se e só se eles trocado correos electrónicos (\ (i \) por correo electrónico \ (j \) e \ (j \) por correo electrónico \ ( i \)) nos 60 días anteriores. Estas opcións non eran arbitrarias; baseábanse en consideración coidadosa desa configuración empírica, e Kossinets e Watts Comprobarase que os seus resultados foron robustos para estas opcións. En xeral, a súa xestión, implica a selección de algúns específicos cortes, digamos 60 días en vez de 30 días ou 90 días-lo é unha boa idea para asegurarse de que os seus resultados non son sensibles a esta opción.

Xa Kossinets e Watts abordou o problema causado pola incompletude (por exemplo, falta de información demográfica, información sobre a actividade compartida falta, e falta de construcións teóricas), que tiñan datos que lles permitiu comprender as tres forzas principais que poden conducir a evolución da rede: 1) a estrutura das relacións existentes 2) actividades compartidas (por exemplo, dormitorios, clases) e 3) demografía. Consistente investigacións anteriores, descubriron que as persoas con datos demográficos similares son máis propensos a formar relacións. Con todo, ao contrario de estudos anteriores, descubriron que este estándar foi fortemente atenuado pola estrutura de rede existente e actividades compartidas. Noutras palabras, o patrón que os investigadores anteriores vira foi parcialmente explicada polos datos que os investigadores anteriores non tiñan. Así, ao tratar con éxito coa incompletude dos seus datos, Kossinets e Watts puideron aclarar a interacción de unha variedade de diferentes factores que impulsan evolucións da rede social.