2.4.1.2 formació de l'amistat entre els estudiants

Els investigadors van utilitzar els registres de correu electrònic i els registres administratius per entendre la formació d'amistats. Aquesta investigació requereix tractar amb el caràcter incomplet de dades grans.

En moltes situacions, els investigadors no tenen la sort de tenir tot el que volen recollir de forma automàtica en un sol lloc. Dos problemes comuns són la informació incompleta sobre les persones i un desajust entre les construccions teòriques i dades. Tots dos d'aquests problemes van ser abordats per Kossinets i Watts (2009) com a part dels seus esforços per comprendre com evolucionen les xarxes socials.

En termes generals, els investigadors pensen que l'evolució xarxa social és impulsada per tres característiques: 1) l'estructura de les relacions existents 2) activitats compartides (per exemple, dormitoris, classes) i 3) dades demogràfiques. La comprensió de les interrelacions entre aquests tres factors es requereixen dades longitudinals de la xarxa combinats amb informació sobre la demografia i les activitats dels individus. Estudis anteriors havien algunes d'aquestes característiques, però cap tenia tots tres.

Kossinets i Watts va començar la seva recerca mitjançant l'adquisició dels registres de correu electrònic d'una gran universitat. No obstant això, aquests registres de correu electrònic només estaven incomplets, que no inclouen tot el necessari per comprendre els diversos factors que impulsen l'evolució de la xarxa. Per tant, Kossinets i Watts es van fusionar aquests registres de correu electrònic, amb altres dues fonts d'informació: la informació demogràfica recopilada per la universitat i la informació sobre les activitats compartides (per exemple, informació residència d'estudiants i una llista completa d'inscripció en els cursos). Una vegada que aquestes tres fonts d'informació, cada un dels quals era incompleta, es van fusionar junts Kossinets i Watts tenia una estructura de dades de gran abast per a l'evolució de la xarxa enteniment.

Hi va haver un últim repte que van haver de superar. Kossinets i Watts volien estudiar com la xarxa social en aquesta universitat ha evolucionat de manera que necessitaven una manera d'utilitzar els registres de correu electrònic en una estimació que estava connectada a qui en aquest moment. Com es va discutir en anteriorment (Secció 2.3.2.1), aquest tipus de posada en marxa de les construccions teòriques és un gran repte quan s'utilitza empremtes digitals per a la investigació social. Al final, Kossinets i Watts van decidir que es van considerar dues persones connectades a l'hora \ (t \) si i només si havien intercanviat missatges de correu electrònic (\ (i \) enviat per correu electrònic \ (j \) i \ (j \) enviat per correu electrònic \ ( i \)) en els 60 dies anteriors. Aquestes opcions no són arbitràries; que es basen en una acurada consideració d'aquest camp de recerca, i Kossinets i Watts comproven que els seus resultats van ser robustos a aquestes opcions. En general, si la seva posada en funcionament consisteix a triar alguns punts de tall específics, diguem 60 dies en lloc de 30 dies o 90 dies, que és una bona idea per assegurar-se que els seus resultats no són sensibles a aquesta elecció.

Un cop Kossinets i Watts aborden el problema causat per la informació incompleta (per exemple, la manca d'informació demogràfica, la manca d'informació sobre l'activitat compartida, i la falta constructes teòrics), tenien les dades que els van permetre comprendre les tres forces principals que poden conduir evolució de la xarxa: 1) la l'estructura de les relacions existents 2) activitats compartides (per exemple, dormitoris, classes) i 3) la demografia. D'acord amb investigacions anteriors, van trobar que les persones amb similars característiques demogràfiques són més propensos a formar relacions. No obstant això, a diferència d'estudis anteriors, van trobar que aquest patró va ser fortament atenuat per l'estructura de xarxa existent i activitats comunes. En altres paraules, el patró que els investigadors anteriors havien vist s'explica en part per dades que els investigadors anteriors no tenien. Per tant, en tractar amb èxit amb el caràcter incomplet de les seves dades, Kossinets i Watts van poder aclarir la interacció d'una varietat de diferents factors que impulsen l'evolució de la xarxa social.