2.3.2.1 puru ncumpreta

No mpurtanza comu "grandi" vostru "grandi données" è prubbabbili ca nun havi la nfurmazzioni vo vulete.

Most fonti di dati granni sunnu puru ncumpreta, in u sensu chì ùn anu a nfurmazzioni ca vi vogghiu di vostra ricerca. Chistu è un elementu cumunu di dati ca foru criati pi mutivi altre chè a ricerca. Parechje scinziati suciali anu dighjà avutu l 'espirienza di droghe cù u TRANCIATO, cume un log dìcini ca nun dumandà à i quistioni si vulia. Per disgrazia, i prublemi di TRANCIATO tendini à essa cchiù strimisti in grande dati. In u me mistieri, big dati tenni a essiri manca trè tippi di infurmazioni utuli per a ricerca suciali: dem demographics, cumpurtamentu nantu à altre are, è dati à operationalize constructs teorichi.

Tutti i trè di sti formi di TRANCIATO sò in sta frasa, in un studiu par Gueorgi Kossinets e Duncan Rimini (2006) circa lu prucessu di evoluzioni di a reta suciale à a prima università. Kossinets e Watts principia cù l 'azzioni email da l' università, ch'ellu avia infurmazione precisa circa chì u mandò sappianu à i quali a chiddu tempu (i circadori ùn avete accessu à u cuntenutu sanu sanu di u sappianu). Sti dischi per mail sonu comu nu dataset maravigghiusu, ma, ca sunnu-malgradu a so statura, è granulera-funnamintarmenti puru ncumpreta. Per esempiu, l 'azzioni mail nun cunta dati circa lu carattari demugrafica di i studienti, comu lu geniri e età. In seguita, l 'azzioni mail nun cunta suggerimenti cumunicazzioni attraversu autri media muderni, tali ca lu chiama telefunu, missaghju testu, o conversations faccia-a-faccia a neve. Infine, l 'azzioni mail nun cunta direttamente nantu à u corsu su raporta, a constructs teorichi in tanti li tiurìi supra esistenti. Più tardi in u capitulu, quandu aghju da pinghje strategii di ricerca, vi Mulateri Di L'vidiri comu Kossinets e Watts solving sti capatoghji.

Di tri tipi di TRANCIATO, u prublema di dati puru ncumpreta à operationalize constructs teorichi è u più duru à scioglie, è a mio esperienza, hè spessu accasu culminata da scentifichi di dati. All'incirca, constructs teorichi sò idei astrattu chi scinziati suciali studià, ma, purtroppu, sti constructs pò micca sempre esse unambiguously difiniti è misuratu. Per esempiu, ch'elli l'creda chì prova à pruvà empirically u apparentimenti sèmplice sustennu ca lu pòpulu chì ùn sò più intelligenti 'mpara a più soldi. In modu à pruvà sta scusa tù avissi bisognu di a misura "paga". Ma, ciò chì hè paga? Per esempiu, Gardner (2011) sustìnniru ca ci sò intreccia ottu sfarente forme di ntilliggenza. E, si ci un antra strada chì pudia misurà precisamente à nisunu di sti formi di paga? Nunustanti paludosa limitati, di u travagliu da Psychologe, sti dumanni ancora nun pussidiri risposti seguru. Cusì, ancu un pocu semplice sustennu-persone chì sò più intelligenti 'mpara a più soldi-ponu esse difficiuli à fà una griglia empirically perchè ùn pò essa difficiuli à operationalize constructs teorichi in dati. Altri asempi di constructs teorichi ca sunnu mpurtanti, ma dura à operationalize includunu lu "normi," "capitale suciale," è "a demucrazia." Scinziati suciali, chjama u forte trà constructs teorichi è di dati custruiri validità (Cronbach and Meehl 1955) . E, comu sta lista di constructs Naturarmenti, custruiscia validità è un prublemu chì scinziati suciali anu tribulatu cù un casu tantu tempu, macari quannu si travagghiannu cu dati chì fù racolta di i prugetti di a ricerca. Quandu u travagliu cù i dati di u prugettu altre chè a ricerca, i prublemi di a validità custruiri li sò ancu di più simule (Lazer 2015) .

Quandu chì tù leghji una carta di ricerca, una manera lesta, è tandu interessante di fà una griglia cuncerna su validità custruiscia è à piglià la scusa principali in i carta, ca di sòlitu spressu in termini di constructs, e sunari-fiurita lu in u nivellu di i infurmazioni. Per esempiu, cunziddirati dui studii hypothetical ca sustennu fàssi vede chì ghjente più intelligenti 'mpara a più soldi:

  • Corso di lingua Francese 1: genti chi partitura bè nantu à u corsu Test-una Raven Hat Matrices test di bè studiatu di ntilliggenza philologica (Carpenter, Just, and Shell 1990) -have Miccadei Lingua italiana hà dettu chì u so torna impositi
  • Corso di lingua Francese 2: populu on Twitter chi teniant, e parolle sò più di più atta à scurdà si di lusso

In tutti i casi, circadori pudia sprime chì hanu dimustratu chì u populu più intelligenti 'mpara a più soldi. Ma, in u primu studiu u constructs teorichi sò bè ​​operationalized da i dati, è in u secondu, ùn sò. In seguita, cum'è stu isempiu è, di più infurmazioni ùn pò scioglie in autumàticu prublemi cù validità custruiscia. Avissi scursuni i risultati di Studiu 2 s'eddu si tratta intarvena un miliuni Dating, un miliardi Dating, o un As Roma Tweets. Di circadori ùn pràticu cù l'idea di validità custruiscia, Table 2.2 dà un pocu di esempi di studii chì hanu operationalized constructs teorichi usannu data, traccia, digitale.

Table 2.2 Esempii di tracci, digitale, ca sunnu di sòlitu usati comu li misuri di li cuncetti teorichi di più astratte. Scinziati suciali chjamate stu validità incontru custruiscia è ghjè una sfida maiò cù i surghjenti dati grande di a ricerca suciali (Lazer 2015) .
traccia Digital custruiri Teaching francese citation
azzioni email da una università (solu quissa-dati) rilazione suciale Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
pusizioni suciali, di cumunicazione nantu à WeiboFrancesco ingaghjamentu Teatru Zhang (2016)
azzioni email da un offiziu (quissa-di dati, è u testu cumplettu) degnu culturale in una urganizazioni Goldberg et al. (2015)

Sibbeni u prublema di dati puru ncumpreta di constructs teorichi operationalizing hè abbastanza difficiuli à fà u cambiamentu, ùn ci sò trè suluzzioni cumuni à u prublema di nfurmazzioni demugrafica intazzati è nantu à u tempiu nantu à u cumpurtamentu nantu à altre are. U primu hè a sorte primurosu di i dati, ci vole; I Mulateri Di L'dicu circa un esempiu di chì a Chapter 3 quannu ti dicu su Salumeria. Purtroppu, 'stu tipu di cullezzione data, ùn hè micca sempri pussibuli. A siconda a suluzioni principale hè di fà ciò chì scentifichi di dati chjamate inference user-attribuilla è ciò chì scinziati suciali chjamate imputation. Nta stu approcciu, circadori usari li nfurmazzioni chi ànnu nantu à certi populi di infer spicificu di àutri genti. U terzu pussibule suluzione-chidda usata di Kossinets e Watts-era à mischjà a multiplicità di fonti di dati. Stu prucessu è spissu discritta comu pripara o attu di lingua. I mo métaphore favuriti per stu prucessu fù pruposta in i primi dô comma di li primi di carta mai scritta in u primatu lingua (Dunn 1946) :

"Ogni persona in u mondu, sciuri di un libru di vita. Stu 索: alfabbèticu, cu a nascita e finiscinu cu la morti. U so pàgine sò custituiti di i cartulari di u principiu evenimenti in a vita. Santuzza lingua è lu nomu datu à u prucessu di assembramentu e pagine di stu libbru nta nu vulumi ".

Stu passaggiu hè statu scrittu in 1946, è a ddu tempu, genti fôru a pinzari ca lu Book of Life pudia cumprendi Major evenimenti vita comu a nascita, u matrimoniu, cu nu divorziu, è a morte. Comunqui, ora ca tantu nantu à u corsu su populu hè incisu, u Libru di Life pudia esse un ritrattu un travagliu info, si ddi pàggini diffirenti (vale à dì, a nostra vistichi digitale), pò esse liatu inseme. Stu Book of Life putissi èssiri na granni risorsa di circadori. Ma, u Libru di Life pudianu esse chjamatu una basa di dati di la ruvina (Ohm 2010) , ca putissi èssiri usatu di tutti li tipi di u prugettu di immurali, comu discrittu più sottu à quandu aghju da pinghje a natura fattivu di la nfurmazzioni di folklori grande fonti di dati quì sottu è in Capitulo 6 (Etica).