2.2 Big données

Big dati sò aperte e folklori guverni di u prugettu di àutru ca di ricerca. Aduprendu stu dati di a ricerca, dunque, hè ubligatoriu repurposing.

An vista idealized di a ricerca suciale imagineghja un scienziatu avè un idea è tandu cugghiennu dati à pruvà chi 'idea. Stu stili di ricerca chì sbocca nantu à un degnu Vincent trà quistione di a ricerca è a data, ma hè limitata, picchì na ricerca individuale spissu nun hannu li risorsi hè vulsutu à fà sorte la data, ch'elli bisognu, cume dati large, riccu, è nationally-ripresenta. Salumeria suciale large-scala accorta, assai di a ricerca suciale in u passatu, hè usata, cume u bambino General Suciali (GSS), lu miricanu National Election Corso di lingua Francese (ANES), è Panel Corso di mette in dinamica rèdditu (PSID). Sti log large-scala sò generalmente lanciatu da una squatra di circadori è ch'elli sò chì cerca à creà dati chì pò esse adupratu da parechji circadori. A causa di i scopi di sti Salumeria large-scala, gran 'impurtanza hè messu in i dicori a cullezzione di dati, è integrà i dati isciuti di usu pi circadori. Sti dati sò di circatori è di circadori.

Most ricerca suciale aduprendu fonti età digitale, parò, è funnamintarmenti diffirenti. Invece di usu dati di folklori circadori è di circadori, si usa fonti di dati ca foru criati e folklori imprese è guverni di lu so 'usi comu facennu un prufittu, chì furnisce un serviziu, o administering una lege. Sti funti dati los è guvernu hannu vinutu à esse chjamatu grande dati. Missioni di ricerca cù grande di dati hè differente chè missioni di ricerca cù data, ca fu spummintatu di a ricerca. Compare, per esempiu, un situ di cumunicazione suciale, cume Twitter, cù un tradiziunali log upinione publica, comu lu bambino Social General (GSS). ughjettivi principali d'Twitter sò à scegli un serviziu à i so utilizatori è à fà un prufittu. In u prucessu di jùnciri questi, Twitter, sciuri di dati ca Pò esse tandu interessante di u valore certi aspetti di a upinione publica. Ma, comu li bambino Social General (GSS), Twitter ùn hè principalmente propie à nantu à a ricerca suciali.

U grande dati termine hè frustratingly jardinier, e lu in i gruppi inseme assai cose sfarente. Di u prugettu di ricerca suciale, mi pari hè Corsets a distìnguiri tra dui tipi di grande fonti data:. Amministrativi di guvernu è i cartulari amministrativi los Government amministrativi sò dati chì sò creati da guverni comu parti di a so attività di ghjurnata. Sti tipi di i cartulari sò stati aduprati solu da circadori in the past-cume demographers di studià a nascita, u matrimoniu, e la morti i cartulari-ma i cullettività sò sempri cugghiennu e lintati dischi info in li formi analyzable. Pi isempiu, lu guvernu New York City stallati metri digitale dintra di tutti i tassì in la cità. Sti metri nutari ogni genari di dati circa ogni accriscimentu tassì cumpresu u vitturinu, u tempu di partenza è insignamentu, u tempu riparu e Locu, e li vuredda. In un studiu chì I Mulateri Di L'dicu, dopu à stu capitulu, Henry Farber (2015) repurposed sti dati à affruntà una dibattiti funnamintali nta l 'econumìa lu travagghiu supra lu rapportu tra solda Conditions e lu nummaru d' uri travagliatu.

Lu secunnu tipu di primura in a grande di dati di a ricerca suciale è amministrativi affare. Chisti sunnu dati ca los creà è vincite comu parti di a so attività di ghjurnata. Quessi i cartulari amministrativi los sunnu spissu chiamatu vistichi numerica, è cumprendi e cose cum'è nant'à a quistione search engine, i posti di cumunicazione suciale, è una chjama ricordi da cellulari. Critically, sti cartulari amministrativi los ùn sò micca prontu cumpurtamentu online. Per esempiu, putìi chi usamu Scanners verificà-out sò criannu li misuri vera-tempu di impianti travagghiaturi. In un studiu ca ora ti dicu su più tardi in stu capitulu, Alexandre Mas è Enrico Moretti (2009) repurposed sta data, di scupriri-out supermercati à studià cumu impianti 'nu i travagliadori hè cerumen da u impianti di i so' pari.

Comu tutti dui di sti asempi illustrate, l'idea di repurposing è funnamintali à l'amparera da grandi dati. In u me mistieri, scinziati suciali e scinziati dati accustà à stu repurposing assai d'un'antra manera. scinziati suciali, chì si abbituatu a travagghiari cu dati creatu per a ricerca, la fannu lesta a dimustrari li prubbremi cu dati repurposed mentri ci piattemu nè u so vantaghju maiò. Nantu à u cuntrariu, scentifichi di dati la fannu lesta a dimustrari lu prestazione di dati repurposed mentri ci piattemu nè a so weaknesses. Certu, a scelta bona saria una o. Pirtantu, circadori bisognu di fà capiscia i carattaristichi di sti novi fonti di dati-sia bona e mala-e poi accussìni cumprènniri comu li à amparà da elli. È, chì hè u pianu di u restu di 'stu capitulu. Next, ju ti numaru di dece caratteristiche cumune di dati amministrativu di cummerci e guvernu. Doppu ca, ju ti numaru trè avvicinamenti di ricerca chì pò ièssiri usatu cu 'sti dati, avvicinamenti chì sò ancu adattu à e caratteristiche di stu dati.