2.2 Big adatok

Big adatok jönnek létre, és összegyűjtöttük a kormányok eltérő célokra kutatás. Ezen adatok kutatási, ezért van szükség repurposing.

Egy idealizált kilátás társadalomkutatás elképzel egy tudós, amelynek ötlete, majd adatgyűjtés tesztelni, hogy az ötlet. Ez a stílus a kutatás vezet szorosan illeszkedik a kutatási kérdés és az adatok, de ez korlátozott, mivel az egyedi kutató gyakran nem rendelkeznek a szükséges forrásokat, hogy összegyűjtsék a szükséges adatokra, mint a nagy, gazdag, és országos reprezentatív adatokat. Ezért, sok társadalmi kutatások a múltban használt nagyszabású társadalmi felmérések, mint például az általános Social Survey (GSS), az amerikai Országos Választási Study (ANES) és Panel Study of Income Dynamics (PSID). Ezek nagyszabású felmérés általában működteti kutatócsoportja és úgy tervezték, hogy hozzon létre az adatok, hogy lehet használni számos kutató. Mivel a célok ilyen nagyszabású felmérés, nagy gonddal kell helyezni tervezése az adatgyűjtési és előkészítése a kapott adatok felhasználása a kutatók. Ezek az adatok a kutatók és a kutatók számára.

A legtöbb társadalmi kutatás segítségével digitális korban források azonban alapvetően más. Ahelyett, hogy a gyűjtött adatok a kutatók és a kutatók, akkor az adatforrások jöttek létre, és összegyűjtöttük a vállalkozások és a kormányok saját célra, mint nyereség, egy szolgáltatás, vagy alkalmazása a törvény. Ezek az üzleti és a kormányzati adatforrást jött, hogy hívják a nagy adat. Kutatni nagy adat más, mint a kutatás adataival, hogy eredetileg a kutatás. Összehasonlítás például a szociális média honlapján, mint a Twitter, a hagyományos közvélemény-kutatás, mint a General Social Survey (GSS). Twitter fő célja az, hogy a szolgáltatás a felhasználók számára, és hogy a nyereséget. A folyamat során a fenti célok eléréséhez, Twitter teremt az adatok, amelyek hasznosak lehetnek a tanuló bizonyos aspektusait a közvéleményt. De, ellentétben az általános Social Survey (GSS), Twitter nem elsődlegesen a szociális kutatás.

A kifejezés nagy adatok kétségbeejtően homályos, és ez fogja össze sok különböző dolog. Alkalmazásában a társadalomkutatás, úgy gondolom, hogy célszerű megkülönböztetni kétféle nagy adatforrások: a ​​kormányzat adminisztratív nyilvántartások és az üzleti adminisztratív rekordok. Kormányzati közigazgatási nyilvántartások adatait, amelyek által létrehozott kormányok részeként rutinszerű tevékenységek. Az effajta feljegyzések már a kutatók az elmúlt-, mint a demográfusok tanul születés, házasság, halál nyilvántartások, de a kormányzatok egyre gyűjtése és kiadása részletes rekordok elemezhető formában. Például a New York-i kormány telepített digitális méter belsejében minden taxi a városban. Ezek méterre rögzíteni mindenféle adatok minden taxi, beleértve a vezetőt, a kezdési időpont és helyszín, a leállítás ideje és helye, valamint a viteldíjat. Egy tanulmány, amely elmondom később ebben a fejezetben, Henry Farber (2015) repurposed ezek az adatok kezelése alapvető vita munkagazdaságtan kapcsolatáról órabérek és a ledolgozott munkaórák száma.

A másik fő típusa a nagy adatok társadalomkutatás az üzlet adminisztratív nyilvántartások. Ezek az adatok, hogy az üzleti létre, és gyűjtsük össze részeként rutinszerű tevékenységek. Ezek az üzleti adminisztratív nyilvántartások gyakran nevezik digitális nyomok, és olyanok, mint a kereső lekérdezést naplók, a szociális média hozzászólások, és a hívás rekordokat mobiltelefonról. Kritikusan, ezek az üzleti közigazgatási nyilvántartások nem csak az online viselkedés. Például, üzletek használó távozáskor szkennerek létre valós idejű intézkedések a dolgozók termelékenységét. Egy tanulmány, amely azt fogja mondani neked később ebben a fejezetben, Alexandre Mas és Enrico Moretti (2009) repurposed ezt szupermarketben távozáskor adatokat annak tanulmányozására, hogy a munkások termelékenysége befolyásolja a termelékenységet társaik.

Mivel mindkét példák, az ötlet repurposing alapvető tanulás nagy adat. Az én tapasztalatom, társadalomtudósok és adatokat a tudósok megközelíteni e repurposing nagyon eltérő. A társadalomtudósok, akik megszokták, hogy dolgozik az adatok tervezett kutatási, gyors rámutatni a probléma ismét felhasználható adatok figyelmen kívül hagyva annak erőssége. Másrészt, az adatok a tudósok nem győzik hangsúlyozni, hogy az előnyök a repurposed adatok figyelmen kívül hagyva annak gyengeségeit. Természetesen a legjobb megoldás lenne egy hibrid. Azaz, a kutatók meg kell érteniük a jellemzőit az új adatforrások-mind a jó és rossz, majd kitaláljuk, hogyan lehet tanulni tőlük. És, hogy a terv a fejezet fennmaradó részében. Ezután fogom leírni tíz közös jellemzői az üzleti és a kormányzati közigazgatási adatok. Ezt követően, azt leírja három kutatási megközelítéseket, hogy lehet használni ezekkel az adatokkal, megközelítések, amelyek jól alkalmas arra, hogy a jellemzői az adatokat.