2.1 Inngangur

Í flaumi aldur, safna gögnum um hegðun-hver gerir hvað þegar-var dýr, og því, tiltölulega sjaldgæf. Nú, í stafrænni öld, hegðun milljarða manna eru skráð, geymt og analyzable. Til dæmis, í hvert skipti sem þú smellir á vefsíðu, hringja á farsímanum þínum, eða borga fyrir eitthvað með kreditkorti, stafræn skrá yfir hegðun þinni er búin og geymd við fyrirtæki. Vegna þess að þessi gögn eru aukaafurð af fólksins dag hverjar aðgerðir, þeir eru oft kallaðir stafræna ummerki. Í viðbót við þessar leifar í eigu fyrirtækja, stjórnvöld hafa einnig ótrúlega ríkur gögn um bæði fólk og fyrirtæki, gögn sem er oft stafrænu og analyzable. Saman þessi fyrirtæki og ríkisstjórn færslur eru oft kölluð stór gögn.

Sífellt hækkandi flóð stór gögn þýðir að við höfum flutt úr heimi þar sem hegðunarvandamál gögn voru af skornum skammti í heimi þar sem hegðunarvandamál gögn er mikil. En vegna þess að þessi tegund gagna eru tiltölulega ný, óheppileg magn af rannsóknum með þeim lítur út eins og vísindamenn blindni elta fyrirliggjandi gögnum. Þessi kafli, í staðinn, býður upp á principled nálgun til að skilja mismunandi uppsprettur upplýsinga og hvernig þeir geta vera notaður. Þessi auðæfi skilningur ætti að hjálpa þér að passa betur rannsóknarspurningar til viðeigandi heimildum upplýsinga. Eða, ef slík tiltækar heimildir skortir, sannfæra þig um að safna eigin gögn með því að nota hugmyndir í framtíðinni köflum.

Fyrsta skrefið til að læra af stór gögn er að átta sig á að það er hluti af víðtækari flokk gagna sem hefur verið notað til félagslega rannsóknir í mörg ár: observational gögn. Um það bil, áhorfs- gögn er einhver gögn sem leiðir af því að fylgjast með félagslega kerfið án grípa á einhvern hátt. A grófur leið til að hugsa um það er að áhorfs- gögn er allt sem felur ekki í sér að tala við fólk (td kannanir, efni kafla 3) eða breyta umhverfi fólks (td tilraunir, efni 4. kafla). Svona, til viðbótar við fyrirtæki og stjórnvöld færslur, áhorfs- gögn eru einnig hluti eins og texta blaðagreinum og gervitungl myndir.

Þessi kafli hefur þrjá hluta. First, í kafla 2.2, lýsa ég stór gögn nánar og skýra grundvallaratriði munur milli þess og gögn sem hafa að jafnaði verið notuð fyrir félagslega rannsóknir í fortíðinni. Þá, í kafla 2.3, lýsa ég tíu sameiginleg einkenni af stór gögn heimildum. Skilningur þessa eiginleika gerir okkur kleift að fljótt þekkja styrkleika og veikleika núverandi heimildum og mun hjálpa okkur virkja nýjar uppsprettur sem verður búin í framtíðinni. Að lokum, í kafla 2.4, lýsi ég þremur helstu rannsóknir aðferðir sem þú getur notað til að læra af observational gögn: telja hluti, spá hlutum, og samræma tilraun.