2.2 Big маалыматтар

Big маалыматтар түзүлгөн жана изилдөө башка максаттар үчүн компаниялар жана башкаруу органдары тарабынан алынат. Изилдөө үчүн Бул маалыматтарды колдонуу менен, ошондуктан, repurposing талап кылат.

Жаштагы көп адамдар коомдук изилдөө туш биринчи жолу көп чоң маалымат деген эмне болуп саналат. Бул мөөнөт кеңири таралган пайдалануу карабастан, чоң маалымат да эмне тууралуу бир пикир жок. Бирок, чоң маалыматтарды көбүнчө аныктамалардын бири ": 3" баса белгиленет: көлөмү, сортторун жана ылдамдыгы. Болжол менен, түрдө ар түрдүү маалыматтарды бир топ бар, жана ар дайым жаратып жатат. чоң маалыматтарды кээ бир көрүүчүлөр башка кошуп "күнү", мисалы, кээ бир сынчылар, мисалы, так эмес жана тантык катары Vs кошуп, ал эми аныктыгына жана баалуу болуп саналат. Тескерисинче, 3 "Vs" (же 5 "Vs" же 7 "Vs") эмес, коомдук-изилдөө максаттары үчүн, мен баштоо үчүн жакшы жер 5 "сыйлыгы ыйгарылган" деп ойлойм: ким, эмне, качан , жана эмне үчүн. Чынында, мен чоң маалымат булактары тарабынан түзүлгөн чакырыктарга жана мүмкүнчүлүктөргө көбү бир эле "W" келип деп ойлойм: Эмне үчүн.

аналогдук доордо, коомдук изилдөө үчүн колдонулган маалыматтардын көбү изилдөө жүргүзүү максатында түзүлгөн. жаштагы, Бирок, көп маалыматтардын көлөмү, кызмат көрсөтүүчү пайда болуп, компаниялардын жана башкаруу изилдөө башка максаттар үчүн, ал түзүлүп жаткан, ошондой эле мыйзамдарды башкаруучу. Чыгармачыл адамдар, бирок, эгерде, сиз иликтөө үчүн бул юридикалык жана мамлекеттик маалыматтарды repurpose мүмкүн экенин түшүндүм. Duchamp чеберчилигин түзүү үчүн ашык объект repurposed эле 1-бөлүмүндө көркөм мисал, кайра ойлоп, окумуштуулар азыр repurpose изилдөө түзүү үчүн маалыматтарды таба аласыз.

изилдөөнүн максаттары үчүн жаратылган эмес маалыматтарды колдонуп, repurposing үчүн, албетте, зор мүмкүнчүлүктөр бар, ал эми ошондой эле жаңы кыйынчылыктар болбой койбойт. Мисалы, мындай жалпы коомдук изилдөө катары коомдук медиа тейлөө, мисалы, Twitter сыяктуу эле, салттуу коомдук пикирди сурамжылоо менен. Twitter негизги максаттары, анын колдонуучуларга кызмат менен камсыз кылуу, ошондой эле пайда алуу болуп саналат. Жалпы коомдук изилдөө, башка жагынан, атап айтканда, коомдук пикирди изилдөө үчүн, коомдук изилдөөлөр боюнча жалпы максаты маалыматтарды түзүүгө багытталган. максаттары Бул айырма Twitter жана жалпы коомдук сурамжылоонун жараткан маалыматтар да коомдук пикирди изилдөө үчүн пайдаланылышы мүмкүн болсо да, ар кандай өзгөчөлүктөргө ээ экендигин билдирет. Twitter Жалпы коомдук Survey дал келбей турган масштабда жана тез иштейт, бирок, жалпы коомдук изилдөө айырмаланып, Twitter кылдат тандап колдонуучуларды жок кылат жана убакыттын өтүшү менен салыштырмалуулугун камсыз кылуу үчүн жан үрөп иштеп бербейт. Бул эки маалымат булактары ушунчалык ар түрдүү болгондуктан, анын Башкы коомдук Survey Twitter же тескерисинче артык деп мааниси жок. Эгер дүйнөлүк маанай (мисалы, саат чараларды келсе Golder and Macy (2011) ), Twitter жакшы. Экинчи жагынан, Америка Кошмо Штаттары менен мамилени экиге узак мөөнөттүү өзгөрүүлөрдү түшүнүп келсе, (мисалы, DiMaggio, Evans, and Bryson (1996) ), андан кийин жалпы коомдук изилдөө жакшы чечим болуп саналат. Жалпысынан, тескерисинче, чоң маалымат булактары маалыматтардын башка түрлөрүнө караганда жакшы же жаман экенине умтулгандан көрө, бул бөлүмдө чоң изилдөө суроолорун бул түрлөрү боюнча маалымат булактары кызыктуу бир өзгөчөлүгү бар жана алар суроолорго түрлөрү үчүн эмес болушу мүмкүн, тактоого аракет кылат идеалдуу.

чоң маалымат булактары жөнүндө ойлонуп жатканда, көп изилдөөчүлөр ошол замат мындай издөө журналдарын жана коомдук медиа тирөөч катары түзүлгөн жана компаниялар тарабынан чогултулган онлайн маалыматтар басым. Бирок, бул тар басым эки башка маанилүү чоң маалыматтардын булактарына чыгып кетет. Биринчиден, барган сайын компаниянын ири маалымат булактары физикалык дүйнөдө санарип аппаратуралар келген. Мисалы, бул бөлүмдө, бир кызматкердин өндүрүмдүүлүгү анын курактуу өндүрүмдүүлүгүн таасири кандай изилдөө супермаркет маалыматтарды-текшерип repurposed изилдөөгө жөнүндө силерге айтып берейин (Mas and Moretti 2009) . Андан кийин, кийинки бөлүмдөрдө, мен уюлдук чалуулар жазуулары колдонулган изилдөөчүлөр жөнүндө силерге айтып берейин (Blumenstock, Cadamuro, and On 2015) жана электр коммуналдык тарабынан түзүлгөн эсеп-кысап дайындарын (Allcott 2015) . Бул мисалдар көрсөтүп тургандай, компаниянын ири маалымат булактары жөн гана онлайн жүрүм-туруму да болуп саналат.

онлайн жүрүм-тар басым тарабынан өткөрүлгөн чоң маалыматтардын экинчи маанилүү булагы маалымат алдынча башкаруу органдары тарабынан түзүлөт. Бул окумуштуулар мамлекеттик башкаруу жазууларды деп мамлекеттик маалыматтар, мисалы, салыктык эсепке сыяктуу нерселерди камтыйт, мектеп документтерин жана маанилүү статистикалык эсепке алуу (мисалы, төрөт жана каза каттоо). Өкмөт маалыматтарын бул түрүн түзүп келген, кээ бир учурларда, жүздөгөн жылдар жана илимпоздордун дээрлик узак коомдук илимпоздор бар болгон сыяктуу эле, аларды пайдаланышат. өзгөрдү кандай, бирок, өкмөт, чогултуу, сактоо, өткөрүп берүү жана маалыматтарды талдоо үчүн кескин көмөк кылууда санариптештирүүнү болуп саналат. Мисалы, бул бөлүмдө, мен эмгек экономиканын негизги талаш маселени чечүү үчүн, New York City өкмөттүн санариптик такси метрге маалыматтарын repurposed изилдөөгө жөнүндө силерге айтып берейин (Farber 2015) . Андан кийин, кийинки бөлүмдөрдө, мен өкмөттүн топтолгон добуш берүү кагаздарын сурамжылоо колдонулган кандай тууралуу айта кетели (Ansolabehere and Hersh 2012) жана экспериментте (Bond et al. 2012) .

Мен repurposing идеясы бул изилдөө (2.4-бөлүм) колдонулушу мүмкүн чоң маалымат булактарынын ири маалымат булактары, ошондой эле, касиеттери жөнүндө атайын сөз чейин үйрөнүү (2.3-бөлүм) жана кандай маанилүү деп ойлойм, мен каалайт элем repurposing жөнүндө жалпы акыл эки күмүш тыйын сунуш кылуу. Биринчиден, мен, "ашык" маалыматтарды жана "иштеп" маалыматтарынын ортосундагы деп койдук деп айырмаланып жөнүндө ойлонууга түрткөн болот. Бул жакын, бирок бул такыр туура эмес. Да, изилдөөчүлөрдүн көз карашы менен, ири маалымат булактары "таап," алар жөн эле асмандан түшкөн жок. Анын ордуна, изилдөөчүлөр тарабынан, "ашык" болуп маалымат булактары кээ бир максат үчүн кимдир бирөө тарабынан арналган. "Ашык" маалымат кимдир бирөө тарабынан иштелип чыккан, анткени, мен ар дайым силер маалыматтарды жараткан адамдар менен жараяндар тууралуу мүмкүн болушунча көбүрөөк түшүнүүгө аракет сунуш кылат. Экинчиден, маалыматты repurposing кийин, ал маселе боюнча идеалдуу танышуусуна элестетип көбүнчө өтө пайдалуу болуп саналат жана сиз колдонгон бир да идеалдуу танышуусуна салыштыруу. Эгер маалыматтарды ойлонуп чогултуп жок болсо, сиз каалаган жана эмне эмне ортосунда маанилүү айырмачылыктар болушу мүмкүн эмес. Бул келишпестиктерди байкап, сага да, сенден да маалыматтар үйрөнө алышат кандай тактоого жардам берет, ошондо сен чогултуу керек жаңы маалыматты сунушташы мүмкүн.

өзүмдүн тажрыйбамдан улам, илимпоздордун жана маалымат илимпоздор абдан башкача repurposing кайрыла алышат. изилдөө үчүн атайын иштелип чыккан маалыматтар менен иштеп көнгөн Коомдук окумуштуулар, анын күчтүү карабастан repurposed маалыматтар менен көйгөйлөрдү көрсөтүш үчүн, адатта, дайым даярбыз. Башка жагынан алганда, маалымат окумуштуулар, анын алсыз көз жумуп, ал эми repurposed маалыматтардын пайда көрсөтүш үчүн, адатта, дайым даярбыз. Албетте, жакшы мамиле гибрид. Башкача айтканда, изилдөөчүлөр чоң маалымат булактары да, жакшы да, жаман-жана андан кийин алардан да үйрөнүүгө кандай амал өзгөчөлүктөрүн түшүнүү керек. Ошондой эле, ушул бөлүмдүн калган планы болуп саналат. кийинки бөлүмгө, мен чоң маалымат булактарынын он жалпы мүнөздөмөлөргө айтып берет. Андан кийин, кийинки бөлүмдө, мен мындай маалыматтар менен жакшы иштей алат үч изилдөө ыкмаларын айтып берет.