2.3.2 Заўсёды-на

Заўсёды-на вялікіх дадзеных дазваляе вывучаць нечаканых падзей і вымярэнняў ў рэжыме рэальнага часу.

Многія буйныя інфармацыйныя сістэмы заўсёды-на; яны ўвесь час збірае дадзеныя. Гэта заўсёды на характарыстыка забяспечвае даследчыкам падоўжных дадзеных (г.зн. дадзеных з цягам часу). Які заўсёды на два важных наступствы для даследаванняў.

Па-першае, заўсёды на зборы дадзеных дазваляе даследчыкам вывучаць нечаканыя падзеі спосабамі, якія інакш не маглі б быць магчыма. Напрыклад, даследчыкі, зацікаўленыя ў вывучэнні Займайце Gezi пратэсты ў Турцыі летам 2013 года, як правіла, засяродзіцца на паводзінах дэманстрантаў падчас мерапрыемства. Серэну Будак і Дункан Ўотс (2015) быў у стане зрабіць больш, выкарыстоўваючы заўсёды на прыроду Twitter для вывучэння дэманстрантаў , якія выкарыстоўвалі Twitter да, падчас і пасля мерапрыемства. І яны былі ў стане стварыць параўнальную групу няўдзельнікам да, падчас і пасля мерапрыемства (малюнак 2.2). У агульнай складанасці іх постфактум групы ўваходзілі твіты 30000 людзей у працягу двух гадоў. Па папаўняючы часта выкарыстоўваюцца дадзеныя пратэстаў з гэтай іншай інфармацыяй, Будак і Ўотс змог даведацца значна больш: яны былі ў стане ацаніць, якія чалавек былі больш схільнае да ўдзелу ў Gezi пратэстаў і ацаніць змены ў адносінах удзельнікаў і няўдзельнікам, як у кароткатэрміновай перспектыве (параўноўваючы папярэдне Gezi на працягу Gezi) і ў доўгатэрміновай перспектыве (параўноўваючы папярэдне Gezi з пост-Gezi).

Малюнак 2.2: Канструкцыя выкарыстоўваецца Будак і Ўотс (2015) для вывучэння Займайце Gezi пратэсты ў Турцыі улетку 2013 г. Выкарыстоўваючы заўсёды на прыроду Twitter, даследчыкі стварылі тое, што яны называюць экс-пост панэль, якая ўключала каля 30000 людзей на працягу двух гадоў. У адрозненні ад тыповага даследаванні, якія сканцэнтраваны на удзельніках падчас пратэстаў, экс-пост панэль дадае 1) дадзеных ад удзельнікаў да і пасля падзеі і 2) дадзеныя з няўдзельнікам да, падчас і пасля мерапрыемства. Гэтая узбагачаная структура дадзеных дазволіла Будак і Ўотс, каб ацаніць, якія людзі былі больш схільныя да ўдзелу ў Gezi пратэстах і ацаніць змены ў дачыненні да ўдзельнікаў і няўдзельнікам, як у кароткатэрміновай перспектыве (параўноўваючы папярэдне Gezi з ва Gezi ) і ў доўгатэрміновай перспектыве (параўноўваючы папярэдне Gezi з пост-Gezi).

Малюнак 2.2: Канструкцыя выкарыстоўваецца Budak and Watts (2015) для вывучэння Займайце Gezi пратэсты ў Турцыі улетку 2013 г. Выкарыстоўваючы заўсёды на прыроду Twitter, даследчыкі стварылі тое , што яны называюць экс-пост панэль , якая ўключала каля 30000 людзей на працягу двух гадоў. У адрозненні ад тыповага даследаванні, якія сканцэнтраваны на удзельніках падчас пратэстаў, экс-пост панэль дадае 1) дадзеных ад удзельнікаў да і пасля падзеі і 2) дадзеныя з няўдзельнікам да, падчас і пасля мерапрыемства. Гэтая узбагачаная структура дадзеных дазволіла Будак і Ўотс, каб ацаніць, якія людзі былі больш схільныя да ўдзелу ў Gezi пратэстах і ацаніць змены ў дачыненні да ўдзельнікаў і няўдзельнікам, як у кароткатэрміновай перспектыве (параўноўваючы папярэдне Gezi з ва Gezi ) і ў доўгатэрміновай перспектыве (параўноўваючы папярэдне Gezi з пост-Gezi).

Скептык мог бы паказаць на тое, што некаторыя з гэтых ацэнак маглі б быць зробленыя без заўсёды на крыніцах збору дадзеных (напрыклад, доўгатэрміновыя ацэнкі змены адносіны), і гэта правільна, хоць такі збор дадзеных для 30000 чалавека быў бы зусім дорага. Нават улічваючы неабмежаваны бюджэт, аднак, я не магу думаць пра нейкі - альбо іншым метадзе , які па сутнасці дазваляе даследчыкам падарожнічаць падчас і непасрэдна назіраць за паводзіны ўдзельнікаў у мінулым. Бліжэйшая альтэрнатыва будзе збіраць рэтраспектыўныя справаздачы аб паводзінах, аднак гэтыя справаздачы будуць мець абмежаванні па зярністасці і сумнеўную дакладнасць. Табліца 2.1 змяшчае іншыя прыклады даследаванняў, якія выкарыстоўваюць заўсёды на крыніцы дадзеных для вывучэння нечаканага падзеі.

Табліца 2.1: Даследаванні нечаканых падзей з выкарыстаннем заўсёды на вялікіх крыніцах дадзеных.
нечаканае падзея Заўсёды-на дадзеных крыніцы цытаванне
Займайце рух Gezi ў Турцыі шчэбет Budak and Watts (2015)
Парасон пратэсты ў Ганконгу Weibo Zhang (2016)
Здымкі паліцыі ў Нью-Ёрку Стоп-і-FRISK справаздачы Legewie (2016)
Твар далучэння ISIS шчэбет Magdy, Darwish, and Weber (2016)
11 верасня 2001 напад livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 верасня 2001 напад пэйджара паведамлення Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

У дадатак да вывучэння нечаканых падзей, заўсёды на вялікіх сістэмах перадачы дадзеных таксама дазваляюць даследчыкам для атрымання адзнак у рэальным часе, што можа быць важна ва ўмовах, калі палітыкі-ў дзяржаўных або галіновых хочаце адказаць на аснове сітуацыйнай дасведчанасці. Напрыклад, дадзеныя сацыяльныя медыя могуць быць выкарыстаны для кіраўніцтва рэагавання на надзвычайныя сітуацыі ў выпадку стыхійных бедстваў (Castillo 2016) і розных буйных крыніц дадзеных могуць быць выкарыстаны атрымання адзнак у рэжыме рэальнага часу эканамічнай дзейнасці (Choi and Varian 2012) .

У заключэнне, заўсёды на дадзеныя сістэмы дазваляюць даследчыкам вывучаць нечаканыя падзеі і прадастаўляць інфармацыю ў рэальным часе для асоб, якія вызначаюць палітыку. Я, аднак, не думаю, што заўсёды на дадзеных сістэма добра падыходзіць для адсочвання змяненняў на працягу вельмі доўгага перыяду часу. Гэта адбываецца таму , што многія буйныя інфармацыйныя сістэмы пастаянна мяняюцца-працэс , які я буду называць дрэйфаваць пазней (раздзел 2.3.7) кіраўніка.