2.3.2 Always-on

Ëmmer-iwwert grouss Daten erméiglecht der Etude vun onerwaart Événementer an real-Zäit Miessung.

Vill grouss Daten Systemer sinn ëmmer-iwwert; si sammelt konstant Daten. Dëst ëmmer-iwwert charakteristesche stellt Fuerscher mat longitudinal Donnéeën (dh, Donnéeën iwwer Zäit). ëmmer-iwwert ginn huet zwou wichteg Donnéeën fir Fuerschung.

Éischtens, ëmmer op Datensammlung erméiglecht d'Fuerscher onerwaart Aktiounen un Weeër ze studéieren déi soss net méiglech sinn. Zum Beispill, Fuerscher déi un der Studie vun den Occupy Gezi Proteste an der Türkei am Summer 2013 studéiere wëllen normalerweis d'Oppositioun vun Demonstranten während der Manifestatioun konzentréieren. Ceren Budak an Duncan Watts (2015) konnten méi maachen, andeems se d'ëmmer op der Natur vum Twitter benotzen fir Studenten ze studéieren déi Twitter viru, während an no der Manifestatioun benotzt hunn. An, sie konnten eng Vergréisserungsgrupp vun Nullpartner hunn, virun an no der Manifestatioun (2.2). Am Ganzen hunn d' Ex-Post-Panel d'Tweets vun 30.000 Leit iwwer zwee Joer. Duerch d'Vergaangenheet vun den allgemengen benotzt Daten aus de Protester mat dësen aner Informatiounen konnte Budak a Watts vill méi léieren: si konnten geschätzten, wéi vill Leit méi e wahrscheinlech bei de Gezi-Proteste matmaachen an d'Verännerunge vun der Astellung vun Participanten an onpartizipanten, souwuel am kuerze Begrëff (de Pre Gezi fir Gezi) a laangfristeg (de Pre Gezi mat Post Gezi).

Figure 2.2: Design vum Budak an Watts (2015) fir d'Occupy Gezi Proteste an der Türkei am Summer 2013 ze studéieren. Duerch d'Allgemengheet vun Twitter hunn d'Fuerscher geschafft wat se e ex post posten hunn, 30.000 Leit iwwer zwee Joer. Am Géigesaz zu enger typescher Studie, déi sech op de Protester fokusséiert huet, fiert d'Ex-Post-Panel 1) Daten vun den Participanten virum a no der Manifestatioun an 2) Daten aus netparticipants virun, während an no der Manifestatioun. Dës bereetgestallt Datenstruktur huet Budak a Watts ermëttelt fir Schätzungen ze maachen, wéi vill Leit méi e wahrscheinlech bei der Gezi-Proteste matmaachen an d'Verännerunge vun den Attituden vun den Participanten an net Participanten këmmeren, souwuel am kuerze Begrëff (de Pre Gezi mat Gezi beim Gezi ) an op laang Siicht (Verglach mat Pre-Gezi mat Post Gezi).

Figure 2.2: Design vum Budak and Watts (2015) fir d'Occupy Gezi Proteste an der Türkei am Summer 2013 ze studéieren. Duerch d'Allgemengheet vun Twitter hunn d'Fuerscher geschafft wat se e ex post posten hunn, 30.000 Leit iwwer zwee Joer. Am Géigesaz zu enger typescher Studie, déi sech op de Protester fokusséiert huet, fiert d'Ex-Post-Panel 1) Daten vun den Participanten virum a no der Manifestatioun an 2) Daten aus netparticipants virun, während an no der Manifestatioun. Dës bereetgestallt Datenstruktur huet Budak a Watts ermëttelt fir Schätzungen ze maachen, wéi vill Leit méi e wahrscheinlech bei der Gezi-Proteste matmaachen an d'Verännerunge vun den Attituden vun den Participanten an net Participanten këmmeren, souwuel am kuerze Begrëff (de Pre Gezi mat Gezi beim Gezi ) an op laang Siicht (Verglach mat Pre-Gezi mat Post Gezi).

Eng Skeptiker kënnen weisen, datt verschidde vun dëse Schätzungen ouni ëmmer op Datenquellenquellen gemaach hunn (z. B. laangfristeg Schätzung vun der Haltung änneren), an dat ass richteg, obwuel dës Datensammlung fir 30.000 Mënsche ganz deier. Och mat engem onlimitéierten Budget kann ech awer keng aner Methode denken, datt d'Fuerscher erlaabt an der Zäit erëm ze reesen an direkt an de Verglach vun den Participanten ze observéieren an der Vergaangenheet. Déi nächst Alternativ wäerte retrospectéiert Rapport vum Verhalen gesammelt ginn, awer dës Berichte wäerten vun enger limitéierter Granularitéit an der frëndlecher Genauegkeet sinn. D'Tabelle 2.1 liwwert aner Beispiller vu Studien déi eng ëmmer-on Datenquelle benotzt fir eng onerwaart Event ze studéieren.

Table 2.1: Etuden vun onerwaarten Evenementer mat ëmmer gréisseren Datenquellen.
Unexpected Event Always-on Datenquelle Citation
Occasioun Gezi Bewegung an der Türkei Twitter Budak and Watts (2015)
Regenschirm protestéiert an Hong Kong Weibo Zhang (2016)
Polizisten vun Police zu New York City Stop-a-frisk Reportagen Legewie (2016)
Persoun ronderëm ISIS Twitter Magdy, Darwish, and Weber (2016)
11. September 2001 attackéiert livejournal.com Cohn, Mehl, and Pennebaker (2004)
11. September 2001 attackéiert Pager Message Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Zousätzlech zu onerwaarten Evenementer ze studéieren, ëmmer op grouss Dateschutzsystemer erméiglechen et och Forscher fir Echtzäit Schätzungen ze produzéieren, wat wichteg sinn an Astellungen, wou Politiker an der Regierung oder der Industrie wëllen op Basis vun der situatorescher Bewosstsinn reagéieren. Zum Beispill sozialen Datebank kënne benotzt ginn fir d'Noutfallreaktioun op Naturkatastrophen (Castillo 2016) an eng Rei vun verschiddenen groussen Datenquellen ze produzéieren kënnen produzéieren Echtzäit Schätzungen vun der wirtschaftlecher Aktivitéit (Choi and Varian 2012) .

Schlussendlech sinn ëmmer Datenbootsysteme fir Fuerscher et onerwaart Eventer ze studéieren an ze informéieren Echtzäit fir politesch Entscheedunge. Ech mengen awer net, datt ëmmer Daten op Systemer suivéiert sinn fir d'Verännerunge vu ganz laang Zäit ze verfolgen. Dat ass well vill grouss Daten Systemer konstant sinn Zaïtgeescht-engem Prozess, dass ech am Kapitel (Rubrik 2.3.7) spéider sech Opruff wäert.