2.3.2 שטענדיק-אויף

שטענדיק-אויף גרויס דאַטן ענייבאַלז די לערנען פון אומגעריכט געשעענישן און פאַקטיש-צייַט מעזשערמאַנט.

פילע גרויס דאַטן סיסטעמען זענען שטענדיק-אויף; זיי זענען קעסיידער קאַלעקטינג דאַטן. דאס שטענדיק-אויף כאַראַקטעריסטיש גיט ריסערטשערז מיט לאַנדזשאַטודאַנאַל דאַטן (ד"ה, דאַטן איבער צייַט). ווייל שטענדיק-אויף האט צוויי וויכטיק ימפּלאַקיישאַנז פֿאַר פאָרשונג.

קודם, שטענדיק-אויף דאַטע זאַמלונג ינייבאַלז ריסערטשערז צו לערנען אומגעריכט געשעענישן אין וועגן וואָס וואָלט ניט אַנדערש זיין מעגלעך. למשל, ריסערטשערז אינטערעסירט אין לערנען די אָקקופּי געזי פראטעסטן אין טערקיי אין דעם זומער פון 2013 וואָלט טיפּיש פאָקוס אויף די נאַטור פון פּראָטעסטערס בעשאַס די געשעעניש. Ceren Budak און Duncan Watts (2015) זענען ביכולת צו טאָן מער דורך ניצן די שטענדיק-אויף נאַטור פון Twitter צו לערנען פּראָטעסטערס וואָס געוויינט טוויטטער איידער, בעשאַס, און נאָך די געשעעניש. און, זיי זענען געווען ביכולת צו שאַפֿן אַ פאַרגלייַך גרופּע פון ​​ניט פּאַרטיסיפּאַנץ איידער, בעשאַס, און נאָך די געשעעניש (געשטאַלט 2.2). אין אַלגעמיין, זייער עקס-פּאָסטן טאַפליע אַרייַנגערעכנט די טוועעץ פון 30,000 מענטשן איבער צוויי יאר. דורך פאַרגרעסערן די קאַמאַנלי געניצט דאַטן פון די פראטעסטן מיט דעם אנדערע אינפֿאָרמאַציע, בודאַק און וואַטץ זענען ביכולת צו לערנען מער: זיי זענען ביכולת צו אָפּשאַצן וואָס מענטשן פון די מענטשן זענען געווען מער מסתּמא צו אָנטייל נעמען אין די געzi פראטעסטן און צו אָפּשאַצן די ענדערונגען אין אַטאַטודז פון פּאַרטיסאַפּאַנץ און ניט פּאַרטיסאַפּאַנץ, ביידע אין די קורץ טערמין (קאַמפּערד פֿאַר גיזי צו בעשאַס געזי) און אין די לאַנג טערמין (קאַמפּערד צו געסט מיט גאָוז-גאָוז).

פיגורע 2.2: פּלאַן געניצט דורך Budak און Watts (2015) צו לערנען אָקופּי Gezi פראטעסטן אין טערקיי אין דעם זומער פון 2013. דורך ניצן די שטענדיק-אויף נאַטור פון Twitter, די ריסערטשערז באשאפן וואָס זיי גערופן אַ עקס-פּאָסטן טאַפליע אַז אַרייַנגערעכנט וועגן 30,000 מענטשן איבער צוויי יאר. אין קאַנטראַסט צו אַ טיפּיש לערנען אַז פאָוקיסט אויף פּאַרטיסאַפּאַנץ בעשאַס די פראטעסטן, די עקס-פּאָסטן טאַפליע מוסיף 1) דאַטן פון פּאַרטיסאַפּאַנץ פריער און נאָך דער געשעעניש און 2) דאַטן פון נעאַטעפּאַסיסאַנץ איידער, בעשאַס, און נאָך די געשעעניש. דעם ענריטשעד דאַטן סטרוקטור ענייבאַלד באַדאַק און וואַטץ צו אָפּשאַצן וואָס די מינים פון מענטשן זענען מער מסתּמא צו אָנטייל נעמען אין די געזי פראטעסטן און צו פאַרשטיין די ענדערונגען אין אַטאַטודז פון פּאַרטיסאַפּאַנץ און ניט-פּאַרטיסאַפּאַנץ, ביידע אין קורץ טערמין (קאַמפּערינג פאַר-געזי מיט בעשאַס געזי ) און אין די לאַנג טערמין (קאַמפּערד צו דער געשיכטע מיט פּאָסטן-געזי).

פיגורע 2.2: פּלאַן געניצט דורך Budak and Watts (2015) צו לערנען אָקופּי Gezi פראטעסטן אין טערקיי אין דעם זומער פון 2013. דורך ניצן די שטענדיק-אויף נאַטור פון Twitter, די ריסערטשערז באשאפן וואָס זיי גערופן אַ עקס-פּאָסטן טאַפליע אַז אַרייַנגערעכנט וועגן 30,000 מענטשן איבער צוויי יאר. אין קאַנטראַסט צו אַ טיפּיש לערנען אַז פאָוקיסט אויף פּאַרטיסאַפּאַנץ בעשאַס די פראטעסטן, די עקס-פּאָסטן טאַפליע מוסיף 1) דאַטן פון פּאַרטיסאַפּאַנץ פריער און נאָך דער געשעעניש און 2) דאַטן פון נעאַטעפּאַסיסאַנץ איידער, בעשאַס, און נאָך די געשעעניש. דעם ענריטשעד דאַטן סטרוקטור ענייבאַלד באַדאַק און וואַטץ צו אָפּשאַצן וואָס די מינים פון מענטשן זענען מער מסתּמא צו אָנטייל נעמען אין די געזי פראטעסטן און צו פאַרשטיין די ענדערונגען אין אַטאַטודז פון פּאַרטיסאַפּאַנץ און ניט-פּאַרטיסאַפּאַנץ, ביידע אין קורץ טערמין (קאַמפּערינג פאַר-געזי מיט בעשאַס געזי ) און אין די לאַנג טערמין (קאַמפּערד צו דער געשיכטע מיט פּאָסטן-געזי).

א סקעפּטיק קען פונט אויס אַז עטלעכע פון ​​די עסטימאַץ קען האָבן געמאכט אָן שטענדיק-אויף דאַטע זאַמלונג קוואלן (למשל, לאַנג-טערמין עסטאַמאַץ פון שטעלונג ענדערונג), און אַז איז ריכטיק, כאָטש אַזאַ אַ דאַטן זאַמלונג פֿאַר 30,000 מענטשן וואָלט געווען גאַנץ טייַער. אפילו געגעבן אַ אַנלימאַטאַד בודזשעט, אָבער, איך קען נישט טראַכטן פון קיין אנדערע אופֿן אַז יסענשאַלי אַלאַוז ריסערטשערז צו אַרומפאָרן צוריק אין צייַט און גלייַך אָבסערווירן אָנטייל אין די פאַרגאַנגענהייַט. די קלאָוסאַסט אָלטערנאַטיוו וואָלט זיין צו קלייַבן רעטראַספּעקטיוו מעלדעט פון נאַטור, אָבער די מעלדעט וואָלט זיין פון לימיטעד גראַנולאַריטי און פּראָבלעמאַטיש אַקיעראַסי. טיש 2.1 גיט אנדערע ביישפילן פון שטודיום וואָס נוצן אַ שטענדיק-אויף דאַטן מקור צו לערנען אַן אומגעריכט געשעעניש.

טיש 2.1: שטודיום פון אומגעריכט געשעענישן ניצן שטענדיק-אויף גרויס דאַטן קוואלן.
Unexpected event שטענדיק-אויף דאַטן מקור Citation
פאַרנעמען געיז אין טערקיי טוויטער Budak and Watts (2015)
שירעם פראטעסטן אין האָנג קאָנג וועיבאָ Zhang (2016)
שוץ פון פּאָליצייַ אין ניו יארק סיטי האַלטן-און-פריק מעלדעט Legewie (2016)
פערזענליכע אינאיינעם מיט ייסיס טוויטער Magdy, Darwish, and Weber (2016)
11 סעפטעמבער 2001 באַפאַלן livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 סעפטעמבער 2001 באַפאַלן pager messages Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

אין דערצו צו געלערנט אומגעריכט events, שטענדיק-אויף גרויס דאַטע סיסטעמען אויך געבן ריסערטשערז צו פּראָדוצירן פאַקטיש-צייַט עסטאַמאַץ, וואָס קענען זיין וויכטיק אין סעטטינגס ווו פּאָליטיק מייקערז - אין רעגירונג אָדער אינדוסטריע-ווילן צו רעספּאָנד באזירט אויף סיטשויישאַנאַל וויסיקייַט. למשל, געזעלשאַפטלעך מידיאַ דאַטן קענען ווערן גענוצט צו פירן נויטפאַל ענטפער צו נאַטירלעך דיזאַסטערז (Castillo 2016) און אַ פאַרשיידנקייַט פון פאַרשידענע גרויס דאַטן קוואלן קענען ווערן געניצט אין פאַקטיש-צייַט אָפּשאַצן פון עקאָנאָמיש טעטיקייט (Choi and Varian 2012) .

אין מסקנא, שטענדיק-אויף דאַטן סיסטעמען געבן ריסערטשערז צו לערנען אומגעריכט געשעענישן און צושטעלן פאַקטיש-צייַט אינפֿאָרמאַציע צו פּאָליטיק מייקערז. איך טאָן ניט, אָבער, טראַכטן אַז שטענדיק-אויף דאַטן סיסטעמען זענען געזונט סוטאַד פֿאַר טראַקינג ענדערונגען איבער זייער לאַנג פּיריאַדז פון צייַט. אַז איז ווייַל פילע גרויס דאַטן סיסטעמס זענען קעסיידער טשאַנגינג - אַ פּראָצעס וואָס איך וועט רופן דריפט שפּעטער אין דעם קאַפּיטל (אָפּטיילונג 2.3.7).