2.3.3 Nonreactive

מעאַסורעמענט אין גרויס דאַטן קוואלן איז פיל ווייניקער מסתּמא צו טוישן נאַטור.

איין אַרויסרופן פון געזעלשאַפטלעך פאָרשונג איז אַז מענטשן קענען טוישן זייער נאַטור ווען זיי וויסן אַז זיי זענען באמערקט דורך פאָרשער. סאציאל סייאַנטיס בכלל רופן דעם ריאַקטיוויטי (Webb et al. 1966) . פֿאַר בייַשפּיל, מענטשן קענען זיין מער ברייטהאַרציק אין לאַבאָראַטאָריע שטודיום ווי פעלד שטודיום ווייַל אין די ערשטע זיי זענען זייער וויסנד אַז זיי זענען געזען (Levitt and List 2007a) . איין אַספּעקט פון גרויס דאַטן אַז פילע טשיימבערז געפֿינען פּראַמאַסינג אַז פּאַרטיסאַפּאַנץ זענען בכלל ניט וויסנד אַז זייער דאַטן זייַנען קאַפּטשערד אָדער זיי ווערן אַזוי צוגעוווינט צו דעם דאַטן זאַמלונג אַז עס ניט מער ענדערונגען זייער נאַטור. ווייַל פּאַרטיסאַפּאַנץ זענען ניט רעאַקטיוו , דעריבער, פילע מקורים פון גרויס דאַטן קענען ווערן גענוצט צו לערנען נאַטור וואָס האט נישט געווען אַמינאַבאַל צו פּינטלעך מעזשערמאַנט פריער. פֿאַר בייַשפּיל, Stephens-Davidowitz (2014) געניצט די פּרעוואַלאַנס פון ראַסיסט ווערטער אין זוכן מאָטאָר קוואָטעס צו מעסטן ראַסיש אַנימאַס אין פאַרשידענע מקומות פון די פאַרייניקטע שטאַטן. די ניטרעאַקטיוו און גרויס (זען אָפּטיילונג 2.3.1) נאַטור פון די זוכן דאַטן ינייבאַלד מעזשערמאַנץ וואָס וואָלט זיין שווער ניצן אנדערע מעטהאָדס אַזאַ ווי סערווייז.

נאָנרעאַקטיוויטי, אָבער, טוט נישט ענשור אַז די דאַטן זענען עפעס אַ גלייַך אָפּשפּיגלונג פון מענטשן 'ס נאַטור אָדער אַטאַטודז. פֿאַר בייַשפּיל, ווי איינער רעספּאָנדענט אין אַן אינטערוויו-באזירט לערנען האט געזאגט, "עס ס 'נישט וואָס איך טאָן נישט האָבן פּראָבלעמס, איך נאָר טאָן ניט שטעלן זיי אויף פאַסעבאָאָק" (Newman et al. 2011) . אין אנדערע ווערטער, כאָטש עטלעכע גרויס דאַטן קוואלן זענען ניט רייאַקטיוו, זיי זענען נישט שטענדיק פֿרייַ פון געזעלשאַפטלעך דיסייאַבילאַטי פאָרורטייל, די טענדענץ פֿאַר מענטשן וואָס ווילן צו פאָרשטעלן זיך אין דער בעסטער מעגלעך וועג. ווייַטער, ווי איך וועט באַשרייַבן שפּעטער אין דעם קאַפּיטל, די נאַטור קאַפּטשערד אין גרויס דאַטן קוואלן איז מאל ימפּאָוזד דורך די צילן פון פּלאַטפאָרמע אָונערז, אַן אַרויסגעבן איך וועט רופן אַלגערידאַמיק קאַנפאַונדינג . צום סוף, כאָטש נאַנרעאַקטיוואַטי איז אַדוואַנטיידזשאַס פֿאַר פאָרשונג, טראַקינג מענטשן ס נאַטור אָן זייער צושטימען און וויסיקייַט רייזאַז עטישע קאַנסערנז אַז איך וועל דיסקרייבד אין דעטאַל אין קאַפּיטל 6.

די דרייַ פּראָפּערטיעס וואָס איך נאָר דיסקרייבד-גרויס, שטענדיק-אויף, און ניט-רעאַקטיוו-זענען בכלל, אָבער ניט שטענדיק, אַדוואַנטיידזשאַס פֿאַר געזעלשאַפטלעך פאָרשונג. ווייַטער, איך ווענדן צו די זיבן פּראָפּערטיעס פון גרויס דאַטן קוואלן - אַנקאַמפּליטיד, ינאַקסעסאַבאַל, ניט-רעפּריזענאַטיוו, דריפטינג, אַלגערידאַמיקלי קאַנפאַונדיד, גראָב, און שפּירעוודיק - וואָס בכלל, אָבער ניט שטענדיק, שאַפֿן פראבלעמען פֿאַר פאָרשונג.