2.1 הקדמה

אין דער אַנאַלאָג עלטער, קאַלעקטינג דאַטן וועגן נאַטור-וואס טוט וואָס, און ווען-איז טייַער, און דעריבער לעפיערעך זעלטן. איצט, אין די דיגיטאַל עלטער, די ביכייערז פון ביליאַנז פון מענטשן זענען רעקאָרדעד, סטאָרד, און אַנאַליזאַבאַל. פֿאַר בייַשפּיל, יעדער צייַט איר גיט אויף אַ וועבזייטל, מאַכן אַ רופן אויף דיין מאָביל טעלעפאָן, אָדער באַצאָלן פֿאַר עפּעס מיט דיין קרעדיט קאַרטל, אַ דיגיטאַל רעקאָרד פון דיין נאַטור איז באשאפן און סטאָרד דורך אַ געשעפט. ווייַל די טייפּס פון דאַטן זענען אַ בייפּראָדוקט פון מענטשן ס וואָכעדיק אַקשאַנז, זיי זענען אָפט גערופן דיגיטאַל טראַסעס . אין דערצו צו די טראַסעס געהאלטן דורך געשעפטן, רעגירונגס אויך ינקרעדאַבלי רייַך דאַטן וועגן ביידע מענטשן און געשעפטן. צוזאַמען די געשעפט און רעגירונג רעקאָרדס זענען אָפט גערופן גרויס דאַטן .

די שטייענדיק שטאַפּל פון גרויס דאַטן מיטל אַז מיר האָבן אריבערגעפארן פון אַ וועלט ווו ביכייוואַלי דאַטן איז געווען טשער צו אַ וועלט ווו ביכייוויעראַל דאַטן איז שעפעדיק. א ערשטער שריט צו וויסן פון גרויס דאַטן איז רילייזינג אַז עס איז טייל פון אַ ברייט קייט פון דאַטן וואָס איז געניצט פֿאַר געזעלשאַפטלעך פאָרשונג פֿאַר פילע יאָרן: אָבסערוואַטיאָנאַל דאַטע . בעערעך, אָבסערוואַטיאָנאַל דאַטע איז קיין דאַטן וואָס רעזולטאטן פון אַבזערווינג אַ געזעלשאַפטלעך סיסטעם אָן ינטערווינינג אין עטלעכע וועג. א גראָבע וועג צו טראַכטן וועגן עס איז אַז אָבסערוואַטיאָנאַל דאַטע איז אַלץ וואָס טוט נישט אַרייַנציען גערעדט מיט מענטשן (למשל, סערווייז, די טעמע פון ​​קאַפּיטל 3) אָדער טשאַנגינג מענטשן ס ינווייראַנמאַנץ (למשל, יקספּעראַמאַנץ, די טעמע פון ​​פּרק 4). אזוי, אין דערצו צו געשעפט און רעגירונג רעקאָרדס, אָבסערוואַטיאָנאַל דאַטע אויך כולל זאכן ווי די טעקסט פון צייַטונג ארטיקלען און סאַטעליט פאָטאָס.

דעם קאַפּיטל האט דרייַ טיילן. ערשטער, אין סעקשאַנז 2.2, איך שרייבט גרויס דאַטן קוואלן אין מער דעטאַל און קלעראַפיי אַ פונדאַמענטאַל חילוק צווישן זיי און די דאַטן וואָס זענען typically used for social research in the past. דערנאָך, אין אָפּטיילונג 2.3, איך באַשרייַבן צען פּראָסט קעראַקטעריסטיקס פון גרויס דאַטן קוואלן. פארשטארקן די קעראַקטעריסטיקס ענייבאַלז איר צו געשווינד דערקענען די סטרענגטס און וויקנאַסאַז פון יגזיסטינג קוואלן און וועט העלפן איר האַרנעסס די נייַ קוואלן וואָס וועט זייַן בנימצא אין דער צוקונפֿט. צום סוף, אין אָפּטיילונג 2.4, איך שרייבט דרייַ הויפּט פאָרשונג סטראַטעגיעס אַז איר קענען נוצן צו לערנען פון אַבזיבאַטיאָנאַל דאַטע: קאַונטינג זאכן, פאָרויסזאָגן זאכן, און אַפּראָוטשינג אַן עקספּערימענט.