3.2 פרעגן קעגן אַבזערווינג

מיר זענען שטענדיק געגאנגען צו דאַרפֿן צו פרעגן מענטשן שאלות.

געגעבן אַז מער און מער פון אונדזער נאַטור איז קאַפּטשערד אין גרויס דאַטן קוואלן, אַזאַ ווי רעגירונג און געשעפט אַדמיניסטראַטיווע דאַטן, עטלעכע מענטשן זאל טראַכטן אַז אַסקינג פראגעס איז אַ זאַך פון די פאַרגאַנגענהייַט. אָבער, עס ס ניט אַז פּשוט. עס זענען צוויי הויפּט סיבות וואָס איך טראַכטן ריסערטשערז וועט פאָרזעצן צו פרעגן מענטשן פֿראגן. ערשטער, ווי איך דיסקאַסט אין קאַפּיטל 2, עס זענען פאַקטיש פּראָבלעמס מיט די אַקיעראַסי, קאַמפּליטנאַס, און אַקסעסאַביליטי פון פילע גרויס דאַטן קוואלן. רגע, אין דערצו צו די פּראַקטיש סיבות, עס איז מער פונדאַמענטאַל סיבה: עס זענען עטלעכע זאכן וואָס זענען זייער שווער צו לערנען פון נאַטוראַל דאַטן, אַפֿילו שליימעסדיק נאַטוראַל דאַטן. פֿאַר בייַשפּיל, עטלעכע פון ​​די מערסט וויכטיק געזעלשאַפטלעך רעזולטאטן און פּרידיקטערז זענען ינערלעך שטאַטן , אַזאַ ווי ימאָושאַנז, וויסן, עקספּעקטיישאַנז, און מיינונגען. אינעווייניקסטע שטייען עקסיסטירן אין מענטשן קעפ, און א מאל דער בעסטער וועג צו לערנען וועגן אינערלעכער שטאַטן איז צו פרעגן.

די פּראַקטיש און פונדאַמענטאַל לימיטיישאַנז פון גרויס דאַטן קוואלן, און ווי זיי קענען באַקומען מיט סערווייז, זענען יללוסטרירט דורך מאָיראַ בורקע און ראבערט קראַוט ס (2014) פאָרשונג אויף ווי די שטאַרקייַט פון פרענדשיפּס איז ימפּאָוזד דורך ינטעראַקשאַן אויף פאַסעבאָאָק. אין דער צייט, בורק איז געווען ארבעטן אין פאַסעבאָאָק אַזוי זי האט אַ גאַנץ צוטריט צו איינער פון די מערסט מאַסיוו און דיטיילד רעקאָרדס פון מענטשלעך נאַטור אלץ באשאפן. אָבער, אַפֿילו אַזוי, בורקע און קראַוט האבן צו נוצן סערווייז אין סדר צו ענטפֿערן זייער פאָרשונג קשיא. זייער אַוטקאַם פון אינטערעס - די סאַבדזשעקטיוו געפיל פון קלאָוסאַסט צווישן די ענטפערער און איר פרייַנד - איז אַן אינערלעכער שטאַט וואָס בלויז יגזיסץ ין די קאָפּ פון די ענטפעראַנט. דערצו, אין דערצו צו נוצן אַ יבערבליק צו קלייַבן זייער אַוטקאַם פון אינטערעס, בורקע און קרוט אויך האָבן צו נוצן אַ יבערבליק צו לערנען וועגן פּאַטענטשאַלי קאַנפאַונדינג סיבות. אין באַזונדער, זיי געוואלט צו צעטיילן די פּראַל פון קאַמיונאַקייטינג אויף פאַסעבאָאָק פון קאָמוניקאַציע דורך אנדערע טשאַנאַלז (למשל, email, טעלעפאָנירן, און פּנים צו פּנים). אפילו ינטעראַקטיאָנס דורך בליצפּאָסט און טעלעפאָנירן זענען אויטאָמאַטיש רעקאָרדעד, די טראַסעס זענען נישט בנימצא צו בורקע און קראַוט אַזוי זיי האָבן צו קלייַבן זיי מיט אַ יבערבליק. קאָמבינינג זייער יבערבליק דאַטן וועגן פֿרייַנדשאַפֿט שטאַרקייַט און ניט-פאַסעבאָאָק ינטעראַקשאַן מיט די פאַסעבאָאָק לאָג דאַטע, בורקע און קראַוט געפונען אַז קאָמוניקאַציע דורך פאַסעבאָאָק האט אין פאַקט פירן צו געוואקסן געפילן פון קלאָוסניס.

ווי די ווערק פון בורקע און קראַוט יללוסטראַטעס, גרויס דאַטן קוואלן וועט נישט עלימינירן די דאַרפֿן צו פרעגן מענטשן פֿראגן. אין פאַקט, איך וואָלט ציען די פאַרקערט לעקציע פון ​​דעם לערנען: גרויס דאַטן קוואלן קען פאקטיש פאַרגרעסערן די ווערט פון אַסקינג פראגעס, ווי איך וועל ווייַזן איבער דעם קאַפּיטל. דעריבער, דער בעסטער וועג צו טראַכטן וועגן די שייכות צווישן אַסקינג און אַבזערווינג איז אַז זיי זענען קאַמפּלאַמאַנץ אלא ווי סאַבסטאַטוץ; זיי זענען ווי פיסטאַשקע פּוטער און זשעלע. ווען עס איז מער פיסטאַשקע פּוטער, מענטשן ווילן מער זשעלע; ווען עס איז מער גרויס דאַטע, איך טראַכטן מענטשן וועלן וועלן מער סערווייז.