2.3.8 אַלגאָריטהמיקאַללי קאַנפאַונדיד

קאָנפעווערי אין גרויס דאַטע סיסטעמס איז נישט נאַטירלעך; עס איז געטריבן דורך ינזשעניעריע צילן פון די סיסטעמס.

כאָטש פילע גרויס דאַטן קוואלן זענען ניט רייאַקטיוו ווייַל מענטשן זענען נישט וויסנד אַז זייער דאַטן זענען זייַענדיק רעקאָרדעד (אָפּטיילונג 2.3.3), ריסערטשערז זאָל נישט באַטראַכטן נאַטור אין די אָנליין סיסטעמען צו זיין "נאַטירלעך געשעעניש." אין פאַקט, די דיגיטאַל סיסטעמען וואָס רעקאָרדירן נאַטור העכסט ענדזשאַנירד צו פּונקט ספּעציפיש ביכייוויערז אַזאַ ווי קליקינג אויף אַדס אָדער פּאָסטינג אינהאַלט. די וועגן וואָס די צילן פון סיסטעם דיזיינערז קענען פאָרשטעלן פּאַטערנז אין דאַטן איז גערופן אַלגערידאַמיק קאָנפאָונדינג . אַלגאָריטהמיק קאָנפאַונדינג איז לעפיערעך אומבאַקאַנט צו געזעלשאַפטלעך סייאַנטיס, אָבער עס איז אַ הויפּט דייַגע צווישן אָפּגעהיט דאַטן סייאַנטיס. און, ניט ענלעך עטלעכע פון ​​די אנדערע פּראָבלעמס מיט דיגיטאַל טראַסעס, אַלגערידאַמיק קאָנפאַונדינג איז לאַרגעלי ומזעיק.

א לעפיערעך פּשוט בייַשפּיל פון אַלגערידאַמיק קאָנפאַונדינג איז דער פאַקט אַז אויף פאַסעבאָאָק עס זענען אַ אַנאַמאַלאַסלי הויך נומער פון וסערס מיט בעערעך 20 פריינט, ווי איז דיסקאַווערד דורך דזשאָהאַן וגאַנדער און קאָללאַגעס (2011) . ססיענטיסץ אַנאַליזינג דעם דאַטן אָן קיין פארשטאנד פון ווי פאַסעבאָאָק ווערק קען סאָף דזשענערייט פילע אַרטיקלען וועגן ווי 20 איז עטלעכע מין פון מאַדזשיקאַל געזעלשאַפטלעך נומער. גליק, אוגאנדע און זייַנע חברים האָבן אַ היפּש פאַרשטאַנד פון דער פּראָצעס וואָס האָט געברענגט די דאַטן, און זיי געוואוסט אַז פאַסעבאָאָק ינקעראַדזשד מענטשן מיט ווייניק קאַנעקשאַנז אויף פאַסעבאָאָק צו מאַכן מער פריינט ביז זיי ריטשט 20 פריינט. כאָטש אוגאנדע און חברים טאָן ניט זאָגן דעם אין זייער פּאַפּיר, דעם פּאָליטיק איז געווען מאַשמאָעס באשאפן דורך פאַסעבאָאָק אין סדר צו מוטיקן נייַע ניצערס צו ווערן מער אַקטיוו. אָן געוואוסט וועגן דער עקזיסטענץ פון דעם פּאָליטיק, אָבער, עס איז גרינג צו ציען די פאַלש מסקנא פון די דאַטן. אין אנדערע ווערטער, די סאַפּרייזינגלי הויך נומער פון מענטשן מיט וועגן 20 פריינט דערציילט אונדז מער וועגן פאַסעבאָאָק ווי וועגן מענטש נאַטור.

אין דעם פריערדיקן בייַשפּיל, אַלגערידאַמיק קאָנפאַונדינג געשאפן אַ קווערקי רעזולטאַט אַז אַ אָפּגעהיט פאָרשער זאל דיטעקט און פאָרשן ווייַטער. אָבער, עס איז אַ אפילו טריקיער ווערסיע פון ​​אַלגערידאַמיק קאָנפאַונדינג אַז אַקערז ווען דיזיינערז פון אָנליין סיסטעמען זענען אַווער פון געזעלשאַפטלעך טיעריז און דעריבער באַקן די טיריז אין די אַרבעט פון זייער סיסטעמס. סאציאל סייאַנטיס רופן דעם פּערפאָרמאַטיוויטי : ווען אַ טעאָריע ענדערט די וועלט אין אַזאַ אַ וועג אַז עס ברענגען די וועלט מער אין שורה מיט די טעאָריע. אין די פאַל פון פּערפאָרמאַטיוו אַלגערידאַמיק קאָנפאַונדינג, די קאַנפאַונדיד נאַטור פון די דאַטן איז זייער שווער צו דעטעקט.

איין בייַשפּיל פון אַ מוסטער באשאפן דורך פּערפאָרמאַטיוויטי איז טראַנסיטיוויטי אין אָנליין געזעלשאַפטלעך נעטוואָרקס. אין די 1970 ס און 1980 ס, ריסערטשערז ריפּיטידלי געפונען אַז אויב איר זענען פריינט מיט ביידע אַליס און באָב, דעמאָלט אַליס און באָב זענען מער מסתּמא צו זיין פריינט מיט יעדער אנדערער ווי אויב זיי זענען צוויי ראַנדאַמלי אויסדערוויילט מענטשן. דער זעלביקער מוסטער איז געפונען אין די געזעלשאַפטלעך גראַפיק אויף פאַסעבאָאָק (Ugander et al. 2011) . אזוי, איינער קען פאַרענדיקן אַז פּאַטערנז פון פֿרייַנדשאַפֿט אויף פאַסעבאָאָק רעפּלאַקייט פּאַטערנז פון אָפפלינע פריינטשיפּס, אין מינדסטער אין טערמינען פון טראַנסיטיוויטי. אָבער, דער גראַד פון טראַנסיטיוויטי אין די פאַסעבאָאָק געזעלשאַפטלעך גראַפיק איז טייל געטריבן דורך אַלגערידאַמיק קאָנפאָונדינג. אַז איז, דאַטן סייאַנטיס בייַ פאַסעבאָאָק געוואוסט פון די עמפּיריקאַל און טעאָרעטיש פאָרשונג וועגן טראַנסיטיוויטי און דעמאָלט בייקט אין ווי פאַסעבאָאָק אַרבעט. פאַסעבאָאָק האט אַ "מענטשן איר קען וויסן" שטריך וואָס סאַגדזשעסץ נייַ פריינט, און איין וועג אַז פאַסעבאָאָק דיסיידז וואס צו רעקאָמענדירן איר איז טראַנסיטיוויטי. אַז איז, פאַסעבאָאָק איז מער מסתּמא צו פֿאָרשלאָגן אַז איר ווערן פריינט מיט די פריינט פון דיין פריינט. דעם שטריך אַזוי האט די ווירקונג פון ינקריסינג טראַנסיטיוויטי אין די פאַסעבאָאָק געזעלשאַפטלעך גראַפיק; אין אנדערע ווערטער, די דיאָריאָ פון טראַנזיטיוויטי ברענגט די וועלט אין שורה מיט די פֿאָרויסזאָגן פון דער טעאָריע (Zignani et al. 2014; Healy 2015) . דעריבער, ווען גרויס דאַטן קוואלן דערשייַנען צו רעפּראָדוצירן פֿאָרויסזאָגן פון געזעלשאַפטלעך טעאָריע, מיר מוזן זיין זיכער אַז די טעאָריע זיך איז נישט בייקט אין ווי די סיסטעם געארבעט.

עס איז ניט מער ווי טראכטן וועגן גרויס דאַטן קוואלן ווי אַבזערווינג מענטשן אין אַ נאַטירלעך באַשטעטיקן, אַ מער פיייק מעטאַפאָר איז אַבזערווינג מענטשן אין אַ קאַסינאָ. קאַסינאָס זענען העכסט ענדזשאַנירד ינווייראַנמאַנץ דיזיינד צו ינדיפּץ זיכער ביכייוויערז, און אַ פאָרשער וואָלט קיינמאָל דערוואַרטן נאַטור אין אַ קאַסינאָ צו צושטעלן אַ אַנפאַטערד פֿענצטער אין מענטשלעך נאַטור. פון קורס, איר קען לערנען עפּעס וועגן מענטש נאַטור דורך געלערנט מענטשן אין קאַסינאָס, אָבער אויב איר איגנאָרירט די פאַקט אַז די דאַטן איז געווען באשאפן אין אַ קאַסינאָ, איר זאלט ​​ציען עטלעכע שלעכט אויסלייג.

צום באַדויערן, אַלאַרמיטהמעטיק דאַקיומענטערי איז זייער שווער, ווייַל פילע פֿעיִקייטן פון אָנליין סיסטעמען זענען פּראַפּרייאַטערי, שוואַך דאַקיומענטאַד, און קעסיידער טשאַנגינג. פֿאַר בייַשפּיל, ווי איך נאָכגיין שפּעטער אין דעם קאַפּיטל, אַלגערידאַם איז געווען אַ מעגלעך דערקלערונג פֿאַר די גראַדזשואַל ברייקדאַון פון Google פלו טרענדס (אָפּטיילונג 2.4.2), אָבער דעם פאָדערן איז שווער צו אַססעסס ווייַל די ינער ווערקינגז פון Google ס זוכן אַלגערידאַם זענען proprietary. די דינאַמיש נאַטור פון אַלגערידאַמיק קאָנפאַונדינג איז איין פאָרעם פון סיסטעם דריפט. אַלגאָריטהמיק קאָנפאַונדינג מיטל אַז מיר זאָל זיין אָפּגעהיט וועגן קיין פאָדערן וועגן מענטשלעך נאַטור אַז קומט פון אַ איין דיגיטאַל סיסטעם, קיין ענין ווי גרויס.