6.6.2 שכל און אָנפירונג ינפאָרמאַטיאָנאַל ריזיקירן

דאס איבערזעצונג איז Created by אַ קאָמפּיוטער. ×

6.6.2 שכל און אָנפירונג ינפאָרמאַטיאָנאַל ריזיקירן

ינפאָרמאַטיוו ריזיקירן איז די מערסט פּראָסט ריזיקירן אין געזעלשאַפטלעך פאָרשונג; עס האט געוואקסן דראַמאַטיקלי; און דאָס איז די כאַרדאַסט ריזיקירן צו פֿאַרשטיין.

די צווייטע עטישע פּראָבלעם פֿאַר דיגיטאַל-עלטער פאָרשונג איז ינפאָרמיישאַנאַל ריזיקירן , די פּאָטענציעל פֿאַר שאַטן פון די אַנטפּלעקונג פון אינפֿאָרמאַציע (National Research Council 2014) . ינפאָרמאַטיאָנאַל שעדיקן פון די אַנטפּלעקונג פון פּערזענלעך אינפֿאָרמאַציע קען זיין עקאָנאָמיש (למשל, לוזינג אַ אַרבעט), געזעלשאַפטלעך (למשל, ימבעראַסמאַנט), פסיכאלאגישן (למשל דעפּרעסיע), אָדער אַפֿילו פאַרברעכער (למשל, אַרעסטירן פֿאַר ומלעגאַל נאַטור). צום באַדויערן, די דיגיטאַל עלטער ינקריסיז ינפאָרמיישאַנאַל ריזיקירן דראַמאַטיקלי - עס איז נאָר אַזוי פיל מער אינפֿאָרמאַציע וועגן אונדזער נאַטור. און ינפאָרמאַטיוו ריזיקירן האט פּראָווען זייער שווער צו פֿאַרשטיין און פירן קאַמפּערד מיט ריסקס וואָס זענען קאַנסערנז אין אַנאַלאָג-עלטער געזעלשאַפטלעך פאָרשונג, אַזאַ ווי פיזיש ריזיקירן.

איין וועג אַז געזעלשאַפטלעך ריסערטשערז פאַרקלענערן ינפאָרמאַטיאָנאַל ריזיקירן איז "אַנאָנימיזאַטיאָן" פון דאַטע. "אַנאָנימיזאַטיאָן" איז דער פּראָצעס פון רימוווינג קלאָר ווי דער טאָג פּערזענלעך ידענטיפיערס אַזאַ ווי נאָמען, אַדרעס, און טעלעפאָן נומער פון די דאַטן. אָבער, דעם צוגאַנג איז פיל ווייניקער עפעקטיוו ווי פילע מענטשן פאַרשטיין, און עס איז, אין פאַקט, דיפּלי און פונדאַמענטאַללי באגרענעצט. פֿאַר וואָס סיבה, ווען איך באַשרייַבן "אַנאָנימיזאַטיאָן," איך וועט נוצן ציטאַט מאַרקס צו דערמאָנען איר אַז דעם פּראָצעס קריייץ דער אויסזען פון אַנאַנימיטי אָבער נישט אמת אַנאַנימיטי.

א לעבעדיק בייַשפּיל פון די דורכפאַל פון "אַנאָנימיזאַטיאָן" קומט פון די שפּעט 1990 ס אין Massachusetts (Sweeney 2002) . די גרופע אינשורענס קאמיסיע (GIC) איז געווען א רעגירונג אגענטור פאראנטווארטליך פאר פארזארגנדע העלטה אינשורונס פאר אלע סטעיטס. דורך דעם אַרבעט, די GIC געזאמלט דיטיילד געזונט רעקאָרדס וועגן טויזנטער פון שטאַט עמפּלוייז. אין אַ מי צו שפּור פאָרשונג, די GIC באַשלאָסן צו באַפרייַען די רעקאָרדס צו ריסערטשערז. אָבער, זיי האבן נישט טיילן אַלע פון זייער דאַטן; אלא, זיי "אַנאָנימיזעד" די דאַטן דורך רימוווינג אינפֿאָרמאַציע אַזאַ ווי נעמען און ווענדט. אָבער, זיי לינקס אנדערע אינפֿאָרמאַציע וואָס זיי טראַכטן קען זיין נוציק פֿאַר ריסערטשערז אַזאַ ווי דעמאָגראַפיק אינפֿאָרמאַציע (פאַרשלעסלען קאָוד, געבורט טאָג, עטהניסיטי און געשלעכט) און מעדיציניש אינפֿאָרמאַציע (באַזוכן דאַטע, דיאַגנאָסיס, פּראָצעדור) (געשטאַלט 6.4) (Ohm 2010) . צום באַדויערן, דעם "אַנאָנימיזאַטיאָן" איז נישט גענוג צו באַשיצן די דאַטן.

פיגורע 6.4: אַנאָנימאַטיאָן איז דער פּראָצעס פון רימוווינג דאָך יידענטאַפייינג אינפֿאָרמאַציע. למשל, ווען ארויסגעבן די מעדיצינישע אינשורענס רעקארדס פון סטעיט עמפּלוייז, די Massachusetts Group Insurance Commission (GIC) אראפגענומען נעמען און ווענדט זיך פון די טעקעס. איך נוצן די ציטאַט מאַרקס אַרום די וואָרט אַנאָנימאַטיאָן ווייַל דער פּראָצעס גיט די אויסזען פון אַנאָנימיטי אָבער ניט פאַקטיש אַנאָנימיטי.

פיגורע 6.4: "אַנאָנימיזאַטיאָן" איז דער פּראָצעס פון רימוווינג דאָך יידענטאַפייינג אינפֿאָרמאַציע. למשל, ווען ארויסגעבן די מעדיצינישע אינשורענס רעקארדס פון סטעיט עמפּלוייז, די Massachusetts Group Insurance Commission (GIC) אראפגענומען נעמען און ווענדט זיך פון די טעקעס. איך נוצן די ציטאַט מאַרקס אַרום די וואָרט "אַנאָנימיזאַטיאָן" ווייַל דער פּראָצעס גיט די אויסזען פון אַנאָנימיטי, אָבער ניט פאַקטיש אַנאָנימיטי.

צו פאַרשטיין די שאָרטקאָמינגס פון די GIC "אַנאָנימיזאַטיאָן", Latanya Sweeney-then a graduate student at MIT-paid $ 20 to acquire the voting records from the city of Cambridge, the hometown of Massachusetts governor William Weld. די אָפּשטימונג רעקאָרדס אַרייַנגערעכנט אינפֿאָרמאַציע אַזאַ ווי נאָמען, אַדרעס, פאַרשלעסלען קאָד, געבורט טאָג, און דזשענדער. דער פאַקט אַז די מעדיציניש דאַטע טעקע און די וויילער טעקע שערד פעלדער-פאַרשלעסלען קאָד, געבורט דאַטע, און געשלעכט-מענט אַז סווענעי קען פֿאַרבינדונג זיי. סווענעי האָט געוואוסט אַז וועלד וועלדעד געבוירן איז יולי 31, 1945, און די אָפּשטימונג רעקאָרדס אַרייַנגערעכנט בלויז זעקס מענטשן אין קיימברידזש מיט דעם דיין געבורסטאָג. ווייַטער, פון די זעקס מענטשן, בלויז דרייַ זכר. און, פון די דרייַ מענטשן, בלויז איינער שערד וועלד ס פאַרשלעסלען קאָד. אזוי, די וואַלן דאַטן האט געוויזן אַז ווער עס יז אין די מעדיציניש דאַטע מיט וועלד ס קאָמבינאַציע פון געבורט דאַטע, דזשענדער און פאַרשלעסלען קאָד איז וויליאם וועלד. אין עסאַנס, די דרייַ ברעקלעך פון אינפֿאָרמאַציע ביטנייַ אַ יינציק פינגערפּרינט צו אים אין די דאַטן. מיט דעם פאַקט, סווענעי איז געווען ביכולת צו געפֿינען וועלד ס מעדיציניש רעקאָרדס, און, צו מיטטיילן אים פון איר פיט, זי מיילד אים אַ קאָפּיע פון זיין רעקאָרדס (Ohm 2010) .

ציפער 6.5: שייַעך-יידענאַפאַקיישאַן פון אַנאָנימייזד דאַטן. לאַטאַניאַ סוועיניי קאַמביינד די אַנאָנימיזעד געזונט רעקאָרדס מיט אָפּשטימונג רעקאָרדס צו געפֿינען די מעדיציניש רעקאָרדס פון גענעראל וויליאם וועלד אַדאַפּט פון סווענעי (2002), פיגור 1.

פיגורע 6.5: שייַעך-יידענאַפאַקיישאַן פון "אַנאָנימיזעד" דאַטן. לאַטאַניאַ סוועיניי קאַמביינד די "אַנאָנימיזעד" געזונט רעקאָרדס מיט אָפּשטימונג רעקאָרדס צו געפֿינען די מעדיציניש רעקאָרדס פון גענעראל וויליאם וועלד אַדאַפּט פון Sweeney (2002) , פיגור 1.

סוועיניי 'ס ווערק פארטיילט די גרונט סטרוקטור פון שייַעך-אידענטיפיקאציע אנפאלן - צו אָננעמען אַ טערמין פון דער זיכערהייַט קאמפיוטער קאמיטעט. אין די אנפאלן, צוויי דאַטן שטעלעס, ניט פון וואָס דורך זיך אַנטדעקן שפּירעוודיק אינפֿאָרמאַציע, זענען לינגקט, און דורך דעם לינגקאַדזש, שפּירעוודיק אינפֿאָרמאַציע איז יקספּאָוזד.

אין דערצו צו סווענעי ס ווערק, און אנדערע שייַכות אַרבעטן, ריסערטשערז איצט באַדויערן פיל מער אינפֿאָרמאַציע-אַלע אַזוי גערופענע "פּערסאַנאַלי יידענטאַפייינג אינפֿאָרמאַציע" (פּיי) (Narayanan and Shmatikov 2010) -דורך דעם פּראָצעס פון "אַנאָנימיזאַטיאָן." איצט פאַרשטיין אַז געוויסע דאַטן, אַזאַ ווי מעדיציניש רעקאָרדס, פינאַנציעל רעקאָרדס, ענטפֿערס צו אַרוישעלפן פראגעס וועגן ומלעגאַל נאַטור - זענען מיסטאָמע אויך שפּירעוודיק צו באַפרייַען אַפֿילו נאָך "אַנאָנימיזאַטיאָן." אבער, די ביישפילן וואָס איך בין וועגן געבן צו רעקאָמענדירן אַז געזעלשאַפטלעך ריסערטשערז דאַרפֿן צו טוישן זייער טראכטן. ווי אַ ערשטער שריט, עס איז קלוג צו יבערנעמען אַז אַלע דאַטן זענען פּאַטענטשאַלי יידענטאַפייאַבאַל און אַלע דאַטן זענען פּאַטענטשאַלי שפּירעוודיק. אין אנדערע ווערטער, אלא ווי טראכטן אַז ינפאָרמיישאַנאַל ריזיקירן אַפּלייז צו אַ קליין סובסעט פון פראיעקטן, מיר זאָל יבערנעמען אַז עס אַפּלייז צו עטלעכע גראַד צו אַלע פראיעקטן.

ביידע אַספּעקץ פון דעם רעאָריענטאַטיאָן זענען ילאַסטרייטאַד דורך די נעטפליקס פרייז. ווי דיסקרייבד אין קאַפּיטל 5, נעטפליקס באפרייט 100,000,000 פֿילם רייטינגז צוגעשטעלט דורך כּמעט 500.000 מיטגלידער, און האט אַ עפענען רוף ווו מענטשן פון אַלע איבער די וועלט אַרייַנגעשיקט אַלגערידאַמז וואָס קען פֿאַרבעסערן Netflix 'ס פיייקייַט צו רעקאָמענדירן קינאָ. איידער ריליסינג די דאַטן, נעטפליקס אַוועקגענומען קיין קלאָר ווי דער טאָג פּערסאַנאַלי יידענטאַפייינג אינפֿאָרמאַציע אַזאַ ווי נעמען. זיי אויך האָבן אַן עקסטרע שריט און באַקענענ קליין פּערטערביישאַנז אין עטלעכע פון די רעקאָרדס (למשל, טשאַנגינג עטלעכע רייטינגז פון 4 שטערן צו 3 שטערן). זיי באַלד דיסקאַווערד, אָבער, אַז טראָץ זייער השתדלות, די דאַטן זענען נאָך נישט קיין אַנאָנימע.

נאָר צוויי וואָכן נאָך די דאַטן זענען באפרייט, אַרווינד נאַרייַאַנאַן און וויטאַלי שמאַטיקאָוו (2008) געוויזן אַז עס איז געווען מעגלעך צו לערנען וועגן די פּרעפֿערענצן פון מענטשן. די טריק צו זייער שייַעך-אידענטיפיקאַציע באַפאַלן איז געווען ענלעך צו סווענעי ס: צונויפנעמען צוויי אינפֿאָרמאַציע קוואלן, איינער מיט פּאַטענטשאַלי שפּירעוודיק אינפֿאָרמאַציע און ניט דאָך ידענטיפיצירן אינפֿאָרמאַציע און איינער וואָס כּולל מענטשן ס אידענטיטעט. יעדער פון די דאַטן קוואלן קענען זיין ינדיווידזשאַלי זיכער, אָבער ווען זיי זענען קאַמביינד, די מערדזשד דאַטאַסעט קענען מאַכן ינפאָרמיישאַנאַל ריסקס. אין דעם פאַל פון די Netflix דאַטן, דאָ ס ווי עס קען פּאַסירן. ימאַדזשאַן אַז איך קלייַבן צו טיילן מיין געדאנקען וועגן קאַמף און קאָמעדיע קינאָ מיט מיין קאָו-טוערס, אָבער אַז איך בעסער נישט צו טיילן מיין מיינונג וועגן רעליגיעז און פּאָליטיש קינאָ. מייַן גלויבנס-טוערס קען ניצן די אינפֿאָרמאַציע וואָס איך שרייַבט מיט זיי צו געפֿינען מיין רעקאָרדס אין די נעטפליקס דאַטן; די אינפֿאָרמאַציע וואָס איך ייַנטיילן קען זיין אַ יינציק פינגערפּרינט ווי וויליאם וועלד ס געבורט טאָג, פאַרשלעסלען קאָד, און געשלעכט. דעריבער, אויב זיי געפונען מיין יינציק פינגערפּרינט אין די דאַטן, זיי קען לערנען מיין רייטינגז וועגן אַלע קינאָ, אַרייַנגערעכנט קינאָ וואָס איך קלייַבן ניט צו טיילן. אין דערצו צו דעם מין פון טאַרגעטעד באַפאַלן פאָוקיסט אויף אַ איין מענטש, נאַרייַאַנאַן און שמאַטיקאָוו אויך געוויזן אַז עס איז געווען מעגלעך צו טאָן אַ ברייט באַפאַלן - אַ ינוואַלווד פילע מענטשן - דורך די נעטפליקס דאַטן מיט פּערזענלעך און פֿילם שאַץ דאַטן אַז עטלעכע מענטשן האָבן אויסדערוויילט צו פּאָסטן אויף דער אינטערנעץ פֿילם דאַטאַבאַסע (ימדב). גאַנץ פשוט, קיין אינפֿאָרמאַציע וואָס איז אַ יינציק פינגערפּרינט צו אַ ספּעציפיש מענטש, אַפֿילו זייער שטעלן פון פֿילם רייטינגז קענען זיין געניצט צו ידענטיפיצירן זיי.

כאָטש די נעטפליקס דאַטן קענען זיין שייַעך-יידענאַפייד אין אַ ציל אָדער ברייט באַפאַלן, עס קען זיין אַ נידעריק ריזיקירן. נאָך אַלע, די פֿילם רייטינגז טאָן ניט ויסקומען זייער שפּירעוודיק. בשעת אַז קען זיין אמת אין אַלגעמיין, פֿאַר עטלעכע פון די 500,000 מענטשן אין די דאַטאַסעט, פֿילם ראַטינגס זאל זיין גאַנץ שפּירעוודיק. אין פאַקט, אין ענטפער צו די שייַעך-לעגיטימאַציע, אַ קלאַסטעטיד לעסביאַן פרוי זיך איינגעשריבן אַ קלאַס-קאַמף פּאַסן קעגן נעטפליקס. דאָ ס ווי די פּראָבלעם איז געווען אויסגעדריקט אין זייער פּראָצעס (Singel 2009) :

"[ב] אָוויע און שאַץ דאַטן כּולל אינפֿאָרמאַציע פון אַ ... זייער פּערזענלעך און שפּירעוודיק נאַטור. די מאטעמאטישע פֿילם דאַטן אויסגעטיילט אַ פּערזענלעך אינטערעס פון נעטפליקס מיטגליד און / אָדער ראנגלענישן מיט פארשידענע העכסטע פּערזענלעך ישוז, אַרייַנגערעכנט סעקסואַליטי, גייַסטיק קראַנקייַט, אָפּזוך פון אַלקאַכאָליזאַם, און ינוואַלאַסיז פון ינסעסט, פיזיש זידלען, דינער גוואַלד, ניעף און שענדונג.

די שייַעך-אידענטיפיקאַציע פון די Netflix Prize דאַטן יללוסטרירט ביידע אַז אַלע דאַטן זענען פּאַטענטשאַלי יידענטאַפייאַבאַל און אַז אַלע דאַטן זענען פּאַטענטשאַלי שפּירעוודיק. אין דעם פונט, איר זאל טראַכטן אַז דאָס אַפּלייז בלויז צו די דאַטן וואָס זענען וועגן מענטשן. סאַפּרייזינגלי, דאָס איז נישט דער פאַל. אין ענטפער צו א פארלאנגונג פון פרייהייט פון אינפארמאציע געזעץ, די ניו יארק סיטי רעגירונג באפרייט רעקאָרדס פון יעדער טאַקסי פאָר אין ניו יארק אין 2013, אַרייַנגערעכנט די פּיקאַפּ און פאַלן אַוועק מאל, לאָוקיישאַנז, און אָפּצאָל אַמאַונץ (צוריקרופן פון קאַפּיטל 2 אַז Farber (2015) געוויינט ענלעך דאַטן צו פּרובירן וויכטיק טיעריז אין אַרבעט עקאָנאָמיק). די דאַטן וועגן טאַקסי טריפּס זאל ויסקומען גוט, ווייַל זיי טאָן ניט ויסקומען צו צושטעלן אינפֿאָרמאַציע וועגן מענטשן, אָבער אַנטאַני טאָקקאַר איינגעזען אַז דעם טאַקסי דאַטאַסעט פאקטיש קאַנטיינד גורל פון פּאַטענשאַלי שפּירעוודיק אינפֿאָרמאַציע וועגן מענטשן. צו אילוסטרירן, האָט ער געקוקט אויף אַלע טריפּס סטאַרטינג בייַ די הוסטלער קלוב, אַ גרויס פּאַס קלוב אין ניו יארק צווישן האַלבנאַכט און 6:00 און דעמאָלט געפונען זייער פאַלן אַוועק. דעם זוכן איז אנטפלעקט-אין עסאַנס - אַ רשימה פון ווענדט פון עטלעכע מענטשן וואָס אָוווערווייטיד די הוסטלער קלוב (Tockar 2014) . עס איז שווער צו ימאַדזשאַן אַז די שטאָט רעגירונג האט דאָס אין גייַסט ווען עס באפרייט די דאַטן. אין פאַקט, די זעלבע טעכניק קען זיין געניצט צו געפינען די היים אַדרעסעס פון מענטשן וואס באַזוכן קיין אָרט אין דער שטאָט, אַ מעדיציניש קליניק, אַ רעגירונג בנין אָדער אַ רעליגיעז ינסטיטושאַן.

די צוויי קאַסעס פון די נעטפליקס פרייז און די ניו יארק סיטי טאַקסי דאַטן ווייַזן אַז לעפיערעך באָקע מענטשן קענען פאַרלאָזן צו אָפּשאַצן די ינפאָרמיישאַנאַל ריזיקירן אין די דאַטן אַז זיי מעלדונג - און די קאַסעס זענען נישט קיין יינציק (Barbaro and Zeller 2006; Zimmer 2010; Narayanan, Huey, and Felten 2016) . דערצו, אין פילע אַזאַ קאַסעס, די פּראָבלעמאַטיק דאַטע זענען נאָך פֿרייַ בנימצא אָנליין, ינדאַקייטינג די שוועריקייט פון אלץ ומלעגאַל אַ דאַטן מעלדונג. קאָלעקטיוולי, די יגזאַמפּאַלז-ווי געזונט ווי פאָרשונג אין קאָמפּיוטער וויסנשאַפֿט וועגן פּריוואַטקייט-פירן צו אַ וויכטיק מסקנא. רעסעאַרטשערס זאָל יבערנעמען אַז אַלע דאַטן זענען פּאַטענטשאַלי יידענטאַפייאַבאַל און אַלע דאַטן זענען פּאַטענטשאַלי שפּירעוודיק.

צום באַדויערן, עס איז קיין פּשוט לייזונג צו די פאקטן אַז אַלע דאַטן זענען פּאַטענטשאַלי יידענטאַפייאַבאַל און אַז אַלע דאַטן זענען פּאַטענטשאַלי שפּירעוודיק. אָבער, איין וועג צו רעדוצירן ינפאָרמיישאַנאַל ריזיקירן ווען איר אַרבעט מיט דאַטן איז צו שאַפֿן און נאָכגיין אַ דאַטן שוץ פּלאַן . דעם פּלאַן וועט פאַרמינערן די געלעגנהייַט אַז דיין דאַטן וועט ליק און וועט פאַרמינערן די שאָדן אויב אַ רינען טוט עפעס פּאַסירן. די ספּעציפיקס פון דאַטן שוץ פּלאַנז, אַזאַ ווי וואָס פאָרעם פון ענקריפּשאַן צו נוצן, וועט טוישן איבער צייַט, אָבער די וק דאַטאַ סערוויסעס העלפּפאַלי אָרגאַנייזיז די יסודות פון אַ דאַטן שוץ פּלאַן אין פינף קאַטעגאָריעס אַז זיי רופן די פינף סאַפעס : זיכער פראיעקטן, זיכער מענטשן , זיכער סעטטינגס, זיכער דאַטן, און זיכער רעזולטאטן (טיש 6.2) (Desai, Ritchie, and Welpton 2016) . קיינער פון די פינף סאַפעס ינדיווידזשאַלי צושטעלן גאנץ שוץ. אבער צוזאַמען זיי פאָרעם אַ שטאַרק שטעלן פון סיבות וואָס קענען פאַרמינערן ינפאָרמיישאַנאַל ריזיקירן.

טיש 6.2: די "פינף סאַפעס" זענען פּרינסיפּלעס פֿאַר דיזיינינג און דורכפירן אַ דאַטן פּראַטעקשאַן פּלאַן (Desai, Ritchie, and Welpton 2016)
זיכער	קאַמף
זיכערע פראיעקטן	לימיץ פראיעקטן מיט דאַטן צו יענע וואס זענען עטישע
זיכערע מענטשן	אַקסעס איז לימיטעד צו מענטשן וואס קענען זיין טראַסטיד מיט דאַטן (למשל, מענטשן וואס האָבן אַנדערגאָניש עטישע טריינינג)
זיכער דאַטע	די דאַטע איז דע-יידענאַפייד און אַגראַגייטאַד צו די מאָס מעגלעך
זיכער סעטטינגס	דאַטן זענען סטאָרד אין קאָמפּיוטערס מיט צונעמען גשמיות (למשל, פארשפארט אָרט) און סאָפטווער (למשל, פּאַראָל שוץ, ינקריפּטיד) שוץ
זיכער רעזולטאַט	פאָרשונג רעזולטאַט איז רעוויעוועד צו פאַרמייַדן אַקסאַדענטאַל פּריוואַטקייט בריטשיז

אין דערצו צו פּראַטעקטינג דיין דאַטן בשעת ניצן זיי, איינער שריט אין דער פאָרשונג פּראָצעס ווו ינפאָרמיישאַנאַל ריזיקירן איז דער הויפּט סאַסיענט איז דאַטן ייַנטיילונג מיט אנדערע ריסערטשערז. דאַטן ייַנטיילונג צווישן סייאַנטיס איז אַ האַרץ ווערט פון די וויסנשאפטלעכע סאַספּעקץ, און עס זייער פאַסילאַטייץ די אַדוואַנטידזש פון וויסן. דאָ ס ווי די UK House of Commons דיסקרייבד די וויכטיקייט פון דאַטן ייַנטיילונג (Molloy 2011) :

"צוטריט צו דאַטן איז פונדאַמענטאַל אויב פאָרשער זענען צו רעפּראָדוצירן, באַשטעטיקן און בויען אויף רעזולטאַטן וואָס זענען געמאלדן אין דער ליטעראַטור. די פּרעסומפּטיאָן מוזן זיין אַז, אויב עס איז אַ שטאַרק סיבה אַנדערש, די דאַטע זאָל זיין גאָר דיסקלאָוזד און געמאכט עפנטלעך בנימצא.

אָבער, דורך ייַנטיילונג דיין דאַטע מיט אן אנדער פאָרשער, איר קען זיין ינקריסינג ינפאָרמיישאַנאַל ריזיקירן צו דיין פּאַרטיסאַפּאַנץ. אזוי עס קען ויסקומען אַז די דאַטע ייַנטיילונג קריייץ אַ פונדאַמענטאַל שפּאַנונג צווישן די פליכט צו טיילן דאַטע מיט אנדערע סייאַנטיס און די פליכט צו מינאַמייז ינפאָרמיישאַנאַל ריזיקירן צו פּאַרטיסאַפּאַנץ. גליק, דעם דילעמאַ איז נישט ווי שטרענג ווי עס אויס. אלא, עס איז בעסער צו טראַכטן וועגן דאַטן ייַנטיילונג ווי פאַללינג צוזאמען אַ קעסיידערדיק, מיט יעדער פונט אויף אַז קעסיידערדיק פּראַוויידינג אַ אַנדערש מישן פון בענעפיץ צו געזעלשאַפט און ריזיקירן צו פּאַרטיסאַפּאַנץ (געשטאַלט 6.6).

אין איין עקסטרעם, איר קענען טיילן דיין דאַטע מיט קיין איינער, וואָס מינאַמייזאַז ריזיקירן צו פּאַרטיסאַפּאַנץ אָבער אויך מינאַמייזאַז גיינז צו געזעלשאַפט. אין די אנדערע עקסטרעם, איר קענען אַרויסלאָזן און פאַרגעסן , ווו דאַטן זענען "אַנאָנימיזעד" און אַרייַנגעשיקט פֿאַר אַלעמען. קאָראַספּאַנדינג צו נישט רילייינג דאַטע, מעלדונג און פאַרגעסן אָפפערס ביידע העכער בענעפיץ צו געזעלשאַפט און העכער ריזיקירן צו פּאַרטיסאַפּאַנץ. צווישן די צוויי עקסטרעם פאלן זענען אַ קייט פון כייבראַדז, אַרייַנגערעכנט וואָס איך וועט רופן אַ וואָלד גאָרטן צוגאַנג. אונטער דעם צוגאַנג, די דאַטן זענען שערד מיט מענטשן וואס טרעפן עטלעכע קרייטיריאַ און וואס שטימען צו זיין פארבונדן דורך זיכער כּללים (למשל, אָוווערסייט פון אַ ירב און אַ דאַטן שוץ פּלאַן). די וואָלד גאָרטן צוגאַנג אָפפערס פילע בענעפיץ פון מעלדונג און פאַרגעסן מיט ווייניקער ריזיקירן. פון קורס, אַזאַ אַ צוגאַנג קריייץ פילע פראגעס-וואס זאָל האָבן אַקסעס, אונטער וואָס טנאָים, און פֿאַר ווי לאַנג, וואס זאָל באַצאָלן צו טייַנען און פּאָליצייַ די וואָלד גאָרטן, אאז"ו ו - אָבער די ביסט נישט ינסערמאַונטאַבאַל. אין פאַקט, עס זענען שוין ארבעטן וואָלד גאַרדענס אין אָרט וואָס ריסערטשערז קענען נוצן רעכט איצט, אַזאַ ווי די אַרקייוו פון די ינטער-אוניווערסיטעט קאָנסאָרטיום פֿאַר פּאָליטיש און סאציאל פאָרשונג בייַ די אוניווערסיטעט פון מישיגן.

פיגורע 6.6: דאַטע מעלדונג סטראַטעגיעס קענען פאַלן צוזאמען אַ קאָנטינוומען. ווו איר זאָל זיין אויף דעם קעסיידערדיק דעפּענדס אויף די ספּעציפיש פרטים פון דיין דאַטן, און איבערבליק פון דריט טיילווייַז קענען העלפן איר באַשליסן די צונעמען וואָג פון ריזיקירן און נוץ אין דיין פאַל. די פּינטלעך פאָרעם פון דעם ויסבייג איז דעפּענדס אויף די ספּאַסיפיקס פון די דאַטן און פאָרשונג צילן (Goroff 2015) .

אַזוי, ווו זאָל די דאַטן פון דיין לערנען זיין אויף די קעסיידערדיק ניט ייַנטיילונג, וואָלד גאָרטן, און מעלדונג און פאַרגעסן? דאָס פאַרלאַנגט אויף די פרטים פון דיין דאַטן: פאָרשער מוזן באַלוינען רעספּעקט פֿאַר פּערסאָנס, בענאַפיטיקאַנס, גערעכטיקייט, און רעספּעקט פֿאַר געזעץ און פּובליק אינטערעס. געוויזן פון דעם פּערספּעקטיוו, דאַטע ייַנטיילונג איז נישט אַ אָפּשיידנדיק עטישע קאַנאַנדראַם; עס איז בלויז איינער פון די פילע אַספּעקץ פון פאָרשונג וואָס ריסערטשערז האָבן צו געפֿינען אַ פּאַסיק עטישע וואָג.

עטלעכע קריטיקס זענען בכלל קעגן די ייַנטיילונג ייַנטיילונג ווייַל, אין מיין מיינונג, זיי זענען פאָוקיסט אויף זייַן ריסקס - וואָס זענען בלי ספק, און זענען יגנאָרינג זייער בענעפיץ. אַזוי, אין סדר צו מוטיקן פאָקוס אויף ביידע ריסקס און בענעפיץ, איך וואָלט ווי צו פאָרשלאָגן אַ אַנאַלאָגי. יעדער יאָר, קאַרס זענען פאַראַנטוואָרטלעך פֿאַר טויזנטער פון דעטס, אָבער מיר טאָן ניט פּרווון צו פאַרבאָט דרייווינג. אין פאַקט, אַ רופן צו פאַרבאָט דרייווינג וואָלט זיין ווילד ווייַל דרייווינג ינייבאַלז פילע ווונדערלעך זאכן. רעפרעזענטירן די געזעלשאַפט ריסטריקשאַנז אויף וואס קענען פאָרן (למשל, די דאַרפֿן צו זיין אַ זיכער עלטער און האָבן פארביי זיכער טעסץ) און ווי זיי קענען פאָרן (למשל, אונטער די גיכקייַט שיעור). געזעלשאַפט אויך האט מענטשן טאַסקט מיט ענפאָרסינג די כּללים (למשל, פּאָליצייַ), און מיר שטימען מענטשן וואס זענען געכאפט ווייאַלייטינג זיי. דער זעלביקער מין פון באַלאַנסט טראכטן אַז געזעלשאַפט אַפּלייז צו רעגיאַלייטינג דרייווינג קענען אויך זיין געווענדט צו דאַטן ייַנטיילונג. דאָס איז, אלא ווי צו מאַכן אַבלאַמענאַל אַרגומענטן פֿאַר אָדער קעגן דאַטע ייַנטיילונג, איך טראַכטן מיר וועלן מאַכן די מערסט פּראָגרעס דורך פאָוקיסינג אויף ווי מיר קענען פאַרמינערן די ריסקס און פאַרגרעסערן די בענעפיץ פון דאַטן ייַנטיילונג.

צו פאַרענדיקן, ינפאָרמיש ריזיקירן האט דראַמאַטיקלי געוואקסן, און עס איז זייער שווער צו פאָרויסזאָגן און קוואַנטיפיי. דעריבער, עס איז בעסטער צו יבערנעמען אַז אַלע דאַטן זענען פּאַטענטשאַלי יידענטאַפייאַבאַל און פּאַטענטשאַלי שפּירעוודיק. צו פאַרמינערן ינפאָרמיישאַנאַל ריזיקירן בשעת טאן פאָרשונג, ריסערטשערז קענען שאַפֿן און נאָכגיין אַ דאַטן שוץ פּלאַן. דערצו, ינפערמיישאַנאַל ריזיקירן טוט נישט פאַרמייַדן ריסערטשערז פון ייַנטיילונג דאַטן מיט אנדערע סייאַנטיס.