5.2.1 גאַלאַקסי זאָאָלאָגישער גאָרטן

גאַלאַקסי זאָאָלאָגישער גאָרטן קאַמביינד די השתדלות פון פילע ניט-מומחה וואַלאַנטירז צו קלאַסיפיצירן אַ מיליאָן גאַלאַקסיעס.

גאַלאַקסי זאָאָלאָגישער גאָרטן געוואקסן פון אַ פּראָבלעם פייסט דורך קעווין שאַווינסקי, אַ גראַדזשאַוואַט תּלמיד אין אסטראָנאָמיע בייַ די אוניווערסיטעט פון אָקספֿאָרד אין 2007. סימפּליפיטינג גאַנץ אַ ביסל, שאַווינסקי איז אינטערעסירט אין גאַלאַקסיעס, און גאַלאַקסיעס קענען זיין קלאַסאַפייד דורך זייער מאָרפאַלאַדזשי-יליפּטיקאַל אָדער ספּיראַליש דורך זייער קאָליר-בלוי אָדער רויט. אין דער צייַט, די קאַנווענשאַנאַל חכמה צווישן די אַסטראַנאַמערז איז אַז ספּיראַליש גאַלאַקסיעס, ווי אונדזער מילקי וועג, זענען בלוי אין קאָלירן (ינדאַקייטינג יוגנט) און יליפּטאַלאַל גאַלאַקסיעס זענען רויט (ינדאַקייטינג עלטער). שאווינסקי האט צווייפל דערוואונדונג. ער האָט געזאָגט אַז בשעת דעם מוסטער קען זיין אמת אין אַלגעמיין, עס איז געווען מיסטאָמע אַ ויסשליסיק נומער פון אויסזען, און דורך געלערנט עטלעכע ומגעוויינטלעך גאַלאַקסיעס, גאַלאַקסיעס געשאפן.

אזוי, וואָס שאַווינסקי דארף אין סדר צו יבערקערן קאַנווענשאַנאַל חכמה איז געווען אַ גרויס שטעלן פון מאָרפאָלאָגיקלי קלאַסאַפייד גאַלאַקסיעס; אַז איז, גאַלאַקסיעס וואָס זענען קלאַסאַפייד ווי אַ ספּיראַליש אָדער יליפּטיקאַל. דער פּראָבלעם, אָבער, איז געווען אַז די אַלגערידאַמיק מעטהאָדס פֿאַר קלאַסאַפאַקיישאַן זענען נישט גענוג גוט געניצט פֿאַר וויסנשאפטלעכע פאָרשונג; אין אנדערע ווערטער, קלאַסאַפייינג גאַלאַקסיעס איז, אין דעם צייַט, אַ פּראָבלעם וואָס איז שווער פֿאַר קאָמפּיוטערס. דעריבער, וואָס איז געווען דארף איז געווען אַ גרויס נומער פון מענטשן - קלאַסאַפייד גאַלאַקסיעס. שאַווינסקי גענומען דעם קלאַסאַפאַקיישאַן פּראָבלעם מיט דער ענטוזיאַזם פון אַ גראַדזשאַוואַט תּלמיד. אין אַ מעראַטאַן סעסיע פון ​​זיבן 12-שעה טעג, ער איז ביכולת צו קלאַסאַפיי 50,000 גאַלאַקסיעס. בשעת 50,000 גאַלאַקסיעס זאל געזונט ווי אַ פּלאַץ, עס איז פאקטיש בלויז וועגן 5% פון די כּמעט 1,000,000 גאַלאַקסיעס וואָס זענען געווען פאָטאָגראַפירט אין די סקאָאַן דיגיטאַל סקי סורוויי. שאווינסקי האט איינגעזען אַז ער דארף אַ מער סקאַלאַבלע צוגאַנג.

צומ גליק, עס טורנס אויס אַז די אַרבעט פון קלאַססיפיינג גאַלאַקסיעס טוט ניט דאַרפן אַוואַנסירטע טריינינג אין אַסטראָנאָמיע; איר קענען לערנען עמעצער צו טאָן עס שיין געשווינד. אין אנדערע ווערטער, אַפֿילו כאָטש קלאַססיפיינג גאַלאַקסיעס איז אַ אַרבעט וואָס איז געווען שווער פֿאַר קאָמפּיוטערס, עס איז געווען שיין גרינג פֿאַר יומאַנז. אַזוי, בשעת זיצן אין אַ שענק אין אָקספֿאָרד, סטשאַווינסקי און יונגערמאַן אַסטראָנאָם קריס לינטאָטט געחלומט אַרויף אַ וועבזייַטל ווו וואַלאַנטירז וואָלט קלאַסיפיצירן בילדער פון גאַלאַקסיעס. א ביסל חדשים שפּעטער, גאַלאַקסי זאָאָלאָגישער גאָרטן איז געווען געבוירן.

אין די גאַלאַקסי זאָאָלאָגישער גאָרטן, וואַלאַנטירז וואָלט פאָרן עטלעכע מינוט פון טריינינג; פֿאַר בייַשפּיל, וויסן די חילוק צווישן אַ ספּיראַליש און יליפּטיקאַל גאַלאַקסי (פיגורע 5.2). נאָך דעם טריינינג, יעדער פרייַוויליקער האט צו פאָרזעצן אַ לעפיערעך גרינג ויספרעג-ריכטיק קלאַסאַפיינינג 11 פון 15 גאַלאַקסיעס מיט באקאנט קלאַסאַפאַקיישאַנז - און דעמאָלט וואָלט אָנהייבן פאַקטיש קלאַסאַפאַקיישאַן פון אומבאַקאַנט גאַלאַקסיעס דורך אַ פּשוט וועב-באזירט צובינד (פיגורע 5.3). דער יבערגאַנג פון פרייַוויליקער צו אַסטראָנאָמער וואָלט נעמען אָרט אין ווייניקער ווי 10 מינוט און נאָר פארלאנגט גייט פארביי די לאָואַסט פון כערדאַלז, אַ פּשוט ויספרעג.

פיגורע 5.2: ביישפילן פון צוויי הויפּט טייפּס פון גאַלאַקסיעס: ספּיראַליש און יליפּטיקאַל. די גאַלאַקסי זאָאָלאָגישער גאָרטן פּרויעקט געוויינט מער ווי 100,000 וואַלאַנטירז צו קאַטאַגערייז מער ווי 900,000 בילדער. רעפּראָדוסעד דורך דערלויבעניש פון http://www.GalaxyZoo.org און סלאָון דיגיטאַל סקי סורוויי.

פיגורע 5.2: ביישפילן פון צוויי הויפּט טייפּס פון גאַלאַקסיעס: ספּיראַליש און יליפּטיקאַל. די גאַלאַקסי זאָאָלאָגישער גאָרטן פּרויעקט געוויינט מער ווי 100,000 וואַלאַנטירז צו קאַטאַגערייז מער ווי 900,000 בילדער. רעפּראָדוסעד דורך דערלויבעניש פון http://www.GalaxyZoo.org און סלאָון דיגיטאַל סקי סורוויי .

פיגורע 5.3: אַרייַנשרייַב פאַרשטעלן ווו וואַלאַנטירז זענען געבעטן צו קלאַסאַפיי אַ איין בילד. רעפּראָדוסעד דורך דערלויבעניש פון Chris Lintott באזירט אויף אַ בילד פון די סלאָאַן דיגיטאַל סקי סורוויי.

פיגורע 5.3: אַרייַנשרייַב פאַרשטעלן ווו וואַלאַנטירז זענען געבעטן צו קלאַסאַפיי אַ איין בילד. רעפּראָדוסעד דורך דערלויבעניש פון Chris Lintott באזירט אויף אַ בילד פון די סלאָאַן דיגיטאַל סקי סורוויי .

גאַלאַקסי זאָאָלאָגישער גאָרטן געצויגן זייַן ערשט וואַלאַנטירז נאָך די פּרויעקט פיטשערד אין אַ נייַעס אַרטיקל, און אין וועגן זעקס חדשים די פּרויעקט געוואקסן צו אַרייַנציען מער ווי 100,000 בירגער סייאַנטיס, מענטשן וואס אנטייל אין ווייַל זיי האבן די אַרבעט און זיי געוואלט צו פאָרן אַסטראָנאָמיע. צוזאַמען, די 100.000 וואַלאַנטירז קאַנטריביוטיד אַ גאַנץ פון מער ווי 40,000,000 קלאַסאַפאַקיישאַנז, מיט די מערהייַט פון די קלאַסאַפאַקיישאַן קומט פון אַ לעפיערעך קליין, האַרץ גרופּע פון ​​פּאַרטיסאַפּאַנץ (Lintott et al. 2008) .

פאָרשער וואָס האָבן דערפאַרונג הירינג ונדערגראַדואַטע פאָרשונג אַסיסטאַנץ זאל מיד זיין סקעפּטיקאַל וועגן דאַטן קוואַליטעט. בשעת דעם סקעפּטיסיזאַם איז גלייַך, גאַלאַקסי זאָאָלאָגישער גאָרטן ווייזט אַז ווען וואָלונטעערינג קאַנטראַביושאַנז זענען ריכטיק קלינד, דעביאַסעד און אַגראַגייטיד, זיי קענען פּראָדוצירן הויך-קוואַליטעט רעזולטאַטן (Lintott et al. 2008) . אַ וויכטיק קונץ פֿאַר געטינג די מאַסע צו שאַפֿן פאַכמאַן-קוואַליטעט דאַטן איז יבעריקייַט , וואָס איז, בעת די זעלבע אַרבעט געטאן דורך פילע פאַרשידענע מענטשן. אין גאַלאַקסי זאָאָלאָגישער גאָרטן, עס זענען וועגן 40 קלאַסאַפאַקיישאַנז פּער גאַלאַקסי; פאָרשער וואָס ניצן ונדערגראַדואַטע פאָרשונג אַסיסטאַנץ קען קיינמאָל פאַרגלייַכן דעם מדרגה פון יבעריק און דעריבער וואָלט זיין פיל מער מער זאָרגן וועגן די קוואַליטעט פון יעדער יחיד קלאַסאַפאַקיישאַן. וואָס די וואַלאַנטירז געפאלן אין טריינינג, זיי געמאכט אַרויף מיט יבעריק.

אפילו מיט קייפל קלאַסאַפאַקיישאַנז פּער גאַלאַקסי, אָבער, קאַמביינינג די סכום פון פרייַוויליקער קלאַסאַפאַקיישאַנז צו פּראָדוצירן אַ קאָנסענסוס קלאַסאַפאַקיישאַן איז טריקי. ווייַל זייער ענלעך פּראָבלעמס זענען אויפגעשטאנען אין רובֿ מענטש קאַמפּיאַטינג פראיעקטן, עס איז נוציק צו באריכטן די דרייַ טריט אַז די גאַלאַקסי זאָאָלאָגישער גאָרטן ריסערטשערז געניצט צו פּראָדוצירן זייער קאָנסענסוס קלאַסאַפאַקיישאַן. ערשטער, די ריסערטשערז "קלינד" די דאַטן דורך רימוווינג פאַלש קלאַסאַפאַקיישאַנז. פֿאַר בייַשפּיל, מענטשן וואס ריפּיטידלי קלאַסאַפייד די זעלבע גאַלאַקסי-עפּעס וואָס וואָלט פּאַסירן אויב זיי זענען טריינג צו מאַניפּולירן די רעזולטאטן - האט אַלע זייער קלאַסאַפאַקיישאַן דיסקאַרדיד. דעם און אנדערע ענלעך רייניקונג אַוועקגענומען וועגן 4% פון אַלע קלאַסאַפאַקיישאַנז.

רגע, נאָך רייניקונג, די ריסערטשערז דאַרפֿן צו באַזייַטיקן סיסטעמאַטיש בייאַסיז אין קלאַסאַפאַקיישאַנז. דורך אַ סעריע פון ​​פאָרשונג דיטעקשאַן סטודענטן עמבעדיד אין דער אָריגינעל פּרויעקט - פֿאַר בייַשפּיל, ווייַזונג עטלעכע וואַלאַנטירז די גאַלאַקסי אין מאַנאַקראָום אַנשטאָט פון קאָלירן, די ריסערטשערז געפונען עטלעכע סיסטעמאַטיש בייייזאַז, אַזאַ ווי אַ סיסטעמאַטיש פאָרורטייל צו קלאַסיפיצירן ווייַט ספּיראַליש גאַלאַקסיעס ווי יליפּטיקאַל גאַלאַקסיעס (Bamford et al. 2009) . אַדזשאַסטינג פֿאַר די סיסטעמאַטיש בייייזאַז איז גאָר וויכטיק ווייַל די יבעריקייַט טוט נישט אויטאָמאַטיש באַזייַטיקן סיסטעמאַטיש פאָרורטייל; עס נאָר העלפן רימוווז טראַפ - טעות.

סוף, נאָך דעביאַסינג, די ריסערטשערז דאַרפֿן אַ מעטאָד צו פאַרבינדן די יחיד קלאַסאַפאַקיישאַנז צו פּראָדוצירן אַ קאָנסענסוס קלאַסאַפאַקיישאַן. די סימפּלאַסט וועג צו פאַרבינדן קלאַסאַפאַקיישאַנז פֿאַר יעדער גאַלאַקסי וואָלט האָבן צו קלייַבן די מערסט פּראָסט קלאַסאַפאַקיישאַן. אָבער, דעם צוגאַנג וואָלט האָבן געגעבן יעדער וואַלאַנטיר גלייַך וואָג, און די ריסערטשערז סאַספּעקטיד אַז עטלעכע וואַלאַנטירז זענען בעסער אין קלאַסאַפאַקיישאַן ווי אנדערע. דעריבער, די ריסערטשערז דעוועלאָפּעד אַ מער קאָמפּליצירט יטעראַטיווע ווייטונג פּראָצעדור וואָס געפרוווט צו דעטעקט די בעסטער קלאַסאַפייערז און געבן זיי מער וואָג.

אזוי, נאָך אַ דרייַ-שריט פּראָצעס-רייניקונג, דעביאַסינג און ווייטונג, די גאַלאַקסי זאָאָלאָגישער גאָרטן פאָרשונג מאַנשאַפֿט האט קאָנווערטעד 40,000,000 פרייַוויליקער קלאַסאַפאַקיישאַנז אין אַ גאַנג פון קאָנסענסוס מאָרפאַלאַדזשיקאַל קלאַסאַפאַקיישאַנז. ווען די גאַלאַקסי זאָאָלאָגישער גאָרטן קלאַסאַפאַקיישאַנז זענען קאַמפּערד מיט דרייַ פרייַערדיק סמאָלער סקאַלער פרווון פון פאַכמאַן אַסטראַנאַמערז, אַרייַנגערעכנט די קלאַסאַפאַקיישאַן פון שאַווינסקי וואָס געהאָלפֿן צו באַגייַסטערן גאַלאַקסי זאָאָלאָגישער גאָרטן, עס איז שטאַרק העסקעם. דעריבער, די וואַלאַנטיינז, אין אַ געמיינזאַם, זענען ביכולת צו צושטעלן הויך-קוואַליטעט קלאַסאַפאַקיישאַנז און אין אַ וואָג אַז די ריסערטשערז קען נישט גלייַכן (Lintott et al. 2008) . אין פאַקט, דורך מענטשלעך קלאַסאַפאַקיישאַן פֿאַר אַזאַ אַ גרויס נומער פון גאַלאַקסיעס, שאַווינסקי, לינטאָטט, און אנדערע זענען ביכולת צו ווייַזן אַז בלויז וועגן 80% פון גאַלאַקסיעס נאָכגיין די דערוואַרט מוסטער-בלוי ספּיראַלז און רויט ילליטטיקאַלס, און פילע צייטונגען האָבן געשריבן וועגן דעם אנטדעקונג (Fortson et al. 2011) .

געגעבן דעם הינטערגרונט, איר קענען איצט זען ווי די גאַלאַקסי זאָאָלאָגישער גאָרטן גייט די שפּאַלטן-צולייגן-פאַרבינדן רעצעפּט, די זעלבע רעצעפּט וואָס איז גענוצט פֿאַר רובֿ מענטש קאַמפּיאַטינג פראיעקטן. ערשטער, אַ גרויס פּראָבלעם איז שפּאַלטן אין טשאַנגקס. אין דעם פאַל, די פּראָבלעם פון קלאַסאַפייינג אַ מיליאָן גאַלאַקסיעס איז שפּאַלטן אין אַ מיליאָן פּראָבלעמס פון קלאַסאַפיינינג איינער גאַלאַקסי. ווייַטער, אַן אָפּעראַציע איז געווענדט צו יעדער טשאַנג ינדיפּענדאַנטלי. אין דעם פאַל, וואַלאַנטירז קלאַסאַפייד יעדער גאַלאַקטיק ווי אַ ספּיראַליש אָדער יליפּטיקאַל. סוף, די רעזולטאַטן זענען קאַמביינד צו פּראָדוצירן אַ קאָנסענסוס רעזולטאַט. אין דעם פאַל, די פאַרבינדן שריט אַרייַנגערעכנט די רייניקונג, דעביאַסינג, און ווייטינג צו פּראָדוצירן אַ קאָנסענסוס קלאַסאַפאַקיישאַן פֿאַר יעדער גאַלאַקסי. אפילו רובֿ פראיעקטן נוצן דעם גענעראַל רעצעפּט, יעדער שריט דאַרף צו זיין קאַסטאַמייזד צו דער ספּעציפיש פּראָבלעם זייַענדיק אַדרעסד. למשל, אין דער מענטש קאַמפּיאַטיישאַן פּרויעקט דיסקרייבד אונטן, דער זעלביקער רעצעפּט וועט זיין נאכגעגאנגען, אָבער די צולייגן און פאַרבינדן טריט וועט זיין גאַנץ אַנדערש.

פֿאַר די Galaxy Zoo מאַנשאַפֿט, דעם ערשטער פּרויעקט איז נאָר דער אָנהייב. זייער געשווינד זיי איינגעזען אַז אַפֿילו כאָטש זיי זענען ביכולת צו קלאַסאַפאַקיישאַן נאָענט צו אַ מיליאָן גאַלאַקסיעס, דעם וואָג איז נישט גענוג צו אַרבעטן מיט נייע דיגיטאַל הימל סערווייז, וואָס קענען פּראָדוצירן בילדער פון וועגן 10000000000 גאַלאַקסיעס (Kuminski et al. 2014) . צו פאַרשטאַרקן אַ פאַרגרעסערן פון 1 מיליאָן צו 10 מיליאַרד, אַ פאַקטאָר פון 10,000-גאַלאַקסי זאָאָלאָגישער גאָרטן וואָלט דאַרפֿן צו רעקרוט בעערעך 10,000 מאל מער פּאַרטיסאַפּאַנץ. כאָטש די נומער פון וואַלאַנטירז אויף די אינטערנעט איז גרויס, עס איז נישט ינפאַנאַט. דעריבער, די ריסערטשערז איינגעזען אַז אויב זיי זענען געגאנגען צו שעפּן אלץ-גראָוינג אַמאַונץ פון דאַטן, אַ נייַ, אפילו מער סקאַלאַבלע, צוגאַנג איז דארף.

דעריבער, מאַנדאַ באַנערדזשי-ארבעטן מיט שאַווינסקי, לינטאָטט, און אנדערע מיטגלידער פון דער גאַלאַקסי זאָאָלאָגישער גאָרטן קאָלעקטיוו (2010) -סטאַרטעד לערנען קאָמפּיוטערס צו קלאַסאַפייז גאַלאַקסיעס. מער ספּעציעל, ניצן די מענטשלעך קלאַסאַפאַקיישאַן באשאפן דורך גאַלאַקסי זאָאָלאָגישער גאָרטן, באַנערדזשי געבויט אַ מאַשין לערנען מאָדעל וואָס קען פאָרויסזאָגן די מענטשלעך קלאַסאַפאַקיישאַן פון אַ גאַלאַקסי באזירט אויף די טשאַראַקטעריסטיקס פון די בילד. אויב דאָס מאָדעל קען רעפּראָדוצירן דעם מענטשלעך קלאַסאַפאַקיישאַן מיט הויך אַקיעראַסי, דעמאָלט עס קען זיין געניצט דורך גאַלאַקסי זאָאָלאָגישער גאָרטן ריסערטשערז צו קלאַסאַפיי אַ יסענשאַלי ינפאַנאַט נומער פון גאַלאַקסיעס.

די האַרץ פון באַנערדזשי און קאָללאַגס 'צוגאַנג איז פאקטיש שיין ענלעך צו טעקניקס קאַמאַנלי געניצט אין געזעלשאַפטלעך פאָרשונג, כאָטש אַז ענלעכקייט זאל נישט זיין קלאָר אין ערשטער בליק. ערשטער, Banerji און חברים קאָנווערטעד יעדער בילד אין אַ סכום פון נומעריקאַל פֿעיִקייטן אַז סאַמערייזד זייַן פּראָפּערטיעס. פֿאַר בייַשפּיל, פֿאַר בילדער פון גאַלאַקסיעס, עס קען זיין דרייַ פֿעיִקייטן: די סומע פון ​​בלוי אין די בילד, די וואַריאַנסע אין די ברייטנאַס פון די בילדצעלן, און די פּראָפּאָרציע פון ​​ניט-ווייַס בילדצעלן. די סעלעקציע פון ​​די ריכטיק פֿעיִקייטן איז אַ וויכטיק טייל פון דעם פּראָבלעם, און עס יוזשאַוואַלי ריקווייערז אונטערטעניק-געגנט עקספּערטיז. דעם ערשטער שריט, קאַמאַנלי גערופן שטריך ינזשעניעריע , רעזולטאַטן אין אַ דאַטן מאַטריץ מיט איין רודערן פּער בילד, און דעמאָלט דרייַ שפאלטן דיסקרייבד אַז בילד. געגעבן די דאַטן מאַטריץ און דער געוואלט רעזולטאַט (למשל, צי די בילד איז קלאַסאַפייד דורך אַ מענטשלעך ווי אַ יליפּטיקאַל גאַלאַקסי), דער פאָרשער שאַפֿן אַ סטאַטיסטיש אָדער מאַשין וויסן מאָדעל, פֿאַר בייַשפּיל, לאָגיסטיק רעגרעססיאָן-אַז פּרידיקס די מענטשלעך קלאַסאַפאַקיישאַן באזירט אויף די פֿעיִקייטן פון די בילד. סוף, די פאָרשער ניצט די פּאַראַמעטערס אין דעם סטאַטיסטיש מאָדעל צו פּראָדוצירן עסטימאַטעד קלאַסאַפאַקיישאַנז פון נייַ גאַלאַקסיעס (פיגורע 5.4). אין מאַשין לערנען, דעם צוגאַנג-ניצן לייבאַלד ביישפילן צו שאַפֿן אַ מאָדעל אַז קענען דערקענען נייַ דאַטע-גערופן סופּערווייזד לערנען .

פיגורע 5.4: סימפּליפיעד באַשרייַבונג וועגן באַנערדזשי עט על. (2010) געניצט די גאַלאַקסי זאָאָלאָגישער גאָרטן קלאַסאַפאַקיישאַן צו באַן אַ מאַשין לערנען מאָדעל צו טאָן גאַלאַקסי קלאַסאַפאַקיישאַן. בילדער פון גאַלאַקסיעס זענען קאָנווערטעד אין אַ מאַטריץ פון פֿעיִקייטן. אין דעם סימפּליפיעד בייַשפּיל, עס זענען דרייַ פֿעיִקייטן (די נומער פון בלוי אין די בילד, די וואַריאַנסע אין די ברייטנאַס פון די בילדצעלן, און די פּראָפּאָרציע פון ​​נעיוויטע פּיקסעלס). דעריבער, פֿאַר אַ סובסעט פון די בילדער, די גאַלאַקסי זאָאָלאָגישער גאָרטן לאַבעלס געניצט צו באַן אַ מאַשין לערנען מאָדעל. צום סוף, די מאַשין לערנען איז גענוצט צו אָפּשאַצן קלאַסאַפאַקיישאַנז פֿאַר די רוען גאַלאַקסיעס. איך גערופן דעם אַ קאָמפּיוטער-אַססיסטעד מענטש קאַמפּיאַטיישאַן פּרויעקט ווייַל, אלא ווי בעת כיומאַנז סאָלווע אַ פּראָבלעם, עס האט יומאַנז בויען אַ דאַטאַסעט וואָס קענען זיין געניצט צו באַן אַ קאָמפּיוטער צו סאָלווע די פּראָבלעם. די מייַלע פון ​​דעם קאָמפּיוטער-אַססיסטעד מענטש קאַמפּיאַטיישאַן סיסטעם איז אַז עס ינייבאַלז איר צו באַשיצן עסן ומענדיקייַט אַמאַונץ פון דאַטן ניצן בלויז אַ ענדיק סומע פון ​​מענטש מי. בילדער פון גאַלאַקסיעס ריפּראַדוסט דורך דערלויבעניש פון Sloan Digital Sky Survey.

פיגורע 5.4: סימפּליפיעד באַשרייַבונג וועגן Banerji et al. (2010) געניצט די גאַלאַקסי זאָאָלאָגישער גאָרטן קלאַסאַפאַקיישאַן צו באַן אַ מאַשין לערנען מאָדעל צו טאָן גאַלאַקסי קלאַסאַפאַקיישאַן. בילדער פון גאַלאַקסיעס זענען קאָנווערטעד אין אַ מאַטריץ פון פֿעיִקייטן. אין דעם סימפּליפיעד בייַשפּיל, עס זענען דרייַ פֿעיִקייטן (די נומער פון בלוי אין די בילד, די וואַריאַנסע אין די ברייטנאַס פון די בילדצעלן, און די פּראָפּאָרציע פון ​​נעיוויטע פּיקסעלס). דעריבער, פֿאַר אַ סובסעט פון די בילדער, די גאַלאַקסי זאָאָלאָגישער גאָרטן לאַבעלס געניצט צו באַן אַ מאַשין לערנען מאָדעל. צום סוף, די מאַשין לערנען איז גענוצט צו אָפּשאַצן קלאַסאַפאַקיישאַנז פֿאַר די רוען גאַלאַקסיעס. איך גערופן דעם אַ קאָמפּיוטער-אַססיסטעד מענטש קאַמפּיאַטיישאַן פּרויעקט ווייַל, אלא ווי בעת כיומאַנז סאָלווע אַ פּראָבלעם, עס האט יומאַנז בויען אַ דאַטאַסעט וואָס קענען זיין געניצט צו באַן אַ קאָמפּיוטער צו סאָלווע די פּראָבלעם. די מייַלע פון ​​דעם קאָמפּיוטער-אַססיסטעד מענטש קאַמפּיאַטיישאַן סיסטעם איז אַז עס ינייבאַלז איר צו באַשיצן עסן ומענדיקייַט אַמאַונץ פון דאַטן ניצן בלויז אַ ענדיק סומע פון ​​מענטש מי. בילדער פון גאַלאַקסיעס ריפּראַדוסט דורך דערלויבעניש פון Sloan Digital Sky Survey .

די פֿעיִקייטן פון באַנערדזשי און קאָללאַגס 'מאַשין לערנען מאָדעל זענען מער קאָמפּליצירט ווי יענע אין מיין צאַצקע בייַשפּיל, פֿאַר בייַשפּיל, זי געניצט פֿעיִקייטן ווי "די וואַוקאָולעורס פּאַסיק אַקסיאַל פאַרהעלטעניש", און איר מאָדעל איז נישט לאָגיסטיק ראַגרעשאַן, עס איז געווען אַ קינסטלעך נוראַל נעץ. ניצן איר פֿעיִקייטן, איר מאָדעל, און די קאָנסענסוס גאַלאַקסי זאָאָלאָגישער גאָרטן קלאַסאַפאַקיישאַן, זי איז געווען ביכולת צו מאַכן ווייץ אויף יעדער שטריך, און דעמאָלט נוצן די ווייץ צו מאַכן פּרעדיקטיאָנס וועגן די קלאַסאַפאַקיישאַן פון גאַלאַקסיעס. פֿאַר בייַשפּיל, איר אַנאַליסיס געפונען אַז בילדער מיט נידעריק "די וואַוקולעורס פּאַסיק אַקסיאַל פאַרהעלטעניש" זענען מער מסתּמא צו זיין ספּיראַליש גאַלאַקסיעס. געגעבן די ווייץ, זי איז ביכולת צו פאָרויסזאָגן די מענטשלעך קלאַסאַפאַקיישאַן פון אַ גאַלאַקסי מיט גלייַך אַקיעראַסי.

די אַרבעט פון באַנערדזשי און קאָללאַגס פארקערט גאַלאַקסי זאָאָלאָגישער גאָרטן אין וואָס איך וואָלט רופן אַ קאָמפּיוטער אַססיסטעד מענטש קאַמפּיאַטיישאַן סיסטעם . דער בעסטער וועג צו טראַכטן וועגן די כייבריד סיסטעמען איז אַז אלא ווי בעת כיומאַנז סאָלווע אַ פּראָבלעם, זיי האָבן יומאַנז בויען אַ דאַטאַסעט וואָס קענען זיין געניצט צו באַן אַ קאָמפּיוטער צו סאָלווע די פּראָבלעם. מאל, טראַינינג אַ קאָמפּיוטער צו סאָלווע די פּראָבלעם קענען דאַרפן אַ פּלאַץ פון ביישפילן, און דער בלויז וועג צו פּראָדוצירן אַ גענוג נומער פון ביישפילן איז אַ מאַסע מיטאַרבעט. די אַדוואַנטאַגעס פון דעם קאָמפּיוטער-אַססיסטעד צוגאַנג איז אַז עס קען ינייבאַלז איר צו באַפרייַען עסן ינסיטינג אַמאַונץ פון דאַטן ניצן בלויז אַ ענדיק סומע פון ​​מענטש מי. פֿאַר בייַשפּיל, אַ פאָרשער מיט אַ מיליאָן מענטש קלאַסאַפייד גאַלאַקסיעס קענען בויען אַ פּרידיקטיוו מאָדעל וואָס קענען זיין געניצט צו קלאַסאַפיי אַ ביליאָן אָדער אַפֿילו טריליאַן גאַלאַקסיעס. אויב עס זענען ריזיק נומערן פון גאַלאַקסיעס, דעמאָלט דעם טיפּ פון מענטש-קאָמפּיוטער היבריד איז טאַקע די בלויז מעגלעך לייזונג. דעם ינפאַנאַט סקאַלאַביליטי איז נישט פֿרייַ, אָבער. ביניען אַ מאַשין לערנען מאָדעל וואָס קענען ריכטיק רעפּראָדוצירן דעם מענטשלעך קלאַסאַפאַקיישאַן איז זיך אַ שווער פּראָבלעם, אָבער גליק עס זענען שוין ויסגעצייכנט ספרים דעדאַקייטאַד צו דעם טעמע (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

גאַלאַקסי זאָאָלאָגישער גאָרטן איז אַ גוט פאָרעם פון ווי פילע מענטש קאַמפּעטיטיוו פּרויעקט יוואַלוו. ערשטער, אַ פאָרשער פרווון די פּרויעקט דורך זיך אָדער מיט אַ קליין מאַנשאַפֿט פון פאָרשונג אַסיסטאַנץ (למשל, שאַווינסקי ס ערשט קלאַסאַפאַקיישאַן מי). אויב דעם צוגאַנג טוט נישט וואָג זיך, דער פאָרשער קענען מאַך צו אַ מענטש קאַמפּאַטיש פּרויעקט מיט פילע פּאַרטיסאַפּאַנץ. אבער, פֿאַר אַ זיכער באַנד פון דאַטן, ריין מענטש מי וועט נישט זיין גענוג. אין דעם פונט, ריסערטשערז דאַרפֿן צו בויען אַ קאָמפּיוטער-אַססיסטעד מענטש קאַמפּיאַטיישאַן סיסטעם וואָס מענטשלעך קלאַסאַפאַקיישאַנז זענען געניצט צו באַן אַ מאַשין לערנען מאָדעל וואָס קענען זיין געווענדט צו כמעט אַנלימאַטאַד אַמאַונץ פון דאַטן.