5.2.1 గాలక్సీ జూ

ఈ అనువాదం కంప్యూటర్ ద్వారా సృష్టించబడింది. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.2.1 గాలక్సీ జూ

గెలాక్సీ జూ ఒక మిలియన్ గెలాక్సీల వర్గీకరించేందుకు అనేక నిపుణులు కానివారికి స్వచ్ఛందంగా ప్రయత్నాలు మిళితం.

గెలాక్సీ జూ 2007 కొంచెం సులభం, Schawinski గెలాక్సీల ఆసక్తి ఉండేది కెవిన్ Schawinski, ఆక్స్ఫర్డ్ విశ్వవిద్యాలయంలో ఖగోళ శాస్త్రం లో ఒక గ్రాడ్యుయేట్ విద్యార్థి ఎదుర్కొన్న సమస్య పరిధిదాటి, మరియు గెలాక్సీల ద్వారా వర్గీకరించవచ్చు వారి పదనిర్మాణం దీర్ఘవృత్తాకార లేదా మురి-మరియు వారి రంగు నీలం లేదా ఎరుపు. సమయంలో, ఖగోళ శాస్త్రజ్ఞులు మధ్య సంప్రదాయ జ్ఞానం దీర్ఘవృత్తాకార గెలాక్సీల (పాత వయస్సు సూచిస్తుంది) రంగులో ఎరుపు మురి గెలాక్సీల, మా పాలపుంత వంటి, రంగు (యువత సూచిస్తుంది) లో నీలం ఉండేవి మరియు. Schawinski ఈ సంప్రదాయ జ్ఞానం అనుమానం వ్యక్తం చేశారు. అతను ఈ నమూనా సాధారణంగా నిజమైన కావచ్చు, అయితే, బహుశా మినహాయింపులు చెప్పుకోతగ్గ సంఖ్యలో ఉన్నారు, మరియు ఆ అనుమానం ఈ అసాధారణ గెలాక్సీల-సరిపోదని వాటిని మా అధ్యయనం నమూనా అతను ప్రక్రియ గురించి ఏదో తెలుసుకోవడానికి కాలేదు అంచనా ద్వారా గెలాక్సీల ఏర్పాటు.

అందువలన, ఏ Schawinski సంప్రదాయ జ్ఞానం తారుమారు క్రమంలో అవసరమైన స్వరూప క్లాసిఫైడ్స్ గెలాక్సీల ఒక పెద్ద సెట్ ఉంది; ఆ మురి లేదా దీర్ఘవృత్తాకార వలె వర్గీకరించబడ్డాయి చేసినట్లు గెలాక్సీల ఉంది. అయితే, వర్గీకరణ కోసం ఇప్పటికే క్రమసూత్ర పద్ధతులు శాస్త్రీయ పరిశోధన కోసం ఉపయోగిస్తారు తగినంత ఇంకా మంచి ఉండేవి కావు; ఇతర మాటలలో, వర్గీకరించడం గెలాక్సీల, ఆ సమయంలో, కంప్యూటర్లు కోసం హార్డ్ అని ఒక సమస్య ఉంది. అందువలన, అవసరమైన ఏమి మానవ క్లాసిఫైడ్ గెలాక్సీల పెద్ద సంఖ్యలో ఉంది. Schawinski ఒక గ్రాడ్యుయేట్ విద్యార్థి ఉత్సాహంతో ఈ వర్గీకరణ సమస్యను చేపట్టింది. ఏడు, 12 గంటల రోజుల మారథాన్ సెషన్ లో, అతను 50,000 గెలాక్సీల వర్గీకరించడానికి చేయగలిగింది. 50,000 గెలాక్సీల చాలా వంటి శబ్దము ఉండవచ్చు, నిజానికి స్లోన్ డిజిటల్ స్కై సర్వే ఫోటోలు తీయించుకున్న దాదాపు ఒక మిలియన్ గెలాక్సీల కేవలం 5% ఉంది. Schawinski అతను అధిక పరిణామాత్మక విధానం అవసరమని గ్రహించారు.

అదృష్టవశాత్తూ, అది వర్గీకరించడం గెలాక్సీల పని ఖగోళశాస్త్రంలో ఆధునిక శిక్షణ అవసరం లేదు అని అవుతుంది; మీరు అందంగా త్వరగా దీన్ని ఎవరైనా బోధించడానికి. ఇతర మాటలలో, అయినప్పటికీ గెలాక్సీల వర్గీకరించడం కంప్యూటర్లకు కష్టం ఒక పని, అది మానవులకు అందంగా సులభం. కాబట్టి, ఆక్స్ఫర్డ్, Schawinski తోటి ఖగోళ శాస్త్రవేత్త క్రిస్ Lintott ఒక పబ్ లో కూర్చొని ఉండగా స్వచ్ఛందంగా గెలాక్సీల చిత్రాలు క్లాసిఫై పేరు ఒక వెబ్సైట్ అప్ కలలు కన్నారు. కొన్ని నెలల తరువాత, గెలాక్సీ జూ జన్మించాడు.

గెలాక్సీ జూ వెబ్సైట్లో స్వచ్ఛందంగా శిక్షణ కొన్ని నిమిషాల గురవుతుంది; ఉదాహరణకు, ఒక మురి మరియు దీర్ఘవృత్తాకార గెలాక్సీ (మూర్తి 5.2) మధ్య తేడా నేర్చుకోవడం. ఈ శిక్షణ తర్వాత, వాలంటీర్లు పిలుస్తారు తో సాపేక్షంగా సులభం క్విజ్ సరిగ్గా వర్గీకరించడం 11 నుంచి 15 గెలాక్సీల పాస్ వచ్చింది వర్గీకరణలు ఆపై స్వచ్ఛంద ఒక సాధారణ వెబ్ ఆధారిత ఇంటర్ఫేస్ (మూర్తి 5.3) ద్వారా లింగ గెలాక్సీల యొక్క నిజమైన వర్గీకరణ ప్రారంభమవుతుంది. స్వచ్ఛంద నుండి ఖగోళ శాస్త్రవేత్త పరివర్తన కంటే తక్కువ 10 నిమిషాల్లో జరుగుతుందని మరియు మాత్రమే హర్డిల్స్, ఒక సాధారణ క్విజ్ అత్యల్ప ప్రయాణిస్తున్న అవసరం.

మూర్తి 5.2: చక్రం మరియు దీర్ఘవృత్తాకార: గెలాక్సీల రెండు ప్రధాన రకాల ఉదాహరణలు. గెలాక్సీ జూ ప్రాజెక్ట్ 900,000 కంటే ఎక్కువ చిత్రాలను కేతగిరీలు 100,000 కంటే ఎక్కువ స్వచ్ఛందంగా ఉపయోగిస్తారు. మూలం: www.galaxyzoo.org .

మూర్తి 5.3: ఓటర్లు ఒకే చిత్రం వర్గీకరించడానికి అడిగారు అక్కడ ఇన్పుట్ స్క్రీన్. మూలం: www.galaxyzoo.org .

ప్రాజెక్ట్ ఒక వార్తా వ్యాసం లో నటించింది, మరియు గురించి ఆరు నెలల్లో ప్రాజెక్టు 100,000 కంటే ఎక్కువ పౌరుడు శాస్త్రవేత్తలు, వారు పని ఆనందించారు మరియు వారు ముందుగానే ఖగోళశాస్త్రం సహాయం కోరుకున్నాడు ఎందుకంటే పాల్గొన్నారు వ్యక్తుల ప్రమేయం కోసం పెరిగింది తర్వాత గెలాక్సీ జూ దాని ప్రారంభ స్వచ్ఛందంగా ఆకర్షించింది. మొత్తంమీద, ఈ 100,000 స్వచ్ఛందంగా పాల్గొనే సాపేక్షంగా చిన్నది, కోర్ గ్రూప్ నుండి వచ్చే వర్గీకరణలు మెజారిటీ, కంటే ఎక్కువ 40 మిలియన్ వర్గీకరణలు మొత్తం కృషి (Lintott et al. 2008) .

అండర్గ్రాడ్యుయేట్ పరిశోధనా సహాయకులు అనుభవం నియామకం కలిగిన పరిశోధకులు వెంటనే డేటా నాణ్యత గురించి అనుమానాస్పద ఉండవచ్చు. ఈ సంశయవాదం సహేతుకమైన కాగా, గెలాక్సీ జూ స్వచ్ఛంద రచనలు సరిగ్గా శుభ్రం చేసినప్పుడు debiased, మరియు సేకరించబడి, వారు అధిక నాణ్యత ఫలితాలను చూపిస్తుంది (Lintott et al. 2008) . ప్రొఫెషనల్ నాణ్యత డేటా సృష్టించడానికి ఉద్దేశించి పొందడానికి ఒక ముఖ్యమైన ట్రిక్ పునరుక్తి ఉంది; ఆ, మమేకమయ్యారు అదే పని చాలా మంది నిర్వహిస్తారు. గెలాక్సీ జూ గెలాక్సీ సుమారు 40 వర్గీకరణలు ఉన్నాయి; అండర్గ్రాడ్యుయేట్ పరిశోధనా సహాయకులు ఉపయోగించి పునరుక్తి ఈ స్థాయిలో కొనే అందువలన ఎప్పుడూ కాలేదు పరిశోధకులు ప్రతి వ్యక్తి వర్గీకరణ నాణ్యతను మరింత ఆందోళన ఉండాలి. స్వచ్ఛందంగా శిక్షణ లోపించాయని, వారు పునరావృత తోడైంది.

కూడా గెలాక్సీ ప్రతి బహుళ వర్గీకరణలతో అయితే ఏకాభిప్రాయం వర్గీకరణ గమ్మత్తైన ఉత్పత్తి స్వచ్ఛంద వర్గీకరణలు సెట్ కలపడం. చాలా పోలి సవాళ్ళను చాలా మానవ గణన ప్రాజెక్టులు ఉద్భవిస్తుంది ఎందుకంటే, అది క్లుప్తంగా గెలాక్సీ జూ పరిశోధకులు తమ ఏకాభిప్రాయం వర్గీకరణలు ఉత్పత్తి చేయడానికి ఉపయోగిస్తారు మూడు చర్యలను సమీక్షించడానికి ఉపయోగపడిందా. మొదటి, పరిశోధకులు బోగస్ వర్గీకరణలు తొలగించడం ద్వారా "శుభ్రం" డేటా. ఉదాహరణకు, పదేపదే వారు రెట్టింపు ప్రయత్నిస్తున్న ఉంటే జరుగుతుంది అదే గెలాక్సీ-ఏదో క్లాసిఫైడ్ వ్యక్తులు వారి వర్గీకరణలు విస్మరించిన ఫలితాలు వచ్చింది. ఈ మరియు ఇతర సారూప్య శుభ్రపరచడం అన్ని వర్గీకరణలు సుమారు 4% తొలగించబడింది.

రెండవది, శుభ్రపరిచిన తరువాత, పరిశోధకులు వర్గీకరణలు క్రమమైన పక్షపాతాన్ని తొలగించడానికి అవసరమైన. అసలు ప్రాజెక్టు-ఉదాహరణకి నిక్షిప్తం బయాస్ గుర్తింపును అధ్యయనాలు, కొన్ని వాలంటీర్లు బదులుగా మోనోక్రోమ్ గెలాక్సీ చూపిస్తున్న వరుస ద్వారా రంగు పరిశోధకులు వంటి దీర్ఘవృత్తాకార గెలాక్సీల దూరంగా మురి గెలాక్సీల వర్గీకరించడానికి ఒక క్రమమైన పక్షపాతాన్ని అనేక క్రమబద్ధమైన పక్షపాతాలు కనుగొన్నారు (Bamford et al. 2009) . ఈ క్రమ పక్షపాతాలు కోసం సర్దుబాటు అనేక రచనలు సగటున ఎందుకంటే క్రమమైన పక్షపాతాన్ని తొలగించలేదు చాలా ముఖ్యం; అది మాత్రమే యాదృచ్ఛిక లోపం తొలగిస్తుంది.

చివరగా, debiasing తరువాత, పరిశోధకులు ఏకాభిప్రాయం వర్గీకరణ ఉత్పత్తి వ్యక్తిగత వర్గీకరణలు కలిపి ఒక పద్ధతిని అవసరమైన. ప్రతి నక్షత్ర మండలానికి వర్గీకరణలు మిళితం సరళమైన మార్గం అత్యంత సాధారణ వర్గీకరణ ఎన్నుకోవడం. అయితే, ఈ విధానం ప్రతి స్వచ్ఛంద సమాన బరువు ఇచ్చి, మరియు పరిశోధకులు కొన్ని వాలంటీర్లు ఇతరులు కంటే వర్గీకరణ వద్ద మంచి అని అనుమానం. అందువలన, పరిశోధకులు స్వయంచాలకంగా ఉత్తమ వర్గీకరణ గుర్తించి మరియు వాటిని మరింత బరువు ఇవ్వాలని ప్రయత్నిస్తాడు ఒక క్లిష్టమైన పునరుత్థాన వైటింగ్ విధానాన్ని అభివృద్ధి చేశారు.

అందువలన, మూడు దశల ప్రక్రియ శుభ్రత, debiasing, మరియు వైటింగ్-గెలాక్సీ జూ పరిశోధన జట్టు తరువాత మతం చేసింది ఏకాభిప్రాయం పదనిర్మాణ వర్గీకరణలు సమితి 40 మిలియన్ స్వచ్ఛంద వర్గీకరణలు. ఈ గెలాక్సీ జూ వర్గీకరణలు గెలాక్సీ జూ స్ఫూర్తి సహాయపడింది Schawinski ద్వారా వర్గీకరణ సహా ప్రొఫెషనల్ ఖగోళశాస్త్రజ్ఞులు ముందు మూడు చిన్న తరహా ప్రయత్నాలు పోలిస్తే చేసినప్పుడు, బలమైన ఒప్పందం ఉంది. అందువలన, వాలంటీర్లు, మొత్తంమీద అధిక నాణ్యత విభజిస్తుంది సాధించారు మరియు పరిశోధకులు మ్యాచ్ కాలేదు ఒక స్థాయిలో (Lintott et al. 2008) . నిజానికి, పాలపుంతలు అంత పెద్ద సంఖ్యలో మానవ వర్గీకరణలు ద్వారా, Schawinski, Lintott, మరియు ఇతరులు గెలాక్సీల మాత్రమే 80% అంచనా నమూనా నీలం సర్పిలాలు మరియు ఎరుపు దీర్ఘవృత్తాకార గెలాక్సీల మరియు అనేక పత్రాలు అనుసరించే గురించి రాశారు చూపించడానికి పోయారు ఈ ఆవిష్కరణ (Fortson et al. 2011) .

ఈ నేపథ్యంలో ఇచ్చిన, మేము ఇప్పుడు గెలాక్సీ జూ క్రింది ఎలా చూడగలరు చీలిక apply-మిళితం రెసిపీ చాలా మానవ గణన ప్రాజెక్టులు ఉపయోగిస్తారు అదే రెసిపీ. మొదటి, ఒక పెద్ద సమస్య భాగాలుగా విభజించబడింది. ఈ సందర్భంలో, ఒక మిలియన్ గెలాక్సీల వర్గీకరించే సమస్య ఒక గెలాక్సీ వర్గీకరించే మిలియన్ సమస్యలు విభజించబడింది. తరువాత, ఒక ఆపరేషన్ స్వతంత్రంగా ప్రతి భాగం వర్తించబడుతుంది. ఈ సందర్భంలో, ఒక స్వచ్చంద మురి లేదా దీర్ఘవృత్తాకార గాని వంటి ప్రతి గెలాక్సీ క్లాసిఫై. చివరగా, ఫలితాలు ఏకాభిప్రాయం ఫలితం దిశగా కలుపుతారు. ఈ సందర్భంలో, మిళితం అడుగు క్లీనింగ్, debiasing, మరియు ప్రతి నక్షత్ర మండలానికి ఏకాభిప్రాయం వర్గీకరణ ఉత్పత్తి వైటింగ్ చేర్చారు. చాలా ప్రాజెక్టులు ఈ సాధారణ వంటకం ఉపయోగించవచ్చు అయినప్పటికీ, దశలను ప్రతి నిర్దిష్ట సమస్య ప్రసంగించారు రక్షణతో అవసరం. ఉదాహరణకు, క్రింద వివరించిన మానవ గణన ప్రాజెక్ట్ లో, అదే రెసిపీ తరువాత చేయబడుతుంది, కానీ దరఖాస్తు మరియు మిళితం దశలను చాలా భిన్నంగా ఉంటుంది.

గెలాక్సీ జూ జట్టు కోసం, ఈ మొదటి ప్రాజెక్టు ఆరంభం. చాలా త్వరగా వారు ఒక మిలియన్ గెలాక్సీల దగ్గరగా వర్గీకరించడానికి సాధించారు అయినప్పటికీ గ్రహించారు, ఈ తరహా 10 బిలియన్ గెలాక్సీల చిత్రాలు ఉత్పత్తి చేసే కొత్త డిజిటల్ ఆకాశ అధ్యయనాలతో, పని సరిపోదు (Kuminski et al. 2014) . నుండి 1 మిలియన్ 10 పెంచుతున్నట్లు నిర్వహించడానికి బిలియన్ 10,000-గెలాక్సీ జూ అంశం సుమారుగా 10,000 రెట్లు ఎక్కువ పాల్గొనే సమీకరణకు వుంటుంది. ఇంటర్నెట్ లో స్వచ్ఛందంగా సంఖ్య పెద్ద సంఖ్యలో ఉన్నప్పటికీ, అది అనంతంగా ఉంటుంది. అందువలన, పరిశోధకులు గ్రహించారు వారు డేటా, ఒక కొత్త, మరింత కొలవలేని, విధానం అవసరమైంది ఎప్పుడు పెరుగుతున్న మొత్తంలో నిర్వహించడానికి వెళ్తున్నారు ఉంటే.

అందువలన, మందా Banerji పని గెలాక్సీల వర్గీకరించడానికి కెవిన్ Schawinski, క్రిస్ Lintott, మరియు గాలక్సీ జూ జట్టు మాపక బోధన కంప్యూటర్ల ఇతర సభ్యులతో. మరింత ప్రత్యేకంగా, గెలాక్సీ జూ, రూపొందించినవారు మానవ వర్గీకరణలు ఉపయోగించి Banerji et al. (2010) చిత్రం యొక్క లక్షణాలు ఆధారంగా ఒక గెలాక్సీ మానవ వర్గీకరణ ఊహించారు ఒక యంత్ర అభ్యాస మోడల్ నిర్మించారు. ఈ యంత్ర అభ్యాస మోడల్ అధిక కచ్చితత్వంతో మానవ వర్గీకరణలు పునరుత్పత్తి చేయగల, అప్పుడు అది గెలాక్సీల అత్యావశ్యక అసంఖ్యాక వర్గీకరించడానికి గెలాక్సీ జూ పరిశోధకులు వాడవచ్చు.

Banerji మరియు సహచరులు 'పద్ధతిలో కోర్ ఆ సారూప్యత మొదటి చూపులో స్పష్టమైన ఉండకపోవచ్చని అయినప్పటికీ నిజంగా సాధారణంగా సామాజిక పరిశోధనలో ఉపయోగించిన పద్ధతుల అందంగా ఇదే. మొదటి, Banerji మరియు సహచరులు అది లక్షణాలు వార్తలు సంగ్రహించేందుకు సంఖ్యాత్మక లక్షణాలను సమితి ప్రతి చిత్రం మార్చబడుతుంది. చిత్రం లో నీలం మొత్తం పిక్సెల్ల ప్రకాశం అంతర్భేధం, మరియు కాని వైట్ పిక్సెళ్ళు నిష్పత్తి: ఉదాహరణకు, గెలాక్సీల చిత్రాలు అక్కడ మూడు లక్షణాలు కావచ్చు. సరైన లక్షణాలను ఎంపిక సమస్య యొక్క ఒక ముఖ్యమైన భాగం మరియు సాధారణంగా ఇది విషయ-అంశ అవగాహన ఉండాలి. సాధారణంగా ఫీచర్ ఇంజనీరింగ్ అనే ఈ మొదటి దశ, చిత్రం ఒకటి వరుసగా ఆపై మూడు ఆ చిత్రం వివరిస్తూ స్తంభాలతో ఒక డేటా మాట్రిక్స్ ఫలితాలు. డేటా మాట్రిక్స్ మరియు కావలసిన అవుట్పుట్ (ఉదా, బొమ్మల దీర్ఘవృత్తాకార గెలాక్సీ వంటి ఒక మానవ వర్గీకరించబడింది అనే), పరిశోధకుడు ఒక గణాంక నమూనా-ఉదాహరణకు పారామితులు అంచనా వేసింది, ఒక లాజిస్టిక్ రిగ్రెషన్-ఆధారిత మానవ వర్గీకరణ ఊహించింది వంటి ఏదో ఇచ్చిన చిత్రం యొక్క లక్షణాలపై. చివరగా, పరిశోధకుడు క్రొత్త గెలాక్సీల రాగలదని వర్గీకరణలు (మూర్తి 5.4) తయారీకి ఈ గణాంక నమూనా పారామితులు ఉపయోగిస్తుంది. ఒక సామాజిక అనలాగ్ ఆలోచించి, మీరు ఒక మిలియన్ విద్యార్థుల గురించి జనాభా సమాచారం ఉందని ఊహించే, మరియు మీరు వారు కళాశాల లేదా గ్రాడ్యుయేట్ లేదో తెలుసు. మీరు ఈ డేటాను ఒక లాజిస్టిక్ రిగ్రెషన్ ఉంచగలిగిన, ఆపై మీరు కొత్త విద్యార్థులు కళాశాల నుండి గ్రాడ్యుయేట్ కావడం లేదో అంచనా ఫలితంగా మోడల్ పారామితులు వాడవచ్చు. నేర్చుకోవడం పర్యవేక్షణలో యంత్ర అభ్యాస అనే పద్ధతి ఉపయోగించి లేబుల్ ఉదాహరణలు అప్పుడు కొత్త లేబుల్ చేసే ఒక గణాంక నమూనా సృష్టించడానికి డేటా అంటారు (Hastie, Tibshirani, and Friedman 2009) .

మూర్తి 5.4: ఎలా Banerji మొదలైనవారు సరళీకృత వివరణ. (2010) గెలాక్సీ వర్గీకరణ చేయాలని యంత్ర అభ్యాస మోడల్ శిక్షణ గెలాక్సీ జూ వర్గీకరణలు ఉపయోగిస్తారు. గెలాక్సీల చిత్రాలు లక్షణాలు మాతృకలో చేరవేశారు. ఈ సరళమైన ఉదాహరణలో మూడు లక్షణాలు (చిత్రం లో నీలం మొత్తం పిక్సెల్ల ప్రకాశం అంతర్భేధం, మరియు కాని వైట్ పిక్సెళ్ళు యొక్క నిష్పత్తి) ఉన్నాయి. అప్పుడు, చిత్రాల ఉపసమితి కోసం, గెలాక్సీ జూ లేబుల్స్ ఒక యంత్ర అభ్యాస మోడల్ శిక్షణ ఉపయోగిస్తారు. చివరగా, యంత్ర అభ్యాస మిగిలిన గెలాక్సీల వర్గీకరణలు అంచనా వేయడానికి ఉపయోగిస్తారు. నేను ప్రాజెక్టు ఈ రకమైన కాల్ రెండవ తరం మానవ గణన ప్రాజెక్ట్ మానవులు కలిగి ఒక సమస్యను పరిష్కరించడానికి కాకుండా, వారు కలిగి, ఎందుకంటే మానవులు సమస్యను పరిష్కరించడానికి ఒక కంప్యూటర్ శిక్షణ ఉపయోగించవచ్చు ఒక డేటాసెట్ నిర్మించడానికి. ఈ కంప్యుటర్ విధానం యొక్క ప్రయోజనం మీరు మానవ ప్రయత్నం కేవలం పరిమిత మొత్తంలో ఉపయోగించి డేటా తప్పనిసరిగా అనంతం మొత్తంలో నిర్వహించడానికి వీలు ఉంది.

మూర్తి 5.4: ఎలా సరళీకృత వివరణ Banerji et al. (2010) గెలాక్సీ వర్గీకరణ చేయాలని యంత్ర అభ్యాస మోడల్ శిక్షణ గెలాక్సీ జూ వర్గీకరణలు ఉపయోగిస్తారు. గెలాక్సీల చిత్రాలు లక్షణాలు మాతృకలో చేరవేశారు. ఈ సరళమైన ఉదాహరణలో మూడు లక్షణాలు (చిత్రం లో నీలం మొత్తం పిక్సెల్ల ప్రకాశం అంతర్భేధం, మరియు కాని వైట్ పిక్సెళ్ళు యొక్క నిష్పత్తి) ఉన్నాయి. అప్పుడు, చిత్రాల ఉపసమితి కోసం, గెలాక్సీ జూ లేబుల్స్ ఒక యంత్ర అభ్యాస మోడల్ శిక్షణ ఉపయోగిస్తారు. చివరగా, యంత్ర అభ్యాస మిగిలిన గెలాక్సీల వర్గీకరణలు అంచనా వేయడానికి ఉపయోగిస్తారు. నేను ప్రాజెక్టు ఈ రకమైన కాల్ రెండవ తరం మానవ గణన ప్రాజెక్ట్ మానవులు కలిగి ఒక సమస్యను పరిష్కరించడానికి కాకుండా, వారు కలిగి, ఎందుకంటే మానవులు సమస్యను పరిష్కరించడానికి ఒక కంప్యూటర్ శిక్షణ ఉపయోగించవచ్చు ఒక డేటాసెట్ నిర్మించడానికి. ఈ కంప్యుటర్ విధానం యొక్క ప్రయోజనం మీరు మానవ ప్రయత్నం కేవలం పరిమిత మొత్తంలో ఉపయోగించి డేటా తప్పనిసరిగా అనంతం మొత్తంలో నిర్వహించడానికి వీలు ఉంది.

లక్షణాలు Banerji et al. (2010) యంత్ర అభ్యాస మోడల్ ఉదాహరణకు-ఉదాహరణకు, ఆమె లక్షణాలు వంటి ఉపయోగించవచ్చు నా బొమ్మ లో ఆ కంటే క్లిష్టమైనది ఉన్నాయి "డి Vaucouleurs అక్ష నిష్పత్తి సరిపోయే" -మరియు ఆమె మోడల్ లాజిస్టిక్ రిగ్రెషన్ కాదు, అది ఒక కృత్రిమ నాడీ నెట్వర్క్. ఆమె లక్షణాలు, ఆమె మోడల్, మరియు ఏకాభిప్రాయం గెలాక్సీ జూ వర్గీకరణలు ఉపయోగించి, ఆమె ప్రతి లక్షణాన్ని బరువులు సృష్టించండి, తరువాత గెలాక్సీలు వర్గీకరణ గురించి అంచనాలు తయారు ఈ బరువులు ఉపయోగించే చేయగలిగింది. ఉదాహరణకు, ఆమె విశ్లేషణ తక్కువ "డీ Vaucouleurs అక్ష నిష్పత్తి సరిపోయే" చిత్రాలు మురి గెలాక్సీల చెందే అవకాశం కనుగొన్నారు. ఈ బరువులు ఇచ్చిన, ఆమె సహేతుకమైన ఖచ్చితత్వంతో ఒక గెలాక్సీ మానవ వర్గీకరణ అంచనా చేయగలిగాడు.

పని Banerji et al. (2010) నేను రెండవ తరం మానవ గణన వ్యవస్థ అంటారని ఏమి గెలాక్సీ జూ మారింది. ఈ రెండవ తరం వ్యవస్థలు ఆలోచించే ఉత్తమ మార్గం మానవులు కలిగి ఒక సమస్యను పరిష్కరించడానికి బదులు, వారు కలిగి మానవులు సమస్యను పరిష్కరించడానికి ఒక కంప్యూటర్ శిక్షణ ఉపయోగించవచ్చు ఒక డేటాసెట్ బిల్డ్. కంప్యూటర్ శిక్షణ ఇచ్చేందుకు కావాల్సిన సమాచార పరిమాణాన్ని దీన్ని సృష్టించడానికి ఒక మానవ మాస్ సహకారం అవసరమవుతుంది కనుక పెద్ద కావచ్చు. గెలాక్సీ జూ వినియోగిస్తున్నాయి నాడీ నెట్వర్క్ల విషయంలో Banerji et al. (2010) విశ్వసనీయంగా మానవ వర్గీకరణ పునరుత్పత్తి చేయగలిగాడు ఒక నమూనా నిర్మించడానికి క్రమంలో మానవ లేబుల్ ఉదాహరణలు చాలా పెద్ద సంఖ్య అవసరం.

ఈ కంప్యుటర్ విధానం యొక్క ప్రయోజనం మీరు మానవ ప్రయత్నం కేవలం పరిమిత మొత్తంలో ఉపయోగించి డేటా తప్పనిసరిగా అనంతం మొత్తంలో నిర్వహించడానికి వీలు ఉంది. ఉదాహరణకు, ఒక మిలియన్ మానవ క్లాసిఫైడ్ గెలాక్సీల ఒక పరిశోధకుడు ఆపై ఒక బిలియన్ లేదా ఒక ట్రిలియన్ గెలాక్సీల వర్గీకరించడానికి ఉపయోగించే చేయవచ్చు ఒక సూచనా మోడల్ నిర్మించవచ్చు. గెలాక్సీల యొక్క అపారమైన సంఖ్యలో ఉన్నాయి ఉంటే, అప్పుడు మానవ-కంప్యూటర్ హైబ్రిడ్ యొక్క ఈ రకమైన నిజంగా మాత్రమే సాధ్యం పరిష్కారం. ఈ అనంత వ్యాప్తిని అయితే, ఉచిత. సరిగ్గా కూడా ఒక హార్డ్ సమస్య మానవ వర్గీకరణలు పునరుత్పత్తి చేసే యంత్ర అభ్యాస మోడల్ బిల్డింగ్, కానీ అదృష్టవశాత్తూ ఇప్పటికే ఈ అంశం కోసం అంకితం అద్భుతమైన పుస్తకాలు ఉన్నాయి (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

గెలాక్సీ జూ అనేక మానవ గణన ప్రాజెక్టులు పరిణామం చూపిస్తుంది. మొదటి దానిలో పరిశోధకుడు ఆమె లేదా పరిశోధన సహాయకుల ఒక చిన్న జట్టు (ఉదా, Schawinski యొక్క ప్రారంభ వర్గీకరణ చర్య) తో ప్రాజెక్ట్ ప్రయత్నించింది. ఈ విధానం బాగా స్కేల్ లేదు ఉంటే, పరిశోధకుడు అనేక మంది వర్గీకరణలు దోహదం పేరు ఒక మానవ గణన ప్రాజెక్ట్ కు తరలించవచ్చు. కానీ, డేటా కొన్ని వాల్యూమ్ స్వచ్ఛమైన మానవ ప్రయత్నంతో తగినంత వుండదు. ఆ సమయంలో, పరిశోధకులు మానవ వర్గీకరణలు అప్పుడు డేటా దాదాపు అపరితమైన మొత్తంలో దరఖాస్తు చేసే యంత్ర అభ్యాస మోడల్ శిక్షణ ఇచ్చేందుకు ఉపయోగిస్తారు ఉండే రెండవ తరం వ్యవస్థలు నిర్మించడానికి అవసరం.