5.2.1 ગેલેક્સી ઝૂ

ગેલેક્સી ઝૂ એક મિલિયન તારાવિશ્વો વર્ગીકૃત ઘણા બધા બિન-નિષ્ણાત સ્વયંસેવકો ના પ્રયાસો સાથે જોડાયેલું છે.

ગેલેક્સી ઝૂ 2007 ખૂબ થોડી સરળ, Schawinski તારાવિશ્વો માં રસ હતો કેવિન Schawinski, ઓક્સફર્ડ યુનિવર્સિટી ખાતે ખગોળશાસ્ત્ર માં ગ્રેજ્યુએટ વિદ્યાર્થી દ્વારા સામનો કરવો પડ્યો હતો સમસ્યા બહાર થયો હતો, અને તારાવિશ્વો દ્વારા વર્ગીકૃત કરી શકાય છે તેમના મોર્ફોલોજી-લંબગોળ અથવા સર્પાકાર અને તેમના રંગ વાદળી અથવા લાલ દ્વારા. તે સમયે, ખગોળશાસ્ત્રીઓએ વચ્ચે પરંપરાગત શાણપણ એ છે કે સર્પાકાર તારાવિશ્વો, અમારા આકાશગંગા, જેમ રંગ (સૂચવે યુવક) વાદળી હતા અને તે લંબગોળ તારાવિશ્વો રંગ લાલ હતા (વૃદ્ધાવસ્થા દર્શાવે છે). Schawinski આ પરંપરાગત શાણપણ શંકા. તેમણે શંકા છે કે, જ્યારે આ પેટર્ન સામાન્ય રીતે સાચું હોઈ શકે, ત્યાં કદાચ અપવાદ એક મોટો નંબર હતા, અને તે આ અસામાન્ય તારાવિશ્વો રાશિઓ કે ફિટ ન હતી ઘણાં અભ્યાસ દ્વારા અપેક્ષિત પેટર્ન તે પ્રક્રિયા વિશે કંઈક જાણવા શકે છે, જેના દ્વારા તારાવિશ્વો રચના કરી હતી.

આમ, શું Schawinski ક્રમમાં પરંપરાગત શાણપણ બદલવા માટે જરૂરી વૈજ્ઞાનિક વર્ગીકૃત તારાવિશ્વો મોટા સમૂહ હતી; કે, તારાવિશ્વો કે જે ક્યાં તો સર્પાકાર અથવા લંબગોળ તરીકે વર્ગીકૃત કરવામાં આવી હતી છે. સમસ્યા છે, તેમ છતાં, એ હતી કે વર્ગીકરણ માટે વર્તમાન ગાણિતિક પદ્ધતિઓ હજુ સુધી પૂરતી સારી વૈજ્ઞાનિક સંશોધન માટે વાપરી શકાય ન હતા; અન્ય શબ્દોમાં, વર્ગીકરણ તારાવિશ્વો તે સમયે, એક સમસ્યા એ છે કે કમ્પ્યુટર્સ માટે મુશ્કેલ હતું. તેથી, શું જરૂર હતી માનવ વર્ગીકૃત તારાવિશ્વો મોટી સંખ્યામાં હતા. Schawinski સ્નાતક વિદ્યાર્થી ઉત્સાહ સાથે આ વર્ગીકરણ સમસ્યા હાથ ધરી હતી. સાત, 12-કલાક દિવસ એક મેરેથોન સત્ર માં, તેમણે 50,000 તારાવિશ્વો વર્ગીકૃત કરવા માટે સક્ષમ હતી. 50,000 તારાવિશ્વો ઘણો જેવા ધ્વનિ શકે છે, તે ખરેખર લગભગ એક મિલિયન તારાવિશ્વો કે સ્લોગન ડિજિટલ સ્કાય સર્વે ફોટોગ્રાફ કરવામાં આવી હતી માત્ર 5% છે. Schawinski સમજાયું કે તે વધુ સ્કેલેબલ અભિગમ જરૂર છે.

સદનસીબે, તે તારણ છે કે વર્ગીકરણ તારાવિશ્વો કાર્ય ખગોળશાસ્ત્ર અદ્યતન તાલીમ જરૂર નથી; તમે કોઈને તે ખૂબ ઝડપથી કરવા માટે શીખવી શકે છે. અન્ય શબ્દોમાં, છતાં પણ તારાવિશ્વો વર્ગીકરણ છે કે જે કાર્ય કમ્પ્યુટર્સ માટે હાર્ડ હતી, તે મનુષ્ય માટે ખૂબ સરળ હતો. તેથી, જ્યારે ઓક્સફર્ડ, Schawinski અને સાથી ખગોળશાસ્ત્રી ક્રિસ લિન્ટોટ્ટ એક પબ બેસીને જ્યાં એક વેબસાઇટ સ્વયંસેવકો તારાવિશ્વો છબીઓ વર્ગીકૃત કરશે સપનું. થોડા મહિના પછી, ગેલેક્સી ઝૂ થયો હતો.

ગેલેક્સી ઝૂ વેબસાઇટ પર, સ્વયંસેવકો તાલીમ થોડા મિનિટ પસાર કરશે; ઉદાહરણ તરીકે, એક સર્પાકાર અને લંબગોળ ગેલેક્સી (આકૃતિ 5.2) વચ્ચે તફાવત શીખવાની. આ તાલીમ બાદ, આ સ્વયંસેવકો જાણીતા સાથે પ્રમાણમાં સરળ ક્વિઝ યોગ્ય વર્ગીકરણ 15 11 તારાવિશ્વો પસાર હતી વર્ગીકરણ અને પછી સ્વયંસેવક એક સરળ વેબ આધારિત ઇન્ટરફેસ છે (આકૃતિ 5.3) દ્વારા અજ્ઞાત તારાવિશ્વો વાસ્તવિક વર્ગીકરણ શરૂ થશે. ખગોળશાસ્ત્રી માટે સ્વયંસેવક સંક્રમણ કરતાં ઓછી 10 મિનિટ માં યોજાય છે અને માત્ર અવરોધ, એક સરળ ક્વિઝ સૌથી નીચો પસાર જરૂરી છે.

આકૃતિ 5.2: સર્પાકાર અને લંબગોળ: તારાવિશ્વો દેખાય બે મુખ્ય પ્રકારો ઉદાહરણો છે. ગેલેક્સી ઝૂ પ્રોજેક્ટ 900,000 છબીઓ કરતાં વધુ વર્ગોમાં કરતાં વધુ 100,000 સ્વયંસેવકો ઉપયોગ થાય છે. સોર્સ: www.galaxyzoo.org.

આકૃતિ 5.2: સર્પાકાર અને લંબગોળ: તારાવિશ્વો દેખાય બે મુખ્ય પ્રકારો ઉદાહરણો છે. ગેલેક્સી ઝૂ પ્રોજેક્ટ 900,000 છબીઓ કરતાં વધુ વર્ગોમાં કરતાં વધુ 100,000 સ્વયંસેવકો ઉપયોગ થાય છે. સોર્સ: www.galaxyzoo.org .

આકૃતિ 5.3: ઇનપુટ સ્ક્રીન જ્યાં મતદારો એક છબી વર્ગીકૃત કહેવામાં આવ્યું હતું. સોર્સ: www.galaxyzoo.org.

આકૃતિ 5.3: ઇનપુટ સ્ક્રીન જ્યાં મતદારો એક છબી વર્ગીકૃત કહેવામાં આવ્યું હતું. સોર્સ: www.galaxyzoo.org .

ગેલેક્સી ઝૂ તેના પ્રારંભિક સ્વયંસેવકો આકર્ષાય પછી પ્રોજેક્ટ એક સમાચાર લેખ દર્શાવવામાં આવી હતી, અને લગભગ છ મહિનામાં પ્રોજેક્ટ કરતાં વધુ 100,000 નાગરિક વૈજ્ઞાનિકો, જે લોકો ભાગ લીધો કારણ કે તેઓ કાર્ય આનંદ અને તેઓ અગાઉથી ખગોળશાસ્ત્ર મદદ કરવા માગે છે સમાવેશ થાય છે વધારો થયો હતો. સાથે, આ 100,000 સ્વયંસેવકો વર્ગીકરણ પ્રમાણમાં નાના, સહભાગીઓ કોર જૂથ આવતા મોટા ભાગના સાથે, મિલિયન કરતાં વધુ 40 વર્ગીકરણ ની કુલ યોગદાન આપ્યું (Lintott et al. 2008) .

સંશોધકો છે, જેઓ અનુભવ ભાડે અન્ડરગ્રેજ્યુએટ રીસર્ચ મદદનીશો છે તરત જ માહિતી ગુણવત્તા અંગે શંકા હોઈ શકે છે. જ્યારે આ નાસ્તિકતા વાજબી છે, ગેલેક્સી ઝૂ બતાવે છે કે જ્યારે સ્વયંસેવક યોગદાન યોગ્ય રીતે સાફ કરવામાં આવે છે debiased, અને સંકલિત, તેઓ ઉચ્ચ ગુણવત્તા પરિણામો ઉત્પન્ન કરી શકે (Lintott et al. 2008) . વ્યાવસાયિક ગુણવત્તા માહિતી બનાવવા માટે ભીડ મેળવવા માટે એક મહત્વપૂર્ણ યુક્તિ નિરર્થકતા છે; કે છે, એ જ કાર્ય ઘણા જુદા જુદા લોકો દ્વારા કરવામાં આવી હતી. ગેલેક્સી ઝૂ માં, ત્યાં ગેલેક્સી દીઠ આશરે 40 વર્ગીકરણ હતા; અન્ડરગ્રેજ્યુએટ રીસર્ચ મદદનીશો મદદથી નિરર્થકતા આ સ્તર પરવડી ન શકે અને તેથી સંશોધકો દરેક વ્યક્તિગત વર્ગીકરણ ગુણવત્તા સાથે વધુ સંબંધિત હોઈ જરૂર છે. શું સ્વયંસેવકો તાલીમ અભાવ હતો, તેઓ નિરર્થકતા સાથે કરી હતી.

પણ ગેલેક્સી દીઠ બહુવિધ વર્ગીકરણ સાથે, જો કે, પેદા કરવા માટે સ્વયંસેવક વર્ગીકરણની સમૂહ સંયોજન સર્વસંમતિ વર્ગીકરણ મુશ્કેલ છે. કારણ કે ખૂબ જ સમાન પડકારો મોટા ભાગની માનવ ગણતરી પ્રોજેક્ટ પેદા થાય છે, તે થોડા સમય માટે ત્રણ પગલાંઓ કે જે ગેલેક્સી ઝૂ સંશોધકો તેમના સર્વસંમતિ વર્ગીકરણ પેદા કરવા માટે વપરાય સમીક્ષા કરવા માટે ઉપયોગી છે. પ્રથમ, સંશોધકો બોગસ વર્ગીકરણ દૂર કરીને "સાફ" માહિતી. ઉદાહરણ તરીકે, જે લોકો વારંવાર આ જ Galaxy-કંઈક કે જે થાય છે જો તેઓ ચાલાકી કરવાનો પ્રયાસ કરવામાં આવી હતી વર્ગીકૃત તેમના તમામ વર્ગીકરણ છોડવામાં પરિણામો હતી. આ અને અન્ય સમાન સફાઈ બધા વર્ગીકરણની લગભગ 4% દૂર કર્યું.

બીજું, સફાઈ કર્યા પછી, સંશોધકો વર્ગીકરણ વ્યવસ્થિત પક્ષપાતને દૂર કરવા માટે જરૂર છે. મૂળ પ્રોજેક્ટ માટે, ઉદાહરણ તરીકે અંદર એમ્બેડ પૂર્વગ્રહ શોધ અભ્યાસ, કેટલાક સ્વયંસેવકો દર્શાવે બદલે મોનોક્રોમ ગેલેક્સી એક શૃંખલા દ્વારા રંગ સંશોધકો આવા લંબગોળ તારાવિશ્વો દૂર સર્પાકાર તારાવિશ્વો વર્ગીકૃત વ્યવસ્થિત પૂર્વગ્રહ તરીકે અનેક વ્યવસ્થિત પક્ષપાતને શોધ્યું (Bamford et al. 2009) . આ વ્યવસ્થિત પક્ષપાતને માટે એડજસ્ટ અત્યંત મહત્વપૂર્ણ છે, કારણ કે ઘણા યોગદાન સરેરાશ વ્યવસ્થિત પૂર્વગ્રહ દૂર કરતું નથી; તે માત્ર રેન્ડમ ભૂલ દૂર કરે છે.

છેલ્લે, debiasing બાદ, સંશોધકો વ્યક્તિગત વર્ગીકરણ ભેગા સર્વસંમતિ વર્ગીકરણ પેદા કરવા માટે એક પદ્ધતિ જરૂર છે. દરેક ગેલેક્સી માટે વર્ગીકરણ ભેગા સરળ માર્ગ સૌથી સામાન્ય વર્ગીકરણ પસંદ કરવા માટે હશે. જો કે, આ અભિગમ દરેક સ્વયંસેવક સમાન વજન આપશે, અને સંશોધકો શંકા છે કે કેટલાક સ્વયંસેવકો અન્ય કરતાં વર્ગીકરણ પર વધુ સારી હતી. તેથી, સંશોધકો વધુ જટિલ પુનરાવર્તન વજન પ્રક્રિયા છે કે જે આપોઆપ શ્રેષ્ઠ ક્લાસિફાયર્સ શોધી શકે છે અને તેમને વધુ વજન આપવા પ્રયત્ન કરે છે વિકસાવી છે.

આમ, ત્રણ પગલું પ્રક્રિયા સફાઈ, debiasing, અને વજન-galaxy ઝૂ સંશોધન ટીમ પછી સર્વસંમતિ મોર્ફોલોજિકલ વર્ગીકરણ સમૂહ માં 40 મિલિયન સ્વયંસેવક વર્ગીકરણ રૂપાંતર કર્યું હતું. આ ગેલેક્સી ઝૂ વર્ગીકરણ વ્યવસાયી ખગોળશાસ્ત્રીઓ દ્વારા અગાઉના ત્રણ નાના પાયે પ્રયાસો Schawinski દ્વારા વર્ગીકરણ છે કે જે ગેલેક્સી ઝૂ પ્રેરણા મદદ કરી સહિત સરખામણીમાં હતા, ત્યારે ત્યાં મજબૂત કરાર હતો. આમ, સ્વયંસેવકો, એકંદર, ઉચ્ચ ગુણવત્તા વર્ગીકરણ પૂરી પાડવા માટે સક્ષમ હતા અને સ્કેલ છે કે સંશોધકો સાથે મેળ ખાતી નથી શકે (Lintott et al. 2008) . હકીકતમાં, તારાવિશ્વો આટલી મોટી સંખ્યામાં માનવ વર્ગીકરણ કર્યા દ્વારા, Schawinski, લિન્ટોટ્ટ, અને અન્ય બતાવવા માટે કે તારાવિશ્વો માત્ર 80% અપેક્ષા પેટર્ન વાદળી spirals અને લાલ ellipticals અને અસંખ્ય કાગળો અનુસરો વિશે લખવામાં આવ્યા છે માટે સમર્થ હતા આ શોધ (Fortson et al. 2011) .

આ પૃષ્ઠભૂમિ આપેલ છે, આપણે હવે જોઈ શકો છો કે કેવી રીતે ગેલેક્સી ઝૂ નીચે વિભાજીત અરજી-ભેગા રેસીપી, તે જ રેસીપી છે કે મોટા ભાગના માનવ ગણતરી પ્રોજેક્ટ માટે ઉપયોગ થાય છે. પ્રથમ, એક મોટી સમસ્યા હિસ્સામાં વિભાજિત છે. આ કિસ્સામાં, એક મિલિયન તારાવિશ્વો વર્ગીકરણ સમસ્યા એક ગેલેક્સી વર્ગીકરણ એક મિલિયન સમસ્યાઓ વિભાજિત છે. આગળ, ઓપરેશન સ્વતંત્ર દરેક ભાગ માટે લાગુ પડે છે. આ કિસ્સામાં, એક સ્વયંસેવક ક્યાં સર્પાકાર અથવા લંબગોળ દરેક ગેલેક્સી વર્ગીકૃત કરશે. છેલ્લે, પરિણામો સર્વસંમતિ પરિણામ પેદા કરવા માટે જોડવામાં આવે છે. આ કિસ્સામાં, ભેગા પગલું સફાઈ, debiasing, અને વજન દરેક ગેલેક્સી માટે સર્વસંમતિ વર્ગીકરણ પેદા કરવા માટે સમાવેશ થાય છે. તેમ છતાં મોટા ભાગના પ્રોજેક્ટ આ સામાન્ય રેસીપી ઉપયોગ માટે, આ પગલાંઓ દરેક ચોક્કસ સમસ્યા સંબોધવામાં આવી રહી માટે કસ્ટમાઇઝ કરવા માટે જરૂર છે. ઉદાહરણ તરીકે, નીચે વર્ણવાયેલ માનવ ગણતરી પ્રોજેક્ટ, તે જ રેસીપી અનુસરવામાં આવશે, પરંતુ લાગુ પડે છે અને ભેગા પગલાંઓ તદ્દન અલગ હશે.

ગેલેક્સી ઝૂ ટીમ માટે, આ પ્રથમ પ્રોજેક્ટ માત્ર શરૂઆત હતી. ખૂબ જ ઝડપથી તેઓ સમજાયું કે ભલે તેઓ એક મિલિયન તારાવિશ્વો માટે બંધ વર્ગીકૃત કરવા માટે સમર્થ હતા, આ સ્કેલ નવા ડિજિટલ સ્કાય સર્વે, જે આશરે 10 અબજ તારાવિશ્વો છબીઓ પેદા કરી શકે છે સાથે કામ કરવા માટે પૂરતી નથી (Kuminski et al. 2014) . 1 મિલિયન 10 થી વધારો નિયંત્રિત કરવા અબજ 10,000-galaxy ઝૂ પરિબળ આશરે 10,000 વખત વધુ સહભાગીઓ ભરતી કરવાની જરૂર છે. તેમ છતાં ઈન્ટરનેટ પર સ્વયંસેવકો સંખ્યા મોટી છે, તે અનંત છે. તેથી, સંશોધકો લાગ્યું કે તેઓ ડેટા એક નવું, પણ વધુ સ્કેલેબલ, અભિગમ જરૂરી હતી માત્રામાં ક્યારેય વધતી નિયંત્રિત કરવા માટે જતા હોય છે, તો.

તેથી, આ Manda બેનરજીએ કામ કેવિન Schawinski, ક્રિસ લિન્ટોટ્ટ, અને ગેલેક્સી ઝૂ ટીમના શરૂ શિક્ષણ એન્જીનિયરિંગ અન્ય સભ્યો સાથે તારાવિશ્વો વર્ગીકૃત. વધુ ખાસ રીતે, માનવ ગેલેક્સી ઝૂ દ્વારા બનાવવામાં વર્ગીકરણ ઉપયોગ કરીને Banerji et al. (2010) એક મશીન શિક્ષણ મોડેલ કે જે ઇમેજ લાક્ષણિકતાઓ પર આધારિત ગેલેક્સી માનવ વર્ગીકરણ આગાહી કરી શકે છે બનાવી છે. આ મશીન શિક્ષણ મોડેલ ઊંચી સચોટતા સાથે માનવ વર્ગીકરણ પ્રજનન કરી શકે છે, તો પછી તે તારાવિશ્વો એક અનિવાર્યપણે અનંત નંબર વર્ગીકૃત ગેલેક્સી ઝૂ સંશોધકો દ્વારા ઉપયોગ કરી શકાય.

બેનરજીએ અને સહકર્મીઓ 'અભિગમ કોર ખરેખર ખૂબ પદ્ધતિઓને સામાન્યપણે સામાજિક સંશોધન ઉપયોગમાં સમાન છે, જો કે તે સમાનતા પ્રથમ નજરમાં સ્પષ્ટ ન પણ હોઈ શકે. પ્રથમ, બેનરજી અને સહકર્મીઓ આંકડાકીય લક્ષણો કે જે સારાંશ તે મિલકત છે સમૂહ માં દરેક ઇમેજ રૂપાંતરિત. છબી વાદળી જથ્થો, પિક્સેલ તેજ અંતરના, અને બિન-સફેદ પિક્સેલ્સ પ્રમાણ: ઉદાહરણ તરીકે, તારાવિશ્વો છબીઓ માટે ત્રણ લક્ષણો હોઈ શકે છે. યોગ્ય લક્ષણો પસંદગી સમસ્યા એક મહત્વપૂર્ણ ભાગ છે, અને તે સામાન્ય રીતે વિષય વિસ્તાર નિપુણતા જરૂરી છે. આ પ્રથમ પગલું છે, સામાન્ય રીતે લક્ષણ એન્જિનિયરિંગ કહેવાય છે, છબી દીઠ એક પંક્તિ અને પછી ત્રણ કે મૂર્તિનું વર્ણન કૉલમ સાથે ડેટા મેટ્રિક્સ માં પરિણમે છે. માહિતી મેટ્રિક્સ અને ઇચ્છિત આઉટપુટ (દા.ત., પછી તે ચિત્ર એક લંબગોળ ગેલેક્સી તરીકે માનવ દ્વારા વર્ગીકૃત કરવામાં આવ્યો હતો), સંશોધક એક આંકડાકીય મોડલ છે-ઉદાહરણ તરીકે પરિમાણો અંદાજ, એક પરીવહન રીગ્રેસન સુધારાયું કે માનવ આધારિત વર્ગીકરણ આગાહી કંઈક આપેલ છબી ના લક્ષણો છે. છેલ્લે, સંશોધક આ આંકડાકીય મોડલ પરિમાણો વાપરે છે (આકૃતિ 5.4) નવી તારાવિશ્વો અંદાજે વર્ગીકરણ પેદા કરે છે. એક સામાજિક એનાલોગ લાગે, કલ્પના કરો કે તમે એક મિલિયન વિદ્યાર્થીઓ વિશે વસ્તી વિષયક માહિતી હતી, અને તમને ખબર છે કે શું તેઓ કોલેજ નથી અથવા સ્નાતક થયા. તમે આ ડેટા માટે પરીવહન રીગ્રેસન સુધારાયું ફિટ કરી શકે છે, અને પછી તમે પરિણામે મોડેલ પરિમાણો ઉપયોગ કરી શકે છે આગાહી છે કે શું નવા વિદ્યાર્થીઓ કોલેજ ગ્રેજ્યુએટ જતા હોય છે. મશીન શિક્ષણ માં, આ અભિગમ ઉપયોગ લેબલ ઉદાહરણો આંકડાકીય મોડલ કે પછી નવું લેબલ કરી શકો છો બનાવવા માટે ડેટા કહેવાય શીખવાની દેખરેખ (Hastie, Tibshirani, and Friedman 2009) .

આકૃતિ 5.4: કેવી રીતે બેનરજીએ એટ અલ સરળ વર્ણન. (2010) ગેલેક્સી ઝૂ વર્ગીકરણ ઉપયોગ એક મશીન શિક્ષણ મોડલ ટ્રેન ગેલેક્સી વર્ગીકરણ કરવું. તારાવિશ્વો છબીઓ લક્ષણો મેટ્રિક્સ માં રૂપાંતરિત કરવામાં આવી હતી. આ સરળ ઉદાહરણમાં ત્રણ લક્ષણો (ઇમેજ વાદળી જથ્થો, પિક્સેલ તેજ અંતરના, અને બિન-સફેદ પિક્સેલ્સ પ્રમાણ) છે. પછી, છબીઓ ઉપગણ માટે, ગેલેક્સી ઝૂ લેબલ્સ એક મશીન શિક્ષણ મોડેલ તાલીમ આપવા માટે વપરાય છે. છેલ્લે, મશીન શિક્ષણ બાકી તારાવિશ્વો માટે વર્ગીકરણ અંદાજ માટે વપરાય છે. હું આ પ્રોજેક્ટ આ પ્રકારની કૉલ બીજી પેઢી માનવ કોમ્પ્યુટેશનલ પ્રોજેક્ટ કારણ કે, તેના બદલે આવી રહી મનુષ્યો સમસ્યા ઉકેલવા માટે, તેઓ માનવો એક dataset કે સમસ્યા હલ કરવા માટે કમ્પ્યુટર તાલીમ માટે વાપરી શકાય છે બિલ્ડ છે. આ કમ્પ્યુટર આસિસ્ટેડ અભિગમ ફાયદો એ છે કે તે તમને માત્ર માનવ પ્રયાસ એક મર્યાદિત રકમ મદદથી માહિતી અનિવાર્યપણે અનંત માત્રામાં નિયંત્રિત કરવા માટે સક્રિય કરે છે.

આકૃતિ 5.4: કેવી રીતે સરળ વર્ણન Banerji et al. (2010) ગેલેક્સી ઝૂ વર્ગીકરણ ઉપયોગ એક મશીન શિક્ષણ મોડલ ટ્રેન ગેલેક્સી વર્ગીકરણ કરવું. તારાવિશ્વો છબીઓ લક્ષણો મેટ્રિક્સ માં રૂપાંતરિત કરવામાં આવી હતી. આ સરળ ઉદાહરણમાં ત્રણ લક્ષણો (ઇમેજ વાદળી જથ્થો, પિક્સેલ તેજ અંતરના, અને બિન-સફેદ પિક્સેલ્સ પ્રમાણ) છે. પછી, છબીઓ ઉપગણ માટે, ગેલેક્સી ઝૂ લેબલ્સ એક મશીન શિક્ષણ મોડેલ તાલીમ આપવા માટે વપરાય છે. છેલ્લે, મશીન શિક્ષણ બાકી તારાવિશ્વો માટે વર્ગીકરણ અંદાજ માટે વપરાય છે. હું આ પ્રોજેક્ટ આ પ્રકારની કૉલ બીજી પેઢી માનવ કોમ્પ્યુટેશનલ પ્રોજેક્ટ કારણ કે, તેના બદલે આવી રહી મનુષ્યો સમસ્યા ઉકેલવા માટે, તેઓ માનવો એક dataset કે સમસ્યા હલ કરવા માટે કમ્પ્યુટર તાલીમ માટે વાપરી શકાય છે બિલ્ડ છે. આ કમ્પ્યુટર આસિસ્ટેડ અભિગમ ફાયદો એ છે કે તે તમને માત્ર માનવ પ્રયાસ એક મર્યાદિત રકમ મદદથી માહિતી અનિવાર્યપણે અનંત માત્રામાં નિયંત્રિત કરવા માટે સક્રિય કરે છે.

લક્ષણો Banerji et al. (2010) મશીન શિક્ષણ મોડેલ મારા રમકડાની તે ઉદાહરણ માટે, ઉદાહરણ તરીકે, તે લક્ષણો જેમ ઉપયોગ કરતાં વધુ જટિલ હતા "દ Vaucouleurs અક્ષીય ગુણોત્તર ફિટ" અને તેના મોડેલ પરીવહન રીગ્રેસન સુધારાયું ન હતી, તે એક કૃત્રિમ ન્યુરલ નેટવર્ક હતી. તેના લક્ષણો, તેના મોડેલ અને સર્વસંમતિ ગેલેક્સી ઝૂ વર્ગીકરણ મદદથી, તે દરેક લક્ષણ પર વજન બનાવો, અને પછી તારાવિશ્વો વર્ગીકરણ વિશે આગાહી કરવા માટે આ વજન ઉપયોગ કરવાનો હતો. ઉદાહરણ તરીકે, તેના વિશ્લેષણમાં જાણવા મળ્યું છે કે ઓછા સાથે "દ Vaucouleurs અક્ષીય ગુણોત્તર ફિટ" છબીઓ વધુ સર્પાકાર તારાવિશ્વો હોઈ શકે તેવી શક્યતા હતી. આ વજન આપેલ છે, તે વાજબી ચોકસાઇ સાથે ગેલેક્સી માનવ વર્ગીકરણ આગાહી કરવા સક્ષમ હતી.

કામ Banerji et al. (2010) હું શું બીજી પેઢી માનવ ગણતરી સિસ્ટમ કૉલ કરશે કે ગેલેક્સી ઝૂ નહીં. શ્રેષ્ઠ રીતે આ બીજી પેઢીના સિસ્ટમો વિશે લાગે છે કે બદલે કર્યા મનુષ્યો સમસ્યા ઉકેલવા માટે, તેઓ માનવો એક dataset કે સમસ્યા હલ કરવા માટે કમ્પ્યુટર તાલીમ માટે વાપરી શકાય છે બિલ્ડ હોય છે. કમ્પ્યુટર તાલીમ આપવા માટે જરૂરી માહિતી જથ્થો એટલું વિશાળ હતું કે બનાવવા માટે માનવ માસ સહયોગ જરૂરી હોઈ શકે છે. ગેલેક્સી ઝૂ દ્વારા ઉપયોગ ન્યુરલ નેટવર્ક્સ કિસ્સામાં Banerji et al. (2010) એક મોડેલ કે વિશ્વસનીય માનવ વર્ગીકરણ પ્રજનન કરવા સક્ષમ હતી બિલ્ડ કરવા માટે માનવ લેબલ ઉદાહરણો ખૂબ જ મોટી સંખ્યામાં જરૂરી છે.

આ કમ્પ્યુટર આસિસ્ટેડ અભિગમ ફાયદો એ છે કે તે તમને માત્ર માનવ પ્રયાસ એક મર્યાદિત રકમ મદદથી માહિતી અનિવાર્યપણે અનંત માત્રામાં નિયંત્રિત કરવા માટે સક્રિય કરે છે. ઉદાહરણ તરીકે, એક મિલિયન માનવ વર્ગીકૃત તારાવિશ્વો સાથે એક સંશોધક આગાહીયુક્ત મોડલ કે પછી એક અબજ અથવા તો એક ટ્રિલિયન તારાવિશ્વો વર્ગીકૃત કરવા માટે વાપરી શકાય બનાવી શકો છો. તારાવિશ્વો પ્રચંડ નંબરો છે, તો પછી માનવ કોમ્પ્યુટર સંકર આ પ્રકારની ખરેખર માત્ર શક્ય ઉકેલ છે. આ અનંત માપનીયતા જો મફત નથી. એક મશીન શિક્ષણ મોડેલ કે યોગ્ય રીતે માનવ વર્ગીકરણ ફરી ઉત્પાદિત કરી શકાય પોતે હાર્ડ સમસ્યા છે બનાવી, પરંતુ સદભાગ્યે ત્યાં પહેલેથી જ ઉત્તમ આ વિષય માટે સમર્પિત પુસ્તકો છે (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

ગેલેક્સી ઝૂ અનેક માનવ ગણતરી પ્રોજેક્ટ ઉત્ક્રાંતિ બતાવે છે. પ્રથમ, એક સંશોધક પોતાને દ્વારા અથવા સંશોધન મદદનીશો એક નાની ટીમ (દા.ત., Schawinski પ્રારંભિક વર્ગીકરણ પ્રયાસ) સાથે પ્રોજેક્ટ કરે છે. આ અભિગમ સાથે પરિમાણ નથી, તો સંશોધક માનવ ગણતરી પ્રોજેક્ટ જ્યાં ઘણા લોકો વર્ગીકરણ ફાળો ખસેડી શકો છો. પરંતુ, માહિતી ચોક્કસ વોલ્યુમ માટે, શુદ્ધ માનવ પ્રયાસ પૂરતી રહેશે નહીં. તે સમયે, સંશોધકો બીજી પેઢીના સિસ્ટમો જ્યાં માનવ વર્ગીકરણ એક મશીન શિક્ષણ મોડેલ કે પછી માહિતી વર્ચ્યુઅલ અમર્યાદિત માત્રામાં લાગુ કરી શકાય છે તાલીમ આપવા માટે ઉપયોગ કરવામાં આવે છે બિલ્ડ કરવાની જરૂર છે.