5.2.1 Galaxy Zoo

Galaxy Zoo Mitambatra ny ezaka ataon'ny olona maro tsy manam-pahaizana mpiasa an-tsitrapo ny nanasokajy iray tapitrisa vahindanitra.

Galaxy Zoo nitombo avy tamin 'ny olana mianjady amin'ny Kevin Schawinski, nahazo diplaoma tamin'ny Astronomia mpianatra ao amin'ny Oniversiten'i Oxford tamin'ny 2007. manatsotra tena kely, no liana amin'ny Schawinski vahindanitra, ary ny vahindanitra azo sokajiana araka ny Morphologie-boribory lavalava na miolakolaka-ary araka ny loko manga na mena. Tamin'izany fotoana izany, fahendrena amin'ny efa mahazatra astronoma dia hoe miolakolaka vahindanitra, toy ny Voie, dia manga ny lokony (manondro tanora) ary boribory lavalava vahindanitra ireo mena ny lokony (milaza antitra). Schawinski nisalasala mahazatra izany ny fahendrena. Izy niahiahy fa raha izany toromarika mety ho marina amin'ny ankapobeny, nisy angamba ny maromaro izay ahitana maro ankoatra ny tranga miavaka, ary amin'ny alalan'ny fandalinana maro ny tsy mahazatra vahindanitra-ireo izay tsy mifanaraka amin'ny nantenaina lamina-fa afaka mianatra zavatra momba ny dingana amin'ny alalan'ny izay vahindanitra niforona.

Noho izany, inona no Schawinski ilaina mba handravana mahazatra fahendrena dia lehibe napetraka ny morphologically tsiambaratelo vahindanitra; izany hoe, vahindanitra izay efa sokajiana ho na miolakolaka na boribory lavalava. Ny olana, na izany aza, dia ny hoe efa misy algorithmic fomba ho an'ny fanasokajiana tsy mbola ampy tsara mba ho ampiasaina amin'ny fikarohana siantifika; amin'ny teny hafa, classifying vahindanitra teo, tamin'izany andro izany, olana izay sarotra ho an'ny solosaina. Noho izany, inona no ilaina dia maro ny olona sokajiana vahindanitra. Schawinski nanaiky io fanasokajiana olana miaraka amin'ny hafanam-po ny mpianatra nahazo diplaoma. Nandritra ny hazakazaka lavitra ezaka fivoriana fito, 12-ora andro, dia afaka ny nanasokajy 50.000 vahindanitra. Raha 50.000 vahindanitra Mety ho toa toy ny be, fa raha ny marina ihany no tokony ho 5% ny efa ho iray tapitrisa vahindanitra izay efa sary ao amin'ny Sloan Digital Sky Survey. Schawinski takany fa nila ny fomba scalable kokoa.

Soa ihany, raha ny fandehany fa ny asa ny classifying vahindanitra tsy mitaky nandroso fiofanana amin'ny astronomia; dia afaka mampianatra ny olona hanao izany tsara tarehy haingana. Amin'ny teny hafa, na dia classifying vahindanitra dia asa izay Mafy ordinatera, dia mora ho an'ny olona tsara tarehy. Noho izany, raha mbola nipetraka teo amin'ny Pub any Oxford, Schawinski sy ny mpiara-astronoma Chris Lintott nanonofy ny tranonkala izay mpiasa an-tsitrapo no manasokajy sary ny vahindanitra. Volana vitsivitsy tatỳ aoriana, Galaxy Zoo teraka.

Tamin'ny Galaxy Zoo vohikala, mpiasa an-tsitrapo hiaritra minitra vitsy ny fiofanana; ohatra, ny fianarana ny fahasamihafana eo amin'ny miolakolaka sy ny boribory lavalava kintana iray (Sary 5.2). Rehefa afaka izany, fiofanana, ny mpiasa an-tsitrapo tsy maintsy mandalo ny somary mora quiz-marina classifying 11 ny 15 vahindanitra amin'ny sokajy fantatra-ary avy eo dia ny mpilatsaka an-tsitrapo dia hanomboka tena fanasokajiana ny vahindanitra tsy fantatra tsotra amin'ny alalan'ny tranonkala mifototra amin'ny interface tsara (Sary 5.3). Ny tetezamita avy amin'ny an-tsitrapo ny astronoma hitranga amin'ny latsaky ny 10 minitra ary nitaky mandalo ihany ny vato misakana ny ambany indrindra, tsotra fanontaniana.

Sary 5.2: Ohatra ny roa lehibe karazana vahindanitra: miolakolaka sy boribory lavalava. Ny tetikasa Zoo Galaxy ampiasaina mihoatra ny 100.000 mpiasa an-tsitrapo ny sokajy mihoatra ny 900,000 sary. Source: www.galaxyzoo.org.

Sary 5.2: Ohatra ny roa lehibe karazana vahindanitra: miolakolaka sy boribory lavalava. Ny tetikasa Zoo Galaxy ampiasaina mihoatra ny 100.000 mpiasa an-tsitrapo ny sokajy mihoatra ny 900,000 sary. Source: www.galaxyzoo.org .

Sary 5.3: dreninao lamba izay mpifidy no nangataka ny nanasokajy sary iray. Source: www.galaxyzoo.org.

Sary 5.3: dreninao lamba izay mpifidy no nangataka ny nanasokajy sary iray. Source: www.galaxyzoo.org .

Galaxy Zoo Nahasarika ny mpirotsaka an-tsitrapo voalohany taorian'ny tetikasa dia nasongadina tao amin'ny lahatsoratra vaovao, sy ny tokony ho enim-bolana ny tetikasa nitombo ny anjara mihoatra ny 100.000 olom-pirenena mpahay siansa, ny olona izay nandray anjara satria nankafy ny asa ary te hanampy mialoha astronomia. Miara, ireo mpiasa an-tsitrapo nandray anjara 100.000 tanteraka ny mihoatra ny 40 tapitrisa sokajy, ny ankamaroan'ny ny sokajy avy somary vitsy, fototra vondrona mpandray anjara (Lintott et al. 2008) .

Mpikaroka izay manana traikefa fandraisana mpiasa avokoa ny undergraduate fikarohana mpanampy mety ho resy lahatra avy hatrany ny tahirin-kevitra tsara. Raha izany fisalasalana dia mahay mandanjalanja, Galaxy Zoo dia mampiseho fa rehefa fanomezana an-tsitrapo nanadio ireo marina, debiased, ka aggregated, dia afaka mamokatra vokatra avo-tsara (Lintott et al. 2008) . Iray manan-danja ho an'ny mahazo fika ny vahoaka mba hamoronana tahirin-kevitra kalitao matihanina dia leon'ny; izany hoe, satria manana izany asa tanterahana amin'ny alalan'ny olona maro samy hafa. Ao amin'ny Galaxy Zoo, dia nisy tokony ho 40 sokajy isaky ny vahindanitra; mpikaroka mampiasa undergraduate fikarohana mpanampy nanam-bola mihitsy izany haavon'ny leon'ny ka noho izany mila ho be zava-dehibe kokoa ny hatsaran'ny fanasokajiana tsirairay. Inona ny mpiasa an-tsitrapo Tsy ampy amin'ny fampiofanana, dia nataony ho amin'ny leon'ny.

Na dia eo aza sokajy maro isan-Vondron-kintana, na izany aza, natambatra ny hametraka ny mpirotsaka an-tsitrapo sokajy hamokatra ny marimaritra iraisana fanasokajiana dia mamitaka. Satria tena mitovy olana mipoitra eo amin'ny ankamaroan'ny olona computation tetikasa, dia manampy ny famerenana fohy ny telo dingana izay ny Galaxy mpikaroka Zoo ampiasaina mba hampisy ny marimaritra iraisana sokajy. Voalohany, ny mpikaroka "nanadio" ny tahirin-kevitra amin'ny alalan'ny fanesorana sandoka sokajy. Ohatra, ny olona izay imbetsaka voasokajy mitovy kintana-zavatra izay mety hitranga raha miezaka izy ireo ny fitaovana ny vokatra-nanana ny sokajy rehetra nariana. Izany sy ny toy izany koa hafa fanadiovana nesorina ny 4% amin'ny sokajy rehetra.

Faharoa, rehefa avy fanadiovana, ny mpikaroka ilaina mba hanala mitohy mifanavakavaka ao amin'ny sokajy. Tamin'ny alalan'ny andiana fitongilanana tratra fianarana nandinika lalina ao anatin'ny tany am-boalohany tetikasa-ohatra, mampiseho ny sasany mpiasa an-tsitrapo ny kintana iray ao doko fa tsy ny loko-ny mpikaroka nahita maro mitohy mifanavakavaka, toy ny paika fitongilanana ny nanasokajy lavitra miolakolaka vahindanitra ho boribory lavalava vahindanitra (Bamford et al. 2009) . Fanitsiana ireo mifanavakavaka maty paika no tena zava-dehibe, satria salan'isa fanomezana maro tsy hanala mitohy fitongilanana; izany ihany no mamindra kisendrasendra fahadisoana.

Farany, rehefa avy debiasing, ny mpikaroka nila ny fomba mba hanambatra ny tsirairay sokajy ny ho lasa marimaritra iraisana fanasokajiana. Ny fomba tsotra indrindra manambatra ny sokajy isaky ny vahindanitra dia ny mifidy ny fanasokajiana mahazatra indrindra. Na izany aza, io fomba mpilatsaka an-tsitrapo tsirairay hanome lanja mitovy, sy ny mpikaroka ahiahiana fa misy mpiasa an-tsitrapo ao amin'ny fanasokajiana dia tsara kokoa noho ny hafa. Noho izany, ny mpikaroka Lasa sarotra kokoa iterative weighting fomba izay miezaka ny mamantatra ny tsara indrindra hatrany classifiers ka omeo lanjany bebe kokoa.

Noho izany, taorian'ny dingana telo-dingana fanadiovana, debiasing, sy weighting-ny Galaxy Zoo fikarohana efa niova fo ekipa 40 tapitrisa sokajy an-tsitrapo ho napetraka ny marimaritra iraisana morphological sokajy. Rehefa Galaxy ireo Zoo sokajy telo ireo raha oharina amin'ny teo aloha kely-ambaratonga ezaka amin'ny astronoma matihanina, anisan'izany ny fanasokajiana ny Schawinski izay nanampy ny aingam-panahy Galaxy Zoo, nisy fifanarahana mafy. Noho izany, ny mpiasa an-tsitrapo, amin'ny aggregate, dia afaka manome sokajy avo lenta sy amin'ny mizana ny mpikaroka fa tsy mifanaraka (Lintott et al. 2008) . Raha ny marina, amin'ny alalan'ny manana olombelona sokajy ho toy izany maro ny vahindanitra, Schawinski, Lintott, sy ny hafa dia afaka mampiseho fa ny ihany no tokony ho 80% ny vahindanitra hanaraka ny andrasana lamina-manga spirals sy mena ellipticals-ary maro taratasy no nanoratana izany fahitana (Fortson et al. 2011) .

Noho izany fototra, izao isika dia afaka mahita ny fomba Galaxy Zoo dia manaraka ny fisarahana-mampihatra-hanambatra fomba fahandro, mitovy fomba fahandro izay ampiasaina ho an'ny ankamaroan'ny olona computation tetikasa. Voalohany, olana lehibe dia Nizara roa ny chunks. Amin'ity tranga ity, ny olana ny classifying vahindanitra iray tapitrisa no Nizara roa ny olana iray tapitrisa ny vahindanitra classifying iray. Manaraka, fandidiana dia ampiharina amin'ny tsirairay chunk tsy miankina. Amin'ity tranga ity, ny mpilatsaka an-tsitrapo dia manasokajy vahindanitra tsirairay toy ny na miolakolaka na boribory lavalava. Farany, ny valiny dia mitambatra hamokatra ny marimaritra iraisana vokany. Amin'ity tranga ity, ny miray tsikombakomba Anisan'ny dingana ny fanadiovana, debiasing, sy weighting mba hamokarana ny marimaritra iraisana fanasokajiana isaky ny vahindanitra. Na dia mampiasa ny ankamaroan'ny tetikasa ankapobeny izany fomba fandrahoan-tsakafo, ny tsirairay avy ny dingana mila namboarina ny olana manokana iresahana. Ohatra, ao amin'ny olombelona computation tetikasa voalaza eto ambany, ny fomba fandrahoan-tsakafo ihany no arahina, fa ny hampihatra sy miray tsikombakomba dingana ho samy hafa be.

Fa ny kintana Zoo ekipa, io tetikasa voalohany fotsiny am-piandohana. Very haingana dia tonga saina fa na dia izay hainy ny nanasokajy manakaiky ny iray tapitrisa vahindanitra, kongonina izany dia tsy ampy ny miasa miaraka amin'ny vaovao nomerika lanitra fanadihadiana, izay afaka mamokatra sarin'ny tokony ho 10 lavitrisa vahindanitra (Kuminski et al. 2014) . Mba hiatrehana ny fitomboana amin'ny 1 tapitrisa ka hatramin'ny 10 miliara-toe-javatra ny 10.000-Galaxy Zoo dia tokony handray mitovitovy 10.000 heny mpandray anjara. Na dia ny isan'ny mpiasa an-tsitrapo ao amin'ny Internet no lehibe, tsy manam-petra. Noho izany, ny mpikaroka fa raha tonga saina izy ireo handeha hiatrehana tsy mitsaha-mitombo be ny tahirin-kevitra, vaovao, scalable kokoa, fomba nilaina.

Noho izany, Manda Banerji-miasa amin'ny Kevin Schawinski, Chris Lintott, sy ny mpikambana hafa ao amin'ny Galaxy Zoo ekipa-manomboka fampianarana ordinatera ny nanasokajy vahindanitra. More manokana, mampiasa ny olombelona sokajy namorona ny kintana Zoo, Banerji et al. (2010) nanorina milina fianarana modely izay afaka milaza mialoha ny olombelona fanasokajiana ny kintana miorina amin'ny toetoetry ny sary. Raha milina modely fianarana afaka miteraka ny olona sokajy avo araka ny marina, dia mety ampiasaina amin'ny Galaxy Zoo mpikaroka ny nanasokajy ny tsy manam-petra indrindra isan'ny vahindanitra.

Ny fototry ny Banerji sy ny mpiara-miasa aminy 'raha ny marina fomba somary mitovy amin'ny teknika fampiasa amin'ny fikarohana ara-tsosialy, na izay mety tsy ho fitoviana mazava Raha vao jerena. Voalohany, Banerji sy ny mpiara-miasa tsirairay niova fo sary ho napetraka ny numeric lafin-javatra izay mamintina izany fananana. Ohatra, ny sary ny vahindanitra tsy mety ho endri-javatra telo: ny habetsaky ny manga eo amin'ny sary, ny hampifandrafy ao ny famirapiratry ny teboka, ary ny ohatry ny tsy fotsy teboka. Ny fifantenana ny marina endri-javatra dia ampahany manan-danja ny olana, ary foto-kevitra ankapobeny dia mitaky-faritra fahaizany. Ity dingana voalohany, antsoina hoe endri-javatra injeniera, vokatr'izany ny angon-drakitra teraka tamin'ny toerana iray isaky ny sary, ary avy eo dia andry telo mamaritra ny sary. Noho ny angona teraka sy ny naniry output (ohatra, na ny sampy no teo voasokajy araka ny olombelona ho boribory lavalava kintana iray), ny mpikaroka milaza ny masontsivana ny antontan'isa modely, ohatra, zavatra toy ny pitaovana ny fihemoran'ny-izay mialoha ny olombelona fanasokajiana mifototra eo amin'ny endri-javatra ny sary. Farany, ny mpikaroka mampiasa ny masontsivana ao amin'ny antontan'isa ity modely mba hamokatra vinavinaina sokajy vaovao vahindanitra (Sary 5.4). Eritrereto ny ara-tsosialy Analog, sary an-tsaina fa mbola nanan-isan'ny mponina fanazavana momba ny iray tapitrisa ireo mpianatra, ary fantatrareo na nahazo diplaoma tany amin'ny oniversite na tsia. Afaka mifanaraka ny pitaovana ny fihemoran'ny ho tahirin-kevitra ity, ary dia afaka mampiasa ny vokatry ny modely masontsivana hilaza mialoha na ireo mpianatra vaovao ireo handeha diplaoma tany amin'ny oniversite. Ao amin'ny milina ny fianarana, izany fomba-mampiasa misy soratra hoe ohatra ny antontan'isa mamorona modely izay afaka dia milaza vaovao data-dia antsoina hoe niandraikitra ny fianarana (Hastie, Tibshirani, and Friedman 2009) .

Sary 5.4: notsorina famaritana ny fomba Banerji et al. (2010) Nampiasa ny Galaxy Zoo sokajy mba hampiofana ny milina modely fianarana hanao vahindanitra fanasokajiana. Images ny vahindanitra niova fo tao amin'ny lasitra ny endri-javatra. Ao amin'io ohatra notsorina misy lafiny telo (ny habetsaky ny manga eo amin'ny sary, ny hampifandrafy ao amin'ny famirapiratan'ny ny teboka, ary ny ohatry ny tsy fotsy teboka). Avy eo, ho subset ny sary, ny Galaxy marika Zoo dia ampiasaina mba hampiofana ny milina modely fianarana. Farany, ny milina fianarana dia ampiasaina mba Tombanan'ny sokajy ho vahindanitra ny ambiny. Dia miantso izany karazana tetikasa faharoa-taranaka olombelona tetikasa kajy amin'ny solosaina, satria, noho ny manana ny olona hamaha ny olana, dia manana ny olona hanangana dataset izay azo ampiasaina mba hampiofanana ny solosaina mba hamaha ny olana. Ny tombony ity solosaina-nanampy fomba fiasa dia ny hoe manampy anao mba hiatrehana indrindra tsy manam-petra dia be ny tahirin-kevitra mampiasa voafetra ihany ny habetsahan'ny ezaka olombelona.

Sary 5.4: notsorina famaritana ny fomba Banerji et al. (2010) Nampiasa ny Galaxy Zoo sokajy mba hampiofana ny milina modely fianarana hanao vahindanitra fanasokajiana. Images ny vahindanitra niova fo tao amin'ny lasitra ny endri-javatra. Ao amin'io ohatra notsorina misy lafiny telo (ny habetsaky ny manga eo amin'ny sary, ny hampifandrafy ao amin'ny famirapiratan'ny ny teboka, ary ny ohatry ny tsy fotsy teboka). Avy eo, ho subset ny sary, ny Galaxy marika Zoo dia ampiasaina mba hampiofana ny milina modely fianarana. Farany, ny milina fianarana dia ampiasaina mba Tombanan'ny sokajy ho vahindanitra ny ambiny. Dia miantso izany karazana tetikasa faharoa-taranaka olombelona tetikasa kajy amin'ny solosaina, satria, noho ny manana ny olona hamaha ny olana, dia manana ny olona hanangana dataset izay azo ampiasaina mba hampiofanana ny solosaina mba hamaha ny olana. Ny tombony ity solosaina-nanampy fomba fiasa dia ny hoe manampy anao mba hiatrehana indrindra tsy manam-petra dia be ny tahirin-kevitra mampiasa voafetra ihany ny habetsahan'ny ezaka olombelona.

Ny endri-javatra in Banerji et al. (2010) milina modely fianarana dia sarotra kokoa noho ny tao ny kilalao ohatra, ohatra, izy nampiasa endri-javatra tahaka ny hoe "de Vaucouleurs mifanaraka axial tahan'ny" -ary ny modely tsy pitaovana ny fihemoran'ny, dia artifisialy neural tambajotra. Mampiasa ny endri-javatra, ny modely, ary ny marimaritra iraisana Galaxy Zoo sokajy, izy dia afaka mamorona vato isaky ny endri-javatra, ary avy eo dia mampiasa ireo vato mba hanao faminaniana momba ny fanasokajiana ny vahindanitra. Ohatra, ny fanadihadiana dia nahita fa sary amin'ny ambany "de Vaucouleurs mifanaraka axial tahan'ny" dia azo inoana kokoa ho miolakolaka vahindanitra. Noho ireo vato, izy dia afaka mialoha ny olombelona fanasokajiana ny kintana amin'ny antonony araka ny marina.

Ny asan'ny Banerji et al. (2010) nivadika Galaxy Zoo ho zavatra aho hoe ny faharoa-taranaka olombelona rafitra computation. Ny fomba tsara indrindra mba hieritreritra momba ireo taranaka faharoa-ny rafitra dia ny hoe noho ny manana ny olona hamaha ny olana, dia manana ny olona hanangana dataset izay azo ampiasaina mba hampiofanana ny solosaina mba hamaha ny olana. Ny habetsahan'ny fanazavana ilaina mba hampiofanana ny solosaina dia afaka ho toy izany fa mitaky lehibe olombelona faobe fiaraha-miasa mba hamoronana. Ho an'ny Galaxy Zoo, ny neural tambajotra ampiasain'ny Banerji et al. (2010) nitaky ny tena maro ny olona-misy soratra hoe ohatra mba hanorina ny modely izay afaka miteraka ny olona reliably fanasokajiana.

Ny tombony ity solosaina-nanampy fomba fiasa dia ny hoe manampy anao mba hiatrehana indrindra tsy manam-petra dia be ny tahirin-kevitra mampiasa voafetra ihany ny habetsahan'ny ezaka olombelona. , Ohatra, ny mpikaroka tamin'ny olona tapitrisa voasokajy vahindanitra dia afaka manorina ny vinavina modely izay afaka dia azo ampiasaina ny nanasokajy ny arivo tapitrisa na iray tapitrisa tapitrisa vahindanitra. Raha misy be ny isan'ny vahindanitra, dia izany karazana solosaina mifangaro olombelona-tena no hany vahaolana azo atao. Tsy manam-petra io scalability Tsy afaka, na izany aza. Fanorenana ny milina fianarana tsara modely izay afaka miteraka ny olona sokajy dia sarotra mihitsy ny olana, fa soa ihany misy efa nanokan-tena ho boky tsara ity lohahevitra ity (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

Galaxy Zoo dia maneho ny fivoaran'ny olombelona maro computation tetikasa. Voalohany, mpikaroka miezaka ny tetikasa amin'ny alalan'ny tenany na amin'ny kely ekipa ny fikarohana mpanampy (ohatra, ny voalohany Schawinski fanasokajiana ezaka). Raha tsy habeny fomba tsara, ny mpikaroka dia afaka mifindra amin'ny olombelona computation tetikasa izay misy olona maro mandray anjara sokajy. Kanefa, satria nisy boky ny angon-drakitra, madio ezaka olombelona dia tsy ho ampy. Tamin'izany fotoana, mpikaroka tokony hanorina faharoa-taranaka rafitra izay sokajy olombelona dia ampiasaina mba hampiofana ny milina fianarana modely izay afaka dia azo ampiharina amin'ny saika tsy voafetra be ny tahirin-kevitra.