5.2.1 Galaxy Zoo

Galaxy Zu hewldanên gelek dilxwazên ne-pispor bi hev re hevpeyivin ku bi mîlyonek mîlyonan derxistin.

Galaxy Zû ji ber pirsgirêkek mezin bû ku di 2007-ê de di asta astronomyê de astronomyê xwendekarên kulturê Kevin Schawinski, di sala 2007'an de. Ji hêla piçûk a Schawinski ve galaxiesk bû, û galaxis dikarin bi morfolojî-ermodel-an-anjî-an ermîdal-an-ankilîk-û bi rengê xweş an sor an sor. Di demê de, hişmendiya kevneşopî di astronomersan de bû ku galaxiesên spiral, mîna mîna me ya Milky Way, rengek rengî bû (ciwanek nîşanî) û galaxên elliptical sor bûn (nîşan dide ku temenê temenî). Schawinski ev şehreza kevneşopî guman kir. Ew guman dikir ku ev rengê dibe ku di gelemperî de rast be, hejmareke hejmareke hêsan a heqê hebû, û ji hêla galaxî yên van nexagonî -ên ku lêkolînek berbiçav nedikir nebû-ew dikarin li ser pêvajoyê tiştek hîn bikin galaxies ava kirin.

Ji ber vê yekê, çi Schawinski hewce ye ku şehreziya kevneşopî vekişînek mezin a galaxies deverek mezin a morphologî bû. Ew e ku, galaxiyên ku wekhev an jî an îkodîk têne kirin. Lêbelê, pirsgirêk bû ku rêbazên algorithmîk yên ji bo dabeşkirina kategoriyê hîn nehatiye baş e ku ji bo lêkolînê zanistî tê bikaranîn; Di heman demê de, galaxên dabeşkirî de, wê demê, pirsgirêkeke ku ji bo komputerên dijwar bû. Ji ber vê yekê, çi hewce bû ku hejmareke mezin mezin a mirovan -clîsedified. Schawinski bi pirsgirêkek kategoriya ku bi enthusiasm a xwendekarê xwendekaran pêk kir. Di rûniştineke marathonê de heft rojên saet 12-ê de, ew bikaribin galaxies 50,000 dabeş kirin. Gava ku 50,000 galaxies dikare gelek tiştek bifikirin, ew bi tenê nêzîkî 5% ji galaxies ku di asta Sky Sky Digital de lêkolîn kiribû de wêne ye. Schawinski fêm kir ku ew hewceyek pêdivî ye.

Cihê kêfxweşiyê ye, ew dema derkeve holê ku bi erkê hingī classifying nade perwerdeya pêşketî li astronomî ne hewce; tu ji kesekî ew çi rind zû hînî min bike. Bi gotineke din, tevî ku classifying galaksiyê, karekî, ku dijwar ji bo komputer bû e, ew ji bo mirov rind û hêsan bû. Bi vî awayî, çaxê ku rûniştî di pub li Oxford, Schawinski û Astronom, Chris Lintott di xewna xwe a di malpera ku dilxwazên wê images of galaksiyan de bisenifînin. Piştî çend mehan, Galaxy Zoo ji dayik bû.

Li malpera Galaxy Zoo, volunteerên çend çend deqeyan perwerde bibin; ji bo nimûne, di navbera galaxy û galaxy-ê (cudahî 5.2). Piştî vê perwerdehiyê, her dilxwazî ​​hebû ku ji hêla 11-ê galaxizên ku bi fikrên zanîngehê tê zanîn tête rastkirin-bi awayekî hêsantir bi awayekî hêsantir derxe-û paşê wê paqijên gerdûnî yên navxweyî (navîgasyon 5.3) bi riya rastîn destnîşan dike. Veguhastina ji dilxwazî ​​bi astronomer re dê di 10 deqîqeyan de bête kirin û tenê hewceyê herî kêm pevçûnan, pirrjimarek hêsan.

Pirtûka 5.2: Pirsên du celebên sereke yên galaxies: spiral û hêlîk. Projeya Galaxy Zoo ji 100,000 volunteerên bikar anîn ku ji hêla wêneyên 900,000 ve têne categorîzekirin. Ji hêla http://www.GalaxyZoo.org û Sloan Digital Sky Survey ve were destnîşankirin.

Pirtûka 5.2: Pirsên du celebên sereke yên galaxies: spiral û hêlîk. Projeya Galaxy Zoo ji 100,000 volunteerên bikar anîn ku ji hêla wêneyên 900,000 ve têne categorîzekirin. Ji hêla http://www.GalaxyZoo.org û Sloan Digital Sky Survey ve were destnîşankirin .

Pirtûka 5.3: Dîmendera inputê ku volunteerên ji wan re tê xwestin ji bo wêneyê yek fireh bikin. Ji hêla destûra ji destûreka Chris Lintott ve girêdayî ye ku li ser wêneya Sloan Digital Sky Survey ve girêdayî ye.

Pirtûka 5.3: Dîmendera inputê ku volunteerên ji wan re tê xwestin ji bo fotografek yek fireh bikin. Ji hêla destûra ji destûreka Chris Lintott ve girêdayî ye ku li ser wêneya Sloan Digital Sky Survey ve girêdayî ye .

Galaxy Zê piştî ku projeya di nûçeya nûçeyan de hate nivîsandin, bi dilxwaziya xwe ya dilxwazên xwe dikişand û di nav şeş mehan de, ev projeyek zûtirîn zanyariyên hemwelatiyên 100,000 beşdar bûn, mirovên ku beşdarî karê xwe dixwest û dixwest ku astronomî pêşîn alîkarî bikin. Bi hev re, ev 100,000 volunteer bi tevahî 40 mîlyonî dabeş kirin, bi piraniya kategoriyên ji hêla piçûktir, komeke bingehîn (Lintott et al. 2008) .

Lêkolînerên ku xwedan tecrûbeyên xwedîkariyê dixebitin ku alîkarên lêkolîner ên lêkolîner ên lêkolîner dikarin di cih de kalîteya danûstendinê bi lezgîn be. Dema ku ev berbiçav e, Galaxy Zo diyar dike ku dema ku beşdarvanên dilxwaz tên rast kirin, nebaş, û kolektîf têne çêkirin, ew dikarin encamên bilind ên kalîteyî (Lintott et al. 2008) . An trick girîng ji bo daketina bi nav elaletê de ji bo afirandina welat-quality profesyonel çarçova qerebûyê de, ew e ku, piştî ku wezîfeya xwe bi heman alîyê gelek kesan e. Li Galaxy Zoo, li gor galaxy per 40 heqê kategoriyan hene; Lêkolînerên ku bi karbidestên lêkolîner ên lêkolîner ên lêkolîner bikar anîna wê bi asta bêkariyê bisekinin û ji ber vê yekê hewceyê hewceyê bi kalîteya her kesî re girîng e. Ma kîjan dilxwazan di perwerdehiyê de ne, ew ji bo bi bêhêzan.

Her weha bi tevahî kategoriyên ku di galaxy-ê de, bi tevlêbûna dabeşkirina volunteer-volkanên hevgirtina ji bo dabeşkirina hevpeymaniya hevpeyman e. Ji ber ku zehmetên gelemperî di projeyên piraniya mirovan de têne çêkirin, ew e ku hûn sê gavên kurt bikin ku lêkolînerên Galaxy Zu lêkolîner bikar tînin ku dabeşkirina hevpeymanên xwe. Ya yekem, lêkolîner "danûstandin" daneyên ku bi hilberîna bogusê veguhastin. Ji bo nimûne, mirovên ku carî digerin encama encamên berbiçav - tiştek bi heman demê galaxy-ê veguhastin-tiştek derxistin. Ev û paqijkirina wateya din 4% ji hemî kategoriyan derxist.

Ya duyemîn, paqijkirina, lêkolînerên hewce ne ku ji hêla tehlîmasyonên sîstematîk veşartin. Bi rêgezên ku di çarçoveya pêvajoya bingehîn de veguhestin ji bo nimûneyên pêvajoya bingehîn-an mînak, hin-dilxwazên galaxy di rengê rengê mîkrogram de nîşan dide-bi lêkolînvanên gelek sîstemên sîstematîk têne dîtin, wekî sîstemên sîstematîkî yên ku ji galaxên spiral yên wekî asayîşên elliptîk (Bamford et al. 2009) . Ji bo bicîhkirina van rêbazên sîstematîk pir girîng e ji ber ku bêkariya xwe bi awayekî sîstematîk veşartî ne; Tenê alîkarî tenê çewtiyek çewtî bîr dike.

Di dawiyê de, piştî dubarekirina, lêkolînerên rêbazek hewceyê ku ji bo dabeşkirina kesan a ji bo dabeşkirina danûstendinê damezrandin. Riya herî hêsan e ku ji bo her galaxy ji bo kategoriya hevgirtinê wê dê hilbijêre herî pir normal. Lêbelê, vê nêzîk wê nêzîkî her dilxwazî ​​hebûna we jî daye, û lêkolînerên gumankirî guman kir ku hin dilxwazên hinek ji dilxwazî ​​li ser din. Ji ber vê yekê, lêkolîneran pêvajoyek giraniya berbiçav a ku ji bo kategoriya herî çêtirîn peyda dike û wan giran bidin wan.

Ji ber vê yekê, piştî pêvajoya sê-gav-paqij, debiasing, û giring-tîmek lêkolînek Galaxy Zu ji bo 40 mîlyonên volunteer bi navnîşên mîkroolojî yên morfolojîk guhertin. Dema ku van dabeşên Galaxy Zo bi sê hewldanên piçûk ên piçûk yên astronomers, bi şirovekirinê ji hêla Schawinskî re ku alîkariya me gazî Galaxy Zoo re, peymanek bihêz bû. Ji ber vê yekê, dilxwazan, di tevayî de, bi karûbarên pîvanên bilind-kalîteyê pêşkêş dikin û di asta ku lêkolîner nikarin nebin (Lintott et al. 2008) . Di rastiyê de, ji hêla pîvanên mirovan re ji bo gelek galaxies, Schawinski, Lintott û din jî bikarin ku tenê tenê nêzîkî 80% galaxies diyarbikin-rengên berbiçav-rîp û red elliptîk-û di gelek pirtûkan de hatine nivîsandin Ev lêgerîn (Fortson et al. 2011) .

Di vê paşnê de ev gavê, hûn dikarin çawa bibînin ku Galaxy Zoo ji riya pêdivî ye, bi heman rengê ku ji bo piraniya projeyên damezrandina mirovan mirovan tê bikaranîn. Ya yekem, pirsgirêkek mezin bû ku dişikîne. Di vê rewşê de, pirsgirêkek pîvanên mîlyonî derxistin yek mîlyon pirsgirêkên ku ji galaxy ve hilberandin. Bêguman, operasyon bi serbixwe her her qonax tê bikaranîn . Di vê rewşê de, dilxwazên her galaxy wekî an jî spiral an îkdîkî ye. Di dawiyê de, encamên hevbeş bi encama hevpeymaniya yekgirtî hilberînin. Di vê rewşê de, gava pêngava paqijkirinê, paqijkirin, û giranîna ji bo her galaxy ji bo dabeşkirineke hevpeymaniyê çêbikin. Tevî ku piraniya projeyên riya vê gavê bikar tînin, her gav pêwîst be ku pirsgirêkek taybet a têgotin be hewce kirin. Ji bo nimûne, di binavê projeya mirovan de tête binivîse, heman rengî wê paşde be, lê lêgerîn û gavên pêkanîn dê pir cuda be.

Ji bo koma teamê Galaxy Zoo, ev projeya yekemîn destpêkê destpê bû. Zû zû zû zûtir ew gihîştin ku tevî ku ew gihîştin galaxies nêzîkî mîlyonî derxistin, ev pîvan ne ku bi (Kuminski et al. 2014) dîjîtal ên dîplomatîk re dixebite, ne ku bi wêneyên 10 milyon galaxies (Kuminski et al. 2014) . Ji bo ku ji zêdebûna 1 milyon heta 10 milyar-faktîkî ya 10,000-Galaxy Zoo hewce dike ku hewce bike ku tevlî beşdaran 10000 caran zêdetir beşdar bikin. Her weha hejmara hejmara volunteerên li Înternetê pir mezin e, ew neheq ne. Ji ber vê yekê, lêkolînvanan fêm kirin ku heger heya heya heya daneyên danûstandinên herdem, bi nû, hûrgelan jî bêtir hewce ne.

Ji ber vê yekê, Manda Banerji-ê bi Schawinski, Lintott û endamên komên Galaxy Zu (2010) xebitîn-komputerên perwerdehiya galaxies dabeş bikin. Bi taybetî jî, bi karanîna galaxy Zoo têne çêkirin, Banerji modela fêrbûna makîneyê çêkir ku dibe ku kategoriya mirovî ya galaxy-ê li ser taybetmendiyên wêneyê li gorî bingehîn. Heke ku ev modela dikare hilberên mirovî bi rêjeya rastîn ya nû ve nûve bikin, wê ji hêla lêkolînerên Galaxy Zu ve tê bikaranîn ku hejmarek hejmareke mezin a galaxisan binirxînin.

Ya bingehîn ya Banerji û hevdîtinên hevpeymanan bi rastî jî teknolojiyên bi gelemperî di lêkolînek civakî de têne bikaranîn e. Pêşîn, Banerji û hevalên xwe her wêne di navnîşên jimareyên hejmarên nimûne yên ku taybetmendiyên xwe kurt kirin. Ji bo nimûne, wêneyên galaxies, hebûn sê taybetmendiyan hebe: heqê şîn in di wêneyê de, variance di ronahiya pencilan de, û nimûne pencereyên ne-spî. Hilbijêre ya taybetmendiyên rastîn pirsgirêkek pir girîng e, û ew bi gelemperî pisporiya mijara jîngehê heye. Yekem ev yekemîn, bi gelemperî pisporê fransî tê gotin, encamên daneyên dîmarî bi yek pîvanek yek û paşê sê-stûnan nîşan dide ku wêneyê. Gelek daneyên matrix û hilberînek xwestinê (mînak, ka wêneyê bi galaxy wek îkodîkal vekirî ye), lêkolîner nimûne nimûne an materyalê pîşesaziyê-ji bo nimûne, zordestiya logistic-ya ku li gor taybetmendiyên mirovî bi pêşniyaz dike pêşniyaz dike. wêneyê. Di dawiyê de, lêkolîner di modela statîstîkan de bikarhênerên nimûne bikar tînin ku ji texmînên texmînkirî yên galaxiesên nû ve (hilbijêre 5.4). Di hînbûna makîneyê de, ev nêzîkî nimûneyên nîşankirî yên ku ji bo modela nû ve tête çêbikin, dibe ku fêrbûna nû ya nû binivîse-tê zanîn hîn tê .

Pirtûka 5.4: Dîroka hêsan a ka Banerji et al. (2010) tercîhên Galaxy Zoo bikar anîn ku ji bo modela fêrbûna fêrkek amadekar amade bike. Wêneyên galaxies di rewşek taybetmendiyên taybet de hatine guhertin. Di nimûneyeke hêsan de, sê taybetmendiyên (hejmara rengê di nav wêneyê de, variance di ronahî ya pencilan de, û rêjeya pêdivî ya nonwhite). Piştre, ji bo kelepên wêneyên, labelên Galaxy Z ê tê bikaranîn ku modela fêrbûna makîneyê hîn bike. Di dawiyê de, fêrbûna makîneyê ji bo galaxiesên mayî yên texmînan têne texmîn kirin. Ez vê yekê dibêjim ku pergala mirovan a komputerê ku mirov mirov çareser dike, ev mirov mirov dataset ava dike ku dikare ji bo çareserkirina pirsgirêkek komputerê amadekar e. Vebijêrk vê komputer-pergala hevgirtina mirovan ya mirovî ye ku ew ji we re hewce dike ku hûn bi tevahî hewceyên danûstendina daneyên daneyên tenê bi tevahî hewldanên mirovahiyê bikar bînin. Wêneyên galaxies ji hêla Sloan Digital Sky Survey ve hatî destnîşankirin.

Pirtûka 5.4: Dîroka hêsan a ka Banerji et al. (2010) tercîhên Galaxy Zoo bikar anîn ku ji bo modela fêrbûna fêrkek amadekar amade bike. Wêneyên galaxies di rewşek taybetmendiyên taybet de hatine guhertin. Di nimûneyeke hêsan de, sê taybetmendiyên (hejmara rengê di nav wêneyê de, variance di ronahî ya pencilan de, û rêjeya pêdivî ya nonwhite). Piştre, ji bo kelepên wêneyên, labelên Galaxy Z ê tê bikaranîn ku modela fêrbûna makîneyê hîn bike. Di dawiyê de, fêrbûna makîneyê ji bo galaxiesên mayî yên texmînan têne texmîn kirin. Ez vê yekê dibêjim ku pergala mirovan a komputerê ku mirov mirov çareser dike, ev mirov mirov dataset ava dike ku dikare ji bo çareserkirina pirsgirêkek komputerê amadekar e. Vebijêrk vê komputer-pergala hevgirtina mirovan ya mirovî ye ku ew ji we re hewce dike ku hûn bi tevahî hewceyên danûstendina daneyên daneyên tenê bi tevahî hewldanên mirovahiyê bikar bînin. Wêneyên galaxies ji hêla Sloan Digital Sky Survey ve hatî destnîşankirin .

Di taybetmendiyên li Banerji û modela perwerdehiya hevrêzên ji hêla mînakê de di mînaka toyota min de ji hêla taybetmendiyên mîna "Va Vaucouleurs fit axial fit" hatiye bikaranîn pir zehmet bûn, -hê modela wê neheqiya lojîstîk bû, ew torê neuralîtîk bû. Bi taybetmendiya wê, modela wê û û Peymana Galaxy Zoo tête peyda kirin, ew bikar anî ser her taybetmendiya wezaretan, û paşê van rojan bikar bînin ku pêşniyarên li ser kategoriya galaxies bikin. Ji bo nimûne, analîzên wê diyar kir ku wêneyên bi "low vaçouleurs des axial fit fit" were meriv gazên spiral bûn. Gelek giran bihêle, ew bi karûbarên rastînek a galaxy-ê bi rastiya nerastî pêşniyaz kiribû.

Karê xebata Banerji û hevalbendên Galaxy Zoo di nav kîjan de ez ê ku pergala sîstema mirovan a computer-assisted human computation call. Riya herî çêtirîn ku ji bo pergalên van hûrgelan difikirin, ji ber ku mirov mirov pirsgirêk çareser bibe, ew xwedan dataset ava dikin ku bikaribin karanîna komputerek heye ku pirsgirêk çareser bikin. Hin caran, perwerdehiyek pirsgirêkek çareserkirina pirsgirêkê dikare gelek pirsan hewce dike, û tenê riya ku ji bo hejmara nimûneyên berbiçav çêbikin, hevkariya girseyî ye. Baweriya vê komputerê-alîkariyek nêzîk e ku hûn bi karanîna tenê hewceyên danûstandinên bêdeng ên ku bi tenê hewldanên mirovan ên bi xebata mirov bikar tînin. Ji bo nimûne, lêkolînerek bi bi milyonek kategoriyên mirovî veguherî dikare modela pêşniyazek çêbikin ku wê bikar bîne ku ew dê bikar anî mîlyar an jî heta trîlyonek trîlyayî dabeş bikin. Heke hejmareke mezin a galaxî hene, hingê vî rengî hûrgelê mirov-komkujî bi rastî çareseriyek yekane ye. Lêbelê ev paqijiya bêkêmasî ne azad e. Mînakek pîşesaziya fêrbûna makîneyê ku dikare bi awayekî rastîn (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) e, xwe pirsgirêkek dijwar e, lê bi kêfxweşî pirtûkên herî baş hene ji bo vê mijarê (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

Galaxy Zoo ev eşkere ye ku projeyên mirovan ên ku çêdikevin pêşve dibin. Pêşîn, lêkolîner hewce dike ku projeya xwe an bi tîma piçûk a lêkolînerên lêkolîner (wek mînak, hewldanên kategoriya destpêka Schawinski). Heke nîqaş baş nake, lêkolîner dikare bi gelek beşdaran re projeyek hevpeymanek mirovan mirovan bistînin. Lê, ji bo hin hûrgelên danûstandinê, hewldanên mirovan ên neteweyên wê ne enough. Di vê yekê de, lêkolînerên pêdivî ye ku pêdivî ye ku pergala mirovan a computer-supported human computation, ku di şerta mirovan de tê bikaranîn ku ji bo modela fêrbûna materyalê perwerde bike ku ji bo wê hema hema hema hema hema hema hema hema hema heya heya agahdariyê de hema hebe.