5.2.1 Galaksi zou

Galaksi zou konbine efò yo nan anpil volontè ki pa ekspè nan klasifye yon galaksi milyon dola.

Galaksi Zoo te grandi soti nan yon pwoblèm fè fas a pa Kevin Schawinski, yon elèv diplome nan Astwonomi nan University of Oxford nan 2007. Senplifye byen yon ti jan, Schawinski te enterese nan galaksi, ak galaksi ka klase pa morfoloji-eliptik oswa espiral-yo pa koulè ble-yo oswa wouj. Nan moman sa a, bon konprann nan konvansyonèl nan mitan astwonòm te ke galaksi espiral, tankou Lakte Way nou an, yo te ble nan koulè (ki endike jèn) ak galaksi eliptik yo te wouj (ki endike laj fin vye granmoun). Schawinski doute ke bon konprann konvansyonèl sa a. Li te sispèk ke pandan ke modèl sa a ta ka vre an jeneral, te gen pwobableman yon nimewo dimensionnable nan eksepsyon, e ke pa etidye anpil nan galaksi sa yo etranj-sa yo ki pa t 'anfòm modèl la te espere-li te kapab aprann yon bagay sou pwosesis la nan ki galaksi ki te fòme.

Se konsa, sa ki Schawinski bezwen yo nan lòd yo ranvèse bon konprann konvansyonèl te yon seri gwo morphologically klase galaksi; se sa ki, galaksi ki te klase kòm swa espiral oswa eliptik. Pwoblèm lan, sepandan, te ke metòd algoritmik ki deja egziste pou klasifikasyon pa t 'ankò bon ase yo dwe itilize pou rechèch syantifik; nan lòt mo, klasifye galaksi ki te, nan tan sa a, yon pwoblèm ki te difisil pou òdinatè. Se poutèt sa, sa ki te bezwen te yon gwo kantite moun ki klase galaksi ki. Schawinski te antreprann pwoblèm klasifikasyon sa a ak antouzyasm nan yon elèv diplome. Nan yon sesyon maraton nan sèt jou 12 èdtan, li te kapab klase 50,000 galaksi ki. Pandan ke 50,000 galaksi ka son tankou yon anpil, li se aktyèlman sèlman apeprè 5% nan galaksi yo prèske yon milyon dola ki te foto nan Sloan Sky Sky Sondaj la. Schawinski reyalize ke li te bezwen yon apwòch plis évolutive.

Erezman, li sanble ke travay la nan klasifikasyon galaksi ki pa mande pou fòmasyon avanse nan astwonomi; ou ka anseye yon moun ki fè li trè byen vit. Nan lòt mo, menm si klasifikasyon galaksi ki se yon travay ki te difisil pou òdinatè, li te trè fasil pou moun. Se konsa, pandan y ap chita nan yon PUB nan Oxford, Schawinski parèy ak astwonòm Chris Lintott reve moute yon sit entènèt kote volontè ta klasifye imaj nan galaksi ki. Yon mwa apre kèk, Galaksi zou te fèt.

Nan sit entènèt la Galaksi Zoo, volontè ta sibi kèk minit nan fòmasyon; pou egzanp, aprann diferans ki genyen ant yon espiral ak galaksi eliptik (figi 5.2). Apre fòmasyon sa a, chak volontè te oblije pase yon egzamen relativman fasil pou klasifye 11 nan 15 galaksi ak klasifikasyon li te ye-e apre sa ta kòmanse klasifikasyon reyèl nan galaksi enkoni atravè yon koòdone ki baze sou entènèt (figi 5.3). Tranzisyon an soti nan volontè nan astwonòm ta pran plas nan mwens pase 10 minit ak sèlman oblije pase pi ba a nan obstakl, yon egzamen ki senp.

Figi 5.2: Egzanp de de prensipal kalite galaksi ki: espiral ak eliptik. Galaksi Zoo pwojè a te itilize plis pase 100,000 volontè pou klasifye plis pase 900,000 imaj. Repwodui pa pèmisyon nan http://www.GalaxyZoo.org ak Sloan Digital Sky Survey.

Figi 5.2: Egzanp de de prensipal kalite galaksi ki: espiral ak eliptik. Galaksi Zoo pwojè a te itilize plis pase 100,000 volontè pou klasifye plis pase 900,000 imaj. Repwodui pa pèmisyon nan http://www.GalaxyZoo.org ak Sloan Digital Sky Survey .

Figi 5.3: ekran Antre kote volontè yo te mande pou klasifye yon imaj sèl. Reproduité pa pèmisyon de Chris Lintott ki baze sou yon imaj de Sloan Digital Sky Survey.

Figi 5.3: ekran Antre kote volontè yo te mande pou klasifye yon imaj sèl. Reproduité pa pèmisyon de Chris Lintott ki baze sou yon imaj de Sloan Digital Sky Survey .

Galaksi Zoo atire volontè inisyal li yo apre pwojè a te parèt nan yon atik nouvèl, ak nan apeprè sis mwa pwojè a te grandi enplike plis pase 100,000 syantis sitwayen yo, moun ki te patisipe paske yo te jwi travay la epi yo te vle ede avanse astwonomi. Ansanm, sa yo volontè 100,000 te kontribye yon total de plis pase 40 milyon klasifikasyon, ak majorite nan klasifikasyon yo soti nan yon relativman ti, gwoup debaz nan patisipan yo (Lintott et al. 2008) .

Chèchè ki gen eksperyans anplwaye asistan rechèch bakaloreya ta ka imedyatman ap ensèten sou bon jan kalite done. Pandan ke dout sa a se rezonab, Galaksi Zoo montre ke lè kontribisyon volontè yo kòrèkteman netwaye, debiased, ak aggregated, yo ka pwodwi rezilta-wo kalite (Lintott et al. 2008) . Yon Trick enpòtan pou jwenn foul moun yo kreye done pwofesyonèl-bon jan kalite se redondance , se sa ki, li te gen menm travay la fèt pa anpil moun diferan. Nan galaksi zou, te gen apeprè 40 klasifikasyon pa galaksi; chèchè lè l sèvi avèk asistan rechèch bakaloreya pa janm kapab peye nivo sa a nan redondans ak Se poutèt sa ta bezwen yo dwe pi plis konsène ak bon jan kalite a nan chak klasifikasyon endividyèl elèv yo. Ki sa ki volontè yo te manke nan fòmasyon yo, yo te fè moute ak redondance.

Menm ak klasifikasyon miltip pa galaksi, sepandan, konbine seri a nan klasifikasyon volontè yo pwodwi yon klasifikasyon konsansis te difisil. Paske defi ki sanble anpil sanble nan pwojè kalkil imen, li itil pou yon ti tan revize twa etap ke chèchè zoo Galaksi yo itilize pou pwodui klasifikasyon konsansis yo. Premyèman, chèchè yo "netwaye" done yo pa retire klasman fos. Pou egzanp, moun ki repete klase menm galaksi a-yon bagay ki ta rive si yo te eseye manipile rezilta yo - te gen tout klasifikasyon yo abandone. Sa a ak lòt menm jan an netwaye retire sou 4% nan tout klasifikasyon.

Dezyèmman, apre yo fin netwaye, chèchè yo bezwen yo retire prejije sistematik nan klasifikasyon. Atravè yon seri de syans deteksyon patipri entegre nan pwojè orijinal la-pou egzanp, ki montre kèk volontè galaksi a nan monochrom olye pou yo koulè-chèchè yo dekouvri plizyè prejije sistematik, tankou yon patipri sistematik klasifye galaksi lwen espiral kòm galaksi eliptik (Bamford et al. 2009) . Ajisteman pou prejije sistematik sa yo trè enpòtan paske redondans pa otomatikman retire patipri sistematik; li sèlman ede retire erè o aza.

Finalman, apre debi, chèchè yo bezwen yon metòd pou konbine klasifikasyon endividyèl yo pou yo pwodui yon klasifikasyon konsansis. Fason ki pi senp nan konbine klasifikasyon pou chak galaksi ta dwe chwazi klasifikasyon ki pi komen. Sepandan, apwòch sa a ta bay chak volontè egal pwa, ak chèchè yo sispèk ke kèk volontè yo te pi bon nan klasifikasyon pase lòt moun. Se poutèt sa, chèchè yo devlope yon pwosedi pi plis konplèks iteratif pondere ki te eseye detekte klasif yo pi byen epi ba yo plis pwa.

Se konsa, apre yon pwosesis twa-etap-netwaye, debaz, ak weighting-Galaksi zoo rechèch ekip la te konvèti 40 milyon dola klasifikasyon volontè nan yon seri konsansis morphological klasifikasyon. Lè klasifikasyon Zoo Galaksi yo te konpare ak twa tantativ anvan ti echèl-pa astwonòm pwofesyonèl, ki gen ladan klasifikasyon a pa Schawinski ki te ede enspire Galaksi Zoo, te gen gwo akò. Se konsa, volontè yo, nan total, yo te kapab bay bon jan kalite klasifikasyon ak nan yon echèl ke chèchè yo pa t 'kapab matche ak (Lintott et al. 2008) . An reyalite, pa gen klasifikasyon imen pou tankou yon gwo kantite galaksi ki, Schawinski, Lintott, ak lòt moun yo te kapab montre ke sèlman apeprè 80% nan galaksi swiv espiral modèl-ble espiral yo ak eliptik wouj-yo ak anpil papye yo te ekri sou sa a dekouvèt (Fortson et al. 2011) .

Etandone sa a background, ou ka wè kouman Galaksi Zoo swiv resèt la fann-aplike-konbine, resèt la menm ki te itilize pou pifò pwojè kalkil imen. Premyèman, se yon gwo pwoblèm divize an fragman. Nan ka sa a, pwoblèm lan nan klasifye yon galaksi milyon dola te divize nan yon milyon pwoblèm nan klasifye yon sèl galaksi. Apre sa, se yon operasyon aplike nan chak ti moso poukont li. Nan ka sa a, volontè klase chak galaksi kòm swa espiral oswa eliptik. Finalman, rezilta yo konbine pou pwodui yon rezilta konsansis. Nan ka sa a, etap nan konbine enkli netwayaj la, debaz, ak pondere yo pwodwi yon klasifikasyon konsansis pou chak galaksi. Menm si pifò pwojè itilize sa a resèt jeneral, chak etap bezwen yo dwe Customized nan pwoblèm nan espesifik yo te adrese. Pou egzanp, nan pwojè a kalkil imen ki dekri anba a, yo pral resèt la menm swiv, men aplike a ak konbine etap yo pral byen diferan.

Pou ekip la Zoo Galaksi, pwojè sa a premye te jis nan konmansman an. Trè byen vit yo reyalize ke menm si yo te kapab klasifye fèmen nan yon galaksi milyon dola, echèl sa a se pa ase yo travay avèk plus sondaj syèl dijital, ki ka pwodwi imaj nan apeprè 10 milya dola galaksi (Kuminski et al. 2014) . Pou okipe yon ogmantasyon de 1 milyon a 10 milyon dola - yon faktè de 10,000-Galaksi Zoo ta bezwen rekrite apeprè 10,000 fwa plis patisipan yo. Menm si kantite a nan volontè sou entènèt la se gwo, li pa enfini. Se poutèt sa, chèchè yo reyalize ke si yo te ale nan okipe tout tan-ap grandi kantite done, yon nouvo, menm plis évolutive, apwòch te nesesè.

Se poutèt sa, Manda Banerji-k ap travay avèk Schawinski, Lintott, ak lòt manm nan Galaksi Zoo ekip (2010) -òdinatè kòmanse ansèyman klasifye galaksi. Plis espesyalman, lè l sèvi avèk klasman imen an ki te kreye pa Galaksi Zoo, Banerji bati yon modèl aprantisaj machin ki ta ka predi klasifikasyon imen an nan yon galaksi ki baze sou karakteristik sa yo nan imaj la. Si modèl sa a ka repwodui klasifikasyon imen yo ak presizyon segondè, Lè sa a, li ta ka itilize pa chèchè Zoo Galaksi klasifye yon nimewo esansyèlman enfini nan galaksi ki.

Nwayo a nan apwòch Banerji ak kòlèg 'se aktyèlman trè menm jan ak teknik souvan itilize nan rechèch sosyal, byenke ki resanblans pa ta ka klè nan premye gade. Premyèman, Banerji ak kòlèg li konvèti chak imaj nan yon seri karakteristik nimerik ki rezime pwopriyete li yo. Pou egzanp, pou imaj nan galaksi, ta ka gen twa karakteristik: kantite a nan ble nan imaj la, divèjans la nan klète nan piksèl yo, ak pwopòsyon de piksèl ki pa blan. Seleksyon an nan karakteristik ki kòrèk la se yon pati enpòtan nan pwoblèm nan, epi li jeneralman mande ekspètiz sijè-zòn. Premye etap sa a, souvan rele jeni karakteristik , rezilta nan yon matris done ak yon sèl ranje pou chak imaj ak Lè sa a, twa kolòn ki dekri imaj sa a. Bay done matris la ak pwodiksyon an vle (egzanp, si wi ou non yo te imaj la imaj pa yon imen kòm yon galaksi eliptik), chèchè a kreye yon estatistik oswa machin aprantisaj modèl-pou egzanp, lojistik retou annaryè-ki predi klasman imen an ki baze sou karakteristik yo nan imaj la. Finalman, chèchè a itilize paramèt nan modèl estatistik sa a pou pwodui klasifikasyon estime nan nouvo galaksi (figi 5.4). Nan aprantisaj machin, apwòch sa a-lè l sèvi avèk egzanp etikèt yo kreye yon modèl ki ka Lè sa a, mete etikèt sou nouvo done-yo rele sipèvize aprantisaj .

Figi 5.4: Senplifye deskripsyon sou kouman Banerji et al. (2010) itilize klasifikasyon yo Zoo Galaksi nan tren yon modèl aprantisaj machin fè klasifikasyon galaksi. Imaj galaksi ki te konvèti nan yon matris nan karakteristik. Nan egzanp sa a senplifye, gen twa karakteristik (kantite lajan an nan ble a nan imaj la, divèjans la nan klète nan piksèl yo, ak pwopòsyon nan piksèl nonwhite). Lè sa a, pou yon subset nan imaj yo, etikèt yo Galaksi Zoo yo itilize nan tren yon modèl aprantisaj machin. Finalman, aprantisaj nan machin yo itilize pou estime klasifikasyon pou galaksi ki rete yo. Mwen rele sa a yon òdinatè-ede pwojè kalkil imen paske, olye ke gen moun rezoud yon pwoblèm, li gen moun bati yon dataset ki ka itilize nan tren yon òdinatè rezoud pwoblèm nan. Avantaj nan sistèm òdinatè kalkil sa a se ke li pèmèt ou okipe kantite lajan ki enfini nan done lè l sèvi avèk sèlman yon kantite limite efò imen. Imaj galaksi ki repwodwi pa pèmisyon Sloan Digital Sky Survey.

Figi 5.4: Senplifye deskripsyon sou kouman Banerji et al. (2010) itilize klasifikasyon yo Zoo Galaksi nan tren yon modèl aprantisaj machin fè klasifikasyon galaksi. Imaj galaksi ki te konvèti nan yon matris nan karakteristik. Nan egzanp sa a senplifye, gen twa karakteristik (kantite lajan an nan ble a nan imaj la, divèjans la nan klète nan piksèl yo, ak pwopòsyon nan piksèl nonwhite). Lè sa a, pou yon subset nan imaj yo, etikèt yo Galaksi Zoo yo itilize nan tren yon modèl aprantisaj machin. Finalman, aprantisaj nan machin yo itilize pou estime klasifikasyon pou galaksi ki rete yo. Mwen rele sa a yon òdinatè-ede pwojè kalkil imen paske, olye ke gen moun rezoud yon pwoblèm, li gen moun bati yon dataset ki ka itilize nan tren yon òdinatè rezoud pwoblèm nan. Avantaj nan sistèm òdinatè kalkil sa a se ke li pèmèt ou okipe kantite lajan ki enfini nan done lè l sèvi avèk sèlman yon kantite limite efò imen. Imaj galaksi ki repwodwi pa pèmisyon Sloan Digital Sky Survey .

Karakteristik sa yo nan modèl aprantisaj Banerji ak modèl kòlèg li yo te pi konplèks pase sa yo nan egzanp jwèt mwen-pou egzanp, li te itilize karakteristik tankou "Vaucouleurs anfòm rapò axial" - ak modèl li pa te lojistik retou annaryè, li te yon rezo atifisyèl neral. Sèvi ak karakteristik li yo, modèl li yo, ak klasifikasyon konsèy Galaksi Zoo yo, li te kapab kreye pwa sou chak karakteristik, ak Lè sa a, sèvi ak sa yo pwa fè prediksyon sou klasifikasyon nan galaksi ki. Pou egzanp, analiz li te jwenn ke imaj ak ba "de Vaucouleurs anfòm rapò axial" yo te plis chans yo dwe galaksi espiral. Bay sa yo pwa, li te kapab predi klasifikasyon imen an nan yon galaksi ak presizyon rezonab.

Travay la nan Banerji ak kòlèg li yo te vire Galaksi Zoo nan sa mwen ta ka rele yon òdinatè-ede sistèm kalkil imen . Pi bon fason yo panse sou sistèm sa yo ibrid se ke olye ke gen moun rezoud yon pwoblèm, yo gen moun bati yon dataset ki ka itilize nan tren yon òdinatè yo rezoud pwoblèm nan. Pafwa, fòmasyon yon òdinatè pou rezoud pwoblèm lan ka egzije anpil egzanp, e sèl fason pou pwodui yon kantite sifizan de egzanp se yon kolaborasyon mas. Avantaj sa a nan apwòch òdinatè-asistans se ke li pèmèt ou okipe kantite lajan esansyèlman enfini nan done lè l sèvi avèk sèlman yon kantite lajan fini nan efò imen. Pou egzanp, yon chèchè ki gen yon milyon galaksi imen klasik ka bati yon modèl prediksyon ki ka Lè sa a, dwe itilize yo klase yon milya dola oswa menm yon galaksi billions. Si gen nimewo menmen nan galaksi, Lè sa a, sa a kalite imen-hybrid òdinatè se reyèlman solisyon an sèlman posib. Sa a évolutive évolutivite se pa gratis, sepandan. Bati yon modèl aprantisaj machin ki ka kòrèkteman repwodui klasifikasyon imen yo se tèt li yon pwoblèm difisil, men erezman gen deja ekselan liv dedye a sijè sa a (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

Galaksi Zoo se yon bon ilistrasyon sou konbyen pwojè kalkil imen evolye. Premyèman, yon chèchè eseye pwojè a pa tèt li oswa avèk yon ti ekip asistan rechèch (egzanp, efò klasifikasyon Schawinski a). Si apwòch sa a pa echèl byen, chèchè a ka deplase nan yon pwojè kalkil imen ak patisipan yo anpil. Men, pou yon volim sèten nan done, pi efò imen pa pral ase. Nan pwen sa a, chèchè yo bezwen bati yon òdinatè-ede sistèm kalkil imen nan ki klasifikasyon imen yo te itilize nan tren yon modèl aprantisaj machin ki ka Lè sa a, dwe aplike nan kantite lajan nòmalman san limit nan done.