5.2.1 Galaksi zou

Galaksi zou konbine efò yo nan anpil volontè ki pa ekspè yo klasifye yon milyon galaksi ki.

Galaksi zou te grandi soti nan yon pwoblèm fè fas a pa Kevin Schawinski, yon elèv gradye nan Astwonomi nan University of Oxford nan 2007. Senplifye byen yon ti jan, Schawinski te enterese nan galaksi ki, ak galaksi ki kapab klase pa yo mòfolojik-eliptik oswa espiral-yo ak pa yo koulè-ble oswa wouj. Nan moman sa a, konvansyonèl bon konprann nan mitan astwonòm te ke galaksi ki espiral, tankou Way Lakte nou an, te ble nan koulè (ki endike jèn) ak ki galaksi ki eliptik te wouj nan koulè (ki endike laj fin vye granmoun). Schawinski doute ke bon konprann sa a konvansyonèl yo. Li sispèk ke pandan ke modèl sa a te ka rive vre an jeneral, te gen pwobableman yon nimewo dimensionnable nan eksepsyon, e ke nan etidye anpil nan galaksi ki-etranj sa yo sa yo ki pa t 'anfòm a te espere modèl-li te kapab aprann yon bagay sou pwosesis la nan ki galaksi ki te fòme.

Se konsa, ki sa Schawinski bezwen yo nan lòd yo ranvèse konvansyonèl bon konprann te yon seri gwo nan galaksi ki mòfoloji klase; se sa ki, galaksi ki ki te klase kòm swa espiral oswa eliptik. Pwoblèm nan, sepandan, te ke ki deja egziste metòd algoritmik pou klasifikasyon yo pa t 'bon ase pou l itilize pou rechèch syantifik; nan lòt mo, klase galaksi ki te, lè sa a, yon pwoblèm ki te difisil pou òdinatè. Se poutèt sa, sa ki te bezwen se te yon gwo kantite galaksi ki moun klase. Schawinski pran abitid pwoblèm sa a klasifikasyon ak antouzyasm a nan yon elèv diplome. Nan yon sesyon maraton nan sèt, jou 12-èdtan, li te kapab klasifye 50,000 galaksi ki. Pandan ke 50,000 galaksi ki ka son tankou yon anpil, li se aktyèlman sèlman apeprè 5% nan prèske yon milyon galaksi ki yo ki te kontinye nan Sondaj sou syèl Sloan Digital. Schawinski reyalize ke li te bezwen yon apwòch plis évolutive.

Erezman, li sanble ke travay la nan klasifikasyon galaksi ki pa mande pou fòmasyon avanse nan astwonomi; ou ka anseye yon moun ki fè li trè byen vit. Nan lòt mo, menm si klasifikasyon galaksi ki se yon travay ki te difisil pou òdinatè, li te trè fasil pou moun. Se konsa, pandan y ap chita nan yon PUB nan Oxford, Schawinski parèy ak astwonòm Chris Lintott reve moute yon sit entènèt kote volontè ta klasifye imaj nan galaksi ki. Yon mwa apre kèk, Galaksi zou te fèt.

Nan sit entènèt la Galaksi zou, volontè ta sibi yon kèk minit nan fòmasyon; pou egzanp, aprann diferans ki genyen ant yon espiral ak eliptik galaksi (Figi 5.2). Apre fòmasyon sa a, volontè yo te gen yo pase yon relativman fasil egzamen-kòrèkteman klasifikasyon 11 nan 15 galaksi ki ak li te ye klasifikasyon-ak Lè sa a volontè a ta kòmanse reyèl klasifikasyon nan galaksi ki unknown nan yon senp ki baze sou wèb koòdone (Figi 5.3). Tranzisyon an nan volontè yo astwonòm ta pran plas nan mwens pase 10 minit ak sèlman mande pase ki pi ba a nan obstakl, yon egzamen senp.

Figi 5.2: Men kèk egzanp sou de kalite prensipal yo nan galaksi ki: espiral ak eliptik. Pwojè a Galaksi zou itilize plis pase 100,000 volontè yo kategori plis pase 900,000 imaj. Sous: www.galaxyzoo.org.

Figi 5.2: Men kèk egzanp sou de kalite prensipal yo nan galaksi ki: espiral ak eliptik. Pwojè a Galaksi zou itilize plis pase 100,000 volontè yo kategori plis pase 900,000 imaj. Sous: www.galaxyzoo.org .

Figi 5.3: ekran Antre kote votè yo te mande yo klasifye yon imaj sèl. Sous: www.galaxyzoo.org.

Figi 5.3: ekran Antre kote votè yo te mande yo klasifye yon imaj sèl. Sous: www.galaxyzoo.org .

Galaksi zou atire volontè inisyal li apre yo te pwojè a chin an tap nan yon atik nan yon nouvèl, ak nan sou sis mwa pwojè a te grandi fè paran yo plis pase 100,000 syantis sitwayen ameriken, moun ki te patisipe paske yo te jwi travay la epi yo te vle ede astwonomi davans. Ansanm, 100,000 volontè sa yo kontribye yon total de plis pase 40 milyon dola klasifikasyon, ak majorite nan klasifikasyon yo vini soti nan yon relativman ti, gwoup debaz nan patisipan (Lintott et al. 2008) .

Chèchè ki gen eksperyans anplwaye asistan rechèch bakaloreya ta ka imedyatman gen ensèten sou bon jan kalite done. Pandan ke dout sa a se rezonab, Galaksi zou montre ke lè kontribisyon volontè yo kòrèkteman netwaye, debiased, ak agrégées, yo ka pwodwi rezilta-wo kalite (Lintott et al. 2008) . Yon Trick enpòtan pou jwenn foul moun yo yo kreye pwofesyonèl bon jan kalite done se èkse; ki se, li te gen travay an menm fèt pa moun ki pale anpil diferan. Nan Galaksi zou, te gen apeprè 40 klasifikasyon pou chak galaksi; chèchè lè l sèvi avèk asistan rechèch bakaloreya pa janm te kapab gen mwayen nivo sa a nan èkse ak Se poutèt sa bezwen yo dwe pi plis konsène ak bon jan kalite a nan chak klasifikasyon endividyèl elèv yo. Ki sa ki volontè yo te manke nan fòmasyon, yo te fè moute pou ak èkse.

Menm ak klasifikasyon miltip pou chak galaksi, sepandan, mete ansanm ak seri a nan klasifikasyon volontè yo pwodwi yon klasifikasyon konsansis se difisil. Paske defi trè menm jan leve nan pi pwojè kalkil imen, li se itil yo yon ti tan revize twa etap sa yo ki chèchè yo Galaksi zou itilize pwodwi klasifikasyon konsansis yo. Premyèman, chèchè yo "netwaye" done yo pa retire klasifikasyon fos. Pou egzanp, moun ki repete klase menm galaksi-yon bagay la ki ta rive si yo t ap eseye manipile rezilta yo-te gen tout klasifikasyon yo abandone. Sa a ak lòt netwaye menm jan an retire apeprè 4% nan tout klasifikasyon.

Dezyèmman, apre w fin netwaye, chèchè yo te bezwen yo retire prejije sistematik nan klasifikasyon. Atravè yon seri nan syans deteksyon patipri anbake nan orijinal egzanp nan pwojè-pou, ki montre kèk volontè galaksi a nan kamayeu olye pou yo koulè-chèchè yo dekouvri plizyè prejije sistematik, tankou yon patipri sistematik yo klasifye galaksi ki byen lwen espiral kòm galaksi ki eliptik (Bamford et al. 2009) . Adapte pou prejije sa yo sistematik se trè enpòtan paske moyenne anpil kontribisyon pa retire sistematik patipri; li sèlman retire erè o aza.

Finalman, apre debiasing, chèchè yo te bezwen yon metòd nan konbine klasifikasyon endividyèl yo yo pwodwi yon klasifikasyon konsansis. Fason pi senp nan konbine klasifikasyon pou chak galaksi ta dwe chwazi klasifikasyon nan pi komen. Sepandan, apwòch sa a ta bay chak volontè egal pwa, ak chèchè yo sispèk ke kèk volontè te pi bon nan klasifikasyon pase lòt moun. Se poutèt sa, chèchè yo devlope yon repete pi konplèks pwosedi pondération ki eseye otomatikman detekte klasifyeur yo pi byen ak ba yo plis pwa.

Se konsa, apre yo fin yon twa etap pwosesis-netwaye, debiasing, ak pondération-ekip rechèch la Galaksi zou te konvèti 40 milyon dola klasifikasyon volontè nan yon seri konsansis klasifikasyon mòfoloji. Lè sa yo klasifikasyon Galaksi zou te konpare a twa pi piti-echèl tantativ Previous by astwonòm pwofesyonèl, ki gen ladan klasifikasyon a pa Schawinski ki te ede yo enspire Galaksi zou, te gen fò akò. Kidonk, volontè yo, nan total, yo te kapab bay klasifikasyon bon jan kalite segondè ak nan yon echèl ki chèchè yo pa t 'kapab matche ak (Lintott et al. 2008) . An reyalite, pa gen klasifikasyon imen pou sa yo yon gwo kantite galaksi ki, Schawinski, Lintott, ak lòt moun yo te kapab montre ke se sèlman sou 80% nan galaksi ki swiv modèl-ble espiral yo atann ak ellipticals-ak wouj papye anpil yo te ekri sou sa a dekouvèt (Fortson et al. 2011) .

Bay sa a jan nou koumanse, nou kapab kounye a wè ki jan Galaksi zou sa a fann-aplike-konbine resèt, resèt la menm ki itilize pou pi pwojè kalkil moun. A Premyèman, se yon gwo pwoblèm divize an fragman. Nan ka sa a, se pwoblèm lan nan klasifikasyon yon milyon galaksi ki divize an yon milyon pwoblèm nan klasifikasyon youn galaksi. Apre sa, se yon operasyon aplike nan chak moso poukont li. Nan ka sa a, yon volontè ta klasifye chak galaksi kòm swa espiral oswa eliptik. Finalman, rezilta yo yo konbine yo pwodwi yon rezilta konsansis. Nan ka sa a, konbine etap la enkli netwaye, debiasing, ak pondération nan yo pwodwi yon klasifikasyon konsansis pou chak galaksi. Menm si pi pwojè sèvi ak resèt jeneral sa a, chak nan etap sa yo bezwen yo Customized nan pwoblèm nan espesifik ke yo te adrese. Pou egzanp, nan pwojè a kalkil imen dekri anba a, resèt a menm yo pral swiv, men aplike ak konbine etap sa yo yo pral byen diferan.

Pou ekip la Galaksi zou, pwojè sa a premye te sèlman kòmansman an. Trè byen vit yo reyalize ke menm si yo te kapab fè klasifye fèmen nan yon milyon dola galaksi ki, echèl sa a se pa ase yo travay avèk plus sondaj dijital syèl, sa ki kapab pwodwi imaj nan apeprè 10 milya dola galaksi ki (Kuminski et al. 2014) . Okipe yon ogmantasyon soti nan 1 milyon dola a 10 milya dola-yon faktè de 10,000-Galaksi zou ta bezwen yo rekrite apeprè 10,000 fwa plis patisipan yo. Menm si ki kantite volontè sou entènèt la se gwo, li se pa enfini. Se poutèt sa, chèchè yo reyalize ke si yo yo ale nan okipe tout tan tout tan ap grandi kantite done, yo te yon nouvo, menm plis évolutive, apwòch sa nesesè.

Se poutèt sa, Manda Banerji-ap travay ak Kevin Schawinski, Chris Lintott, ak lòt manm nan Galaksi zou ekip-kòmanse òdinatè yo ansèyman yo klasifye galaksi ki. Plis espesyalman, lè l sèvi avèk klasifikasyon yo imen kreye pa Galaksi Zoo, Banerji et al. (2010) bati yon modèl aprantisaj machin ki ta ka predi klasifikasyon imen an nan yon galaksi ki baze sou karakteristik sa yo nan imaj la. Si modèl sa a aprantisaj machin te kapab repwodui klasifikasyon yo imen ak presizyon segondè, lè sa a li te kapab itilize pa Galaksi zou chèchè yo klasifye yon nimewo esansyèlman enfini nan galaksi ki.

Nwayo a nan apwòch Banerji ak kòlèg 'se aktyèlman trè menm jan ak teknik souvan itilize nan rechèch sosyal, byenke ki resanblans pa ta ka dwe klè nan premye gade. Premyèman, Banerji ak kòlèg konvèti chak imaj nan yon seri karakteristik nimerik ki rezime li nan pwopriyete. Pou egzanp, pou imaj nan galaksi ki ta kapab genyen twa karakteristik: kantite lajan an nan ble nan imaj la, divèjans nan nan limyè nan piksèl yo, ak pwopòsyon de piksèl ki pa blan. Seleksyon an nan karakteristik yo ki kòrèk la se yon pati enpòtan nan pwoblèm nan, epi li jeneralman mande pou ekspètiz sijè-zòn nan. Sa a premye etap, souvan yo rele jeni karakteristik, rezilta yo nan yon matris done ak yon sèl ranje pou chak imaj ak Lè sa a, twa kolòn dekri ki imaj. Bay matris la done ak pwodiksyon a vle (egzanp, si wi ou non te imaj la klase pa yon moun kòm yon galaksi eliptik), chèchè a estime paramèt yo nan yon estatistik egzanp modèl-pou, yon bagay tankou yon retou annaryè-ki lojistik predi klasifikasyon imen an ki baze sou karakteristik yo ki nan imaj la. Finalman, chèchè a sèvi ak paramèt yo nan modèl sa a estatistik yo pwodwi klasifikasyon estime nan galaksi ki nouvo (Figi 5.4). Panse a yon analòg sosyal, imajine ke ou te gen enfòmasyon demografik sou yon milyon elèv yo, epi ou konnen si yo gradye nan kolèj oswa ou pa. Ou te kapab anfòm yon retou annaryè lojistik nan done sa a, ak Lè sa a ou ka sèvi ak paramèt yo modèl ki kapab lakòz nou ka prevwa si wi ou non nouvo elèv yo ale nan gradye nan kolèj. Nan aprantisaj machin, apwòch-lè l sèvi avèk ki make egzanp sa a yo kreye yon modèl estatistik ki ka Lè sa a mete lejann sou nouvo done-yo rele sipèvize aprann (Hastie, Tibshirani, and Friedman 2009) .

Figi 5.4: Senplifye deskripsyon ki montre kouman Banerji et al. (2010) itilize klasifikasyon yo Galaksi zou nan tren yon modèl aprantisaj machin fè galaksi klasifikasyon. Imaj nan galaksi ki te konvèti nan yon matris nan karakteristik. Nan egzanp sa a senplifye gen twa karakteristik (kantite lajan an nan ble nan imaj la, divèjans nan nan limyè nan piksèl yo, ak pwopòsyon de piksèl ki pa blan). Lè sa a, pou yon sou nan imaj yo, etikèt yo Galaksi zou yo te itilize nan tren yon modèl aprantisaj machin. Finalman, se aprantisaj la machin yo itilize yo estime klasifikasyon pou galaksi ki ki rete yo. Mwen rele sa a kalite pwojè yon dezyèm jenerasyon enfòmatik imen pwojè paske, olye ke gen moun rezoud yon pwoblèm, yo gen moun bati yon dataze ki ka itilize nan tren yon òdinatè nan rezoud pwoblèm nan. Avantaj nan apwòch sa a òdinatè-ede se ke li pèmèt ou okipe kantite lajan esansyèlman enfini nan done lè l sèvi avèk sèlman yon kantite lajan fini nan efò imen.

Figi 5.4: Senplifye deskripsyon ki montre kouman Banerji et al. (2010) itilize klasifikasyon yo Galaksi zou nan tren yon modèl aprantisaj machin fè galaksi klasifikasyon. Imaj nan galaksi ki te konvèti nan yon matris nan karakteristik. Nan egzanp sa a senplifye gen twa karakteristik (kantite lajan an nan ble nan imaj la, divèjans nan nan limyè nan piksèl yo, ak pwopòsyon de piksèl ki pa blan). Lè sa a, pou yon sou nan imaj yo, etikèt yo Galaksi zou yo te itilize nan tren yon modèl aprantisaj machin. Finalman, se aprantisaj la machin yo itilize yo estime klasifikasyon pou galaksi ki ki rete yo. Mwen rele sa a kalite pwojè yon dezyèm jenerasyon enfòmatik imen pwojè paske, olye ke gen moun rezoud yon pwoblèm, yo gen moun bati yon dataze ki ka itilize nan tren yon òdinatè nan rezoud pwoblèm nan. Avantaj nan apwòch sa a òdinatè-ede se ke li pèmèt ou okipe kantite lajan esansyèlman enfini nan done lè l sèvi avèk sèlman yon kantite lajan fini nan efò imen.

Karakteristik yo ki nan Banerji et al. (2010) modèl aprantisaj machin yo te plis konplèks pase sa yo ki nan jwèt mwen egzanp-pou egzanp, li te itilize karakteristik tankou "de Vaucouleurs anfòm axial rapò", e modèl li pa t 'lojistik retou annaryè, li te yon rezo atifisyèl neral. Lè l sèvi avèk karakteristik li, modèl l ', epi konsansis Galaksi zou klasifikasyon yo, li te kapab kreye pwa sou chak karakteristik, ak Lè sa a sèvi ak pwa sa yo fè prediksyon sou klasifikasyon nan galaksi ki. Pou egzanp, analiz li te jwenn ke imaj ak ba "de Vaucouleurs anfòm axial rapò sa yo" te plis chans yo dwe galaksi ki espiral. Bay pwa sa yo, li te kapab nou ka prevwa klasifikasyon imen an nan yon galaksi ak presizyon ki rezonab.

Travay la nan Banerji et al. (2010) vire Galaksi zou nan ki sa mwen ta rele yon dezyèm jenerasyon sistèm kalkil moun. Pi bon fason pou yo reflechi sou sa yo sistèm dezyèm jenerasyon se ke olye ke gen moun rezoud yon pwoblèm, yo gen moun bati yon dataze ki ka itilize nan tren yon òdinatè nan rezoud pwoblèm nan. Kantite lajan an nan done ki nesesè nan tren òdinatè a kapab tèlman gwo ke li mande pou yon kolaborasyon mas imen yo kreye. Nan ka a nan Galaksi Zoo, rezo yo neral itilize pa Banerji et al. (2010) mande yon nimewo gwo anpil nan egzanp moun-ki make yo nan lòd bati yon modèl ki te kapab fiable repwodui klasifikasyon imen an.

Avantaj nan apwòch sa a òdinatè-ede se ke li pèmèt ou okipe kantite lajan esansyèlman enfini nan done lè l sèvi avèk sèlman yon kantite lajan fini nan efò imen. Pou egzanp, se yon chèchè ak yon milyon dola galaksi ki moun klase ka bati yon modèl prediksyon ki ka Lè sa a, dwe itilize yo klasifye yon milya dola oswa menm yon billions galaksi ki. Si gen nimewo menmen nan galaksi ki, lè sa a sa a kalite ibrid imen-òdinatè se reyèlman sèlman solisyon an posib. Sa a évolutivité enfini se pa gratis, sepandan. Bati yon modèl aprantisaj machin ki ka kòrèkteman repwodui klasifikasyon yo moun se tèt li yon pwoblèm difisil, men erezman gen deja liv ekselan dedye a sijè sa a (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

Galaksi zou montre evolisyon nan pwojè anpil kalkil moun. Premyèman, yon chèchè eseye pwojè a pa tèt li oswa avèk yon ti ekip nan asistan rechèch (egzanp, premye efò klasifikasyon Schawinski a). Si apwòch sa a pa echèl byen, chèchè a kapab deplase nan yon pwojè kalkil imen kote anpil moun kontribye klasifikasyon. Men, pou yon volim sèten nan done, pi bon kalite efò imen pa pral ase. Nan pwen sa, chèchè bezwen bati sistèm dezyèm jenerasyon kote klasifikasyon imen yo te itilize nan tren yon modèl aprantisaj machin ki ka Lè sa a dwe aplike nan kantite lajan nòmalman san limit ak done yo.