5.2.1 Galaxy Zoo

Galaxy Zoo омехта кӯшишҳои зиёди ихтиёриёни ғайри коршинос барои ба гуруҳо ҷудо як миллион галактикаҳо медароянд.

Galaxy Zoo калон аз мушкилот аз тарафи Кевин Schawinski, донишҷӯи баъдидипломӣ дар ситорашиносӣ дар Донишгоҳи Оксфорд дар соли 2007 Содда хеле каме, Schawinski манфиатдор дар галактикаҳо буд, рӯ ба рӯ ва галактикаҳо мумкин аст аз тарафи тасниф онҳо morphology-elliptical ё босуръати ва аз тарафи худ ранги кабуд ё-сурх. Дар он вақт, ҳикмати анъанавии байни astronomers буд, ки галактикаҳо босуръати, ба монанди Роҳи Каҳкашон, кабуд дар ранги (бо нишон додани ҷавонон) буданд ва галактикаҳо elliptical дар ранги сурх буданд (бо нишон додани синну сол кӯҳна). Schawinski чунин ҳикмат анъанавӣ дар шак ҳастанд. Ӯ гумонбар, ки дар ҳоле аз ин одат шояд дар маҷмӯъ ҳақиқӣ буданд, эҳтимол дорад теъдоди назарраси намудани истисноҳо, ки ба воситаи омӯзиши дастаи ин галактикаҳо аз-ғайриоддӣ касоне ҳастанд, ки кард, мувофиқат намекунад, ки дар назар намунае-ӯ чизе дар бораи раванди меомӯзем, ки тавассути он галактикаҳо ташкил карда мешаванд.

Ҳамин тавр, чӣ Schawinski лозим ба хотири бекор ҳикмати анъанавии маҷмӯи зиёди галактикаҳо morphologically таснифшуда буд; аст, ки галактикаҳо, ки ё босуръати ё elliptical тасниф шуда буд. Масъала, аммо ин буд, ки усулҳои алгоритмӣ мавҷудаи таснифи ҳанӯз кофӣ хуб барои тадқиқоти илмӣ истифода бурда мешавад нест; ба ибораи дигар, галактикаҳо тасниф мушкилоти, ки сахт барои компютер буд, дар он вақт. Аз ин рӯ, чӣ лозим буд, шумораи зиёди галактикаҳо тасниф инсонӣ буд. Schawinski ин масъала таснифотии бо шавқу як донишҷӯи баъдидипломӣ гузарониданд. Дар ҷаласаи марафон ҳафт, рӯзҳои 12-соата, ӯ тавонист барои ба гуруҳо ҷудо 50,000 галактикаҳо буд. Дар ҳоле, 50000 галактикаҳо шояд мисли бисёр садо, он аст, дар асл танҳо 5% аз тақрибан як миллион галактикаҳо, ки дар Тадќиќоти Sky Sloan Digital акс шуда буд. Schawinski фаҳмид, ки ӯ як муносибати миқёспазир бештар зарур аст.

Хушбахтона, он рӯй дод, ки вазифаи галактикаҳо тасниф мекунад омўзиши пешрафта дар астрономия талаб намекунанд; Шумо метавонед касе ба он ҷо хеле ба зудӣ таълим додан гирифт. Ба ибораи дигар, ҳарчанд тасниф галактикаҳо вазифае, ки сахт барои компютер буд аст, он барои одамон хеле осон буд. Пас, дар ҳоле ки нишаста дар ин майкада дар Оксфорд, Schawinski ва ситорашиноси ҳамимонон Крис Lintott орзу, то як сомонаи ки ихтиёриёни мебуд, тасвири галактикаҳо тасниф. Чанд моҳ пас, Galaxy Zoo таваллуд шудааст.

Дар сомона Galaxy Zoo, ихтиёриён мебуд гузаранд якчанд дақиқа барои омӯзиш; барои мисол, омӯзиш фарқи байни босуръати ва галактикаи elliptical (расми 5.2). Баъд аз ин омӯзиш, ихтиёриён буд, ба вуқӯъ як нисбатан осон викторина-дуруст тасниф 11 15 галактикаҳо бо маълум таснифоти-ва он гоҳ, ки ихтиёрӣ мебуд, таснифи воқеии галактикаҳо номаълум сар тавассути интерфейси асоси веб оддӣ (расми 5.3). Гузариш аз ихтиёрӣ ба ситорашиноси мебуд, дар камтар аз 10 дақиқа ва танҳо талаб гузариш пасттар аз монеаҳои, як викторина оддӣ.

Расми 5.2: Намунаҳои аз ду намуди асосии галактикаҳо: босуръати ва elliptical. Лоиҳаи Galaxy Zoo зиёда аз 100,000 ихтиёриён ба категорияњои бештар аз 900.000 тасвирҳо истифода бурда мешавад. Манбаъ: www.galaxyzoo.org.

Расми 5.2: Намунаҳои аз ду намуди асосии галактикаҳо: босуръати ва elliptical. Лоиҳаи Galaxy Zoo зиёда аз 100,000 ихтиёриён ба категорияњои бештар аз 900.000 тасвирҳо истифода бурда мешавад. Манбаъ: www.galaxyzoo.org .

Расми 5.3: экрани рдЗрдирдкреБрдЯ, ки интихобкунандагон пурсиданд, барои ба гуруҳо ҷудо симои ягона. Манбаъ: www.galaxyzoo.org.

Расми 5.3: экрани рдЗрдирдкреБрдЯ, ки интихобкунандагон пурсиданд, барои ба гуруҳо ҷудо симои ягона. Манбаъ: www.galaxyzoo.org .

Galaxy Zoo ихтиёриён ибтидоии худ ҷалб пас аз анҷоми лоиҳа дар як мақолаи ахбор тавсиф шуда буд, ва дар тақрибан шаш моҳ лоиҳаи калон ҷалб зиёда аз 100,000 олимон шаҳрванд, мардуме, ки иштирок зеро онҳо вазифаи баҳравар ва онҳо мехостанд, барои кӯмак ба ситорашиносӣ пешакӣ. Якҷоя ин 100,000 ихтиёриёни мусоидат ба маблағи умумии беш аз 40 миллион таснифоти, бо аксари таснифоти аз як гурӯҳи нисбатан хурд асосии иштирокчиён (Lintott et al. 2008) .

Тадқиқотчиён, ки таҷрибаи тадқиқотӣ ёрдамчиён бакалаврӣ фавран шояд шубҳа дар бораи сифати маълумотњо бошад. Дар ҳоле, ки ин пора оқилона аст, ки Galaxy Zoo нишон медиҳад, ки вақте ки саҳми ихтиёрии дуруст тоза карда мешавад, debiased, ва нишонгари, онҳо метавонанд натиҷаҳои-сифати баланд истеҳсол (Lintott et al. 2008) . Як ҳиллаест, муҳим барои ба даст овардани мардум барои эҷоди маълумоти сифати касбии ихтисор аст; ки аст, ки вазифаи ҳамон аз ҷониби бисёр одамон гуногун. Дар Galaxy Zoo, тақрибан 40 таснифоти як галактикаи нест; муҳаққиқон бо истифода аз ёрдамчиён тадқиқотӣ дар донишгоҳ ҳеҷ гоҳ ба ин сатҳи ихтисор имконият ва аз ин рӯ лозим аст, ки хеле ба ташвиш бештар бо сифати ҳар як таснифоти инфиродӣ. Чӣ ихтиёриён дар тайёрии намерасид, ки онҳо то барои бо ихтисор дод.

Ҳатто бо гурўњбандии гуногун дар як галактикаи, аммо њамгиро маҷмӯи таснифоти ихтиёриён ба истеҳсоли таснифи ризоияти назарфиреб аст. Зеро мушкилоти хеле монанд дар бештари лоиҳаҳои ҳисоб инсон меоянд, он муфид ба таври мухтасар дида се қадамҳои, ки муҳаққиқон Galaxy Zoo истифода бурда ба истеҳсоли таснифоти консенсус аст. Якум, муҳаққиқон «тоза» кардани маълумот бо аз байн бурдани таснифоти bogus. Масалан, мардуме, ки такроран тасниф ҳамон галактикаи-чизе мебуд, ки рӯй медиҳад, агар онҳо кӯшиш мекарданд, ки бухгалтер натиҷаҳои-буд, ҳамаи таснифоти худро ҳузф. Ин ва тоза монанд дар бораи 4% -и ҳамаи таснифоти дур.

Дуюм, пас аз тоза, таҳқиқотчӣ лозим ба хориҷ Тамоюлҳои системавї дар таснифоти. Тавассути як қатор тадқиқотҳои ошкор Хатои барномаи дарунсохти дар доираи намунаи лоиҳа барои аслии зоҳир баъзе ихтиёриён галактикаи дар monochrome ҷои ранги-муҳаққиқон якчанд Тамоюлҳои системавї, ба монанди Хатои системавии барои ба гуруҳо ҷудо галактикаҳо дур босуръати ҳамчун галактикаҳо elliptical ошкор (Bamford et al. 2009) . Тасьеьи ин Тамоюлҳои системавї хеле муҳим аст, зеро ки ба њисоби миёна бисёр Ҳиссагузориҳои тавр Хатои системавии бартараф карда натавонад; он танҳо дур гумроҳии тасодуфӣ.

Дар охир, баъд debiasing, таҳқиқотчӣ усули ба якчояги таснифоти алоҳида ба истеҳсоли таснифи консенсус лозим буд. Дар соддатарин роҳи якҷоя таснифоти барои ҳар як галактикаи мебуд, ки ба интихоб ҳама бештар гурӯҳбандии умумӣ. Вале, ин муносибат ҳар як ихтиёрии вазни баробар диҳад, ва муҳаққиқон гумонбар, ки баъзе аз ихтиёриён беҳтар таснифи аз дигарон буданд. Аз ин рӯ, таҳқиқотчӣ тартиби вазнченкунӣ такрорӣ мураккаб, ки кӯшиш мекунад, ки ба таври худкор ошкор беҳтарин classifiers ва онҳоро вазни бештар диҳад тањия карда мешаванд.

Ҳамин тариқ, пас аз се қадами раванди тоза, debiasing, ва вазнченкунӣ-дастаи таҳқиқотчиёни Galaxy Zoo 40 миллион таснифоти ихтиёрӣ ба як қатор ризоияти таснифоти морфологӣ табдил карда буд. Вақте ки ин таснифоти Galaxy Zoo ба се кӯшиши-андозад гузашта astronomers касбӣ, аз ҷумла таснифи аз тарафи Schawinski, ки кӯмак ба илҳом Galaxy Zoo муқоиса карда буд, созишномаи қавӣ нест. Ҳамин тариқ, ихтиёриён, дар маҷмӯъ, метавонад барои таъмин намудани таснифоти сифати баланд буд ва дар миқёси, ки муҳаққиқон карда наметавонистанд мувофиқ (Lintott et al. 2008) . Дар асл, бо доштани таснифоти инсонӣ барои чунин шумораи зиёди галактикаҳо, Schawinski, Lintott, ва дигарон қодир ба нишон медиҳад, ки танҳо дар бораи 80% галактикаҳо пайравӣ spirals назар намунаи-кабуд ва ellipticals ва сурх ҳуҷҷатҳои сершумори дар бораи навишта шудааст буданд, ин кашфи (Fortson et al. 2011) .

Бо дарназардошти ин замина, ки мо ҳоло мебинем, ки чӣ тавр Galaxy Zoo пайравӣ ҹудо-татбиқ-якҷоя дорухат, дорухат ҳамон аст, ки барои аксари лоиҳаҳои ҳисоб инсон истифода бурда мешавад. Якум, мушкилоти калон аст, ба зервазифа тақсим. Дар ин ҳолат, масъалаи таснифи як миллион галактикаҳо ба як миллион масъалањои таснифи як галактикаи тақсим. Сипас, ин амалиёт аст, ки ба ҳар як порча мустақилона истифода бурда мешавад. Дар ин ҳолат, як ихтиёрии мебуд ҳар галактикаи ҳамчун ё босуръати ё elliptical тасниф. Дар охир, бо натиҷаҳои омехта ба истеҳсоли натиҷа ризоияти. Дар ин ҳолат, қадами якчояги дохил тоза, debiasing, ва вазнченкунӣ ба истеҳсоли таснифи ризоияти барои ҳар як галактикаи. Ҳарчанд аксари лоиҳаҳо истифода бурдани ин дорухат Умуман, ҳар як аз қадамҳои бояд фармоишгари ба масъалаи муайян, ҳал намуд. Барои мисол, дар лоиҳаи ҳисоб инсон дар поён, дорухат ҳамон мешавад аз паи хоҳад кард, вале мурољиат ва якҷоя қадамҳои хоҳад хеле гуногун.

Зеро дастаи Galaxy Zoo, лоиҳаи мазкур аввали танҳо ибтидои буд. Хеле зуд онҳо дарк намуд, ки ҳарчанд онҳо метавонанд барои ба гуруҳо ҷудо наздик ба як миллион галактикаҳо буданд, ин миқёси аст, кофӣ нест, барои кор бо тадќиќоти осмон рақамӣ навтар, ки метавонад тасвирҳои қариб 10 миллиард галактика истеҳсол (Kuminski et al. 2014) . Барои идора зиёд аз 1 миллион то 10 миллиард-омили 10000-Galaxy Zoo бояд ҷалб тақрибан 10,000 маротиба зиёд иштирокчиёни. Ҳарчанд шумораи ихтиёриён дар Интернет калон аст, он аст, беохир нест. Аз ин рӯ, муҳаққиқон, ки агар онҳо ба зудӣ барои идора кардани миқдори ҳамеша парвариши маълумот, як нав, ҳатто миқёспазир бештар равиши лозим буд.

Аз ин рӯ, Manda Banerji-кор бо Кевин Schawinski, Крис Lintott, ва дигар аъзои даста-сар Galaxy Zoo компютер таълим барои ба гуруҳо ҷудо галактикаҳо медароянд. Махсусан, бо истифода аз таснифоти инсон офаридааст, аз ҷониби Galaxy Zoo, Banerji et al. (2010) модели омӯзиши мошини, ки метавонад ба таснифи инсон як галактикаи дар асоси хусусиятҳои тасвир пешгӯии бино. Агар ин модел омӯзиши мошини метавонад таснифоти инсон бо аниқии баланди дубораи, он гоҳ он метавонад аз ҷониби муҳаққиқон Galaxy Zoo истифода бурда мешавад барои ба гуруҳо ҷудо шумораи аслан бепоёни моро аз галактикаҳо медароянд.

Дар асосии муносибати Banerji ва ҳамкорони 'аст, дар асл хеле монанд ба техникаи одатан дар соҳаи тадқиқоти иҷтимоӣ истифода мешавад, гарчанде, ки монандии нест, шояд дар назари аввал равшан бошад. Якум, Banerji ва ҳамкорони ҳар сурат ба як қатор хусусиятҳои ададӣ, ки дар ҷамъбасти он хосиятҳои табдил. Барои мисол, барои тасвирҳои аҷибе метавонад се хусусиятҳои нест: маблаљи кабуд дар тасвир, ки ихтилоф дар Равшании пиксел, ва њиссаи пиксел ғайридавлатӣ сафед. Интихоби хусусиятҳои дуруст қисми муҳими масъала аст, ва аз он ба таври умум талаб ташхиси мавзӯъ-соҳаи. Ин қадами аввалин, одатан муҳандисӣ хусусияти даъват намуда, дар натиҷа дар як ҷадвал маълумот бо як сатр як тасвир ва он гоҳ, ки ба се сутун тасвир кардани тасвир. Бо дарназардошти матритсаи маълумот ва баромади дилхоҳро (масалан, оё тасвирҳоро ба воситаи инсон ҳамчун галактикаи elliptical тасниф шуда буд), таҳқиқотчии ҳисобҳои параметрҳои модели-масалан оморӣ, чизе монанди регрессияи-, ки логистикӣ пешгӯӣ таснифи инсон асос ёфтааст дар бораи хусусиятҳои тасвир. Дар охир, муҳаққиқи мебарад параметрҳои дар ин модел оморӣ истеҳсоли таснифоти њисобкардашудаи галактикаҳо нав (расми 5.4). Барои як аналогӣ иљтимої фикр, тасаввур кунед, ки шумо маълумоти демографӣ дар бораи як миллион донишҷӯ буд, ва шумо медонед, ки оё онҳо хатм коллеҷ ё не. Шумо метавонед як регрессияи логистикӣ ба ин маълумоти муносиб, ва он гоҳ шумо метавонед параметрҳои модели натиҷа барои пешгӯии оё омӯзандагони нави ба зудӣ ба хатм коллеҷ истифода баред. Дар омӯзиши мошини, ки ин равиши истифода аз намунањои-нишонгузорӣ ба эҷоди модели оморӣ гоҳ, ки метавонад дараҷаи масоили нав маълумот номида назорат омӯзиш (Hastie, Tibshirani, and Friedman 2009) .

Расми 5.4: Шарҳи соддакардашудаи, ки чӣ тавр Banerji ва диг. (2010) истифода таснифоти Galaxy Zoo омӯзонидани модели омӯзиши мошини ба кор гурӯҳбандии галактикаи. Тасвирҳо аз галактикаҳо дар матритсаи хусусиятҳои табдил шуданд. Дар ин мисол соддакардашуда се хусусиятҳои (маблағи кабуд дар тасвир, ки ихтилоф дар Равшании пиксел, ва њиссаи пиксел ғайридавлатӣ сафед) вуҷуд доранд. Сипас, барои як қисми таркибии тасвирҳои, ки тамғакоғазҳо Galaxy Zoo истифода тайёр модели омӯзиши мошини. Ниҳоят, омӯзиши мошини, ки истифода бурда мешавад, барои ҳисоб таснифоти барои галактикаҳо боқимонда. Ман ин гуна лоиҳа даъват ба насли дувуми лоиҳаи ҳисоббарории инсон, зеро, ба ҷои аз ин ки ба одамон дар як масъаларо ҳал, ки онҳо доранд, ба одамон сохтани як мажм, ки метавонад истифода шавад барои тайёр кардани компютер ба ҳалли масъалаи. Бартарии ин усул-компютер аст, ки ба туфайли он ба шумо идора кардани миқдори аслан бепоёни маълумот бо истифода аз танҳо як миқдори маҳдуди кӯшишҳои инсон.

Расми 5.4: Шарҳи соддакардашудаи, ки чӣ тавр Banerji et al. (2010) истифода таснифоти Galaxy Zoo омӯзонидани модели омӯзиши мошини ба кор гурӯҳбандии галактикаи. Тасвирҳо аз галактикаҳо дар матритсаи хусусиятҳои табдил шуданд. Дар ин мисол соддакардашуда се хусусиятҳои (маблағи кабуд дар тасвир, ки ихтилоф дар Равшании пиксел, ва њиссаи пиксел ғайридавлатӣ сафед) вуҷуд доранд. Сипас, барои як қисми таркибии тасвирҳои, ки тамғакоғазҳо Galaxy Zoo истифода тайёр модели омӯзиши мошини. Ниҳоят, омӯзиши мошини, ки истифода бурда мешавад, барои ҳисоб таснифоти барои галактикаҳо боқимонда. Ман ин гуна лоиҳа даъват ба насли дувуми лоиҳаи ҳисоббарории инсон, зеро, ба ҷои аз ин ки ба одамон дар як масъаларо ҳал, ки онҳо доранд, ба одамон сохтани як мажм, ки метавонад истифода шавад барои тайёр кардани компютер ба ҳалли масъалаи. Бартарии ин усул-компютер аст, ки ба туфайли он ба шумо идора кардани миқдори аслан бепоёни маълумот бо истифода аз танҳо як миқдори маҳдуди кӯшишҳои инсон.

Дар хусусиятҳо дар Banerji et al. (2010) модели омӯзиши мошини мураккаб бештар аз онҳое, ки дар бозича ман намунаи-барои мисол, ӯ хусусиятҳои монанд истифода бурда буданд, «де Vaucouleurs муносиб таносуби axial фано нашавад» модели буд регрессияи логистикӣ не, он шабакаи neural сунъӣ буд. Истифодаи хусусиятҳои вай, модели, ва консенсус ба таснифоти Galaxy Zoo, ӯ қодир ба сохтани вазни оид ба њар як хусусият, ва сипас истифода аз ин вазн кунад пешгӯиҳо дар бораи таснифи галактикаҳо буд. Масалан, таҳлили вай пайдо тасвирҳо бо пасти "де Vaucouleurs мувофиқат таносуби axial», ки эҳтимоли зиёд бошад, галактикаҳо босуръати буданд. Бо дарназардошти ин вазн, ӯ тавонист барои пешгӯии таснифи инсон як галактикаи бо дурустии оқилона буд.

Дар кори Banerji et al. (2010) Galaxy Zoo ба он чӣ Ман як насли дувуми системаи ҳисоб инсон даъват табдил ёфт. Беҳтарин роҳ, ки дар бораи ин, системаҳои насли дуюм фикр он аст, ки на аз ин ки ба одамон дар як масъаларо ҳал, ки онҳо доранд, ба одамон сохтани як мажм, ки метавонад истифода шавад барои тайёр кардани компютер ба ҳалли масъалаи. Ҳаҷми маълумоти зарурӣ барои тайёр кардани компютер метавонад, то калон, ки дар он талаб ҳамкорӣ омма инсон ба эҷод. Дар мавриди Galaxy Zoo, шабакаҳои neural истифода Banerji et al. (2010) бо мақсади сохтани модели, ки қодир ба боэътимод дубораи таснифи инсон буд, талаб шумораи хеле зиёди мисолҳои-инсон нишонгузорӣ.

Бартарии ин усул-компютер аст, ки ба туфайли он ба шумо идора кардани миқдори аслан бепоёни маълумот бо истифода аз танҳо як миқдори маҳдуди кӯшишҳои инсон. Барои намуна, як пажӯҳишгари бо як миллион галактикаҳо тасниф инсон метавонад дар як модели пешгӯии он гоҳ, ки метавонад истифода шавад барои ба гуруҳо ҷудо миллиард ё ҳатто як триллион галактикаҳо бино. Агар шумораи бузурги галактикаҳо нест, пас ин гуна гибридии инсон компютер аст, дар ҳақиқат танҳо ҳалли. Ин вусъатдиҳӣ беохир дорад бепул нест, вале. Сохтани модели омӯзиши мошини, ки дуруст метавонанд дубораи кардани таснифоти инсон худ як масъала душвор аст, вале хушбахтона аллакай китобҳои аъло бахшида ба ин мавзӯъ нест (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

Galaxy Zoo таҳаввулоти лоиҳаҳои зиёди ҳисоб инсон нишон дода шудааст. Якум, як пажӯҳишгари кӯшиши лоиҳа аз ҷониби худаш ва ё бо як дастаи хурди ёрдамчиён илмӣ (масалан, кӯшиши гурӯҳбандии аввалаи Schawinski кард). Агар ин равиш тавр, инчунин васеъ нест, таҳқиқотчии метавонад ба лоиҳаи ҳисоб инсонӣ, ки бисёр одамон мусоидат тасниф ҳаракат. Аммо, барои як ҳаҷми муайяни маълумот, саъю пок инсон нест, кофӣ. Дар ин бора, муҳаққиқон бояд барои сохтани системаҳои насли дуюм, ки таснифоти инсон истифода бурда мешаванд таълим модели омӯзиши мошини, ки он вақт метавонем ба миқдори амалан номаҳдуди маълумот истифода бурда мешавад.