5.2.1 Galaxy Zoo

Galaxy Zoo ба талошҳои бештари ихтиёриёни ихтиёрӣ барои тақсим кардани як миллион галактика равона шудааст.

Galaxy Zoo дар як мушкилие, ки Ковин Шавинский, донишҷӯи баъдидипломӣ дар Донишгоҳи Оксфорд дар соли 2007 бо мушкилоти зиёд рӯ ба рӯ буд, каме шиддат ёфт, Шавински дар галактикаҳо манфиатдор буд ва галактикаҳо аз тарафи морфология-евлитикӣ ё сурудхонӣ аз тарафи ранг-кабуд ё сурх. Дар айни замон, хиради анъанавӣ дар байни astronomersҳо, ки галактикаҳо, мисли роҳи Сиёҳии мо, ранги кабуд буданд (нишондиҳандаи ҷавонон) ва галактикаи elliptical-ро сурх (нишонаи синну сол) буд. Шавински ин хиради анъанавӣ шубҳа дорад. Вай гумонбар аст, ки агар ин намуна метавонад дар маҷмӯъ ҳақиқӣ бошад, эҳтимолан шумораи зиёдтари истисноҳо вуҷуд доштанд ва аз рӯи омӯзиши сершумори ин галактикаҳои ғайриқонунӣ - онҳое, ки намунаи интихоби онҳоро мувофиқат намекарданд, ӯ метавонад дар бораи раванди омӯхта галактикаҳо ташкил карда шуданд.

Ҳамин тариқ, чӣ гуна Schawinski барои ноил шудан ба ҳикмати анъанавӣ лозим буд, ки маҷмӯи васеи галактикаҳо ба шумор меравад; яъне, галактикаҳо, ки ҳамчун як спирт ё elliptical тасниф шудаанд. Аммо мушкилоте буд, ки усулҳои алгоритми таснифоти таснифот ҳанӯз барои хуби таҳқиқоти илмӣ истифода намешаванд; Ба ибораи дигар, таснифоти галактикаҳо дар он замон мушкилоти компютерҳо душвор буд. Бинобар ин лозим буд, ки шумораи зиёди галактикаҳои инсонӣ ба даст оранд. Шавинский проблемаи синфиро бо ихтирои донишҷӯёни аспирантура қабул намуд. Дар як марафони марафонӣ ҳафт рӯз 12 соат, ӯ қудрати 50 000 галактикаро тақсим кард. Дар ҳоле ки 50,000 галактикаҳо метавонанд хеле зиёд бошанд, ин танҳо дар бораи тақрибан 5% қариб як миллион галактикае мебошад, ки дар санҷиши слайдҳои рақамии Сноу тасвир шудааст. Шавинский медонист, ки ӯ бояд муносибати нисбатан васеътарро талаб кунад.

Хушбахтона, он рӯй дод, ки вазифаи галактикаҳо тасниф мекунад омўзиши пешрафта дар астрономия талаб намекунанд; Шумо метавонед касе ба он ҷо хеле ба зудӣ таълим додан гирифт. Ба ибораи дигар, ҳарчанд тасниф галактикаҳо вазифае, ки сахт барои компютер буд аст, он барои одамон хеле осон буд. Пас, дар ҳоле ки нишаста дар ин майкада дар Оксфорд, Schawinski ва ситорашиноси ҳамимонон Крис Lintott орзу, то як сомонаи ки ихтиёриёни мебуд, тасвири галактикаҳо тасниф. Чанд моҳ пас, Galaxy Zoo таваллуд шудааст.

Дар сайти зебо Galaxy, ихтиёриён чанд дақиқа тренингро мегузаронанд; Масалан, омӯхтани фарқияти байни галактикаи эффективӣ ва elliptical (ҷадвали 5.2). Баъд аз ин тренинг, ҳар як ихтиёрӣ бояд аз 11 тақрибан 15 галактика бо синфҳои маъруфи таснифотии мураккаб ҷудо карда шуда бошад ва сипас дараҷаи воқеии гаражҳои номаълум бо воситаи варианти оддии вебӣ (ҷадвал 5.3) оғоз хоҳад ёфт. Гузаштан аз ихтиёрӣ ба astronomer дар камтар аз 10 дақиқа сурат мегирад ва танҳо аз пажӯҳишҳое,

Тасвири 5.2: Намунаҳои ду намуди асосии галактика: спирал ва elliptical. Дар лоиҳаи Galaxy Galaxy зиёда аз 100,000 ихтиёриён истифода бурд, ки беш аз 900,000 тасвирҳоро дарбар гирад. Бо иҷозати http://www.GalaxyZoo.org ва Сноуден Тафтиши Смайл.

Тасвири 5.2: Намунаҳои ду намуди асосии галактика: спирал ва elliptical. Дар лоиҳаи Galaxy Galaxy зиёда аз 100,000 ихтиёриён истифода бурд, ки беш аз 900,000 тасвирҳоро дарбар гирад. Бо иҷозати http://www.GalaxyZoo.org ва Сноуден Тафтиши Смайл .

Тасвири 5.3: Экрани нишондиҳандае, ки ихтиёриён дархост карда буданд, ки тасвири ягонаро тасниф кунанд. Бо иҷозати корӣ аз Крис Линтот дар асоси тасвир аз Тадқиқоти Смоки Саноати рақамӣ.

Тасвири 5.3: Экрани нишондиҳандае, ки ихтиёриён дархост карда буданд, ки тасвири ягонаро тасниф кунанд. Бо иҷозати корӣ аз Крис Линтот дар асоси тасвир аз Тадқиқоти Смоки Саноати рақамӣ .

Ширкати Galaxy Zoo пас аз лоиҳа дар як мақолаи навбатӣ иштирок кард ва дар давоми тақрибан 6 моҳ лоиҳа беш аз 100 ҳазор олимон, одамоне, Ҳамагӣ 100,000 ихтиёриён якҷоя бо зиёда аз 40 миллион гурӯҳбандӣ, бо аксарияти гурӯҳҳо аз гурӯҳи нисбатан хурд, иштирокчии иштироккунандагон (Lintott et al. 2008) .

Тадқиқотчиёние, ки таҷрибаи кофтукови таҳқиқоти илмӣ доранд, метавонанд дар бораи сифатҳои маълумот шикоят кунанд. Дар ҳоле, ки ин шубҳа дуруст аст, Galaxy Zoo нишон медиҳад, ки вақте ҳиссагузориҳои ихтиёрӣ тоза, барҳамхӯрӣ ва ҷамъбаст карда мешаванд, онҳо метавонанд натиҷаҳои баланди (Lintott et al. 2008) . Як ҳиллаест, муҳим барои ба даст овардани мардум ба сохтани маълумот сифати касбии ихтисор, он аст, ки дорои вазифаи ҳамон аз ҷониби бисёр одамон гуногун аст. Дар Galaxy Zoo, тақрибан 40 синфҳои як галакакӣ вуҷуд доштанд; тадқиқотчиён бо истифода аз аспирантҳои тадқиқоти илмӣ наметавонанд ба ин сатҳҳои иловагӣ ниёз надошта бошанд ва бинобар ин бояд ба сифати ҳар як гурӯҳбандии инфиродӣ бештар нигарон бошанд. Он чи ки ихтиёриён буданд, дар тренингҳо набуданд, ки онҳо бо функсияҳо кор мекарданд.

Бо вуҷуди он, ки дар як галактикаи якчанд гурӯҳбандӣ, якҷоя кардани маҷмӯи гурӯҳҳои ихтиёрии ихтиёрӣ барои тавлиди таснифоти консенсус ҳассос буд. Азбаски аксарияти лоиҳаҳои ҳисобкунии инсонӣ бисёр монанд ба миён меояд, барои кӯтоҳ кардани се марҳила, ки тадқиқотчиёни зебоии Galaxy Galaxy истифода мебаранд, таснифоти консенсусро истифода мебаранд. Аввалан, тадқиқотчиён «маълумотҳоро бо роҳи бартараф намудани таснифоти блогҳо тоза намуданд. Масалан, одамоне, ки дар бораи галактикаҳо такроран такрор карда мешаванд, агар онҳо кӯшиш кунанд, ки натиҷаҳои онро ҳал кунанд, ҳамаи синфҳои худро партофтаанд. Ин ва дигар намуди тоза кардани он тақрибан 4% ҳамаи синфҳо ҷудо карда шуданд.

Дуюм, баъд аз тоза кардани тадқиқотчиён зарурати бартараф кардани системаҳои беназоратиро дар синфҳои. Ба воситаи як қатор тадқиқотҳои ҷустуҷӯӣ дар доираи лоиҳаи ибтидоӣ, масалан, нишон доданд, ки баъзе ихтиёриён ба галактикаи моногрӯ ба ивази ранг нишон медиҳанд - тадқиқотчиён якчанд якбора системаро пайдо карданд, масалан, бодиққати системавӣ барои таснифоти галактикаҳои дурдасти классикӣ (Bamford et al. 2009) . Барои ислоҳ кардани ин системаҳои пешазинтихоботӣ хеле муҳим аст, зеро функсияҳо ба таври автоматӣ бартараф карда мешаванд. он танҳо кӯмакро аз хатогиҳои тасодуфӣ хориҷ мекунад.

Ниҳоят, баъд аз бозгашт, тадқиқотчиён методеро барои муттаҳид кардани таснифоти инфиродӣ барои тавлиди таснифи созишнома талаб карданд. Тарзи осонтарини якҷоя кардани таснифот барои ҳар як галактика мебуд интихоби таснифоти бештар умумӣ буд. Бо вуҷуди ин, ин равиши ҳар як ихтиёрӣ ба ҳар як ихтиёрӣ баробар хоҳад буд ва тадқиқотчиён гумонбар мешаванд, ки баъзе ихтиёриён дар гурӯҳбандӣ нисбат ба дигарон беҳтартар буданд. Бинобар ин, тадқиқотчиён тартиботи вазнинтарини мураккабро таҳия намудаанд, ки кӯшиш карданд, ки беҳтарин синифкунандаҳоро ошкор созанд ва ба онҳо вазни бештар диҳанд.

Ҳамин тариқ, баъд аз як марҳилаи се марҳила, тоза, ҷустуҷӯ ва вазнин - гурӯҳи коршиносони Galaxy Galaxy ба синфҳои ихтиёрии ихтиёриён тақсим карда шуд. Вақте, ки ин синфхонаҳои Galaxy Zoo муқоиса кардани се кӯшиши пештара аз ҷониби astronomerҳои касбӣ, аз ҷумла таснифоти Schawinski, ки ба ҷунбиши Galaxy Zoo расонида шуд, муқоиса гардид. Ҳамин тариқ, ихтиёриён дар маҷмӯъ, таснифоти баланди сифат ва дараҷае, ки тадқиқотчиён натавонистанд мутобиқат кунанд (Lintott et al. 2008) . Дар ҳақиқат, ки синну соли зиёди галактикаҳо, Шавинский, Линтотт ва дигарон буданд, нишон доданд, ки тақрибан 80% галактикаҳо артиши зард ва кабудизори сурхро пайравӣ мекунанд - ва ҳуҷҷатҳои сершумор навишта шудаанд ин кашфи (Fortson et al. 2011) .

Бо назардошти ин замина, шумо ҳоло метавонед дидед, ки чӣ тавр Galaxy Zoo таҳти фармоиши якҷоя истифодашаванда, якхела, ки барои аксарияти лоиҳаҳои ҳисобкунии инсонӣ истифода мешавад. Аввалан, проблемаи калон ба зервазифа тақсим карда мешавад. Дар ин ҳолат проблемаи тақсимкунии як миллион галактикаҳо ба як миллион мушкилоти тақсимкунии як галактика тақсим карда шуд. Сипас, ин амалиёт аст, ки ба ҳар як порча мустақилона истифода бурда мешавад. Дар ин ҳолат, ихтиёриён ҳар як галактикаро ҳамчун як спирт ё elliptical classed classified. Дар охир, бо натиҷаҳои омехта ба истеҳсоли натиҷа ризоияти. Дар ин ҳолат, якҷоя кардани қадами тоза, ҷустуҷӯӣ ва вазнин сохтани таснифоти тасодуфӣ барои ҳар як галактика дохил карда шудааст. Гарчанде, ки аксари лоиҳаҳо ин дорухат умумиро истифода мебаранд, ҳар як қадами ба проблемаи мушаххас алоқаманд аст. Масалан, дар лоиҳаи ҳисоби ҳисобкунии инсон дар поён оварда шудааст, ҳамон дорухо бояд риоя карда шавад, аммо татбиқ ва ҳамбастагии қадамҳо хеле фарқ мекунанд.

Барои дастаи Galaxy Zoo, ин лоиҳаи аввал танҳо оғози буд. Онҳо зуд фаҳмиданд, ки гарчанде онҳо қариб ба миллион миллион галактикаҳо тақсим карда натавонистанд, ин миқдор барои кор бо санҷишҳои (Kuminski et al. 2014) рақамӣ кофӣ нест, ки метавонад тақрибан 10 миллиард (Kuminski et al. 2014) . Барои афзоиши афзоиш аз 1 миллион то 10 миллиард-омили 10,000-Galaxy Zoo, бояд тақрибан 10,000 маротиба бештар иштирокчиёнро гирад. Гарчанде, ки шумораи ихтиёриён дар Интернет хеле калон аст, он бефоида аст. Бинобар ин, тадқиқотчиён фаҳмиданд, ки агар онҳо ба миқдори зиёди афзоиши маълумотҳо машғул мешуданд, муносибати нав, ҳатто нисбат ба миқёси бештар лозим аст.

Бинобар ин, Манда Баннер бо коргарони Schawinski, Линтотт ва дигар аъзоёни дастаи зебоии Galaxy (2010) компютерҳои таълимиро барои тасниф кардани галактикаҳо медонад. Махсусан, бо истифода аз таснифоти инсонӣ, ки аз ҷониби Galaxy Zoo офарида шуда буд, Banger як модели омӯзиши машқро бунёд кард, ки метавонад таснифоти инсонии галактикаро дар асоси хусусиятҳои тасвир муайян кунад. Агар ин модели таснифоти инсонӣ бо дақиқ будани тавлидкунанда бошад, он метавонад онро аз ҷониби ҷустуҷӯгари Galaxy Zoo истифода барад, ки шумораи муайяни галактикаҳо тақсим карда шавад.

Самти муҳими Бонк ва равобити ҳамкорони он бо усулҳоест, ки дар соҳаи тадқиқоти ҷамъиятӣ одатан истифода мешаванд, гарчанде ки монандӣ дар назари аввал набошад. Аввалан, Banerji ва ҳамкорон бо ҳар як тасвир ба маҷмӯи хусусиятҳои рақамӣ табдил ёфтанд, ки хусусиятҳои онро ҷамъбаст намуданд. Масалан, барои тасвирҳои галактикаҳо мумкин аст се хусусият вуҷуд дошта бошанд: миқдори санги кабуд дар тасвир, варианти тасвири пикселҳо ва нисфи пикселҳои ғайрихаттӣ. Интихоби хусусиятҳои дуруст қисми муҳими мушкилот аст ва умуман экспертизаи мавзӯъро талаб мекунад. Ин қадами аввал, ки одатан инжининги муосир номида мешавад, дар матритсаи маълумот бо як сатр дар як тасвир ва баъд аз се сутуни тасвир тасвир мекунад. Бо дарназардошти матритсаи маълумот ва омили дилхоҳ (масалан, оё тасвири тасвир аз ҷониби инсон ҳамчун галактикаи эффективӣ тасниф шудааст), таҳқиқотчӣ модели оморӣ ё машғулиятҳои омӯзиширо мефаҳмонад - масалан, regression logistic, ки пешгӯиҳои инсонӣ дар асоси хусусиятҳо аз тасвири. Ниҳоят, тадқиқотчӣ нишон медиҳад, ки ин модели статистикиро барои истеҳсоли синфҳои арзёбии галактикаҳои нав (ҷадвали 5.4) истифода мебарад. Дар омӯзиши машқҳо, ин равиш бо истифода аз намунаҳои қайдгардида барои эҷоди модели, ки он вақт метавонад маълумоти навро қайд кунад - омӯзиши назоратӣ номида мешавад.

Тасвири 5.4: Тавсифи соддашудаи тарзи истифодаи Banergy et al. (2010) истифода бурдани Galaxy Class Zoo барои омӯзиши модели омӯзиши машқҳо барои таснифи галактика истифода шудааст. Тасвирҳои галактикаҳо дар матритсаи хусусиятҳо табдил дода шуданд. Дар ин намунаи соддашуда, се хусусият (андозаи кабуд дар тасвир, варақи равшании равшании пикселҳо ва нисфи пикселҳо) вуҷуд дорад. Сипас, барои як зергурӯҳҳои тасвирҳо зикри Galaxy Galaxy барои омӯзиши модели омӯзиши мошин истифода мешавад. Ниҳоят, омӯзиши мошинҳо барои тасниф кардани таснифот барои галактикаҳои боқимонда истифода мешавад. Ман инро лоиҳаи ҳисобкардашудаи компютерро дастгирӣ мекунам, зеро на он қадаре, ки одамон проблемаи ҳалли мушкилоти ҳалли худро ҳал мекунанд, одамон дорои як маълумотномае, ки барои омӯзонидани компютер барои ҳалли мушкилот истифода мешаванд, истифода мекунанд. Натиҷаи ин компютер-системаи ҳисобкунии компютерии он аст, ки он ба шумо имкон медиҳад, ки миқдори муайяни маълумотро ба таври кофӣ истифода баред. Тасвирҳои галактикаҳо бо иҷозати санҷиши сканҳои Смоки рақамӣ.

Тасвири 5.4: Тавсифи соддашудаи тарзи истифодаи Banerji et al. (2010) истифода бурдани Galaxy Class Zoo барои омӯзиши модели омӯзиши машқҳо барои таснифи галактика истифода шудааст. Тасвирҳои галактикаҳо дар матритсаи хусусиятҳо табдил дода шуданд. Дар ин намунаи соддашуда, се хусусият (андозаи кабуд дар тасвир, варақи равшании равшании пикселҳо ва нисфи пикселҳо) вуҷуд дорад. Сипас, барои як зергурӯҳҳои тасвирҳо зикри Galaxy Galaxy барои омӯзиши модели омӯзиши мошин истифода мешавад. Ниҳоят, омӯзиши мошинҳо барои тасниф кардани таснифот барои галактикаҳои боқимонда истифода мешавад. Ман инро лоиҳаи ҳисобкардашудаи компютерро дастгирӣ мекунам, зеро на он қадаре, ки одамон проблемаи ҳалли мушкилоти ҳалли худро ҳал мекунанд, одамон дорои як маълумотномае, ки барои омӯзонидани компютер барои ҳалли мушкилот истифода мешаванд, истифода мекунанд. Натиҷаи ин компютер-системаи ҳисобкунии компютерии он аст, ки он ба шумо имкон медиҳад, ки миқдори муайяни маълумотро ба таври кофӣ истифода баред. Тасвирҳои галактикаҳо бо иҷозати санҷиши сканҳои Смоки рақамӣ .

Хусусиятҳое, ки дар Banger ва ҳамкорони машғули омӯзиши машқҳои компютерӣ нисбат ба онҳое, ки дар намунаи бозичаи ман бештар мураккабтар буданд, масалан, ӯ ба сифати "Vaucouleurs муқовимати фолитизии fit" -ро истифода мебурданд ва намунаи вай аз реҷаи логистикӣ набуд, ин шабакаи сунъии сунъӣ буд. Бо истифода аз функсияҳо, намунаи вай, ва тасвири Galaxy Galaxy Class, ӯ қодир буд, ки дар бораи ҳар як хусусият вазнҳо бунёд кунад ва сипас ин масофаро барои пешгӯиҳо дар бораи таснифоти галактикаҳо истифода барад. Масалан, таҳлили ӯ нишон дод, ки тасвирҳо бо суръати каме "Vaucouleurs" мувофиқанд, ки эҳтимолан галактикаҳо бошанд. Бо назардошти ин вазнҳо, вай қодир буд, ки таснифоти инсонии галактикаро бо дақиқии дуруст муайян кунад.

Ҷоизаи Banpress ва ҳамкорон Galaxy Galaxy Zoo ба он ман ба системаи ҳисобкунии компютерии ёрирасон занг мезананд. Беҳтарин роҳи ҳалли ин системаҳои гибридӣ ин аст, ки ба ҷои он ки одамон ҳалли проблемаро ҳал кунанд, онҳо одамонро маҷмӯа месозанд, ки барои омӯзонидани компютер барои ҳалли мушкилот истифода мешаванд. Баъзан омӯзиши компютер барои ҳалли мушкилот метавонад якчанд мисолҳоро талаб кунад ва роҳи ягона барои тавлиди шумораи кофии мисолҳо як ҳамкории омма мебошад. Афзалияти ин дастурҳои компютерӣ ин аст, ки он ба шумо имкон медиҳад, ки миқдори муайяни маълумотро бо истифодаи миқдори муайяни кӯшишҳои инсонӣ анҷом диҳед. Масалан, як тадқиқотчӣ бо як миллион галактикаҳои синфии одам метавонад модели пешгӯиро бунёд кунад, ки баъдтар метавонад барои таснифи як миллиард доллар ё ҳатто трафикаи галактикаҳо истифода шавад. Агар шумораи зиёди галактикаҳо вуҷуд дошта бошад, ин навъи гибридҳои компютерӣ ҳақиқатан ягона роҳи ҳалли имконпазир аст. Вале ин скансилаи бепули озод нест. Сохтани модели омӯзиши мошин, ки метавонад ба таври дуруст тавлид кардани таснифоти инсонӣ дуруст бошад, худи худи мушкилоти мушкил аст, аммо хушбахт аст, ки аллакай китобҳои аъло ба ин мавзӯъ бахшида шудаанд (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

Galaxy Zoo ин як мисоли хубест, ки чӣ қадар лоиҳаҳои ҳисобкунии инсонӣ ба вуҷуд меояд. Аввалан, як таҳқиқот лоиҳаро аз ҷониби худ ё гурӯҳи ками кӯмаки тадқиқотӣ (масалан, кӯшиши таснифоти ибтидоии Шавинский) мекушояд. Агар ин равия беҳбуд наёбад, таҳқиқотчӣ метавонад ба лоиҳаи ҳисобкунии инсонӣ бо якчанд иштироккунандагон ҳаракат кунад. Аммо, барои ҳаҷми муайяни маълумот, кӯшиши поки инсонӣ кофӣ нахоҳад буд. Дар ин замина, таҳқиқотчиён бояд сохтани системаи ҳисобкунии компютерии кӯмаки компютерӣ, ки дар он синфҳои одамон барои омӯзиши модели омӯзиши мошинҳо истифода мешаванд, ки он гоҳ ба маблағи ҳадди аққали маълумот истифода бурда мешавад.