5.2.1 Galaxy Zoo

ගැලැක්සි සත්වෝද්යානය මිලියන ගණනක් මන්දාකිණි වර්ගීකරණය කිරීමට ස්වේච්ඡා නොවන ස්වේච්ඡා සේවකයන්ගේ ප්රයත්නයන් ඒකාබද්ධ කළේය.

ගැලැක්සි සත්වෝද්යානය 2007 දී ඔක්ස්ෆර්ඩ් විශ්වවිද්යාලයේ තාරකා විද්යාව පිළිබඳ උපාධිධාරී ශිෂ්යයකු වන කෙවින් ෂවීනීස් මුහුණ දුන් ගැටලුවකින් වර්ධනය විය. මින් ස්වල්පයක් සරාගී වීම මන්දාකිණි පිලිබඳව උනන්දුවක් දැක්වූ අතර මන්දාකිනි ඔවුන්ගේ මෝර්ටිකල් විද්යාව අනුව වර්ගීකරණය කර ඇත - ඉලිප්සාකාර හෝ සර්පිලාකාර ඔවුන්ගේ වර්ණය නිල් හෝ රතු පැහැයෙන්. කාලයාගේ ඇවෑමෙන් තාරකා විද්යාඥයන් අතර සම්ප්රදායික ප්රඥාව අපගේ ක්ෂීර පථය මෙන් ම ස්පීටර මන්දාකන් වර්ණය නිල් වර්ණයෙන් යුක්ත වන අතර ඉලිප්සාකාර මන්දාකිනි රතු (මහලු වයස පෙන්නුම් කිරීම) රතු විය. Schawinski මෙම සාම්ප්රදායික ප්රඥාව සැක කළා. සාමාන්යයෙන් මෙම රටාව සත්යයක් විය හැකි වුවත්, ව්යතිරේක සංඛ්යාවක් විය හැකි අතර, මෙම අසාමාන්ය මන්දාකිනි බොහෝමයක් අපේක්ෂිත රටාවට ගැළපෙන අයුරින් අධ්යයනය කිරීමෙන් ඔහු විසින් ක්රියාවලිය ගැන යමක් ඉගෙන ගත හැකිය මන්දාකිණි පිහිටුවා ඇත.

මේ අනුව, සාම්ප්රදායික ප්රඥාව පෙරළීම සඳහා අවශ්ය වූ ෂාවිනින්ට අවශ්ය වුයේ morphologically වර්ගීකරණය කරන ලද මන්දාකිනි සමූහයකි; එනම්, සර්පිලාකාර හෝ ඉලිප්සාකාර ලෙස වර්ගීකරණය කරන ලද මන්දාකිණි. කෙසේ වෙතත්, ගැටළුව විද්යාත්මක පර්යේෂණ සඳහා භාවිතා කිරීමට ප්රමාණවත් තරම් ප්රමාණවත් නොවන වර්ගීකරණයක් සඳහා පවතින ඇල්ගොරිතම ක්රමවේදයන් තවමත් ප්රමාණවත් නොවේ. වෙනත් වචනවලින් කිවහොත්, මන්දාකිනි වර්ගීකරණය කිරීම එවකට පරිගණකයට දුෂ්කර වූ ගැටළුවක් විය. එබැවින්, අවශ්ය වූයේ මානව- වර්ගීකරණය කරන ලද මන්දාකිණි විශාල සංඛ්යාවකි. උපාධිධාරී ශිෂ්යයෙකුගේ උද්යෝගය සමඟ මෙම ශ්රේණිගත කිරීමේ ගැටලුව Schawinski විසින් ඉටු කරන ලදී. පැය 12 ක් පුරා පැවැත්වෙන මැරතන් සැසියකදී ඔහු මන්දාකිණි 50,000 ක් වර්ග කිරීමට සමත් විය. මන්දාකිණි 50,000 ක් පමණ විශාල ලෙස පෙනෙන්නට ඇතත්, එය ස්ලොන් ඩිජිටි ස්කයි සමීක්ෂණයේ ඡායාරූපගත කරන ලද මන්දාකිණියේ මිලියනයෙන් 5% ක් පමණි. ඔහු වඩාත් පුළුල් කළ හැකි ප්රවේශයක් අවශ්ය බව Schawinski තේරුම්.

එහෙත් වාසනාවකට මෙන්, එය මන්දාකිණි වර්ගීකරණය කිරීමේ කාර්යය තාරකා විද්යාව දියුණු පුහුණු අවශ්ය නොවේ බව හැරෙනවා; ඔබ ලස්සන ඉක්මනින් එය කිරීමට කෙනෙක් ඉගැන්විය හැක. වෙනත් වචන වලින් කිවහොත්, වර්ගීකරණය මන්දාකිණි පරිගණක සඳහා වෙහෙස මහන්සි වූ බව කාර්යය වුවත්, එය මිනිසුන්ට ලස්සන පහසු වුණා. ඒ නිසා, ඔක්ස්ෆර්ඩ්, Schawinski හා සෙසු තාරකා විද්යාඥ ක්රිස් Lintott දී පන්නයේ සමාජ වාඩි අතර ස්වේච්ඡා මන්දාකිනි රූප වර්ගීකරණය කරනු ඇත, වෙබ් අඩවියක් දක්වා සිහින මැව්වා. මාස කිහිපයකට පස්සේ, Galaxy සත්වෝද්යානය උපත ලැබීය.

ගැලැක්සි සව් වෙබ් අඩවියේ ස්වේච්ඡා සේවකයන්ට විනාඩි කිහිපයක් පුහුණුව ලැබෙනු ඇත. නිදසුනක් ලෙස, සර්පිලාකාර සහ ඉලිප්සාකාර මන්දාකිණිය අතර වෙනස ඉගෙන ගන්න (රූපය 5.2). මෙම පුහුණුවීමෙන් පසු, සෑම ස්වේච්ඡා සේවකයෙකුට සාපේක්ෂව පහසු සරල පරීක්ෂණයකට මුහුණදීමට සිදුවිය. එනම්, හඳුනාගත් වර්ගීකරණ වර්ග 15 කින් යුත් මන්දාකිණි 15 ක් 11 ක් නිවැරදිව වර්ගීකරණය කිරීමයි. පසුව සරල වෙබ් පාදක කරගත් අතුරුමුහුණතකි. ස්වෙච්ඡාවෙන් තාරකා විද්යාඥයින් වෙත සංක්රමණය වීම විනාඩි 10 කටත් වඩා අඩු කාලයකදී සිදුවනු ඇත.

රූපය 5.2: මන්දාකිණි ප්රධාන වර්ග දෙකට නිදසුන්: සර්පිලාකාර සහ ඉලිප්සීය. ගැලැක්සි සත්වෝද්යාන ව්යාපෘතිය ස්වේච්ඡා සේවකයන් 100,000 කට අධික සංඛ්යාවක් භාවිතා කළ අතර රූප 900,000 කට වඩා වර්ග කිරීම සඳහා යොදා ගන්නා ලදී. Http://www.GalaxyZoo.org හා ස්ලොන් ඩිජිටි ස්කයි සමීක්ෂණ මගින් අවසර ලබා ඇත.

රූපය 5.2: මන්දාකිණි ප්රධාන වර්ග දෙකට නිදසුන්: සර්පිලාකාර සහ ඉලිප්සීය. ගැලැක්සි සත්වෝද්යාන ව්යාපෘතිය ස්වේච්ඡා සේවකයන් 100,000 කට අධික සංඛ්යාවක් භාවිතා කළ අතර රූප 900,000 කට වඩා වර්ග කිරීම සඳහා යොදා ගන්නා ලදී. Http://www.GalaxyZoo.org හා ස්ලොන් ඩිජිටි ස්කයි සමීක්ෂණ මගින් අවසර ලබා ඇත.

රූප සටහන 5.3: එක් රූපයක් වර්ගීකරණය කිරීමට ස්වේච්ඡා සේවකයන්ගෙන් ඉල්ලා සිටින ආදාන තිරය. ස්ලොන් ඩිජිටි ස්කයි සමීක්ෂණයෙන් රූපයක් මත ක්රිස් ක්රිස් ලින්ට්ට් විසින් අවසරය ලබා ඇත.

රූප සටහන 5.3: එක් රූපයක් වර්ගීකරණය කිරීමට ස්වේච්ඡා සේවකයන්ගෙන් ඉල්ලා සිටින ආදාන තිරය. ස්ලොන් ඩිජිටි ස්කයි සමීක්ෂණයෙන් රූපයක් මත ක්රිස් ක්රිස් ලින්ට්ට් විසින් අවසරය ලබා ඇත.

මෙම ව්යාපෘතියේ ආරම්භක ස්වේච්ඡා සේවකයින් සිය ප්රාරම්භක ස්වේච්ඡා සේවකයින් ආකර්ෂණීය අයුරින් ප්රචලිත විය. ප්රවෘත්ති ලිපියෙහි දැක්වෙන පරිදි මාස හයක් පමණ වූ මෙම ව්යාපෘතියෙන් 100,000 කට වැඩි පුරවැසියන් විද්යාඥයින් සහභාගී විය. මෙම 100,000 ස්වේච්ඡා සේවකයන් එකතුවී මිලියන 40 කට වඩා වර්ගීකරණයට දායක වූ අතර, සාපේක්ෂව කුඩා, ප්රධාන කොටස්කරුවන්ගෙන් (Lintott et al. 2008) .

උපාධි අපේක්ෂක පර්යේෂණ සහායකයින් බඳවා ගැනීමේ අත්දැකීම් ඇති පර්යේෂකයන්ට දත්තවල ගුණාත්මකභාවය පිළිබඳව වහාම සැකසහිත වනු ඇත. මෙම සංශයවාදය සාධාරණ වුවත්, ගැලැක්සි සෝං පෙන්නුම් කරන්නේ, ස්වේච්ඡා දායකයන් නිවැරදිව පවිත්ර කරනු ලැබූ විට, පිරිහුණු හා සංයුක්ත වූ විට, ඔවුන් උසස් තත්වයේ ප්රතිඵල නිෂ්පාදනය කළ හැකිය (Lintott et al. 2008) . වෘත්තීමය තත්ත්වයෙන් යුත් දත්ත සෑදීමට සමූහය ලබා ගැනීම සඳහා වැදගත් ප්රයත්නයක් වන්නේ බොහෝ දෙනා විසින් කරන ලද එකම කර්තව්යයක් සහිත අතිරික්තතාවයකි . ගැලැක්සි සත්වෝද්යානය තුළ මන්දාකිණියට වර්ග වර්ග 40 ක් පමණ තිබිණි. උපාධි අෙප්ක්ෂක පර්ෙය්ෂක සහායකයින් භාවිතා කරන පර්ෙය්ෂකයන්ට ෙමම මට්ටමේ අතිරික්තතාව ලබා ගත ෙනොහැකි අතර එම නිසා එක් එක් වර්ගීකරණයට වඩා වැඩි සැලකිල්ලක් දැක්විය යුතුය. පුහුණුව සඳහා ස්වේච්ඡා සේවකයන්ට නොලැබුණේ කුමක් ද?

කෙසේ වෙතත්, මන්දාකිණිය සඳහා වර්ගීකරණයන් කීපයක් වුවද, සම්මුති සංග්රහයක් නිර්මාණය කිරීම සඳහා ස්වේච්ඡා වර්ගීකරණ කාණ්ඩයක් ඒකාබද්ධ කිරීම රළු විය. බොහෝ මානව ගණුෙදනු ව්යාපෘති වලදී ඉතා සමාන ගැටළු ඇතිවීම නිසා ගැලැක්සි සත්ව පර්යේෂණ පර්යේෂකයින් ඔවුන්ගේ එකඟතා වර්ගීකරණයන් භාවිතා කිරීමට පියවර තුනක් කෙටියෙන් සලකා බැලීම ප්රයෝජනවත් වේ. පළමුවෙන්ම, පර්යේෂකයන් ව්යාජ වර්ගීකරණයන් ඉවත් කිරීමෙන් දත්ත දත්ත "පිරිසිදු" කලේය. නිදසුනක් වශයෙන්, එම මන්දාකිනිය නැවත නැවතත් එම වර්ගීකරණයට ලක් කළ අය - එම ප්රතිඵල උපයෝගී කරගැනීමට උත්සාහ කළහොත් එය සිදු වනු ඇත. මෙම සහ වෙනත් එවැනි පිරිසිදු කිරීම් සියලු වර්ගීකරණයන්ගෙන් 4% පමණ ඉවත් කර ඇත.

දෙවනුව, පිරිසිදු කිරීමෙන් අනතුරුව පර්යේෂකයන්ට වර්ගීකරණයන්හි ක්රමානුකූල පක්ෂපාතීත්වය ඉවත් කිරීමට අවශ්ය විය. මුල් ව්යාපෘති-නිදසුනක් ලෙසින්, තුළ කා වැදී නැඹුරුව හඳුනා අධ්යයන මාලාවක් හරහා, ඊට හේතුවක් සමහර ස්වේච්ඡා මන්දාකිනියේ පෙන්නුම් වෙනුවට වර්ණ පර්යේෂකයන් එවැනි ක්රමානුකූල නැඹුරුව ලෙස කිහිපයක් ක්රමානුකූලව අගතීන්, ඉලිප්සාකාර මන්දාකිණි ලෙස දුර ඈත සර්පිලාකාර මන්දාකිණි වර්ගීකරණය කිරීමට සොයා (Bamford et al. 2009) . මෙම ක්රමවත් පක්ෂපාතීත්වය සඳහා ගැලපීම අතිශයින්ම වැදගත් වන්නේ අතිරික්තතාව ස්වයංක්රීයව පක්ෂග්රාහීව ඉවත් කිරීම නොවේ; එය අහඹු දෝෂ ඉවත් කරයි.

අවසාන වශයෙන්, පර්යේෂකයන්ට එකඟතාවයකට අනුව වර්ගීකරණය කිරීම සඳහා තනි වර්ගීකරණයන් ඒකාබද්ධ කිරීමට ක්රමයක් අවශ්ය විය. එක් එක් මන්දාකිණිය සඳහා වර්ගීකරණයන් ඒකාබද්ධ කිරීම සඳහා සරලම ක්රමය වන්නේ වඩාත් පොදු වර්ගීකරණයයි. කෙසේ වෙතත්, මෙම ප්රවේශය සෑම ස්වේච්ඡා සේවකයෙකුටම සමාන බරක් ලබා දෙනු ඇති අතර, සමහර ස්වේච්ඡා සේවකයන් අනෙකුත් වර්ගයන්ට වඩා වර්ගීකරණයට ලක් වූ බව පර්යේෂකයින් සැක කළෝය. එම නිසා පර්යේෂකයන් විසින් වඩා උසස් වර්ගීකරණයක් හඳුනා ගැනීමට උත්සාහ කළ වඩාත් සංකීර්ණ නැවත අර්ථ නිරූපණය කිරීමේ ක්රමවේදය වැඩිදියුණු කර වැඩි බරක් ලබා දෙන ලදී.

මේ අනුව, පියවර තුනක ක්රියාවලියක් පිරිසිදු කිරීම, බර කිරීම හා බර කිරීම - ගැලැක්සි සත්ව පර්යේෂණ කණ්ඩායමට මිලියන 40 ක් ස්වේච්ඡා වර්ගීකරණයන් අනුගත වී ඇත. මෙම ගැලැක්සි සෝ සුචීශීලී වර්ගීකරණයන් විසින් Galaxy තාරකා සම්භවයක් ඇති කිරීමට උපකාරී වූ ස්විට්සීන් විසින් වර්ගීකරණය කිරීම ඇතුළු වෘත්තීය තාරකා විද්යාඥයන් විසින් සිදු කරන ලද කුඩා කුඩා පරිමාණ ප්රයෝගයන් සමඟ සැසඳුන විට එය බලගතු එකඟත්වයක් ඇත. මේ අනුව, ස්වේච්ඡා සේවකයන්, සමස්තයක් වශයෙන්, උසස් තත්ත්වයේ වර්ගීකරණයන් සැපයීමට සමත් වූ අතර පර්යේෂකයන්ට නොගැලපෙන පරිමාණයෙන් (Lintott et al. 2008) . සැබවින්ම, මන්දාකිනි වැනි විශාල සංඛ්යාවන් සඳහා මිනිස් වර්ගීකරණ මගින් ස්වීප්ස්කි, ලින්ග්නට් හා අනෙකුත් අය හට ගැලැක්සිවලින් සියයට 80 ක් පමණ අපේක්ෂා කරන ලද නිල් පැහැති ස්පරල් සහ රතු ඉලිප්ලිවල අනුගමනය කළ හැකි බව පෙන්වනු ලැබේ. මෙම සොයාගැනීම (Fortson et al. 2011) .

මෙම පසුබිම සලකා බැලූ විට, දැන් ඔබට ගැලැක්සි සත්වෝද්යානයෙන් බෙහෙවින් භාවිතා වන වට්ටෝරුව, බොහෝ මානව ගණුනාත්මක ව්යාපෘති සඳහා භාවිතා කරනු ලබන එම වට්ටෝරුව අනුගමනය කරයි. පළමුව, විශාල ගැටළුවක් කැබලිවලට බෙදී ඇත. මේ අවස්ථාවේ දී එක් මන්දාකිණි වර්ගීකරණය කිරීම පිළිබඳ ගැටළුව එක් මන්දාකිණි වර්ගීකරණය කිරීම පිලිබඳ ගැටළු ලක්ෂයක් බවට පත් විය. ඊළඟට, මෙහෙයුමක් ස්වාධීනව එක් එක් කොටසේ ආලේප කරයි. මෙම අවස්ථාවේ දී ස්වෙච්ඡාවෙන් එක් එක් මන්දාකිනිය සර්පිලාකාර හෝ ඉලිප්සාකාර ලෙස වර්ගීකරණය කරයි. අවසාන වශයෙන්, සම්මුතිමය ප්රතිඵලයක් ලබා ගැනීම සඳහා ප්රතිඵල ඒකාබද්ධ කෙරේ. මෙම අවස්ථාවේදී, එක් එක් මන්දාකිණි සඳහා සම්මුති සංග්රහයක් නිර්මාණය කිරීම සඳහා පිරිසිදු කිරීමේ, අඳින බව සහ බර තැබීම ඇතුළත් විය. බොහෝ ව්යාපෘති මෙම පොදු වට්ටෝරුව භාවිතා කරන නමුත්, සෑම පියවරක්ම ආමන්ත්රණය කරන විශේෂිත ගැටළුවකට අනුව සකස් කළ යුතුය. උදාහරණයක් ලෙස, පහත විස්තර කර ඇති මානව ගණිත ව්යාපෘතියේ දී එම වට්ටෝරුව අනුගමනය කරනු ඇත, නමුත් පියවර හා ඒකාබද්ධ පියවර ඉතා වෙනස් වේ.

Galaxy Zoo කණ්ඩායම සඳහා මෙම පළමු ව්යාපෘතිය ආරම්භය පමණි. මිලියනයකට ආසන්න මන්දාකිණියකට වර්ගීකරනය කිරීමට හැකි වුවද, මෙම පරිමාණය නව ඩිජිටල් අහස සමීක්ෂණ සමග වැඩ කිරීමට ප්රමාණවත් නොවේ. එය බිලියන 10 ක පමණ මන්දාකිනිවල රූප සෑදිය හැකිය. (Kuminski et al. 2014) . මිලියන 1 සිට බිලියන 10 දක්වා වැඩිවීම සඳහා 10,000 ක් පමණ වන Galaxy Saloon වැඩිපුර 10,000 කට වඩා වැඩි සංඛ්යාවක් බඳවා ගැනීමට අවශ්ය වනු ඇත. අන්තර්ජාලයේ ස්වේච්ඡා සේවකයන් විශාල සංඛ්යාවක් විශාල වුණත් එය අනන්තය. එමනිසා පර්යේෂකයන් අවබෝධ කරගෙන සිටියේ, ඔවුන් වර්ධනය වෙමින් පවතින දත්ත වලට මුහුණ දීමට සිදුවන බවය. නව, වඩාත් පරිමාණ කළ හැකි ප්රවේශයක් අවශ්ය බවය.

එබැවින්, මැන්ඩා බැනර්ජි - මැක්නා බැනර්ජි (2010) Schawinski (2010) ලින්ග්නට් සහ මැලැක්සෝ සෝ සුකී (2010) සෙසු සාමාජිකයන් සමග වැඩ කිරීම - මන්දාකිණි වර්ගීකරණය කිරීමට පරිගණක ඉගැන්වීම ආරම්භ කළහ. විශේෂයෙන් ම ගැලැක්සි සත්වෝද්යානය නිර්මාණය කරන ලද මානව වර්ගීකරණ භාවිතයන් යොදා ගනිමින්, බැනර්ජි රූපයේ ලක්ෂණයන් මත පදනම් වූ මන්දාකිනියක මානව වර්ගීකරණයක් අනාවැකි පල කළ හැකි පරිගණක ඉගෙනුම් ආකෘතියක් නිර්මාණය කළේය. මෙම ආකෘතිය ඉතා ඉහළ නිරවද්යතාවයකින් මනුෂ්ය වර්ගීකරණයන් ප්රජනනය කළ හැකි නම්, එය ගැලැක්සි සෝප් පර්යේෂකයන් විසින් සාරභූතව අනන්ත ප්රමාණයේ මන්දාකිණි වර්ගීකරණය කිරීමට යොදා ගත හැකිය.

බැනර්ජි සහ සගයන්ගේ ප්රවේශයේ කේන්ද්රය සමාජ පර්යේෂණයන්හි බහුලව භාවිතා වන තාක්ෂණික ක්රම වලට සමානයි. එහෙත්, එම සමානකම පළමු පැහැදිළිව පැහැදිළි නොවිය හැකිය. පළමුව, බැනර්ජි සහ සගයන් සෑම රූපයක්ම සිය ගුණාංගයන් සාරාංශගත කර ඇති සංඛ්යාත්මක ලක්ෂණ ගණන බවට පරිවර්තනය කළේය. උදාහරණයක් වශයෙන්, මන්දාකිනිවල රූප සඳහා, ලක්ෂණ තුනක් විය හැකිය: රූපයේ නිල් පැහැති ප්රමාණය, පික්සෙල් දීප්තියේ විචලතාව සහ අක්ෂි නොවන පික්සල්වල ප්රතිශතය. නිවැරදි ලක්ෂණ තෝරාගැනීම ගැටලුවේ වැදගත් කොටසක් වන අතර, එය සාමාන්යයෙන් විෂය ක්ෂේත්රයේ විශේෂඥතාව අවශ්ය වේ. මෙම පළමු පියවර, සාමාන්යයෙන් වෛරස් ඉංජිනේරු විද්යාව යනුවෙන් හැඳින්වෙන්නේ, එක් රූපයකට එක් පේළියක් සමග දත්ත ශ්රේණියක ප්රතිඵලයක් වන අතර එම රූපය විස්තර කරන තීරු තුනකි. දත්ත අනුකෘතිය සහ අපේක්ෂිත ප්රතිදානය (උදා. රූපය මිනිසා විසින් ඉලිප්සීය චක්රාවාටයක් ලෙස වර්ගීකරණය කර තිබේද?) පර්යේෂකයා විසින් සංඛ්යානමය හෝ පරිගණක ඉගෙනුම් ආකෘතියක් නිර්මාණය කරයි. නිදසුනක් ලෙස, රූපය. අවසානයේ, පර්යේෂකයා විසින් නව මන්දාකිනිවල ඇස්තමේන්තුගත වර්ගීකරණයන් නිෂ්පාදනය සඳහා මෙම සංඛ්යානමය ආකෘතියේ පරාමිතීන් භාවිතා කරයි (රූප සටහන 5.4). පරිගණක ඉගෙනීමේදී, මෙම ප්රවේශය - නව දත්ත නාමකරණයට ලක් කළ හැකි ආකෘතියක් නිර්මාණය කිරීමට ලේබල් කළ උදාහරණ භාවිතා කිරීම අධීක්ෂිත ඉගෙනුම් ලෙස හැඳින්වේ.

රූප සටහන 5.4: බැනර්ජි සහ ඇල්. (2010) මයික්රොසොෆ්ට් සෝු ශ්රේණිගත කිරීම් භාවිතා කළේ ගාමක වර්ගීකරණය සඳහා යන්ත්ර ඉගෙනුම් ආකෘතියක් පුහුණු කිරීම සඳහාය. මන්දාකිණි වල රූප එක් අංගයක ගුණකයක් බවට පරිවර්තනය විය. මෙම සරල කළ නිදසුන තුළ, විශේෂාංග තුනක් (රූපයේ නිල් පැහැය, පික්සෙල් දීප්තියේ විචලතාව සහ නොවන සුදු පැහැ පික්සල්වල ප්රමාණය). ඉන්පසු, පින්තූරවල උපකුලකයක් සඳහා මැක්සිං සෝු ලේබල් යාන්ත්රික ඉගෙනුම් මොඩියුලයක් පුහුණු කිරීම සඳහා යොදා ගනී. අවසාන වශයෙන්, යාන්ත්රික ඉගෙනීම, ඉතිරි මන්දාකිනි සඳහා වර්ගීකරණයන් තක්සේරු කිරීම සඳහා යොදා ගනී. මම මෙය පරිගණක ආධාරයෙන් මානව ගණකාධිකරණ ව්යාපෘතියක් ලෙස හඳුන්වනු ලැබුවෙමි. මන්ද මිනිසා ගැටලුවක් විසඳීමට වඩා මිනිසා විසින් ගැටලුව විසඳීමට පරිගණකයක් පුහුණු කිරීමට භාවිතා කළ හැකි දත්ත කට්ටලයක් නිර්මාණය කර ඇත. මෙම පරිගණක ආධාරයෙන් මානව ගණනය කිරීමේ පද්ධතියේ ඇති වාසිය වන්නේ එය අනිවාර්යයෙන්ම අනන්ත ප්රමාණාත්මක දත්තයන් යොදාගෙන මිනිසාගේ පරිශ්රමයෙන් පරිපූර්ණ ලෙස භාවිතා කළ හැකි බවයි. ස්ලොන් ඩිජිටි ස්කයි සමීක්ෂනයෙන් අවසර ලත් මන්දාකිණිවල ඡායාරූප.

රූප සටහන 5.4: Banerji et al. (2010) මයික්රොසොෆ්ට් සෝු ශ්රේණිගත කිරීම් භාවිතා කළේ ගාමක වර්ගීකරණය සඳහා යන්ත්ර ඉගෙනුම් ආකෘතියක් පුහුණු කිරීම සඳහාය. මන්දාකිණි වල රූප එක් අංගයක ගුණකයක් බවට පරිවර්තනය විය. මෙම සරල කළ නිදසුන තුළ, විශේෂාංග තුනක් (රූපයේ නිල් පැහැය, පික්සෙල් දීප්තියේ විචලතාව සහ නොවන සුදු පැහැ පික්සල්වල ප්රමාණය). ඉන්පසු, පින්තූරවල උපකුලකයක් සඳහා මැක්සිං සෝු ලේබල් යාන්ත්රික ඉගෙනුම් මොඩියුලයක් පුහුණු කිරීම සඳහා යොදා ගනී. අවසාන වශයෙන්, යාන්ත්රික ඉගෙනීම, ඉතිරි මන්දාකිනි සඳහා වර්ගීකරණයන් තක්සේරු කිරීම සඳහා යොදා ගනී. මම මෙය පරිගණක ආධාරයෙන් මානව ගණකාධිකරණ ව්යාපෘතියක් ලෙස හඳුන්වනු ලැබුවෙමි. මන්ද මිනිසා ගැටලුවක් විසඳීමට වඩා මිනිසා විසින් ගැටලුව විසඳීමට පරිගණකයක් පුහුණු කිරීමට භාවිතා කළ හැකි දත්ත කට්ටලයක් නිර්මාණය කර ඇත. මෙම පරිගණක ආධාරයෙන් මානව ගණනය කිරීමේ පද්ධතියේ ඇති වාසිය වන්නේ එය අනිවාර්යයෙන්ම අනන්ත ප්රමාණාත්මක දත්තයන් යොදාගෙන මිනිසාගේ පරිශ්රමයෙන් පරිපූර්ණ ලෙස භාවිතා කළ හැකි බවයි. ස්ලොන් ඩිජිටි ස්කයි සමීක්ෂනයෙන් අවසර ලත් මන්දාකිණිවල ඡායාරූප.

බැනර්ජි සහ සගයන්ගේ පරිගණක ඉගෙනුම් ආකෘතියෙහි ඇති අංගයන් මගේ සෙල්ලම් බඩු ආදර්ශයට වඩා සංකීර්ණ විය. නිදසුනක් ලෙස, ඇය "ඩි වොකියුලර්ස් ඇක්සියා අනුපාතය" වැනි අංගයන් භාවිතා කළාය. ඇගේ ආකෘතිය logistical regression විය. මෙය කෘතිම ස්නායු ජාලයකි. සිය ලක්ෂණ, ඇගේ ආකෘතිය සහ එකඟතාවයට ගැලැක්සි සෝු ශ්රේණිගත කිරීම් භාවිතා කරමින්, සෑම අංගයක් සඳහාම බර උත්පාදනය කිරීමට හැකි වූ අතර, ගැලැක්සි වර්ගීකරණය පිළිබඳව අනාවැකි පළ කිරීම සඳහා එම බර භාවිතා කළාය. නිදසුනක් වශයෙන් ඇයගේ විශ්ලේෂණයෙන් පෙනී ගියේ, අඩු "ඩි වොකියුලර්ස් ඇක්සියා අනුපාතය" සහිත ඡායාරූප සහිත සර්පිලාකාර මන්දාකිනි විය හැකි බවයි. මෙම බර දරා ගැනීම සඳහා සාධාරණ නිරවද්යතාවකින් යුත් මන්දාකිණියේ මානව වර්ගීකරණය අනාවැකි කිරීමට හැකි විය.

බැනර්ජි සහ සගයන්ගේ කාර්යයන් Galaxy Sawoo මා පරිගණක පරිගනකයෙන් යුක්ත පරිගණක ක්රමයක් ලෙස හඳුන්වන දේ ලෙසට පරිවර්තනය විය. මෙම දෙමුහුන් ක්රම ගැන සිතිය හැකි හොඳම ක්රමය මිනිසා ගැටළුවක් විසඳීමට වඩා, මිනිසුන් ගැටලුව විසඳීමට පරිගණකයක් පුහුණු කිරීම සඳහා යොදා ගත හැකි දත්ත කට්ටලයක් ගොඩ නගා ගැනීමයි. සමහර අවස්ථාවලදී, ගැටලුව විසඳීමට පරිගණකයක් පුහුණු කිරීම සඳහා බොහෝ උදාහරණ අවශ්ය වන අතර ප්රමාණවත් උදාහරණ සාදනු ලබන එකම මාර්ගය වන්නේ සමූහ සහයෝගිතාවයි. මෙම පරිගණක ආධාරයෙන් යුත් ප්රවේශයේ වාසිය වනුයේ ඔබට අවශ්ය වන්නේ අසීමිත ප්රමාණාත්මක දත්තයන් යොදාගෙන පමණි. නිදසුනක් වශයෙන්, මිලියන ගණන් වර්ගීකරණ මන්දාකිනිවල පර්යේෂකයෙකුට බිලියන එකක් හෝ මන්දාකිණි වර්ගයක් වර්ග කිරීම සඳහා උපකල්පිත ආකෘතියක් නිර්මාණය කළ හැකිය. විශාල මන්දාකිනි සංඛ්යාවක් තිබේ නම්, මේ ආකාරයේ මානව-පරිගණක දෙමුහුන් නම් සැබවින්ම එකම විසඳුම විය හැකිය. කෙසේ වෙතත් මෙම අසමසම විභේධතිය නිදහස් වේ. මානව වර්ගීකරණය නිවැරදිව ප්රතිනිෂ්පාදනය කළ හැකි පරිගණක ආකෘතියක් ගොඩ නැගීම අපහසු වේ, නමුත් වාසනාවකට මෙන් මෙම මාතෘකාව සඳහා කැපවූ පොත් දැනටමත් ඇත (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

ගැලැක්සි සත්වෝද්යානය යනු මානව ගණුනාත්මක ව්යාපෘති විශාල සංඛ්යාවක් පරිණාමය වේ. පළමුවෙන්ම, පර්යේෂකයෙක් විසින් මෙම ව්යාපෘතිය මගින් හෝ කුඩා පර්යේෂණ කණ්ඩායමක් සමග (උදා: Schwinski's මුල් වර්ගීකරණ ප්රයත්නය) සමග ය. මෙම ප්රවේශය හොඳින් මනිනු නැති නම්, පර්යේෂකයාට බොහෝ සහභාගී වන්නන්ට මානව ගණනය කිරීමේ ව්යාපෘතියකට ගමන් කළ හැකිය. එහෙත්, එක්තරා පරිමාවක් සඳහා, පිරිසිදු මානව ප්රයත්නය ප්රමාණවත් නොවේ. එතැන් සිට පර්යේෂකයන්ට පරිගනක සහය ලබා දෙන මානව ගණකාධිකරණ පද්ධතියක් ගොඩනැඟිය යුතු අතර, පරිගණක වර්ගීකරණ මොඩියුලයක් පුහුණු කිරීම සඳහා මානව වර්ගීකරණ ක්රම භාවිතා කරනු ලබන අතර එය අසීමිත දත්ත ප්රමාණයක් භාවිතයට ගත හැකිය.