5.2.1 கேலக்ஸி பூங்காவில்

கேலக்ஸி உயிரியல் பூங்காவில் பல மில்லியன் நிபுணத்துவ வாலண்டியர்களின் முயற்சிகள் ஒரு மில்லியன் விண்மீன் மண்டலங்களை வகைப்படுத்தப்பட்டன.

2007 ஆம் ஆண்டில் ஆக்ஸ்போர்டு பல்கலைக்கழகத்தின் வானியல் துறையில் பட்டதாரி மாணவரான கெவின் ஷாவின்ஸ்கி எதிர்கொண்ட ஒரு பிரச்சனையிலிருந்து கேலக்ஸி உயிரியல் பூங்காவிற்கு வெளியே வளர்ந்தது. ஷாவின்ஸ்கி விண்மீன் குழுக்களில் ஆர்வமாக இருந்தார், மேலும் விண்மீன் திரவங்கள்-உருவங்கள் அல்லது சுழல் மற்றும் அவர்களின் நிறம் நீலம் அல்லது சிவப்பு மூலம். அந்த நேரத்தில், வானியல் வல்லுநர்களிடையே உள்ள வழக்கமான ஞானம், நமது பால்வெளி போன்ற சுழல் மண்டலம், நீல நிறத்தில் இருந்தது (இளைஞர்களைக் குறிக்கிறது) மற்றும் நீள்வட்ட மண்டலங்கள் சிவப்பு (வயது முதிர்வைக் குறிக்கும்). இந்த வழக்கமான ஞானத்தை Schawinski சந்தேகித்தார். இந்த முறை பொதுவாகவே உண்மையாக இருக்கலாம் என சந்தேகிக்கிறார், அநேகமாக கணிசமான எண்ணிக்கையில் விதிவிலக்குகள் இருந்தன, மேலும் இந்த அசாதாரண விண்மீன் பலவற்றைப் படிப்பதன் மூலம்-எதிர்பார்த்த வகைக்கு பொருந்தாதவற்றை-அவர் செயல்முறை பற்றி ஏதாவது கற்றுக் கொள்ளலாம் விண்மீன் திரள்கள் உருவாக்கப்பட்டது.

இவ்வாறு, மரபு ரீதியான ஞானத்தைத் திருப்புவதற்காக ஷாவின்ஸ்கிக்கு என்ன தேவை என்பது ஒரு பரவலான ஒழுங்கமைக்கப்பட்ட விண்மீன் தொகுப்பாக இருந்தது; அதாவது, சுழல் அல்லது நீள்வட்டமாக வகைப்படுத்திய கேலக்ஸிகள். சிக்கல், இருப்பினும், வகைப்பாட்டிற்கான நடைமுறை வழிமுறைகள் அறிவியல் ஆராய்ச்சிக்காக பயன்படுத்தப்படவேண்டிய போதுமானதல்ல. வேறு வார்த்தைகளில் கூறுவதானால், விண்மீன் குழுக்கள் அந்த நேரத்தில், கணினிகளுக்கு கடினமாக இருந்த ஒரு சிக்கல். ஆகையால், மனித- வகைப்படுத்தப்பட்ட விண்மீன் திரள்கள் ஏராளமான எண்ணிக்கையில் தேவைப்பட்டன. ஒரு பட்டதாரி மாணவரின் உற்சாகத்துடன் இந்த வகைப்பாடு சிக்கலை Schawinski மேற்கொண்டார். ஏழு 12 மணி நேர நாட்களுக்கு ஒரு மராத்தான் கூட்டத்தில், அவர் 50,000 விண்மீன் திரள்களை வகைப்படுத்த முடிந்தது. ஏறக்குறைய 50,000 விண்மீன் திரள்கள் நிறைய ஒலிக்கும் போது, ​​இது ஸ்லொன் டிஜிட்டல் ஸ்கை சர்வேயில் புகைப்படம் எடுத்த சுமார் ஒரு மில்லியன் விண்மீன் திரள்களில் சுமார் 5% ஆகும். ஷாவின்ஸ்கிக்கு இன்னும் அதிக அளவிலான அணுகுமுறை தேவை என்று உணர்ந்தார்.

அதிர்ஷ்டவசமாக, அது வகைப்படுத்தி விண்மீன் திரள்கள் பணி வானியல் மேம்பட்ட பயிற்சி தேவையில்லை என்று மாறிவிடும்; நீங்கள் மிகவும் விரைவாக அதை செய்ய ஒருவரை கற்பிக்க முடியும். வேறு வார்த்தைகளில் கூறுவதானால், விண்மீன் திரள்கள் வகைப்படுத்தி கணினிகள் கடினமாக இருந்தது என்று ஒரு பணியாகும் கூட, அது மனிதர்கள் அழகாக எளிதாக இருந்தது. எனவே, ஆக்ஸ்போர்டு, Schawinski மற்றும் சக வானியலாளர் கிறிஸ் Lintott ஒரு மதுக்கடையில் உட்கார்ந்து போது தொண்டர்கள் விண்மீன் திரள்கள் படங்களை வகைப்படுத்த வேண்டும், அங்கு ஒரு வலைத்தளத்தில் வரை கனவு. ஒரு சில மாதங்கள் கழித்து, கேலக்ஸி பூங்காவில் பிறந்தார்.

கேலக்ஸி உயிரியல் பூங்காவில், தொண்டர்கள் சில நிமிட பயிற்சிக்கு உட்படுத்தப்படுவார்கள்; உதாரணமாக, சுழல் மற்றும் நீள்வட்ட மண்டலம் (வேறுபாடு 5.2) இடையே உள்ள வித்தியாசத்தை அறிந்து கொள்வது. இந்த பயிற்சிக்கான பிறகு, ஒவ்வொரு வாலண்டியரும் ஒரு ஒப்பீட்டளவில் எளிதான வினாடி-விதியை சரியாகப் புரிந்து கொள்ள வேண்டும்-அதாவது, 15 வகை விண்மீன்களைக் கொண்ட 11 வகைப்பட்ட வகைப்படுத்தல்களை வகைப்படுத்தி, பின்னர் ஒரு எளிய வலை-அடிப்படையிலான இடைமுகம் (எண்ணிக்கை 5.3) மூலம் அறியப்படாத விண்மீன் திரட்டல்களின் உண்மையான வகைப்படுத்தலைத் தொடங்கலாம். தன்னார்வலரிடம் வானியலாளருக்கு மாற்றுவதற்கு 10 நிமிடங்களுக்கும் குறைவான இடங்களில் மட்டுமே நடைபெறும், குறைந்தபட்சமான தடைகளை கடந்து செல்லும் ஒரு எளிய வினாடி.

படம் 5.2: இரண்டு முக்கிய வகை விண்மீன்களின் எடுத்துக்காட்டுகள்: சுழல் மற்றும் நீள்வட்டம். கேலக்ஸி மிருகக்காட்சி திட்டம் 900,000 க்கும் மேற்பட்ட படங்களை வகைப்படுத்த 100,000 க்கும் மேற்பட்ட தன்னார்வலர்களைப் பயன்படுத்தியது. Http://www.GalaxyZoo.org மற்றும் ஸ்லொன் டிஜிட்டல் ஸ்கை சர்வே ஆகியோரிடமிருந்து அனுமதியால் அனுப்பிவைக்கப்பட்டது.

படம் 5.2: இரண்டு முக்கிய வகை விண்மீன்களின் எடுத்துக்காட்டுகள்: சுழல் மற்றும் நீள்வட்டம். கேலக்ஸி மிருகக்காட்சி திட்டம் 900,000 க்கும் மேற்பட்ட படங்களை வகைப்படுத்த 100,000 க்கும் மேற்பட்ட தன்னார்வலர்களைப் பயன்படுத்தியது. Http://www.GalaxyZoo.org மற்றும் ஸ்லொன் டிஜிட்டல் ஸ்கை சர்வே ஆகியோரிடமிருந்து அனுமதியால் அனுப்பிவைக்கப்பட்டது .

படம் 5.3: தொண்டர்கள் ஒரு ஒற்றை படத்தை வகைப்படுத்த வேண்டும் என்று அங்கு உள்ளீடு திரை. ஸ்லோன் டிஜிட்டல் ஸ்கை சர்வயில் இருந்து ஒரு படத்தை அடிப்படையாகக் கொண்ட கிறிஸ் லின்டாட்டின் அனுமதியால் அனுப்பி வைக்கப்பட்டது.

படம் 5.3: தொண்டர்கள் ஒரு ஒற்றை படத்தை வகைப்படுத்த வேண்டும் என்று அங்கு உள்ளீடு திரை. ஸ்லோன் டிஜிட்டல் ஸ்கை சர்வயில் இருந்து ஒரு படத்தை அடிப்படையாகக் கொண்ட கிறிஸ் லின்டாட்டின் அனுமதியால் அனுப்பி வைக்கப்பட்டது.

கேலக்ஸி மிருகக்காட்சி அதன் ஆரம்ப தொண்டர்களை ஈர்த்தது, செய்தி அறிக்கையில் இடம்பெற்றது, சுமார் ஆறு மாதங்களில் இந்த திட்டம் 100,000 க்கும் அதிகமான குடிமக்கள் விஞ்ஞானிகளால் பங்குபெற்றது, அவர்கள் பணி அனுபவித்ததால், அவர்கள் பணியை அனுபவித்தனர், அவர்கள் வானியல் முன்னேற்றத்திற்கு உதவ விரும்பினர். இந்த 100,000 தொண்டர்கள் மொத்தமாக 40 மில்லியனுக்கும் மேலான வகைப்படுத்தல்களுக்கு பங்களித்தனர், இதில் பெரும்பான்மையானவர்கள், சிறிய, முக்கிய குழு பங்கேற்பாளர்களிடமிருந்து (Lintott et al. 2008) .

இளங்கலை ஆய்வாளர்கள் பணியமர்த்தல் அனுபவம் அனுபவமுள்ள ஆய்வாளர்கள் உடனடியாக தரவு தரத்தைப் பற்றி சந்தேகம் கொள்ளலாம். இந்த சந்தேகம் நியாயமானதாக இருக்கும்போது, ​​தன்னார்வ நன்கொடைகள் சரியாக சுத்தம் செய்யப்பட்டு, debiased மற்றும் திரட்டப்பட்டால், அவை உயர் தர முடிவுகளை உருவாக்கலாம் (Lintott et al. 2008) . தொழில்ரீதியான தரமுள்ள தரவு உருவாக்க கூட்டத்தில் பெறுவதற்கான ஒரு முக்கிய தந்திரம் பல்வேறு மக்களால் மேற்கொள்ளப்படும் அதே பணி கொண்டிருக்கும் என்று ஆள்குறைப்பு, உள்ளது. கேலக்ஸி மிருகக்காட்சிசாலையில், விண்மீன் ஒன்றுக்கு சுமார் 40 வகைப்பாடுகள் இருந்தன; பட்டதாரி ஆராய்ச்சி உதவியாளர்களைப் பயன்படுத்தும் ஆய்வாளர்கள், இந்த அளவு குறைபாட்டைக் கொண்டிருக்க முடியாது, எனவே ஒவ்வொரு தனி வகைப்பாட்டின் தரத்திற்கும் அதிக கவனம் செலுத்த வேண்டும். தன்னார்வலர்களுக்கு பயிற்சி இல்லாததால், அவர்கள் பணிநீக்கம் செய்யப்பட்டனர்.

எவ்வாறாயினும், ஒரு விண்மீன் ஒன்றுக்கு பல வகைப்பாடுகளுடன் கூட, ஒரு தன்னார்வ வகைப்பாட்டின் தொகுப்பை ஒருங்கிணைத்து, ஒரு கருத்தொகுப்பு வகைப்பாட்டியை உருவாக்குவது தந்திரமானதாக இருந்தது. பெரும்பாலான மனித கணிப்புத் திட்டங்களில் இதேபோன்ற சவால்கள் ஏற்படுகின்றன, ஏனெனில் கேலக்ஸி உயிரியல் ஆராய்ச்சியாளர்கள் தங்கள் கருத்தொற்றுமை வகைப்படுத்தல்களை தயாரிக்க மூன்று படிகளை சுருக்கமாக ஆய்வு செய்வது உதவியாக இருக்கும். முதலாவதாக, ஆராய்ச்சியாளர்கள் போலி வகைகளை அகற்றுவதன் மூலம் தரவுகளை "சுத்தம் செய்தனர்." உதாரணமாக, மீண்டும் மீண்டும் அதே கேலக்ஸை வகைப்படுத்தியவர்கள்-அவை முடிவுகளை கையாள முயற்சிக்கிறார்களானால்-அவை அனைத்தும் தங்கள் வகைப்பாடுகளை நிராகரித்தன. இந்த மற்றும் பிற ஒத்த துப்புரவுகளில் அனைத்து வகைகளில் 4% நீக்கப்பட்டன.

இரண்டாவதாக, சுத்திகரிக்கப்பட்ட பிறகு, ஆராய்ச்சியாளர்கள் வகுப்புவாதத்தில் முறையான பயன்களை அகற்ற வேண்டும். அசல் திட்டத்திற்குள் உட்பொதிக்கப்பட்ட தொடர்ச்சியான பயாஸ் கண்டறிதல் ஆய்வுகள் மூலம், உதாரணமாக, சில தொண்டர்கள் மோனோக்ரோமில் உள்ள விண்மீன்களைக் காட்டிலும் பதிலாக நிறத்தை காட்டுகின்றன-ஆராய்ச்சியாளர்கள் பல முறையான பயன்களைக் கண்டுபிடித்தனர், தொலைதூர சுருள் மண்டலங்களை நீள்வட்ட மண்டலங்களாக (Bamford et al. 2009) . இந்த முறையான சார்புகளுக்கு சரிசெய்தல் மிக முக்கியமானது ஏனெனில் ஏனெனில் பணிநீக்கம் தானாக திட்டமிட்ட பகுப்பாய்வுகளை அகற்றாது; அது மட்டும் சீரற்ற பிழை நீக்குவதற்கு உதவும்.

இறுதியில், debiasing பின்னர், ஆராய்ச்சியாளர்கள் ஒருமித்த வகைப்படுத்தலை ஒரு தனிபயன் வகைப்படுத்தலை உருவாக்க ஒரு முறை தேவை. ஒவ்வொரு விண்மீன் மண்டலத்திற்கும் வகைப்படுத்தல்களை இணைப்பதற்கான மிக எளிய வழியாகும் மிகவும் பொதுவான வகைப்பாட்டியைத் தேர்வுசெய்யும். இருப்பினும், இந்த அணுகுமுறை ஒவ்வொரு தன்னார்வ தொகையும் சமமான எடையைக் கொடுத்திருக்கும், மேலும் சில தொண்டர்கள் மற்றவர்களை விட வகைப்பாட்டில் சிறப்பாக இருந்ததாக ஆராய்ச்சியாளர்கள் சந்தேகிக்கின்றனர். எனவே, ஆய்வாளர்கள் மிகவும் சிக்கலான மறுதலிப்பு எடையை நடைமுறைப்படுத்தினர், அது சிறந்த வகைப்படுத்திகளை கண்டுபிடித்து அவற்றை அதிக எடையைக் கொடுக்க முயன்றது.

எனவே, மூன்று-படிநிலை-சுத்தம், debiasing மற்றும் எடையைப் பற்றிக்- கேலக்ஸி உயிரியல் ஆராய்ச்சி குழு ஒரு 40 மில்லியன் தன்னார்வ வகைப்பாடுகளை ஒருமித்த கருத்தியல் வகைப்பாடுகளாக மாற்றியது. இந்த கேலக்ஸி உயிரியல் பூங்கா வகைகளை தொழில்முறை வானியல் நிபுணர்களின் மூன்று சிறிய சிறிய முயற்சிகளுடன் ஒப்பிடுகையில், ஸ்காலின்ஸ்கியின் வகைப்படுத்தல்கள் உட்பட, கேலக்ஸி உயிரியல் பூங்காவை ஊக்குவிப்பதில் உதவியது, வலுவான உடன்படிக்கை இருந்தது. எனவே, தொண்டர்கள், மொத்தத்தில், உயர்தர வகைப்பாடுகளை வழங்க முடிந்தது; ஆய்வாளர்கள் (Lintott et al. 2008) பொருந்தக்கூடாத அளவிற்கு ஒரு அளவிற்கு வழங்க முடிந்தது. உண்மையில், பெருமளவிலான விண்மீன் திரள்களான ஸ்வாவின்ஸ்கி, லின்தோட் மற்றும் பலர் மனித வர்க்க வகைப்படுத்தல்களைப் பயன்படுத்தி கிட்டத்தட்ட 80% விண்மீன் திரள்கள் எதிர்பார்த்த மாதிரியைப் பின்பற்றுகின்றன - நீல சுருள்கள் மற்றும் சிவப்பு நீள்வட்டங்கள்-மற்றும் பல ஆவணங்கள் இந்த கண்டுபிடிப்பு (Fortson et al. 2011) .

இந்த பின்புலத்தில், இப்போது கேலக்ஸி உயிரியல் பிளேடு-பொருந்தும்-ஒருங்கிணைப்பு செய்முறையை பின்பற்றுகிறது என்பதை நீங்கள் இப்போது பார்க்கலாம், பெரும்பாலான மனித கணிப்பீட்டு திட்டங்களுக்கு பயன்படுத்தப்படும் அதே செய்முறையும். முதல், ஒரு பெரிய பிரச்சனை துகள்களாக பிரிக்கப்படுகிறது . இந்த நிகழ்வில், ஒரு மில்லியன் விண்மீன் திரவங்களை வகைப்படுத்துவதற்கான பிரச்சனை ஒரு கேலிக்காக வகைப்படுத்தப்படும் ஒரு மில்லியன் பிரச்சினையாகப் பிரிக்கப்பட்டது. அடுத்து, ஒவ்வொரு துணுக்குக்கும் ஒரு அறுவை சிகிச்சை பயன்படுத்தப்படுகிறது . இந்த வழக்கில், தன்னார்வலர்கள் ஒவ்வொரு மண்டலத்தையும் சுழல் அல்லது நீள்வட்டமாக வகைப்படுத்தலாம். இறுதியாக, முடிவுகள் ஒருமித்த கருத்தை உருவாக்க ஒருங்கிணைந்தன . இந்த வழக்கில், ஒவ்வொரு படிகத்திற்கும் ஒருமித்த ஒத்திசைவுகளைத் தயாரிப்பதற்கு, சுத்தம் செய்தல், debiasing மற்றும் எடையை உள்ளடக்கியது. பெரும்பாலான திட்டங்கள் இந்த பொது செய்முறையைப் பயன்படுத்தினாலும், ஒவ்வொரு படியிலும் குறிப்பிடப்பட்டிருக்கும் குறிப்பிட்ட பிரச்சனைக்கு தனிப்பயனாக்கப்பட வேண்டும். உதாரணமாக, கீழே கணக்கிடப்பட்ட மனித கணிப்புத் திட்டத்தில், அதே செய்முறை பின்பற்றப்படும், ஆனால் நடைமுறை மற்றும் இணைந்த வழிமுறைகளைப் பின்பற்றுவது மிகவும் வித்தியாசமானது.

கேலக்ஸி உயிரியல் பூங்காவில், இந்த முதல் திட்டம் தொடக்கமாக இருந்தது. கிட்டத்தட்ட ஒரு மில்லியன் விண்மீன் திரள்களுக்கு நெருக்கமானதாக இருந்தாலும்கூட, இந்த அளவிலான புதிய டிஜிட்டல் வானியல் ஆய்வுகள் மூலம் வேலைசெய்யும் போதுமானதாக இல்லை, 10 பில்லியன் கேலக்ஸிகளுடன் (Kuminski et al. 2014) படங்கள் உருவாக்க முடியும் என்று அவர்கள் விரைவாக உணர்ந்தனர். 10,000 மில்லியனுக்கும் அதிகமான பில்லியன்களை அதிகரிப்பதற்கு 10,000-கேலக்ஸி உயிரியல் காரணி 10,000 மடங்கு அதிகமான பங்கேற்பாளர்களை நியமிக்க வேண்டும். இணையத்தில் தொண்டர்கள் எண்ணிக்கை அதிகமாக இருந்தாலும், அது எல்லையற்றது அல்ல. எனவே, ஆய்வாளர்கள், தரவுகளை அதிக அளவில் வளர்த்துக் கொண்டால், ஒரு புதிய, இன்னும் மேம்பட்ட அணுகுமுறை தேவைப்படுகிறது என்பதை உணர்ந்தனர்.

எனவே, மண்டா பானர்ஜி-ஷாவின்ஸ்கி, லின்ட்ட் மற்றும் கேலக்ஸி ஜூ குழு (2010) ஆகியோருடன் இணைந்து பணியாற்றினார். மேலும் குறிப்பாக, கேலக்ஸி மிருகத்தால் உருவாக்கப்பட்ட மனித வகைப்பாடுகளைப் பயன்படுத்தி, பானர்ஜி ஒரு இயந்திர கற்றல் மாதிரியை உருவாக்கினார், அது படத்தின் பண்புகளை அடிப்படையாகக் கொண்ட ஒரு விண்மீன் மண்டலத்தின் மனித வகைப்படுத்தலை முன்னறிவிக்கும். இந்த மாதிரி மனித வர்க்கம் உயர் துல்லியத்துடன் இனப்பெருக்கம் செய்ய முடியுமானால், கேலக்ஸி மிருகக்காட்சி ஆராய்ச்சியாளர்களால் இது அநேக விண்மீன் திரள்களை வகைப்படுத்த முடியும்.

Banerji மற்றும் சக 'அணுகுமுறை மைய உண்மையில் சமூக ஆராய்ச்சி பொதுவாக பயன்படுத்தப்படும் நுட்பங்களை மிகவும் ஒத்ததாக உள்ளது, எனினும் ஒற்றுமை முதல் பார்வையில் தெளிவான இருக்கலாம். முதலாவதாக, பானர்ஜி மற்றும் சகாக்கள் ஒவ்வொரு படத்தையும் அதன் பண்புகள் சுருக்கமாகக் கொண்ட எண்ணற்ற அம்சங்களின் தொகுப்பாக மாற்றினர். உதாரணமாக, கேலக்ஸிகளின் படங்களைப் பொறுத்தவரை, மூன்று அம்சங்கள் இருக்கக்கூடும்: படத்தில் நீல அளவு, பிக்சல்களின் பிரகாசத்தில் மாறுபாடு மற்றும் வெள்ளை அல்லாத பிக்சல்களின் விகிதம். சரியான அம்சங்களை தேர்ந்தெடுப்பது பிரச்சினையின் ஒரு முக்கிய பகுதியாகும், மேலும் பொதுவாக பொருள் சார்ந்த நிபுணத்துவம் தேவைப்படுகிறது. இந்த முதல் படி, பொதுவாக அம்சம் பொறியியல் என்று அழைக்கப்படுகிறது, ஒரு தரவு ஒரு வரிசையில் தரவு matrix முடிவு பின்னர் படத்தை விவரிக்கும் மூன்று பத்திகள். தரவு மேட்ரிக்ஸ் மற்றும் விரும்பிய வெளியீடு (எ.கா., படம் ஒரு நீள்வட்ட மண்டலம் போன்ற மனிதரால் வகைப்படுத்தப்பட்டுள்ளதா என்பதைப் பொறுத்து), ஆராய்ச்சியாளர் புள்ளியியல் அல்லது இயந்திர கற்றல் மாதிரியை உருவாக்கினார்-உதாரணமாக, லாஜிஸ்டிக் பின்னடைவு-அம்சங்களை அடிப்படையாகக் கொண்ட மனித வகைமுறை படம். இறுதியாக, ஆராய்ச்சியாளர் இந்த புள்ளிவிவர மாதிரியில் புதிய விண்மீன் திரள்களின் மதிப்பிடப்பட்ட வகைப்பாடுகளை உருவாக்க (அளவு 5.4) வரையறையைப் பயன்படுத்துகிறார். இயந்திர கற்றல் முறையில், இந்த அணுகுமுறை-பயன்படுத்தி பெயரிடப்பட்ட உதாரணங்கள், புதிய தரவுகளை பட்டியலிடும் ஒரு மாதிரி உருவாக்க, மேற்பார்வையிடப்பட்ட கற்றல் என்று அழைக்கப்படுகிறது.

படம் 5.4: எப்படி பானர்ஜி மற்றும் பலர் பற்றிய எளிமையான விளக்கம். (2010) கேலக்ஸி உயிரியல் வகைப்பாடுகளைப் பயன்படுத்தியது, இது விண்மீன் வகைப்படுத்தலை செய்ய இயந்திர கற்றல் மாதிரியைப் பயிற்றுவித்தது. கேலக்ஸிகளின் படங்கள் மாதிரியின் அம்சங்களில் மாற்றப்பட்டன. இந்த எளிமையான எடுத்துக்காட்டாக, மூன்று அம்சங்கள் (படத்தில் நீல அளவு, பிக்சல்களின் பிரகாசத்தில் மாறுபாடு மற்றும் nonwhite பிக்சின் விகிதம்) உள்ளன. பின்னர், படங்களை ஒரு துணைக்குழு, கேலக்ஸி ஜூ லேபிள்கள் ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி பயன்படுத்தப்படுகின்றன. இறுதியாக, இயந்திர கற்றல் மீதமுள்ள விண்மீன் குழுக்களுக்கு வகைப்படுத்தி மதிப்பிடப்படுகிறது. இது ஒரு கணினி உதவி மனித கணிப்புத் திட்டத்தை நான் அழைக்கிறேன், ஏனென்றால் மனிதர்கள் ஒரு சிக்கலைத் தீர்ப்பதைக் காட்டிலும், அதை சரிசெய்ய ஒரு கணினியைப் பயிற்றுவிக்கக்கூடிய ஒரு தரவுத்தளத்தை மனிதர்கள் உருவாக்கி உள்ளனர். இந்த கணினி உதவியுள்ள மனித கணிப்பு முறையின் பயன்பாடானது, ஒரு வரையறுக்கப்பட்ட மனித முயற்சியைப் பயன்படுத்தி தரவுகளின் அத்தியாவசிய அளவுகளைக் குறைக்க உங்களுக்கு உதவுகிறது. ஸ்லோக டிஜிட்டல் ஸ்கை சர்வயில் இருந்து அனுமதிப்பத்திரத்தை மீண்டும் உருவாக்கிய கேலக்ஸிகளின் படங்கள்.

படம் 5.4: எப்படி Banerji et al. (2010) பற்றிய எளிமையான விளக்கம் Banerji et al. (2010) கேலக்ஸி உயிரியல் வகைப்பாடுகளைப் பயன்படுத்தியது, இது விண்மீன் வகைப்படுத்தலை செய்ய இயந்திர கற்றல் மாதிரியைப் பயிற்றுவித்தது. கேலக்ஸிகளின் படங்கள் மாதிரியின் அம்சங்களில் மாற்றப்பட்டன. இந்த எளிமையான எடுத்துக்காட்டாக, மூன்று அம்சங்கள் (படத்தில் நீல அளவு, பிக்சல்களின் பிரகாசத்தில் மாறுபாடு மற்றும் nonwhite பிக்சின் விகிதம்) உள்ளன. பின்னர், படங்களை ஒரு துணைக்குழு, கேலக்ஸி ஜூ லேபிள்கள் ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி பயன்படுத்தப்படுகின்றன. இறுதியாக, இயந்திர கற்றல் மீதமுள்ள விண்மீன் குழுக்களுக்கு வகைப்படுத்தி மதிப்பிடப்படுகிறது. இது ஒரு கணினி உதவி மனித கணிப்பு திட்டத்தை நான் அழைக்கிறேன், ஏனென்றால் மனிதர்கள் ஒரு பிரச்சினையைத் தீர்ப்பதைக் காட்டிலும், இது ஒரு கணினியைப் பயன் படுத்துவதற்கு ஒரு கணினியைப் பயிற்றுவிக்க பயன்படும் ஒரு தரவுத்தளத்தை உருவாக்கி இருக்கிறது. இந்த கணினி உதவியுள்ள மனித கணிப்பு முறையின் பயன்பாடானது, ஒரு வரையறுக்கப்பட்ட மனித முயற்சியைப் பயன்படுத்தி தரவுகளின் அத்தியாவசிய அளவுகளைக் குறைக்க உங்களுக்கு உதவுகிறது. ஸ்லோக டிஜிட்டல் ஸ்கை சர்வயில் இருந்து அனுமதிப்பத்திரத்தை மீண்டும் உருவாக்கிய கேலக்ஸிகளின் படங்கள்.

உதாரணமாக, பானர்ஜி மற்றும் சக மாணவர்களின் இயந்திர கற்றல் மாதிரியின் சிறப்பம்சங்கள் என் பொம்மை உதாரணத்தில்தான் மிகவும் சிக்கலாக இருந்தன-உதாரணமாக, "டி வாக்கௌலூர்ஸ் பொருத்தம் அச்சு விகிதம்" போன்ற அம்சங்களைப் பயன்படுத்தினார் - அவளுடைய மாதிரியானது லாஜிஸ்டிக் பின்னடைவு அல்ல, அது ஒரு செயற்கை நரம்பியல் நெட்வொர்க் ஆகும். தனது அம்சங்களை, அவளது மாதிரியை, மற்றும் கருத்தொற்றுமை கேலக்ஸி உயிரியல் வகைப்பாடுகளைப் பயன்படுத்தி, ஒவ்வொரு அம்சத்திலும் எடையை உருவாக்க முடிந்தது, பின்னர் இந்த எடையைப் பயன்படுத்தி விண்மீன் தொகுப்பின் வகைப்பாடு பற்றிய கணிப்புகள் செய்ய பயன்படுத்தப்பட்டது. உதாரணமாக, அவரது பகுப்பாய்வு குறைந்த "de Vaucouleurs பொருத்தம் அச்சு விகிதம்" படங்கள் சுழல் மண்டலங்களாக இருக்கும் என்று கண்டறியப்பட்டது. இந்த எடையைக் கொண்டு, ஒரு விண்மீன் மனித வர்க்கம் நியாயமான துல்லியத்துடன் கணிக்க முடிந்தது.

பானர்ஜி மற்றும் சக பணியாளர்கள் கம்ப்யூட்டர் உதவியுடனான மனித கணிப்பு முறைமையை நான் அழைப்பதை கேலாலிய விலங்காக மாற்றியது. இந்த கலப்பின முறைகளைப் பற்றி சிந்திக்க சிறந்த வழி, மனிதர்கள் ஒரு சிக்கலைத் தீர்ப்பதைக் காட்டிலும், மனிதர்கள் இந்தப் பிரச்சினையைத் தீர்ப்பதற்கு ஒரு கணினியைப் பயிற்றுவிப்பதற்கு பயன்படுத்தக்கூடிய ஒரு தரவுத்தளத்தை உருவாக்கிறார்கள். சில நேரங்களில், சிக்கலை தீர்க்க ஒரு கணினி பயிற்சி உதாரணங்கள் நிறைய தேவைப்படுகிறது, மற்றும் உதாரணங்கள் போதுமான எண்ணிக்கையிலான உற்பத்தி ஒரே வழி ஒரு வெகுஜன ஒத்துழைப்பு ஆகும். இந்த கணினி உதவியின் அணுகுமுறையின் நன்மை என்னவென்றால், ஒரு வரையறுக்கப்பட்ட மனித முயற்சியைப் பயன்படுத்தி தரவுகளின் அடிப்படையில் எல்லையற்ற அளவுகளை கையாள உங்களுக்கு உதவுகிறது. உதாரணமாக, ஒரு மில்லியன் மனித வளைவு மண்டலங்களைக் கொண்ட ஒரு ஆராய்ச்சியாளர் ஒரு முன்கூட்டிய மாதிரி உருவாக்க முடியும், அது ஒரு பில்லியன் அல்லது ஒரு டிரில்லியன் கேலக்ஸிகளையும் கூட வகைப்படுத்தலாம். பெருமளவிலான விண்மீன் திரள்கள் இருந்தால், இந்த வகையான மனித-கணினி கலப்பு உண்மையில் ஒரே தீர்வுதான். இந்த எல்லையற்ற அளவிடுதல் இலவசம் அல்ல. மனித வர்க்கம் சரியாக ஒழுங்கமைக்கப்படக்கூடிய ஒரு இயந்திர கற்றல் மாதிரியை உருவாக்குவது ஒரு கடினமான பிரச்சனையாகும், ஆனால் அதிர்ஷ்டவசமாக இந்த தலைப்புக்கு அர்ப்பணிக்கப்பட்ட சிறந்த புத்தகங்கள் உள்ளன (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

கேலக்ஸி உயிரியல் பூங்காவானது எத்தனை மனித கணிப்புத் திட்டங்களை உருவாக்குகிறது என்பதற்கு ஒரு நல்ல எடுத்துக்காட்டு. முதலாவதாக, ஒரு ஆராய்ச்சியாளர் தனது திட்டம் அல்லது ஒரு சிறிய குழு ஆராய்ச்சி உதவியாளர்களை (எ.கா., ஷாவின்ஸ்கியின் ஆரம்ப வகைப்பாடு முயற்சி) முயற்சிக்கிறார். இந்த அணுகுமுறை நன்றாக இல்லை என்றால், ஆராய்ச்சியாளர் பல பங்கேற்பாளர்கள் ஒரு மனித கணக்கீட்டு திட்டம் செல்ல முடியும். ஆனால், தரவுகளின் ஒரு குறிப்பிட்ட அளவுக்கு, தூய மனித முயற்சிகள் போதுமானதாக இருக்காது. அந்த கட்டத்தில், ஆராய்ச்சியாளர்கள் கணிப்பொறி உதவியுள்ள மனித கணிப்பு முறையை உருவாக்க வேண்டும், இதில் இயந்திர வகை கற்றல் மாதிரி பயிற்சிக்கு மனித வர்க்கம் பயன்படுத்தப்படுகிறது, இதன் விளைவாக கிட்டத்தட்ட வரம்பற்ற அளவிலான தரவுகளைப் பயன்படுத்தலாம்.