5.2.1 கேலக்ஸி பூங்காவில்

இந்த மொழிபெயர்ப்பு ஒரு கணினி மூலம் உருவாக்கப்பட்டது. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

5.2.1 கேலக்ஸி பூங்காவில்

கேலக்ஸி பூங்காவில் ஒரு மில்லியன் விண்மீன் திரள்கள் வகைப்படுத்த பல அல்லாத நிபுணர் தொண்டர்கள் முயற்சிகளை ஒருங்கிணைக்கிறது.

கேலக்ஸி பூங்காவில் ஒரு பிரச்சனை 2007 மிகவும் ஒரு பிட், Schawinski விண்மீன் திரள்கள் ஆர்வம் இருந்தது எளிமைப்படுத்தும் கெவின் Schawinski, ஆக்ஸ்போர்டு பல்கலைக்கழகத்தில் வானியல் ஒரு பட்டதாரி மாணவர் எதிர்கொள்ளும் வளர்ந்தது, மற்றும் விண்மீன் திரள்கள் வகைப்படுத்தப்படுகின்றன அவற்றின் வடிவமைப்பு நீள்வட்ட அல்லது சுழல்-மற்றும் அவற்றின் நிறம்-நீலம் அல்லது சிவப்பு மூலம். நேரத்தில், வானியல் மத்தியில் ஏற்றுக்கொள்ளப்பட்ட மதிநுட்பம் சுழல் விண்மீன் திரள்கள், பால்வீதி போன்ற, நிறம் (குறிக்கும் இளைஞர்கள்) நீல என்று இருந்தது என்று நீள் விண்மீன் திரள்கள் (வயது குறிக்கும்) சிவப்பு நிறத்தில் இருந்தன. Schawinski இந்த ஏற்றுக்கொள்ளப்பட்ட மதிநுட்பம் சந்தேகப்பட்டார்கள். அவர் இந்த முறை பொதுவாக உண்மை இருக்கலாம் போது, ஒருவேளை விதிவிலக்குகள் ஒரு கணிசமான எண்ணிக்கை இருந்தன, அந்த என்று சந்தேகிக்கப்படுகிறது இந்த அசாதாரண விண்மீன் திரள்கள்-பொருந்தும் இல்லை என்று தான் நிறைய படிப்பதன் மூலம் முறை அவர் செயல்முறை பற்றி ஏதாவது அறிய முடியும் என எதிர்பார்க்கப்படுகிறது, இதன் மூலம் விண்மீன் திரள்கள் உருவாக்கப்பட்டது.

இவ்வாறு, என்ன Schawinski ஏற்றுக்கொள்ளப்பட்ட மதிநுட்பம் இரத்து செய்ய தேவைப்படும் morphologically இரகசியத் விண்மீன் திரள்கள் ஒரு பெரிய செட் இருந்தது; என்று, சுழல் அல்லது நீள்வட்ட ஒன்று என வகைப்படுத்தப்பட்டுள்ளன என்று விண்மீன் திரள்கள் உள்ளது. பிரச்சனை, எனினும், வகைப்பாடு இருக்கும் வழிமுறைகள் அறிவியல் ஆராய்ச்சி பயன்படுத்தப்படும் இன்னும் போதுமான நல்ல என்று இருந்தது; வேறு வார்த்தைகளில் கூறுவதானால், வகைப்படுத்தும் விண்மீன் திரள்கள், அந்த நேரத்தில், கணினிகள் கடினமாக இருந்தது என்று ஒரு பிரச்சனை இருந்தது. எனவே, தேவைப்படுவதைக் மனித விளம்பரத்திற்கு விண்மீன் திரள்கள் ஒரு பெரிய எண் இருந்தது. Schawinski ஒரு பட்டதாரி மாணவர் உற்சாகம் இந்த வகைப்பாடு பிரச்சனை மேற்கொண்டார். ஏழு, 12 மணி நேர நாட்கள் ஒரு மாரத்தான் அமர்வின், அவர் 50,000 விண்மீன் திரள்கள் வகைப்படுத்த முடிந்தது. 50,000 விண்மீன் திரள்கள் நிறைய போன்ற ஒலி போது, அது உண்மையில் ஸ்லோன் டிஜிட்டல் ஸ்கை சர்வே புகைப்படம் என்று கிட்டத்தட்ட ஒரு மில்லியன் விண்மீன் திரள்கள் மட்டும் சுமார் 5% ஆகும். Schawinski அவர் ஒரு மேம்பட்ட அணுகுமுறை தேவை என்று உணர்ந்து.

அதிர்ஷ்டவசமாக, அது வகைப்படுத்தி விண்மீன் திரள்கள் பணி வானியல் மேம்பட்ட பயிற்சி தேவையில்லை என்று மாறிவிடும்; நீங்கள் மிகவும் விரைவாக அதை செய்ய ஒருவரை கற்பிக்க முடியும். வேறு வார்த்தைகளில் கூறுவதானால், விண்மீன் திரள்கள் வகைப்படுத்தி கணினிகள் கடினமாக இருந்தது என்று ஒரு பணியாகும் கூட, அது மனிதர்கள் அழகாக எளிதாக இருந்தது. எனவே, ஆக்ஸ்போர்டு, Schawinski மற்றும் சக வானியலாளர் கிறிஸ் Lintott ஒரு மதுக்கடையில் உட்கார்ந்து போது தொண்டர்கள் விண்மீன் திரள்கள் படங்களை வகைப்படுத்த வேண்டும், அங்கு ஒரு வலைத்தளத்தில் வரை கனவு. ஒரு சில மாதங்கள் கழித்து, கேலக்ஸி பூங்காவில் பிறந்தார்.

கேலக்ஸி பூங்காவில் வலைத்தளத்தை, தொண்டர்கள் பயிற்சி ஒரு சில நிமிடங்கள் மேற்கொள்ள வேண்டும்; உதாரணமாக, ஒரு சுழல் மற்றும் நீள்வட்ட அண்டத்தின் (படம் 5.2) இடையே உள்ள வேறுபாடு கற்றல். இந்த பயிற்சி பெற்ற பிறகு, தொண்டர்கள் அறியப்பட்ட ஒரு ஒப்பீட்டளவில் எளிதானது வினாடி-வினா சரியாக வகைப்படுத்தி 11 15 விண்மீன் திரள்கள் கடக்க வேண்டியிருந்தது வகைப்படுத்தல்-மற்றும் தன்னார்வ ஒரு எளிய இணைய அடிப்படையிலான இடைமுகம் (படம் 5.3) மூலம் தெரியவில்லை விண்மீன் திரள்கள் உண்மையான வகைப்பாடு தொடங்குவார். வானியலாளர் தன்னார்வ இருந்து மாற்றம் குறைவாக 10 நிமிடங்கள் நடைபெறும் என்று மட்டுமே தடைகளை, ஒரு எளிய வினாடி வினா மிக குறைந்த கடந்து தேவை.

படம் 5.2: சுழல் மற்றும் நீள்: விண்மீன் திரள்களின் இரண்டு முக்கிய வகைகள் எடுத்துக்காட்டுகள். கேலக்ஸி பூங்காவில் திட்டம் 900,000 படங்களை விட பிரிவுகள் 100,000 க்கும் அதிகமான தொண்டர்கள் பயன்படுத்தப்படும். ஆதாரம்: www.galaxyzoo.org .

படம் 5.3: அங்கு வாக்காளர்கள் ஒரு படத்தை வகைப்படுத்த வேண்டும் என்று கேட்டு கொண்டது உள்ளீடு திரை. ஆதாரம்: www.galaxyzoo.org .

திட்டம் ஒரு செய்தி கட்டுரை இடம்பெற்றது பிறகு, மற்றும் ஆறு மாதங்களில் திட்டம் 100,000 மேற்பட்ட குடிமக்கள் விஞ்ஞானிகள், அவர்கள் பணி மகிழ்ந்தோம் மற்றும் அவர்கள் முன்கூட்டியே வானியல் உதவ வேண்டும், ஏனெனில் கலந்து கொண்ட மக்கள் ஈடுபடுத்த வளர்ந்தது கேலக்ஸி பூங்காவில் அதன் ஆரம்ப தொண்டர்கள் ஈர்த்தது. ஒன்றாக, இந்த 100,000 தொண்டர்கள் பங்கேற்பாளர்கள் ஒரு சிறிய, மைய குழு இருந்து வரும் வகைப்படுத்துதல் பெரும்பான்மையினர் 40 மில்லியனுக்கு மேற்பட்ட வகைப்பாட்டின் மொத்த பங்களிப்பு (Lintott et al. 2008) .

அனுபவம் பணியமர்த்தல் இளங்கலை ஆராய்ச்சி உதவியாளர்கள் யார் ஆராய்ச்சியாளர்கள் உடனடியாக தரவு தரம் பற்றி சந்தேகம் இருக்கலாம். இந்த ஐயுறவு நியாயமான போது, கேலக்ஸி பூங்காவில் தன்னார்வ பங்களிப்புகளை சரியாக, சுத்தம் போது debiased, ஒருங்கிணைக்கப்பட்டு, அவர்கள் உயர்தரமான முடிவுகளை உருவாக்க முடியும் என்று காட்டுகிறது (Lintott et al. 2008) . தொழில்முறை தரம் தரவு உருவாக்க கூட்டத்தில் பெறுவதற்கான ஒரு முக்கிய தந்திரம் பணிநீக்க உள்ளது; அதாவது, அதே பணியை பல்வேறு மக்களால் மேற்கொள்ளப்படும் நிலையில். கேலக்ஸி உயிரியல் பூங்காவில் உள்ள, விண்மீன் சுமார் 40 வகைப்படுத்துதல் இருந்தன; இளங்கலை ஆராய்ச்சி உதவியாளர்கள் பயன்படுத்தி பணிநீக்க இந்த நிலை கொடுக்க எனவே முடியாது ஆராய்ச்சியாளர்கள் ஒவ்வொரு தனிப்பட்ட வகைப்பாடு தரம் மிகவும் அக்கறை இருக்க வேண்டும். தொண்டர்கள் பயிற்சி இல்லாத என்ன, அவர்கள் பணிநீக்க வரை செய்த.

கூட விண்மீன் ஒன்றுக்கு பல வகைப்படுத்துதல் மூலம், எனினும், தன்னார்வ வகைப்பாட்டின் தொகுப்பு இணைந்த ஒரு ஒருமித்த வகைப்பாடு தந்திரமான தயாரிக்க. மிகவும் போன்ற சவால்களை மிகவும் மனித கணக்கீடு திட்டங்கள் எழும் ஏனெனில், அது சுருக்கமாக கேலக்ஸி பூங்காவில் ஆராய்ச்சியாளர்கள், அவர்களின் ஒருமித்த வகைப்படுத்துதல் தயாரிக்க பயன்படுத்தப்படும் என்று மூன்று படிகள் ஆய்வு செய்ய உதவியாக இருக்கும். முதல், ஆராய்ச்சியாளர்கள் போலி வகைப்படுத்துதல் அகற்றுவதன் மூலம் தரவு "சுத்தம்". உதாரணமாக, மீண்டும் மீண்டும் அவர்கள் கையாள முயற்சி இருந்தால் என்ன நடந்திருக்கும் என்று அதே விண்மீன் ஒன்று விளம்பரத்திற்கு மக்கள் முடிவு-அவர்களது அனைத்து வகைப்படுத்துதல் அகற்றப்படுகிறது. இந்த மற்றும் பிற ஒத்த சுத்தம் அனைத்து வகைப்படுத்துதல் சுமார் 4% நீக்கப்பட்டது.

இரண்டாவது, சுத்தம் பிறகு, ஆராய்ச்சியாளர்கள் வகைப்படுத்துதல் முறையான பாகுபாடுகளை நீக்க வேண்டும். அசல் திட்டம்-உதாரணமாக உள்ள பதிக்கப்பட்ட கோடல் கண்டறிதல் ஆய்வுகள், சில தொண்டர்கள் பதிலாக ஒரே வண்ணமுடைய விண்மீன் காண்பிக்கப்படுகிறது ஒரு தொடர் மூலம் வண்ண ஆராய்ச்சியாளர்கள் நீள் விண்மீன் திரள்கள் தொலைவில் சுழல் விண்மீன் திரள்கள் வகைப்படுத்த ஒரு திட்டமிட்ட கோடல் போன்ற பல திட்டமிட்ட பாகுபாடுகளை, கண்டுபிடிக்கப்பட்டது (Bamford et al. 2009) . பல பங்களிப்புகளை சராசரியாக திட்டமிட்ட கோடல் நீக்க முடியாது, ஏனெனில் இந்த திட்டமிட்ட பாகுபாடுகளை சரிசெய்த மிகவும் முக்கியமானது ஆகும்; அது மட்டும் சீரற்ற பிழை நீக்குகிறது.

இறுதியாக, debiasing பிறகு, ஆராய்ச்சியாளர்கள் ஒரு ஒருமித்த வகைப் படுத்திட தனிப்பட்ட வகைப்படுத்துதல் இணைக்க ஒரு முறை தேவைப்படலாம். ஒவ்வொரு விண்மீன் வகைப்பாட்டின் இணைக்க எளிய வழி மிகவும் பொதுவான வகைப்பாடு தேர்வு இருக்கும். எனினும், இந்த அணுகுமுறையை ஒவ்வொரு தன்னார்வ சம எடை கொடுக்க வேண்டும், மற்றும் ஆராய்ச்சியாளர்கள் சில தொண்டர்கள் மற்றவர்களை விட வகைப்பாடு நன்றாக இருந்தது என்று சந்தேகிக்கப்படுகிறது. எனவே, ஆராய்ச்சியாளர்கள் தானாகவே சிறந்த வகைப்படுத்திகளின் கண்டுபிடித்து அவர்களை மேலும் எடை கொடுக்க முயற்சிக்கிறது என்று ஒரு மிகவும் சிக்கலான பங்கேற்பு வெயிட்டிங் நடைமுறை உருவாக்கப்பட்டது.

இவ்வாறு, ஒரு மூன்று படி செயல்முறை சுத்தம், debiasing, மற்றும் மதிப்பு-கேலக்ஸி பூங்காவில் ஆராய்ச்சி குழு பிறகு ஒருமித்த உருவ வகைப்பாட்டின் தொகுப்பு ஒரு 40 மில்லியன் தன்னார்வ வகைப்படுத்துதல் மாறிய. இந்த கேலக்ஸி பூங்காவில் வகைப்படுத்துதல் கேலக்ஸி பூங்காவில் ஊக்குவிக்கும் உதவியது என்று Schawinski மூலம் வகைப்பாடு உட்பட தொழில்முறை வானியலாளர்கள் முந்தைய மூன்று சிறிய அளவிலான முயற்சிகள், ஒப்பிடும்போது போது, வலுவான உடன்பாடு இருந்தது. இவ்வாறு, தொண்டர்கள், ஒட்டுமொத்தமாக, உயர் தரமான வகைப்படுத்துதல் வழங்க முடிந்தது மற்றும் ஆராய்ச்சியாளர்கள் முடியவில்லை பொருந்தவில்லை என்று ஒரு அளவில் (Lintott et al. 2008) . உண்மையில், விண்மீன் திரள்கள் போன்ற ஒரு பெரிய எண் மனித வகைப்படுத்துதல் கொண்டு, Schawinski, Lintott, மற்றும் பலர் விண்மீன் திரள்கள் சுமார் 80% எதிர்பார்க்கப்படுகிறது முறை-நீல சுருள்களின் மற்றும் சிவப்பு ellipticals-மற்றும் ஏராளமான ஆவணங்கள் பற்றி எழுதப்பட்ட பின்பற்ற என்று காட்ட முடிந்தது இந்த கண்டுபிடிப்பு (Fortson et al. 2011) .

இந்த பின்னணி கொடுக்கப்பட்ட, நாம் இப்போது கேலக்ஸி பூங்காவில் பின்வருமாறு எப்படி பார்க்க முடியும் பிளவு-விண்ணப்பிக்க-இணைக்க செய்முறையை, பெரும்பாலான மனித கணக்கீடு திட்டங்களுக்கு பயன்படுத்தப்படுகிறது என்று அதே செய்முறையை. முதல், ஒரு பெரிய பிரச்சினை துண்டுகளாக்கி பிரிந்தது. இந்த வழக்கில், ஒரு மில்லியன் விண்மீன் திரள்கள் வகைப்படுத்தும் பிரச்சனை ஒரு விண்மீன் வகைப்படுத்தும் மில்லியன் பிரச்சினைகள் பிரிந்தது. அடுத்து, ஒரு அறுவை சிகிச்சை சுதந்திரமாக ஒவ்வொரு துண்டின் செய்ய பயன்படுத்தப்படும். இந்த வழக்கில், ஒரு தன்னார்வ சுழல் அல்லது நீள்வட்ட ஒன்று என ஒவ்வொரு விண்மீன் வகைப்படுத்த வேண்டும். இறுதியாக, முடிவுகளை ஒரு ஒருமித்த விளைவாக உற்பத்தி இணைக்கப்படுகின்றன. இந்த வழக்கில், இணைக்க நடவடிக்கை சுத்தம், debiasing, மற்றும் ஒவ்வொரு விண்மீன் ஒரு ஒருமித்த வகைப் படுத்திட வெயிட்டிங் சேர்க்கப்பட்டுள்ளது. மிகவும் திட்டங்கள் இந்த பொது செய்முறையை பயன்படுத்தினாலும் கூட, வழிமுறைகளை ஒவ்வொரு குறிப்பிட்ட பிரச்சினை உரையாற்றினார் வருகின்றன அமைத்துக்கொள்ள வேண்டும். உதாரணமாக, கீழே விவரிக்கப்பட்ட மனித கணக்கீடு திட்டத்தில், அதே செய்முறையை தொடர்ந்து இருக்க வேண்டும், ஆனால் விண்ணப்பிக்க மற்றும் இணைப்பது நடவடிக்கைகளை மிகவும் வித்தியாசமாக இருக்கும்.

கேலக்ஸி பூங்காவில் அணி, இந்த முதல் திட்டம் தான் ஆரம்பம். மிக விரைவில் அவர்கள் கூட அவர்கள் ஒரு மில்லியன் விண்மீன் திரள்கள் நெருங்கிய வகைப்படுத்த முடியும் என்று உணர்ந்தேன், இந்த அளவில் இல்லை சுமார் 10 பில்லியன் விண்மீன் திரள்கள் படங்களை தயாரிக்க முடியும் புதிய டிஜிட்டல் வானத்தில் ஆய்வுகள், வேலை போதும் (Kuminski et al. 2014) . இருந்து 1 மில்லியன் 10 ஆக அதிகரித்தது கையாள ஒரு பில்லியன் 10,000-கேலக்ஸி பூங்காவில் காரணி சுமார் 10,000 க்கும் முறை பங்கேற்பாளர்கள் சேர்த்துக்கொள்ள வேண்டும். இணையத்தில் தொண்டர்கள் எண்ணிக்கை பெரிய என்றாலும், அது முடிவில்லா அல்ல. எனவே, ஆராய்ச்சியாளர்கள் உணர்ந்த அவர்கள் தரவு, ஒரு புதிய, இன்னும் தக்கது, அணுகுமுறை தேவை என்ற எப்போதும் வளரும் தொகைகள் கையாள போகிறோம் என்றால்.

எனவே, Manda, பானர்ஜி-வேலை விண்மீன் திரள்கள் வகைப்படுத்த கெவின் Schawinski, கிறிஸ் Lintott, மற்றும் கேலக்ஸி பூங்காவில் அணி தொடங்கி கற்பித்தல் கணினிகள் மற்ற உறுப்பினர்கள். மேலும் குறிப்பாக, கேலக்ஸி பூங்காவில், உருவாக்கப்பட்ட மனித வகைப்படுத்துதல் பயன்படுத்தி Banerji et al. (2010) படத்தை பண்புகள் அடிப்படையில் ஒரு விண்மீன் மனித வகைப்பாடு கணிக்க முடியும் என்று ஒரு இயந்திர கற்றல் மாதிரி கட்டப்பட்டது. இந்த இயந்திர கற்றல் மாதிரி அதிக துல்லியத்துடன் மனித வகைப்படுத்துதல் இனப்பெருக்கம் முடியும் என்றால், அது விண்மீன் திரள்கள் ஆகியவை அடிப்படையில் எண்ணற்ற வகைப்படுத்த கேலக்ஸி பூங்காவில் ஆராய்ச்சியாளர்கள் பயன்படுத்த முடியும்.

பானர்ஜி மற்றும் சக 'அணுகுமுறை முக்கிய என்று ஒற்றுமை முதல் பார்வையில் தெளிவாக இருக்க வேண்டும் என்றாலும், உண்மையில் பொதுவாக சமூக ஆராய்ச்சி பயன்படுத்தப்படும் நுட்பங்கள் அழகாக ஒத்த. முதல், பானர்ஜி மற்றும் சக அது பண்புகளை சுருக்கமாக என்று எண் அம்சங்களை ஒரு தொகுப்பு ஒவ்வொரு படத்தை மாற்றப்படுகிறது. படத்தை நீல அளவு, பிக்சல்கள் பிரகாசம் மாறுபாட்டின் மற்றும் அல்லாத வெள்ளை பிக்சல்கள் விகிதம்: உதாரணமாக, விண்மீன் திரள்கள் படங்களை அங்கு மூன்று அம்சங்கள் இருக்க முடியும். சரியான அம்சங்களின் தேர்வை பிரச்சனை ஒரு முக்கிய பகுதியாக உள்ளது, மேலும் இது பொதுவாக பொருள் பகுதியில் நிபுணத்துவம் தேவை. இந்த முதல் படி, பொதுவாக அம்சம் பொறியியல் என்று, படத்தை ஒன்றுக்கு ஒரு வரிசையில் பின்னர் மூன்று பத்திகள் அந்த படத்தை விவரிக்கும் ஒரு தரவு அணி முடிவு. தரவு அணி மற்றும் தேவையான வெளியீடு (எ.கா., படத்தை ஒரு நீள்வட்ட அண்டத்தின் ஒரு மனித காட்டியிருந்தால் என்பதை), ஆராய்ச்சியாளர் ஒரு புள்ளிவிவர மாதிரி, உதாரணமாக அளவுருக்கள் மதிப்பிட்டுள்ளது, ஒரு லாஜிஸ்டிக் பின்னடைவு-சார்ந்த மனித வகைப்பாடு கணித்துள்ளது போன்ற ஏதாவது கொடுக்கப்பட்ட படத்தை அம்சங்கள். இறுதியாக, ஆராய்ச்சியாளர் புதிய விண்மீன் திரள்கள் மதிப்பீட்டிலான வகைப்படுத்துதல் (படம் 5.4) உற்பத்தி செய்ய இந்த புள்ளிவிவர மாதிரி அளவுருக்கள் பயன்படுத்துகிறது. ஒரு சமூக அனலாக் யோசிக்க வேண்டும், நீங்கள் ஒரு மில்லியன் மாணவர்கள் பற்றி புள்ளிவிவர தகவல் என்று கற்பனை, மற்றும் நீங்கள் அவர்கள் கல்லூரியில் இருந்து அல்லது பட்டம் என்பதை தெரிந்து. இந்த தரவு ஒரு லாஜிஸ்டிக் பின்னடைவு அல்ல, மற்றும் நீங்கள் புதிய மாணவர்கள் கல்லூரியில் இருந்து பட்டதாரி போகிறீர்கள் என்பதை கணிக்க விளைவாக மாதிரி காரணிகள் பயன்படுத்த முடியும். இயந்திர கற்றல், இந்த அணுகுமுறை பயன்படுத்தி பெயரிடப்பட்ட உதாரணங்கள் பின்னர் புதிய லேபிள் முடியும் என்று ஒரு புள்ளிவிவர மாதிரி உருவாக்க தரவு உள்ளது கற்றல் மேற்பார்வை என்று (Hastie, Tibshirani, and Friedman 2009) .

படம் 5.4: எப்படி பானர்ஜி மற்றும் பலர் எளிமையான விளக்கம். (2010) விண்மீன் வகைப்பாடு செய்ய ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி கேலக்ஸி பூங்காவில் வகைப்படுத்துதல் பயன்படுத்தப்படும். விண்மீன் திரள்கள் படங்களை அம்சங்கள் ஒரு அணியில் உள்ள மாற்றப்பட்டன. இந்த எளிமையான எடுத்துக்காட்டு மூன்று அம்சங்கள் (படம் நீல அளவு, பிக்சல்கள் பிரகாசம் மாறுபாட்டின் மற்றும் அல்லாத வெள்ளை பிக்சல்கள் விகிதம்) உள்ளன. பின்னர், படங்களை உட்கணத்திற்கான, கேலக்ஸி பூங்காவில் அடையாளங்கள் ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி பயன்படுத்தப்படுகின்றன. இறுதியாக, இயந்திர கற்றல் மீதமுள்ள விண்மீன் திரள்கள் வகைப்பாட்டின் மதிப்பிட பயன்படுத்தப்படுகிறது. நான் திட்ட இந்த வகையான அழைக்க இரண்டாவது தலைமுறை மனித கணக்கீட்டு திட்டம் மனிதர்கள் கொண்ட ஒரு பிரச்சினையை தீர்க்க விட, அவர்கள் மனிதர்கள் பிரச்சினையை தீர்க்க ஒரு கணினி பயிற்சி பயன்படுத்த முடியும் என்று தரவுத் உருவாக்க வேண்டும், ஏனெனில். இந்த கணினி உதவியுடனான அணுகுமுறையை பயன்படுத்தி அதை நீங்கள் மனித முயற்சி மட்டும் ஒரு வரையறுக்கப்பட்ட அளவு பயன்படுத்தி தரவின் அடிப்படையில், எல்லையற்ற அளவில் கையாள செயல்படுத்துகிறது என்று ஆகிறது.

படம் 5.4: எப்படி எளிமையான விளக்கம் Banerji et al. (2010) விண்மீன் வகைப்பாடு செய்ய ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி கேலக்ஸி பூங்காவில் வகைப்படுத்துதல் பயன்படுத்தப்படும். விண்மீன் திரள்கள் படங்களை அம்சங்கள் ஒரு அணியில் உள்ள மாற்றப்பட்டன. இந்த எளிமையான எடுத்துக்காட்டு மூன்று அம்சங்கள் (படம் நீல அளவு, பிக்சல்கள் பிரகாசம் மாறுபாட்டின் மற்றும் அல்லாத வெள்ளை பிக்சல்கள் விகிதம்) உள்ளன. பின்னர், படங்களை உட்கணத்திற்கான, கேலக்ஸி பூங்காவில் அடையாளங்கள் ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி பயன்படுத்தப்படுகின்றன. இறுதியாக, இயந்திர கற்றல் மீதமுள்ள விண்மீன் திரள்கள் வகைப்பாட்டின் மதிப்பிட பயன்படுத்தப்படுகிறது. நான் திட்ட இந்த வகையான அழைக்க இரண்டாவது தலைமுறை மனித கணக்கீட்டு திட்டம் மனிதர்கள் கொண்ட ஒரு பிரச்சினையை தீர்க்க விட, அவர்கள் மனிதர்கள் பிரச்சினையை தீர்க்க ஒரு கணினி பயிற்சி பயன்படுத்த முடியும் என்று தரவுத் உருவாக்க வேண்டும், ஏனெனில். இந்த கணினி உதவியுடனான அணுகுமுறையை பயன்படுத்தி அதை நீங்கள் மனித முயற்சி மட்டும் ஒரு வரையறுக்கப்பட்ட அளவு பயன்படுத்தி தரவின் அடிப்படையில், எல்லையற்ற அளவில் கையாள செயல்படுத்துகிறது என்று ஆகிறது.

அம்சங்கள் Banerji et al. (2010) இயந்திர கற்றல் மாதிரி உதாரணமாக, எடுத்துக்காட்டாக, அவர் அம்சங்கள் போன்ற பயன்படுத்தப்படும் என் பொம்மை விட மிகவும் சிக்கலான "டி Vaucouleurs அச்சுவிகிதம் பொருந்தும்" சாடியுள்ளார் அவளை மாதிரி லாஜிஸ்டிக் பின்னடைவு இல்லை, அது ஒரு செயற்கை நரம்பியல் வலையமைப்பு இருந்தது. அவளை அம்சங்கள், தனது மாதிரி, மற்றும் ஒருமித்த கேலக்ஸி பூங்காவில் வகைப்படுத்துதல் பயன்படுத்தி, அவர் ஒவ்வொரு அம்சத்தை எடைகள் உருவாக்க, பின்னர் விண்மீன் திரள்கள் வகைப்பாடு பற்றி யூகங்களை இந்த எடை பயன்படுத்த முடிந்தது. உதாரணமாக, தனது ஆய்வு குறைந்த கொண்டு "Vaucouleurs அச்சுவிகிதம் பொருந்தும் டி" படங்கள் சுழல் விண்மீன் திரள்கள் இருக்க அதிக வாய்ப்பு இருந்தது கண்டறியப்பட்டது. இந்த எடை கொடுக்கப்பட்ட, நியாயமான துல்லியத்துடன் ஒரு விண்மீன் மனித வகைப்பாடு கணிக்க முடிந்தது.

வேலை Banerji et al. (2010) நான் ஒரு இரண்டாவது தலைமுறை மனித கணக்கீடு அமைப்பு என்று அழைக்கிறோம் ஒரு கேலக்ஸி பூங்காவில் திரும்பியது. இந்த இரண்டாவது தலைமுறை அமைப்புகள் பற்றி யோசிக்க சிறந்த வழி மனிதர்கள் கொண்ட ஒரு பிரச்சினையை தீர்க்க விட, அவர்கள் மனிதர்கள் பிரச்சினையை தீர்க்க ஒரு கணினி பயிற்சி பயன்படுத்த முடியும் என்று தரவுத் கட்ட வேண்டும் என்று. கணினி பயிற்சி தேவை தரவு அளவு அதை உருவாக்க ஒரு மனித வெகுஜன ஒத்துழைப்பு தேவைப்படுகிறது என்று பெரிய இருக்க முடியும். கேலக்ஸி பூங்காவில், பயன்படுத்தப்படும் நரம்பியல் வலையமைப்புகள் வழக்கில் Banerji et al. (2010) நம்பத்தகுந்த மனித வகைப்பாடு இனப்பெருக்கம் முடிந்தது என்று ஒரு மாதிரி உருவாக்க பொருட்டு மனித-பெயரிடப்பட்ட உதாரணங்கள் ஒரு மிக பெரிய எண் தேவைப்படுகிறது.

இந்த கணினி உதவியுடனான அணுகுமுறையை பயன்படுத்தி அதை நீங்கள் மனித முயற்சி மட்டும் ஒரு வரையறுக்கப்பட்ட அளவு பயன்படுத்தி தரவின் அடிப்படையில், எல்லையற்ற அளவில் கையாள செயல்படுத்துகிறது என்று ஆகிறது. உதாரணமாக, ஒரு மில்லியன் மனித விளம்பரத்திற்கு விண்மீன் திரள்கள் ஒரு ஆராய்ச்சியாளர் பின்னர் ஒரு பில்லியன் அல்லது ஒரு டிரில்லியன் விண்மீன் திரள்கள் வகைப்படுத்த பயன்படுத்த முடியும் என்று கணிப்புக் மாதிரி உருவாக்க முடியும். விண்மீன் திரள்கள் மகத்தான எண்கள் உள்ளன என்றால், மனித கணினி கலப்பின இந்த வகையான உண்மையில் ஒரே தீர்வு ஆகும். இந்த எல்லையற்ற அளவிடுதல் எனினும், இலவசம். சரியாக தன்னை ஒரு கடினமான பிரச்சினையாக உள்ளது மனித வகைப்படுத்துதல் இனப்பெருக்கம் என்று ஒரு இயந்திர கற்றல் மாதிரி கட்டிட, ஆனால் அதிர்ஷ்டவசமாக ஏற்கனவே இந்த தலைப்பு அர்ப்பணிக்கப்பட்ட சிறந்த புத்தகங்கள் உள்ளன (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

கேலக்ஸி பூங்காவில் பல மனித கணக்கீடு திட்டங்கள் பரிணாம வளர்ச்சி காட்டுகிறது. முதல், ஒரு ஆராய்ச்சியாளர் தன்னை மூலம் அல்லது ஆராய்ச்சி உதவியாளர்கள், ஒரு சிறு குழு (எ.கா., Schawinski ஆரம்ப வகைப்பாடு முயற்சி) திட்ட முயற்சிக்கிறது. இந்த அணுகுமுறை நன்றாக அளவிட முடியாது என்றால், ஆராய்ச்சியாளர் பல மக்கள் வகைப்படுத்துதல் பங்களிக்க அங்கு ஒரு மனித கணக்கீடு திட்டம் நகர்த்த முடியும். ஆனால், தரவு ஒரு குறிப்பிட்ட அளவு, ஆனால் தூய்மையான மனித முயற்சி போதுமான முடியாது. அந்த நேரத்தில், ஆராய்ச்சியாளர்கள் மனித வகைப்படுத்துதல் தரவுத் கிட்டத்தட்ட வரம்பற்ற அளவில் பயன்படுத்த முடியும் என்று ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி பயன்படுத்தப்படும் எங்கே இரண்டாவது தலைமுறை அமைப்புகள் உருவாக்க வேண்டும்.