5.2.1 আকাশগঙ্গা চিড়িয়াখানা

আকাশগঙ্গা চিড়িয়াখানা একটি মিলিয়ন ছায়াপথ শ্রেণীভুক্ত অনেক অ বিশেষজ্ঞ স্বেচ্ছাসেবকদের প্রচেষ্টায় সম্মিলন.

আকাশগঙ্গা চিড়িয়াখানা 2007. বেশ বিট সরলীকৃত, Schawinski ছায়াপথ আগ্রহী ছিলেন কেভিন Schawinski, অক্সফোর্ড বিশ্ববিদ্যালয়ের জ্যোতির্বিদ্যা একটি স্নাতক ছাত্র দ্বারা সম্মুখীন একটি সমস্যা থেকে বের হয়েছি, এবং ছায়াপথ দ্বারা শ্রেণীবদ্ধ করা যেতে পারে তাদের অঙ্গসংস্থানবিদ্যা-উপবৃত্তাকার বা সর্পিল-ও তাদের রঙ নীল বা লাল দ্বারা. সময়ে, জ্যোতির্বিজ্ঞানীরা মধ্যে প্রচলিত জ্ঞান যে সর্পিল ছায়াপথ, আমাদের আকাশগঙ্গার মত, রঙ (ইঙ্গিত যুব) নীল ছিল এবং যে উপবৃত্তাকার ছায়াপথ লাল রঙের এ ছিল (বার্ধক্যে ইঙ্গিত). Schawinski এই প্রচলিত জ্ঞান doubted. তিনি সন্দেহ যখন এই প্যাটার্ন সাধারণভাবে সত্য হতে পারে, সেখানে সম্ভবত ব্যতিক্রম একটি বৃহদাকার সংখ্যা ছিল, এবং যে এই অস্বাভাবিক ছায়াপথ-বেশী যে মাপসই করা হয়নি প্রচুর অধ্যয়নরত দ্বারা প্রত্যাশিত প্যাটার্ন তিনি প্রক্রিয়া সম্পর্কে কিছু শিখতে পারে, যার মাধ্যমে ছায়াপথ গঠিত.

এভাবে কি Schawinski প্রচলিত জ্ঞান ত্তলটান প্রয়োজন দৃশ্যত শ্রেণীবদ্ধ ছায়াপথ বৃহৎ সেট ছিল; যে, ছায়াপথ যে পারেন সর্পিল বা উপবৃত্তাকার হিসাবে শ্রেণীবদ্ধ করা হত. সমস্যাটি অবশ্য ছিল যে শ্রেণীবিন্যাস জন্য বিদ্যমান আলগোরিদিমিক পদ্ধতি এখনো যথেষ্ট ভাল বৈজ্ঞানিক গবেষণার জন্য ব্যবহার করা হবে না; অন্য কথায়, শ্রেণীকরণের ছায়াপথ যে সময়ে ছিল, একটি সমস্যা যে কম্পিউটারের জন্য কঠিন ছিল. অতএব, কি দরকার ছিল মানুষের শ্রেণীবদ্ধ ছায়াপথ সংখ্যক ছিল. Schawinski একটি স্নাতক ছাত্র উদ্যম সঙ্গে এই শ্রেণীবিন্যাস সমস্যা হাতে নেয়. সাত, 12-ঘন্টা দিনের একটি সহ্যশক্তির পরীক্ষা অধিবেশনে তিনি 50,000 ছায়াপথ শ্রেণীভুক্ত করতে সক্ষম ছিল. 50,000 ছায়াপথ একটি অনেক মত শব্দ হতে পারে, এটা আসলে প্রায় এক মিলিয়ন ছায়াপথ যে স্লোয়ান ডিজিটাল স্কাই সার্ভে photographed হয়েছে মাত্র 5%. Schawinski উপলব্ধি করেন যে তিনি আরো একটি আকার পরিবর্তনযোগ্য পদ্ধতির প্রয়োজন.

ভাগ্যক্রমে, এটি সক্রিয় আউট যে শ্রেণীকরণের ছায়াপথ কাজটি জ্যোতির্বিদ্যা উন্নত প্রশিক্ষণ প্রয়োজন হয় না; যদি আপনি কাউকে এটা প্রশংসনীয় দ্রুত করতে শেখাতে পারেন. অন্য কথায়, যদিও ছায়াপথ শ্রেণীকরণের একটি টাস্ক যে কম্পিউটারের জন্য কঠিন ছিল, এটা মানুষের জন্য বেশ সহজ ছিল. সুতরাং, যখন অক্সফোর্ড, Schawinski এবং সহকর্মী জ্যোতির্বিজ্ঞানী ক্রিস Lintott একটি পানশালায় বসে একটি ওয়েবসাইট যেখানে স্বেচ্ছাসেবকদের ছায়াপথ ইমেজ শ্রেণীভুক্ত হবে আপ স্বপ্নেও ভাবিনি. কয়েক মাস পরে, আকাশগঙ্গা চিড়িয়াখানা জন্মগ্রহণ করেন.

আকাশগঙ্গা চিড়িয়াখানা ওয়েবসাইট এ, স্বেচ্ছাসেবকদের প্রশিক্ষণ কয়েক মিনিটের কষ্ট ভোগ করতে হবে; উদাহরণস্বরূপ, একটি সর্পিল এবং উপবৃত্তাকার ছায়াপথ (চিত্র 5.2) মধ্যে পার্থক্য শেখার. এই প্রশিক্ষণের পর স্বেচ্ছাসেবকদের পরিচিত একটি অপেক্ষাকৃত সহজ ব্যঙ্গ-সঠিকভাবে শ্রেণীকরণের 15 11 ছায়াপথ পাস ছিল শ্রেণীবিভাগেরও এবং তারপর স্বেচ্ছাসেবক একটি সহজ ওয়েব ভিত্তিক ইন্টারফেস (চিত্র 5.3) মাধ্যমে অজানা ছায়াপথ বাস্তব শ্রেণীবিন্যাস শুরু হবে. জ্যোতির্বিজ্ঞানী করতে স্বেচ্ছাসেবক থেকে রূপান্তরটি কম 10 মিনিটের মধ্যে স্থান গ্রহণ করা হবে এবং শুধুমাত্র বাধা, একটি সহজ ব্যঙ্গ সর্বনিম্ন পাশ প্রয়োজনীয়.

চিত্র 5.2: সর্পিল এবং উপবৃত্তাকার: এর ছায়াপথ দুটি প্রধান ধরনের উদাহরণ. আকাশগঙ্গা চিড়িয়াখানা প্রকল্প 900,000 টিরও বেশি চিত্র আরও বেশী 100,000 স্বেচ্ছাসেবকদের ব্যবহার. উত্স: www.galaxyzoo.org.

চিত্র 5.2: সর্পিল এবং উপবৃত্তাকার: এর ছায়াপথ দুটি প্রধান ধরনের উদাহরণ. আকাশগঙ্গা চিড়িয়াখানা প্রকল্প 900,000 টিরও বেশি চিত্র আরও বেশী 100,000 স্বেচ্ছাসেবকদের ব্যবহার. উত্স: www.galaxyzoo.org .

চিত্র 5.3: ইনপুট পর্দা যেখানে ভোটারদের একটি একক চিত্র শ্রেণীভুক্ত করতে বলা হয়. উত্স: www.galaxyzoo.org.

চিত্র 5.3: ইনপুট পর্দা যেখানে ভোটারদের একটি একক চিত্র শ্রেণীভুক্ত করতে বলা হয়. উত্স: www.galaxyzoo.org .

আকাশগঙ্গা চিড়িয়াখানা তার প্রাথমিক স্বেচ্ছাসেবকদের আকৃষ্ট পর প্রকল্পের একটি সংবাদ নিবন্ধে দেখানো হয়েছিল, এবং প্রায় ছয় মাসের মধ্যে প্রকল্পের অধিক 100,000 নাগরিক বিজ্ঞানী, যারা অংশগ্রহণ কারণ তারা কাজের আস্বাদিত এবং তারা অগ্রিম জ্যোতির্বিদ্যা সাহায্য চেয়েছিলেন জড়িত হয়েছি. একসঙ্গে, এই 100,000 স্বেচ্ছাসেবকদের শ্রেণীবিভাগেরও একটি অপেক্ষাকৃত ছোট, অংশগ্রহণকারীদের কোর গ্রুপ থেকে আসছে সংখ্যাগরিষ্ঠ সঙ্গে, অধিক 40 মিলিয়ন শ্রেণীবিভাগেরও মোট অবদান (Lintott et al. 2008) .

গবেষকরা যারা অভিজ্ঞতা নিয়োগের স্নাতক গবেষণা সহকারী আছে অবিলম্বে তথ্য মান সম্পর্কে সন্দিহান হতে পারে. যদিও এই সংশয়বাদ যুক্তিযুক্ত, আকাশগঙ্গা চিড়িয়াখানা দেখায় যে যখন স্বেচ্ছাসেবক অবদান সঠিকভাবে পরিষ্কার debiased, এবং সমষ্টিগত, তারা উচ্চ মানের ফল করতে (Lintott et al. 2008) . পেশাদারী মানের তথ্য তৈরি করতে ভিড় পাওয়ার জন্য একটি গুরুত্বপূর্ণ কৌতুক অতিরেক হয়; অর্থাৎ একই কাজের বিভিন্ন মানুষ দ্বারা সঞ্চালিত হচ্ছে. আকাশগঙ্গা চিড়িয়াখানা ইন, ছায়াপথ প্রতি প্রায় 40 শ্রেণীবিভাগেরও ছিল; স্নাতক গবেষণা সহায়ক ব্যবহার অতিরেক এই স্তর সামর্থ্য না পারে এবং সেইজন্য গবেষকরা প্রতিটি পৃথক শ্রেণীকরণের মানের সঙ্গে অনেক বেশি উদ্বিগ্ন হতে হবে. কি স্বেচ্ছাসেবকদের প্রশিক্ষণ অভাব, তারা অতিরেক সঙ্গে জন্য গঠিত.

এমনকি ছায়াপথ প্রতি একাধিক শ্রেণীবিভাগেরও সঙ্গে অবশ্য উত্পাদন স্বেচ্ছাসেবক শ্রেণীবিভাগেরও সেট মিশ্রন একটি ঐক্যমত্য শ্রেণীবিন্যাস চালাক. কারণ খুব অনুরূপ চ্যালেঞ্জ অধিকাংশ মানুষের গুনতি প্রকল্পে উঠা, এটা সংক্ষেপে তিনটি পদক্ষেপ যে আকাশগঙ্গা চিড়িয়াখানা গবেষকরা তাদের ঐক্যমত্য শ্রেণীবিভাগেরও উত্পাদন ব্যবহৃত পর্যালোচনা করতে সহায়ক হয়. প্রথমত, গবেষক মেকি শ্রেণীবিভাগেরও সরানোর দ্বারা "পরিষ্কার" তথ্য. উদাহরণস্বরূপ, যারা বারবার একই ছায়াপথ-কিছু যে ঘটতে পারে যদি তারা নিপূণভাবে করার চেষ্টা করা হয়েছে শ্রেণীবদ্ধ তাদের সব শ্রেণীবিভাগেরও প্রত্যাখ্যাত ফল-ছিল. এই এবং অন্যান্য অনুরূপ পরিচ্ছন্নতার সব শ্রেণীবিভাগেরও প্রায় 4% কাটানো.

দ্বিতীয়ত, পরিষ্কারের পর গবেষকরা শ্রেণীবিভাগেরও মধ্যে নিয়মানুগ গোঁড়ামির অপসারণ প্রয়োজন. মূল প্রকল্প-উদাহরণস্বরূপ মধ্যে এমবেডেড পক্ষপাত সনাক্তকরণ স্টাডিজ, কিছু স্বেচ্ছাসেবকদের দেখাচ্ছে পরিবর্তে একবর্ণ মধ্যে ছায়াপথ একটি সিরিজের মাধ্যমে রঙ-গবেষক যেমন উপবৃত্তাকার ছায়াপথ দূরে সর্পিল ছায়াপথ শ্রেণীভুক্ত একটি নিয়মানুগ পক্ষপাত হিসাবে বিভিন্ন পদ্ধতিগত গোঁড়ামির, আবিষ্কৃত (Bamford et al. 2009) . এই নিয়মানুগ গোঁড়ামির জন্য সামঞ্জস্য অত্যন্ত গুরুত্বপূর্ণ কারণ হল, অনেক অবদান গড় নিয়মানুগ পক্ষপাত মুছে যাবে না; এটা শুধুমাত্র র্যান্ডম ত্রুটি দূর করে দেয়.

অবশেষে, debiasing পর গবেষকরা পৃথক শ্রেণীবিভাগেরও একত্রিত করার জন্য একটি ঐক্যমত্য শ্রেণীবিন্যাস উত্পাদন একটি পদ্ধতি প্রয়োজন. প্রতিটি ছায়াপথ জন্য শ্রেণীবিভাগেরও একত্রিত করার সবচেয়ে সহজ উপায় হল সবচেয়ে সাধারণ শ্রেণীবিন্যাস নির্বাচন করতে হবে. যাইহোক, এই পদ্ধতির প্রতিটি স্বেচ্ছাসেবক সমান ওজন দেবে, এবং গবেষক সন্দেহভাজন যে কিছু স্বেচ্ছাসেবকদের অন্যদের তুলনায় শ্রেণীবিন্যাস ভালো ছিল. অতএব, গবেষকরা আরো জটিল পুনরাবৃত্ত তৌল পদ্ধতি স্বয়ংক্রিয়ভাবে সেরা ক্লাসিফায়ার শনাক্ত এবং তাদের বেশি ওজন দিতে প্রচেষ্টা উন্নত.

সুতরাং, একটি তিন ধাপ প্রক্রিয়া পরিস্কার, debiasing, এবং তৌল-আকাশগঙ্গা চিড়িয়াখানা গবেষণা দলের পর ঐক্যমত্য অঙ্গসংস্থান শ্রেণীবিভাগেরও একটি সেট মধ্যে 40 মিলিয়ন স্বেচ্ছাসেবক শ্রেণীবিভাগেরও রূপান্তরিত ছিল. এই আকাশগঙ্গা চিড়িয়াখানা শ্রেণীবিভাগেরও পেশাদার জ্যোতির্বিদদের তিন পূর্ববর্তী ছোট মাপের প্রচেষ্টা, Schawinski দ্বারা শ্রেণীবিন্যাস গ্যালাক্সি চিড়িয়াখানা উদ্বুদ্ধ করতে সাহায্য করেছিল সহ তুলনায় হয়েছিল, তখন সেখানে শক্তিশালী চুক্তি ছিল. সুতরাং, স্বেচ্ছাসেবক, সমষ্টিগতভাবে, উচ্চ মানের শ্রেণীবিভাগেরও প্রদান করতে সক্ষম এবং ছিল একটি স্কেল যে গবেষকরা মেলে না পারে এ (Lintott et al. 2008) . বস্তুত, ছায়াপথ এত বিপুল সংখ্যক মানুষের শ্রেণীবিভাগেরও থাকার, Schawinski, Lintott, এবং অন্যদের দেখানোর জন্য যে ছায়াপথ মাত্র 80% প্রত্যাশিত প্যাটার্ন-নীল বারবেল এবং লাল ellipticals-এবং অনেক কাগজপত্র অনুসরণ সম্পর্কে লেখা হয়েছে পেরেছি এই আবিষ্কারের (Fortson et al. 2011) .

এই পটভূমি দেওয়া, আমরা এখন দেখতে পারেন কিভাবে আকাশগঙ্গা চিড়িয়াখানা অনুসরণ বিভক্ত-প্রয়োগ- একত্রিত রেসিপি, একই রেসিপি যে অধিকাংশ মানুষের গুনতি প্রকল্পের জন্য ব্যবহার করা হয়. প্রথমত, একটি বড় সমস্যা অংশ বিভক্ত করা হয়. এই ক্ষেত্রে, একটি মিলিয়ন ছায়াপথ শ্রেণীকরণের এর সমস্যা এক ছায়াপথ শ্রেণীকরণের একটি মিলিয়ন সমস্যার বিভক্ত করা হয়. এর পরে, একটি অপারেশন স্বাধীনভাবে প্রতিটি খণ্ড প্রয়োগ করা হয়. এই ক্ষেত্রে, একটি স্বেচ্ছাসেবক পারেন সর্পিল বা উপবৃত্তাকার হিসাবে প্রতিটি ছায়াপথ শ্রেণীভুক্ত হবে. অবশেষে, ফলাফল একটি ঐক্যমত্য ফল উত্পাদন একত্রিত করা হয়. এই ক্ষেত্রে, একত্রিত ধাপ পরিষ্কার, debiasing, এবং তৌল প্রতিটি ছায়াপথ জন্য একটি ঐক্যমত্য শ্রেণীবিন্যাস উত্পাদন অন্তর্ভুক্ত. যদিও অধিকাংশ প্রকল্পের এই সাধারণ রেসিপি ব্যবহার, প্রতিটি ধাপ নির্দিষ্ট সমস্যা সুরাহা হচ্ছে কাস্টমাইজ করতে হবে. উদাহরণস্বরূপ, নীচে বর্ণিত মানব গুনতি প্রকল্পে, একই রেসিপি অনুসরণ করা হবে, কিন্তু প্রয়োগ এবং একত্রিত পদক্ষেপ বেশ আলাদা হতে হবে.

আকাশগঙ্গা চিড়িয়াখানা দলের জন্য, এই প্রথম প্রকল্প মাত্র শুরুতে ছিল. খুব দ্রুত তারা বুঝতে পেরেছিলেন যে, যদিও তারা একটি মিলিয়ন ছায়াপথ পাসে শ্রেণীভুক্ত করতে পেরেছি, এই স্কেল অপেক্ষাকৃত নতুন ডিজিটাল আকাশ সার্ভে, যা প্রায় 10 বিলিয়ন ছায়াপথ ইমেজ উত্পাদন করতে পারে সঙ্গে কাজ করার জন্য যথেষ্ট না হয় (Kuminski et al. 2014) . 1 কোটি 10 ​​থেকে বৃদ্ধি হ্যান্ডেল করতে বিলিয়ন একটি 10,000-আকাশগঙ্গা চিড়িয়াখানার ফ্যাক্টর প্রায় 10,000 গুণ বেশি অংশগ্রহণকারীদের নিয়োগ করতে হবে. যদিও ইন্টারনেটে স্বেচ্ছাসেবকদের সংখ্যা এমনিতেই বড় হয়, এটা অসীম নয়. তাই গবেষকরা উপলব্ধি করেন যে তারা তথ্য, একটি নতুন, এমনকি আরো আকার পরিবর্তনযোগ্য, পদ্ধতির প্রয়োজন ছিল পরিমাণে বাড়তে হ্যান্ডেল করতে যাচ্ছি যদি.

অতএব, মান্দা বন্দ্যোপাধ্যায় পরিশ্রমী কেভিন Schawinski ক্রিস Lintott, এবং আকাশগঙ্গা চিড়িয়াখানা দল শুরু শিক্ষাদান কম্পিউটারের অন্যান্য সদস্যদের সঙ্গে ছায়াপথ শ্রেণীভুক্ত. আরো নির্দিষ্টভাবে, মানব আকাশগঙ্গা চিড়িয়াখানায় করে নির্মিত শ্রেণীবিভাগেরও ব্যবহার Banerji et al. (2010) একটি মেশিন লার্নিং মডেল যে ইমেজ বৈশিষ্ট্যের উপর ভিত্তি করে একটি নীহারিকার মানুষের শ্রেণীবিন্যাস ভবিষ্যদ্বাণী করতে পারে নির্মিত. এই মেশিন লার্নিং মডেল উচ্চ নির্ভুলতা সঙ্গে মানুষের শ্রেণীবিভাগেরও বংশবৃদ্ধি করতে পারতেন, তাহলে এটা ছায়াপথের একটি মূলত অসীম সংখ্যা শ্রেণীভুক্ত আকাশগঙ্গা চিড়িয়াখানা গবেষকরা দ্বারা ব্যবহার করা যেতে পারে.

বন্দ্যোপাধ্যায় এবং সহকর্মীদেরও পদ্ধতির কোর আসলে বেশ কৌশল সাধারণভাবে সামাজিক গবেষণা ব্যবহৃত অনুরূপ, যদিও যে অভিন্নতা প্রথম নজরে স্পষ্ট হতে পারে না. প্রথমত, বন্দ্যোপাধ্যায় এবং সহকর্মীদের সাংখ্যিক বৈশিষ্ট্য যে সংক্ষেপ এটা বৈশিষ্ট্য এর একটি সেট প্রতিটি ইমেজ রূপান্তরিত. চিত্রে নীল পরিমাণ, পিক্সেল উজ্জ্বলতা মধ্যে বিরোধ, এবং অ সাদা পিক্সেল অনুপাত: উদাহরণস্বরূপ, ছায়াপথ ইমেজ জন্য তিনটি বৈশিষ্ট্য হতে পারে. সঠিক বৈশিষ্ট্য নির্বাচন সংক্রান্ত একটি গুরুত্বপূর্ণ অংশ, এবং এটি সাধারণত বিষয় এলাকার দক্ষতারপ্রয়োজন. এই প্রথম ধাপ, সাধারণভাবে বৈশিষ্ট্য ইঞ্জিনিয়ারিং নামক ইমেজ প্রতি এক সারি এবং তারপর তিন যে ইমেজ বর্ণনা কলাম সঙ্গে একটি তথ্য ম্যাট্রিক্স ফলাফল. তথ্য ম্যাট্রিক্স এবং পছন্দসই আউটপুট (যেমন, কিনা ইমেজ একটি উপবৃত্তাকার ছায়াপথ হিসেবে মানুষের দ্বারা শ্রেণীবদ্ধ করা হয়), গবেষক একটি পরিসংখ্যানগত মডেল-উদাহরণস্বরূপ পরামিতি অনুমান, একটি লজিস্টিক নির্ভরণ-মানব ভিত্তিক শ্রেণীবিন্যাস অনাবিষ্কৃত মৌলগুলো সম্বন্ধে ভবিষ্যদ্বাণী মত কিছু দেওয়া ইমেজ বৈশিষ্ট্যের উপর. অবশেষে গবেষক এই পরিসংখ্যানগত মডেল পরামিতি ব্যবহার (চিত্র 5.4) নতুন ছায়াপথের আনুমানিক শ্রেণীবিভাগেরও উত্পাদন. একটি সামাজিক এনালগ ভাবতে হবে, কল্পনা করুন যে, আপনি একটি মিলিয়ন ছাত্র সম্পর্কে জনতাত্ত্বিক তথ্য ছিল, এবং আপনি জানেন কিনা তারা কলেজ থেকে বা না স্নাতক. আপনি এই তথ্য একটি লজিস্টিক নির্ভরণ মাপসই পারে, এবং তারপর আপনি ফলে মডেল পরামিতি ব্যবহার করতে পারে ভবিষ্যদ্বাণী করা কিনা নতুন ছাত্র কলেজ থেকে স্নাতক করতে যাচ্ছি. মেশিন লার্নিং, এই পদ্ধতির-ব্যবহার লেবেল উদাহরণ একটি পরিসংখ্যানগত মডেল যে তারপর নতুন লেবেল তৈরি করতে পারেন তথ্য-বলা শেখার পরিদর্শিত (Hastie, Tibshirani, and Friedman 2009) .

চিত্র 5.4: কিভাবে বন্দ্যোপাধ্যায় এট এর সরলীকৃত বিবরণ. (2010) আকাশগঙ্গা চিড়িয়াখানা শ্রেণীবিভাগেরও ব্যবহৃত একটি মেশিন লার্নিং মডেল প্রশিক্ষণের জন্য ছায়াপথ শ্রেণীবিন্যাস করতে. ছায়াপথ চিত্র বৈশিষ্ট্য একটি ম্যাট্রিক্স মধ্যে ধর্মান্তরিত করা হয়. এই সরলীকৃত উদাহরণে তিনটি বৈশিষ্ট্য (চিত্রে নীল পরিমাণ, পিক্সেল উজ্জ্বলতা মধ্যে বিরোধ, এবং অ সাদা পিক্সেল অনুপাত) আছে. তারপর, ইমেজ একটি উপসেট জন্য, আকাশগঙ্গা চিড়িয়াখানা লেবেল একটি মেশিন লার্নিং মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয়. অবশেষে, মেশিন লার্নিং অবশিষ্ট ছায়াপথ জন্য শ্রেণীবিভাগেরও অনুমান করার জন্য ব্যবহৃত হয়. আমি এই ধরনের প্রকল্পের কল একটি দ্বিতীয় প্রজন্মের মানুষের গণনীয় প্রকল্প কারণ, বদলে হচ্ছে মানুষের একটি সমস্যা সমাধান, তারা মানুষের একটি ডেটা সেটটি যে সমস্যা সমাধানের জন্য একটি কম্পিউটার প্রশিক্ষণ দেওয়ার জন্য ব্যবহার করা যেতে পারে বিল্ড আছে. এই কম্পিউটারের সাহায্যে পদ্ধতির সুবিধা হল যে এটা আপনি শুধুমাত্র মানুষের প্রচেষ্টার একটি সসীম পরিমাণ ব্যবহার ডাটা মূলত অসীম পরিমাণ হ্যান্ডেল করতে সক্ষম হবেন.

চিত্র 5.4: কিভাবে সরলীকৃত বিবরণ Banerji et al. (2010) আকাশগঙ্গা চিড়িয়াখানা শ্রেণীবিভাগেরও ব্যবহৃত একটি মেশিন লার্নিং মডেল প্রশিক্ষণের জন্য ছায়াপথ শ্রেণীবিন্যাস করতে. ছায়াপথ চিত্র বৈশিষ্ট্য একটি ম্যাট্রিক্স মধ্যে ধর্মান্তরিত করা হয়. এই সরলীকৃত উদাহরণে তিনটি বৈশিষ্ট্য (চিত্রে নীল পরিমাণ, পিক্সেল উজ্জ্বলতা মধ্যে বিরোধ, এবং অ সাদা পিক্সেল অনুপাত) আছে. তারপর, ইমেজ একটি উপসেট জন্য, আকাশগঙ্গা চিড়িয়াখানা লেবেল একটি মেশিন লার্নিং মডেল প্রশিক্ষণের জন্য ব্যবহার করা হয়. অবশেষে, মেশিন লার্নিং অবশিষ্ট ছায়াপথ জন্য শ্রেণীবিভাগেরও অনুমান করার জন্য ব্যবহৃত হয়. আমি এই ধরনের প্রকল্পের কল একটি দ্বিতীয় প্রজন্মের মানুষের গণনীয় প্রকল্প কারণ, বদলে হচ্ছে মানুষের একটি সমস্যা সমাধান, তারা মানুষের একটি ডেটা সেটটি যে সমস্যা সমাধানের জন্য একটি কম্পিউটার প্রশিক্ষণ দেওয়ার জন্য ব্যবহার করা যেতে পারে বিল্ড আছে. এই কম্পিউটারের সাহায্যে পদ্ধতির সুবিধা হল যে এটা আপনি শুধুমাত্র মানুষের প্রচেষ্টার একটি সসীম পরিমাণ ব্যবহার ডাটা মূলত অসীম পরিমাণ হ্যান্ডেল করতে সক্ষম হবেন.

বৈশিষ্ট্য Banerji et al. (2010) মেশিন লার্নিং মডেল আমার খেলনা সেই দৃষ্টান্ত-উদাহরণস্বরূপ, তিনি বৈশিষ্ট্য মত ব্যবহৃত তুলনায় আরো জটিল ছিল "ডি Vaucouleurs অক্ষীয় অনুপাত মাপসই" -এবং তার মডেল লজিস্টিক নির্ভরণ ছিল না, এটি একটি কৃত্রিম নিউরাল নেটওয়ার্ক ছিল. তার বৈশিষ্ট্য, তার মডেল, এবং ঐক্যমত্য আকাশগঙ্গা চিড়িয়াখানা শ্রেণীবিভাগেরও ব্যবহার করে, সে প্রতিটি বৈশিষ্ট্য ওজন তৈরি করুন এবং তারপর ছায়াপথ শ্রেণীবিন্যাস সম্পর্কে ভবিষ্যৎবাণী করতে এই ওজন ব্যবহার করতে সক্ষম ছিল. উদাহরণস্বরূপ, তার বিশ্লেষণে দেখা গেছে, কম সঙ্গে "ডি Vaucouleurs অক্ষীয় অনুপাত মাপসই" ইমেজ আরো সর্পিল ছায়াপথ হওয়ার সম্ভাবনা ছিল. এই ওজন দেওয়া, তিনি যুক্তিসঙ্গত সঠিকতা সঙ্গে একটি নীহারিকার মানুষের শ্রেণীবিন্যাস ভবিষ্যদ্বাণী করতে সক্ষম ছিল.

কাজ Banerji et al. (2010) আমি কি একটি দ্বিতীয় প্রজন্মের মানুষের গুনতি সিস্টেম কল করবে বা আকাশগঙ্গা চিড়িয়াখানা পরিণত. সবচেয়ে ভালো উপায় হলো এই দ্বিতীয় প্রজন্মের সিস্টেম সম্বন্ধে চিন্তা করার জন্য যে বদলে হচ্ছে মানুষের একটি সমস্যা সমাধান, তারা মানুষের একটি ডেটা সেটটি যে সমস্যা সমাধানের জন্য একটি কম্পিউটার প্রশিক্ষণ দেওয়ার জন্য ব্যবহার করা যেতে পারে বিল্ড আছে. কম্পিউটার প্রশিক্ষণের জন্য প্রয়োজন পরিমাণ ডেটা এত বড় যে, এটা তৈরি করার জন্য একটি মানুষের ভর সহযোগিতা প্রয়োজন হতে পারে. আকাশগঙ্গা চিড়িয়াখানা, দ্বারা ব্যবহৃত নিউরাল নেটওয়ার্ক ক্ষেত্রে Banerji et al. (2010) অর্ডার একটি মডেল যে নির্ভরযোগ্যভাবে মানুষের শ্রেণীবিন্যাস বংশবৃদ্ধি করতে সক্ষম ছিল গড়ে তুলতে মানব-লেবেল উদাহরণ কয়েক একটি খুব বড় সংখ্যা প্রয়োজন.

এই কম্পিউটারের সাহায্যে পদ্ধতির সুবিধা হল যে এটা আপনি শুধুমাত্র মানুষের প্রচেষ্টার একটি সসীম পরিমাণ ব্যবহার ডাটা মূলত অসীম পরিমাণ হ্যান্ডেল করতে সক্ষম হবেন. উদাহরণস্বরূপ, একটি মিলিয়ন মানুষের শ্রেণীবদ্ধ ছায়াপথ সঙ্গে একটি গবেষক একটি ভবিষ্যদ্বাণীপূর্ণ মডেল যে তারপর একটি বিলিয়ন বা এমনকি একটি ট্রিলিয়ন ছায়াপথ শ্রেণীভুক্ত ব্যবহার করা যেতে পারে নির্মাণ করতে পারেন. ছায়াপথ বিরাট সংখ্যা আছে, তাহলে মানুষের কম্পিউটার সংকর এই ধরনের সত্যিই শুধুমাত্র সম্ভাব্য সমাধান. এই অসীম কর্মপরিধি তবে বিনামূল্যে নয়. একটি মেশিন লার্নিং মডেল যে সঠিকভাবে মানুষের শ্রেণীবিভাগেরও প্রজনন করতে পারে নিজেই একটি কঠিন সমস্যা নির্মাণের প্রণালী, কিন্তু ভাগ্যক্রমে সেখানে ইতিমধ্যে চমৎকার এই বিষয়ে নিবেদিত বই (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .

আকাশগঙ্গা চিড়িয়াখানা অনেক মানুষের গুনতি প্রকল্পের বিবর্তন দেখায়. প্রথমত, একটি গবেষক নিজেকে দ্বারা বা গবেষণা সহকারী একটি ছোট দল (যেমন, Schawinski প্রাথমিক ক্লাসিফিকেশন প্রচেষ্টা) সঙ্গে প্রকল্প প্রচেষ্টা. এই পদ্ধতির ভাল স্কেল না থাকলে, গবেষক একটি মানব গুনতি প্রকল্প যেখানে অনেক মানুষ শ্রেণীবিভাগেরও অবদান অগ্রসর না হতে পারেন. কিন্তু, তথ্য একটি নির্দিষ্ট ভলিউম জন্য, খাঁটি মানুষের প্রচেষ্টার যথেষ্ট হবে না. এই মুহুর্তে, গবেষক দ্বিতীয় প্রজন্মের সিস্টেম যেখানে মানুষের শ্রেণীবিভাগেরও একটি মেশিন লার্নিং মডেল যে তারপর ডাটা কার্যত সীমাহীন পরিমাণে প্রয়োগ করা যেতে পারে প্রশিক্ষণের জন্য ব্যবহার করা হয় নির্মাণ করা প্রয়োজন.