5.2.1 আকাশগঙ্গা চিড়িয়াখানা

এই অনুবাদ একটি কম্পিউটার দ্বারা তৈরি করা হয়েছে. ×

5.2.1 আকাশগঙ্গা চিড়িয়াখানা

আকাশগঙ্গা চিড়িয়াখানাটি একাধিক অ-বিশেষজ্ঞ স্বেচ্ছাসেবকদের এক মিলিয়ন ছায়াপথ শ্রেণীভুক্ত করার প্রচেষ্টাকে মিলিত করেছে।

2007 সালে অক্সফোর্ড ইউনিভার্সিটির অ্যাস্ট্রোনিমিতে স্নাতক ছাত্র কেভিন স্কাউনিস্কি একটি সমস্যার মুখোমুখি হয়েছিলেন। বেশ কিছুটা সরলীকরণ করে, স্লেজিস্কি ছায়াপথগুলিতে আগ্রহী ছিলেন এবং ছায়াপথগুলি তাদের মৃত্তিকা-আড়াআড়ি বা সর্পিল দ্বারা শ্রেণীবদ্ধ হতে পারে- এবং তাদের রঙ-নীল বা লাল দ্বারা এ সময় জ্যোতির্বিজ্ঞানীদের মধ্যে প্রথাগত জ্ঞান ছিল যে আমাদের আকাশগঙ্গার মতো আকাশগঙ্গা ছায়াপথগুলি নীল রঙের (যুবককে নির্দেশ করে) এবং অ্যান্টিবায়োটিক ছায়াপথগুলি লাল (ইঙ্গিত দেয় বৃদ্ধ বয়সে)। Schawinski এই প্রচলিত প্রজ্ঞা সন্দেহ। তিনি মনে করেন যে এই প্যাটার্নটি সাধারণভাবে সত্য হতে পারে, তবে সম্ভবত ব্যতিক্রমগুলির বেশ কিছুসংখ্যক সংখ্যক অসাধারণ ছায়াপথই পড়তে পারে-যেগুলি প্রত্যাশিত প্যাটার্ন অনুসারে মাপতে পারে না-সেটি প্রক্রিয়াটি সম্পর্কে কিছু শিখতে পারে ছায়াপথ গঠিত।

সুতরাং, প্রচলিত প্রজ্ঞাকে অগ্রাহ্য করার জন্য স্কাউনিস্কি কি প্রয়োজন ছিল তা ছিল মাপবিজ্ঞানবিহীন শ্রেণীবদ্ধ ছায়াপথের একটি বড় সেট; যে, ছায়াপথ যা সর্পিল বা উপবৃত্তাকার হিসাবে শ্রেণীবদ্ধ করা হয়েছে তবে সমস্যা ছিল, যে শ্রেণীবিন্যাসের জন্য বিদ্যমান এলগরিদম পদ্ধতি বৈজ্ঞানিক গবেষণার জন্য ব্যবহার করা যথেষ্ট ভাল ছিল না; অন্য কথায়, সেই সময়ে, ছায়াপথ শ্রেণীবদ্ধ ছিল এমন একটি সমস্যা যা কম্পিউটারের জন্য কঠিন ছিল। অতএব, প্রয়োজনীয় সংখ্যক মানুষের শ্রেণীবিন্যাসকৃত ছায়াপথ ছিল। একটি স্নাতক ছাত্র উত্সাহ সঙ্গে Schawinski এই শ্রেণীবিভাজন সমস্যা গৃহীত সাত ঘণ্টার 1২ ঘণ্টায় ম্যারাথন সেশনে তিনি 50,000 ছায়াপথ শ্রেণীবদ্ধ করতে সক্ষম হন। যদিও 50,000 ছায়াপথগুলি অনেকের মতো শব্দ হতে পারে, স্লওন ডিজিটাল স্কিম সার্ভে ছবিতে প্রায় এক মিলিয়ন ছায়াপথের মধ্যে প্রায় 5% ছায়াপথটি ছড়িয়েছে। Schawinski উপলব্ধি করেন যে তিনি একটি আরো মাপসই পদ্ধতির প্রয়োজন

ভাগ্যক্রমে, এটি সক্রিয় আউট যে শ্রেণীকরণের ছায়াপথ কাজটি জ্যোতির্বিদ্যা উন্নত প্রশিক্ষণ প্রয়োজন হয় না; যদি আপনি কাউকে এটা প্রশংসনীয় দ্রুত করতে শেখাতে পারেন. অন্য কথায়, যদিও ছায়াপথ শ্রেণীকরণের একটি টাস্ক যে কম্পিউটারের জন্য কঠিন ছিল, এটা মানুষের জন্য বেশ সহজ ছিল. সুতরাং, যখন অক্সফোর্ড, Schawinski এবং সহকর্মী জ্যোতির্বিজ্ঞানী ক্রিস Lintott একটি পানশালায় বসে একটি ওয়েবসাইট যেখানে স্বেচ্ছাসেবকদের ছায়াপথ ইমেজ শ্রেণীভুক্ত হবে আপ স্বপ্নেও ভাবিনি. কয়েক মাস পরে, আকাশগঙ্গা চিড়িয়াখানা জন্মগ্রহণ করেন.

আকাশগঙ্গা চিড়িয়াখানা ওয়েবসাইটে, স্বেচ্ছাসেবকদের প্রশিক্ষণ কয়েক মিনিট সময় সহ্য করা হবে; উদাহরণস্বরূপ, একটি সর্পিল এবং উপবৃত্তাকার ছায়াপথের মধ্যে পার্থক্য শেখা (চিত্র 5.2)। এই প্রশিক্ষণের পর, প্রতিটি স্বেচ্ছাসেবককে একটি অসাধারণ ওয়েব-ভিত্তিক ইন্টারফেস (চিত্র 5.3) এর মাধ্যমে অজানা ছায়াপথের প্রকৃত শ্রেণিবিন্যাস শুরু করা হবে। স্বেচ্ছাসেবক থেকে জ্যোতির্বিজ্ঞানীর মধ্যে 10 মিনিটেরও কম সময়ে স্থানান্তরিত হবে এবং শুধুমাত্র সর্বনিম্ন বাধা অতিক্রম করা প্রয়োজন, একটি সহজ ক্যুইজ।

চিত্র 5.2: দুইটি প্রধান ধরণের ছায়াপথের উদাহরণ: সর্পিল এবং উপবৃত্তাকার। আকাশগঙ্গা চিড়িয়াখানা প্রকল্প 900,000 এরও বেশি ইমেজ শ্রেণীবদ্ধ করার জন্য 100,000 এর বেশি স্বেচ্ছাসেবকদের ব্যবহার করেছে। Http://www.GalaxyZoo.org এবং Sloan ডিজিটাল স্কিম সার্ভার থেকে অনুমতি দ্বারা পুনরুত্পাদন।

চিত্র 5.3: ইনপুট স্ক্রিন যেখানে স্বেচ্ছাসেবকদের একক চিত্র শ্রেণীভুক্ত করার জন্য বলা হয়েছিল। স্লিওন ডিজিটাল স্কিম সার্ভে থেকে একটি ইমেজ উপর ভিত্তি করে ক্রিস লিনটোট থেকে অনুমতি দ্বারা পুনর্ব্যবহৃত।

প্রজেক্টটি একটি প্রবন্ধে প্রকাশিত হওয়ার পর আলেকজান্ডার চিড়িয়াখানার প্রাথমিক স্বেচ্ছাসেবীদের আকৃষ্ট করে এবং প্রায় ছয় মাস এই প্রকল্পটি 100,000 এরও বেশি নাগরিকের বিজ্ঞানীদের অন্তর্ভুক্ত করার জন্য বৃদ্ধি পেয়েছিল, যারা অংশগ্রহণ করেছিলো কারণ তারা এই কাজটি উপভোগ করেছিল এবং তারা জ্যোতির্বিজ্ঞানের অগ্রগতিতে সাহায্য করতে চেয়েছিলেন। একসঙ্গে, এই 100,000 স্বেচ্ছাসেবকদের একটি মোট মোট 40 মিলিয়ন শ্রেণীভুক্তকরণ, অংশীদারিত্বের তুলনায় ছোট, অংশগ্রহণকারীদের মূল গ্রুপ (Lintott et al. 2008) থেকে আসার অধিকাংশ (Lintott et al. 2008) ।

গবেষকরা স্নাতক ডিগ্রী গবেষণা সহকারী নিয়োগের অভিজ্ঞতা আছে অবিলম্বে তথ্য গুণমান সম্পর্কে সন্দেহজনক হতে পারে। যদিও এই সংশয়বাদ যুক্তিসঙ্গত, গ্যালাক্সি চিও দেখায় যে স্বেচ্ছাসেবকের অবদান সঠিকভাবে পরিষ্কার, ডেবিয়েজ এবং সমষ্টিগত হয়, তখন তারা উচ্চ মানের ফলাফল (Lintott et al. 2008) তৈরি করতে পারে। জনসাধারণের পেশাদার মানের তথ্য তৈরি করার জন্য একটি গুরুত্বপূর্ণ কৌতুক হল অপ্রতুলতা , যা একই কাজটি বিভিন্ন লোকের দ্বারা পরিচালিত হচ্ছে। আকাশগঙ্গা চিড়িয়াখানাতে, ছায়াপথ প্রতি প্রায় 40 শ্রেণীবিন্যাস ছিল; স্নাতকোত্তর গবেষণা সহকারীর সাহায্যে গবেষকরা এই স্তরের অপ্রতুলতাটি সামলাতে পারে না এবং সেইজন্য প্রতিটি শ্রেণির শ্রেণীবিন্যাসের গুণমানের সাথে আরো বেশি সংশ্লিষ্টতা থাকা প্রয়োজন। স্বেচ্ছাসেবকদের প্রশিক্ষণের অভাব ছিল কি না, তারা অপ্রতুলতার জন্য তৈরি।

এমনকি ছায়াপথ প্রতি একাধিক শ্রেণীবিন্যাস সঙ্গে, তবে, একটি ঐক্যমত্য শ্রেণিবদ্ধ উত্পাদন স্বেচ্ছাসেবক শ্রেণীবিভাজন সেট সংমিশ্রণ ছিল চতুর। যেহেতু বেশিরভাগ মানব গণনা প্রকল্পে একই ধরণের চ্যালেঞ্জগুলি দেখা দেয়, তাই গ্যালাক্সি চিড়িয়াখানার গবেষণাকারীরা তাদের ঐক্যমত্য শ্রেণীবিন্যাস তৈরিতে ব্যবহৃত তিনটি পদক্ষেপের সংক্ষিপ্তভাবে পর্যালোচনা করতে সহায়ক। প্রথমত, গবেষকরা বগুড়ায় শ্রেণীবিন্যাস অপসারণের মাধ্যমে "পরিষ্কার করে" তথ্যগুলি উদাহরণস্বরূপ, যারা বারংবার একই ছায়াপথকে শ্রেণীবদ্ধ করেছে- এমন কিছু যা ঘটবে যদি তারা ফলাফলগুলি নিপূণভাবে পরীক্ষা করতে চেষ্টা করে-তাদের সমস্ত শ্রেণীবিন্যাস বাতিল করা হয়েছিল। এই এবং অন্যান্য অনুরূপ পরিষ্কার অপসারণ প্রায় 4% সব শ্রেণীবিভাজন।

দ্বিতীয়ত, পরিস্কার করার পরে, গবেষকরা শ্রেণিবদ্ধকরণে নিয়মানুবর্তিতামূলক বিভাজন সরিয়ে ফেলতে প্রয়োজন। মূল প্রকল্পের-উদাহরণস্বরূপ মধ্যে এমবেড করা পক্ষপাত সনাক্তকরণ স্টাডিজ, কিছু স্বেচ্ছাসেবকদের দেখাচ্ছে পরিবর্তে একবর্ণ মধ্যে ছায়াপথ একটি সিরিজের মাধ্যমে রঙ-গবেষক যেমন উপবৃত্তাকার ছায়াপথ যেমন বহুদূর সর্পিল ছায়াপথ শ্রেণীভুক্ত করতে নিয়মতান্ত্রিক পক্ষপাত হিসাবে বিভিন্ন নিয়মানুগ গোঁড়ামির আবিষ্কৃত (Bamford et al. 2009) । এই নিয়মতান্ত্রিক পক্ষপাত জন্য সামঞ্জস্য অত্যন্ত গুরুত্বপূর্ণ কারণ redundancy স্বয়ংক্রিয়ভাবে পদ্ধতিগত পক্ষপাত অপসারণ করা হয় না; এটি শুধুমাত্র র্যান্ডম ত্রুটির অপসারণ সাহায্য।

অবশেষে, ডেবিয়াসিংয়ের পরে, গবেষকরা একটি ঐক্যমতি শ্রেণিবদ্ধ উত্পাদন পৃথক শ্রেণীবিভাগের একত্রিত করার একটি পদ্ধতি প্রয়োজন। প্রতিটি ছায়াপথের জন্য শ্রেণীবিন্যাস একত্রিত করার সবচেয়ে সহজ উপায় হল সবচেয়ে সাধারণ শ্রেণীবিভাগ নির্বাচন করা। যাইহোক, এই পদ্ধতির প্রতিটি স্বেচ্ছাসেবী সমান ওজন দেওয়া হবে, এবং গবেষকরা কিছু স্বেচ্ছাসেবকদের তুলনায় শ্রেণীবদ্ধ করার চেয়ে ভাল অন্যদের সন্দেহ ছিল। অতএব, গবেষকরা আরও শ্রেণিবিন্যাসমূলক ওজনের পদ্ধতি আবিষ্কার করে যা সর্বোত্তম ক্লাসিফায়ারগুলি সনাক্ত করার চেষ্টা করে এবং তাদেরকে আরও ওজন প্রদান করে।

এইভাবে, তিন-পদক্ষেপের প্রক্রিয়া-পরিষ্কারকরণ, বিতৃষ্ণা এবং ওজন-এর পরে, আকাশগঙ্গা চিড়িয়াখানার গবেষক দল 40 মিলিয়ন স্বেচ্ছাসেবক শ্রেণিবিন্যাসকে ঐক্যমুলক আকারের শ্রেণীবিন্যাসের একটি সেট রূপে রূপান্তরিত করেছিল। এই গ্যালাক্সি চিড়িয়াখানা শ্রেণীবিভাগ যখন পেশাদার জ্যোতির্বিজ্ঞানীদের দ্বারা তিনটি ক্ষুদ্রতর প্রচেষ্টা তিনটি সঙ্গে তুলনা করা হয়েছিল, স্কাউন্সিস্কি দ্বারা ক্লাসিফিকেশন সহ যে আকাশগঙ্গা চিড়িয়া অনুপ্রাণিত সাহায্য, শক্তিশালী চুক্তি ছিল এইভাবে, স্বেচ্ছাসেবকদের, সামগ্রিকভাবে, উচ্চ মানের শ্রেণীবিভাগ এবং একটি স্কেলে যে গবেষকরা (Lintott et al. 2008) মেলে না পারতে সক্ষম ছিল। বস্তুত, এত বিপুল সংখ্যক ছায়াপথের জন্য মানব শ্রেণীকরণের মাধ্যমে, শাভিনস্কি, লিন্টোট এবং অন্যান্যরা দেখিয়েছেন যে প্রায় 80% ছায়াপথগুলি প্রত্যাশিত প্যাটার্ন-নীল স্ফুলিঙ্গ এবং লাল উপবৃত্তাকার অনুসরণ করে- এবং অসংখ্য কাগজপত্রগুলি সম্পর্কে লেখা হয়েছে এই আবিষ্কার (Fortson et al. 2011) ।

এই ব্যাকগ্রাউন্ডটি দেখলে, আপনি এখন দেখতে পারেন কিভাবে গ্যালাক্সির চিড়িয়াখানা বিভক্ত-আবেদন-সংযোজন প্রণালীটি অনুসরণ করে, একই রেসিপি যা অধিকাংশ মানব গণনা প্রকল্পগুলির জন্য ব্যবহৃত হয়। প্রথম, একটি বড় সমস্যা বিভক্ত মধ্যে বিভক্ত করা হয়। এই ক্ষেত্রে, এক মিলিয়নের গ্যালাক্সি শ্রেণীকরণের সমস্যাটি একটি ছায়াপথ শ্রেণিবিন্যাসের একটি মিলিয়ন সমস্যা বিভক্ত ছিল। পরবর্তী, একটি অপারেশন প্রতিটি অংশে স্বাধীনভাবে প্রয়োগ করা হয়। এই ক্ষেত্রে, স্বেচ্ছাসেবী প্রতিটি আকাশগঙ্গা হিসাবে সর্পিল বা elliptical হিসাবে শ্রেণীবদ্ধ। অবশেষে, ফলাফল একটি ঐক্যমত্য ফলাফল উত্পাদন মিলিত হয়। এই ক্ষেত্রে, একত্রিত পদক্ষেপটি প্রতিটি গ্যালাক্সি জন্য একটি ঐক্যমত্য শ্রেণিবদ্ধ উত্পাদন পরিষ্কার, debiasing, এবং ওজন অন্তর্ভুক্ত। যদিও বেশিরভাগ প্রকল্প এই সাধারণ রেসিপিটি ব্যবহার করে, প্রতিটি পদক্ষেপের জন্য নির্দিষ্ট সমস্যাগুলির সাথে কাস্টমাইজ করা প্রয়োজন। উদাহরণস্বরূপ, মানব গণনা প্রকল্পের নীচে বর্ণিত, একই রেসিপি অনুসরণ করা হবে, কিন্তু আবেদন এবং একত্রিত করা পদক্ষেপগুলি বেশ ভিন্ন হবে।

আকাশগঙ্গা চিড়িয়াখানা দলের জন্য, এই প্রথম প্রকল্প ছিল শুধু শুরু খুব শীঘ্রই তারা বুঝতে পেরেছিলেন যে যদিও তারা প্রায় এক মিলিয়ন ছায়াপথ শ্রেণীবদ্ধ শ্রেণীভুক্ত করতে সক্ষম হয়, এই স্কেলটি নতুন ডিজিটাল আকাশ জরিপের সাথে কাজ করতে যথেষ্ট নয়, যা প্রায় 10 বিলিয়ন গ্যালাক্সি (Kuminski et al. 2014) চিত্র তৈরি করতে পারে। 1 মিলিয়ন থেকে 10 বিলিয়ন পর্যন্ত বৃদ্ধি করার জন্য - 10,000-এর একটি ফ্যাক্টর - আকাশগঙ্গা চিড়িয়াখানা প্রায় 10,000 গুণ বেশি অংশগ্রহণকারীদের নিয়োগের প্রয়োজন হবে। যদিও ইন্টারনেটে স্বেচ্ছাসেবীদের সংখ্যা বড়, এটি অসীম নয়। অতএব, গবেষকরা বুঝতে পেরেছিলেন যে যদি তারা ডেডের ক্রমবর্ধমান পরিমাণে হ্যান্ডেল করতে যাচ্ছিল, তবে একটি নতুন, এমনকি আরো মাপযোগ্য, পদ্ধতিটি প্রয়োজন ছিল।

অতএব, মন্না ব্যানারজী- স্কাউনিস্কি, লিনটট এবং গ্যালাক্সি জেডু টিম (2010) এর অন্যান্য সদস্যদের সাথে কাজ করে- ছায়াপথগুলিকে শ্রেণীভুক্ত করার জন্য কম্পিউটারকে শিক্ষাদান শুরু করে। আরো বিশেষভাবে, আকাশগঙ্গা চিড়িয়াখানা দ্বারা তৈরি মানব শ্রেণিবিন্যাস ব্যবহার করে, বেনারজি একটি মেশিন লার্নিং মডেল তৈরি করে যা চিত্রের বৈশিষ্ট্যগুলির উপর ভিত্তি করে একটি ছায়াপথের মানুষের শ্রেণীবিন্যাসের ভবিষ্যদ্বাণী করতে পারে। যদি এই মডেলটি উচ্চ নির্ভুলতার সাথে মানব শ্রেণীকরণের পুনরুত্পাদন করতে পারে, তবে এটি গ্যালাক্সি চিড়িয়াখানার গবেষকদের দ্বারা অপরিহার্যভাবে অসংখ্য গ্যালাক্সিগুলি শ্রেণীবদ্ধ করার জন্য ব্যবহার করা যেতে পারে।

বানরজী ও সহকর্মীদের দৃষ্টিভঙ্গি মূলত সামাজিক গবেষণার ক্ষেত্রে ব্যবহৃত হয় এমন কৌশলগুলির অনুরূপ, যদিও প্রথম নজরে এ সমীকরণটি স্পষ্ট নাও হতে পারে। প্রথমত, বানরজি এবং সহকর্মীরা প্রতিটি চিত্রকে সাংখ্যিক বৈশিষ্ট্যগুলির একটি সেট রূপে রূপান্তরিত করে যা তার বৈশিষ্ট্যগুলির সংক্ষিপ্ত বিবরণ দেয়। উদাহরণস্বরূপ, ছায়াপথগুলির ছবির জন্য তিনটি বৈশিষ্ট্য থাকতে পারে: চিত্রের নীল পরিমাণ, পিক্সেলের উজ্জ্বলতা এবং অ-সাদা পিক্সেলের অনুপাত। সঠিক বৈশিষ্ট্য নির্বাচন সমস্যা একটি গুরুত্বপূর্ণ অংশ, এবং এটি সাধারণত বিষয় এলাকা দক্ষতার প্রয়োজন। এই প্রথম ধাপ, সাধারণত বৈশিষ্ট্যপূর্ণ প্রকৌশল বলা হয়, প্রতি ইমেজ প্রতি এক সারি সহ একটি ডাটা ম্যাট্রিক্সের ফলাফল এবং তারপর সেই চিত্রটি বর্ণনা করে তিনটি কলাম। তথ্য ম্যাট্রিক্স এবং পছন্দসই আউটপুট দেওয়া (উদাহরণস্বরূপ, ইমেজ একটি অ্যান্টিবায়োটিক ছায়াপথ হিসাবে মানুষের দ্বারা শ্রেণীবদ্ধ ছিল কিনা), গবেষক একটি পরিসংখ্যানগত বা মেশিন শেখার মডেল তৈরি করে - উদাহরণস্বরূপ, অবজেক্টিক রিগ্রেশন - যে বৈশিষ্ট্য উপর ভিত্তি করে মানুষের শ্রেণীবিভাগ অনুমান ইমেজ এর অবশেষে, গবেষক এই ছাপার মডেলের পরামিতিগুলি নতুন ছায়াপথের অনুপস্থিত শ্রেণিবিন্যাস (চিত্র 5.4) তৈরি করে। মেশিন লার্নিংয়ের ক্ষেত্রে, এই পদ্ধতিটি- লেবেলকৃত উদাহরণ ব্যবহার করে এমন একটি মডেল তৈরি করতে পারেন যা নতুন ডেটা লেবেল করতে পারে- যা তত্ত্বাবধানে শেখার জন্য বলা হয়।

চিত্র 5.4: কিভাবে বানরজি এট আল এর সরল বর্ণনা (২010) ছায়াপথ শ্রেণিবদ্ধকরণের জন্য একটি মেশিন শেখার মডেলকে প্রশিক্ষণ দেওয়ার জন্য আকাশগঙ্গা চিড়িয়াখানা শ্রেণিবদ্ধ ব্যবহার করত। ছায়াপথের ছবি বৈশিষ্ট্যগুলির একটি ম্যাট্রিক্স রূপান্তরিত হয়। এই সরলীকৃত উদাহরণে, তিনটি বৈশিষ্ট্য রয়েছে (চিত্রের নীল পরিমাণ, পিক্সেলের উজ্জ্বলতা এবং nonwhite পিক্সেলের অনুপাত)। তারপর, চিত্রের একটি উপসেট জন্য, একটি মেশিন লার্নিং মডেল প্রশিক্ষণ জন্য ব্যবহৃত আকাশগঙ্গা চিড়িয়াখানা লেবেল ব্যবহার করা হয়। অবশেষে, মেশিন লার্নিং অবশিষ্ট ছায়াপথ জন্য ক্লাসিফিকেশন অনুমান ব্যবহার করা হয়। আমি এটি একটি কম্পিউটার-সহায়তাকারী মানব কম্পিউটেশন প্রকল্পটি কল করি কারণ মানুষের সমস্যা সমাধান করার পরিবর্তে এটি মানুষের একটি ডেটা সেট তৈরি করে যা সমস্যার সমাধান করতে কম্পিউটারকে প্রশিক্ষিত করতে পারে। এই কম্পিউটার-সহায়তাকারী মানব গণনা সিস্টেমের সুবিধা হল যে এটি শুধুমাত্র মানুষের প্রচেষ্টার একটি সীমিত পরিমাণ ব্যবহার করে আনুমানিক অসীম পরিমাণে হ্যান্ডেল করতে সক্ষম করে। স্লিওন ডিজিটাল স্কিম সার্ভে থেকে অনুমতিপ্রাপ্ত ছায়াপথগুলির ছবি।

চিত্র 5.4: কিভাবে Banerji et al. (2010) সরল বর্ণনা Banerji et al. (2010) ছায়াপথ শ্রেণিবদ্ধকরণের জন্য একটি মেশিন শেখার মডেলকে প্রশিক্ষণ দেওয়ার জন্য আকাশগঙ্গা চিড়িয়াখানা শ্রেণিবদ্ধ ব্যবহার করত। ছায়াপথের ছবি বৈশিষ্ট্যগুলির একটি ম্যাট্রিক্স রূপান্তরিত হয়। এই সরলীকৃত উদাহরণে, তিনটি বৈশিষ্ট্য রয়েছে (চিত্রের নীল পরিমাণ, পিক্সেলের উজ্জ্বলতা এবং nonwhite পিক্সেলের অনুপাত)। তারপর, চিত্রের একটি উপসেট জন্য, একটি মেশিন লার্নিং মডেল প্রশিক্ষণ জন্য ব্যবহৃত আকাশগঙ্গা চিড়িয়াখানা লেবেল ব্যবহার করা হয়। অবশেষে, মেশিন লার্নিং অবশিষ্ট ছায়াপথ জন্য ক্লাসিফিকেশন অনুমান ব্যবহার করা হয়। আমি এটি একটি কম্পিউটার-সহায়তাকারী মানব কম্পিউটেশন প্রকল্পটি কল করি কারণ মানুষের সমস্যা সমাধান করার পরিবর্তে এটি মানুষের একটি ডেটা সেট তৈরি করে যা সমস্যার সমাধান করতে কম্পিউটারকে প্রশিক্ষিত করতে পারে। এই কম্পিউটার-সহায়তাকারী মানব গণনা সিস্টেমের সুবিধা হল যে এটি শুধুমাত্র মানুষের প্রচেষ্টার একটি সীমিত পরিমাণ ব্যবহার করে আনুমানিক অসীম পরিমাণে হ্যান্ডেল করতে সক্ষম করে। স্লিওন ডিজিটাল স্কিম সার্ভে থেকে অনুমতিপ্রাপ্ত ছায়াপথগুলির ছবি।

বেনারজি এবং সহকর্মীদের 'মেশিন লার্নিং মডেলের বৈশিষ্ট্যগুলি আমার খেলনা উদাহরণের তুলনায় আরো জটিল ছিল- উদাহরণস্বরূপ, তিনি "ডি ভাকৌলুরস ফিট অক্ষীয় অনুপাত" -র মতো বৈশিষ্ট্যগুলি ব্যবহার করেন-এবং তার মডেল লজিস্টিক রিগ্রেশন নয়, এটি একটি কৃত্রিম নিউরাল নেটওয়ার্ক ছিল। তার বৈশিষ্ট্য, তার মডেল, এবং একক গ্যালাক্সি চিড়িয়াখানা শ্রেণিবদ্ধ ব্যবহার করে, তিনি প্রতিটি বৈশিষ্ট্য উপর ওজন তৈরি করতে সক্ষম, এবং তারপর ছায়াপথ শ্রেণীবদ্ধকরণ সম্পর্কে ভবিষ্যদ্বাণী করতে এই ওজন ব্যবহার করুন। উদাহরণস্বরূপ, তার বিশ্লেষণটি পাওয়া গেছে যে কম "ডি Vaucouleurs অক্ষীয় অনুপাত ফিট" সঙ্গে ইমেজ সর্পিল ছায়াপথ হতে সম্ভবত ছিল। এই ওজন দেওয়া, তিনি যুক্তিযুক্ত সঠিকতা সঙ্গে একটি ছায়াপথ মানুষের শ্রেণীবিভাগ পূর্বাভাস করতে পারবেন।

বেনারজি ও সহকর্মীদের কাজ থেকে আমি গ্যালাক্সি জিউকে একটি কম্পিউটার-সহায়তা মানুষের গণনা পদ্ধতিতে কল করতে বলি। এই হাইব্রিড সিস্টেমগুলি সম্পর্কে চিন্তা করার সর্বোত্তম উপায় হচ্ছে মানুষের সমস্যা সমাধানের একটি সমস্যা থাকা সত্ত্বেও, মানুষের একটি ডেটসেট তৈরি করা হয়েছে যা একটি কম্পিউটারকে সমস্যার সমাধান করতে ব্যবহার করতে পারে। কখনও কখনও, সমস্যা সমাধানের একটি কম্পিউটার প্রশিক্ষণ, অনেক উদাহরণ প্রয়োজন হতে পারে, এবং উদাহরণ একটি যথেষ্ট সংখ্যা উত্পাদন করার একমাত্র উপায় একটি ভর সহযোগিতা হয়। এই কম্পিউটার-সহায়তা পদ্ধতির সুবিধা হল যে এটি শুধুমাত্র মানুষের প্রচেষ্টার একটি সীমিত পরিমাণ ব্যবহার করে আনুমানিক অসীম পরিমাণে হ্যান্ডেল সক্ষম করে। উদাহরণস্বরূপ, এক মিলিয়ন মানুষের শ্রেণিবদ্ধ ছায়াপথের গবেষক একটি ভবিষ্যদ্বাণীমূলক মডেল তৈরি করতে পারেন যা এক বিলিয়ন বা এমনকি ট্রিলিয়ান ছায়াপথগুলি শ্রেণীবদ্ধ করার জন্য ব্যবহার করা যেতে পারে। যদি প্রচুর সংখ্যক ছায়াপথ থাকে, তবে এই ধরনের মানব-কম্পিউটার সংকর আসলেই একমাত্র সম্ভাব্য সমাধান। এই অসীম scalability মুক্ত হয় না, তবে। একটি মেশিন লার্নিং মডেল নির্মাণ করা যা মানুষের শ্রেণীকরণ সঠিকভাবে পুনরুত্পাদন করতে পারে নিজেই একটি কঠিন সমস্যা, কিন্তু সৌভাগ্যবশত ইতিমধ্যেই এই বিষয়টিকে (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) ।

আকাশগঙ্গা চিড়িয়াখানাটি কতগুলি মানব গণনা প্রকল্প উদ্ভবের একটি চমৎকার দৃষ্টান্ত। প্রথমত, একজন গবেষক নিজে অথবা গবেষণা সহযোগীদের একটি ছোট দল (যেমন, শাভিনস্কি এর প্রাথমিক শ্রেণীবিভাগ প্রচেষ্টা) দ্বারা এই প্রকল্পটির প্রচেষ্ট করেন। যদি এই পদ্ধতিটি ভালভাবে স্কেল না হয়, তবে গবেষক অনেক অংশগ্রহণকারীদের সাথে মানব গণনা প্রকল্পে স্থানান্তর করতে পারেন। কিন্তু, একটি নির্দিষ্ট পরিমাণে তথ্যের জন্য, বিশুদ্ধ মানুষের প্রচেষ্টা যথেষ্ট হবে না। সেই সময়ে, গবেষকরা একটি কম্পিউটার-সহায়তাকারী মানব গণনা পদ্ধতি নির্মাণ করতে হবে যার মধ্যে মানুষের শ্রেণীবিভাজন একটি মেশিন লার্নিং মডেলের প্রশিক্ষণের জন্য ব্যবহার করা হয় যা তারপর কার্যত অসীম পরিমাণে ডেটাতে প্রয়োগ করা যেতে পারে।