3.4 কে জিজ্ঞাসা করতে

ডিজিটাল যুগ অনুশীলনের সম্ভাব্যতা স্যাম্পলিংকে কঠিন করে তুলছে এবং অ-সম্ভাব্যতা স্যাম্পলিংয়ের জন্য নতুন সুযোগ তৈরি করছে।

স্যাম্পলিংয়ের ইতিহাসে, দুটি প্রতিদ্বন্দ্বী পন্থা রয়েছে: সম্ভাব্যতা নমুনা পদ্ধতি এবং অ-সম্ভাব্যতার নমুনা পদ্ধতি। স্যাম্পলিং এর প্রথম দিনগুলিতে উভয় পদ্ধতির ব্যবহার করা হলেও, সম্ভাব্যতা স্যাম্পলিং হ'ল হ'ল, এবং অনেক সামাজিক গবেষককে অসাধারণ সংশয়বাদের সাথে অ-সম্ভাব্যতার নমুনা দেখতে শেখানো হয়। যাইহোক, আমি নিম্নে বর্ণনা করবো, ডিজিটাল বয়স দ্বারা সৃষ্ট পরিবর্তনগুলি বোঝায় যে গবেষকরা অ-সম্ভাব্যতার নমুনা পুনর্বিবেচনা করার জন্য সময়। বিশেষত, সম্ভাব্যতা স্যাম্পলিং অনুশীলন করতে কঠোর হচ্ছে, এবং অ-সম্ভাব্যতা স্যাম্পলিং দ্রুততর, সস্তা, এবং আরও ভালো হয়েছে। দ্রুত এবং সস্তা জরিপগুলি শুধু নিজেদের মধ্যে শেষ হয় না: তারা আরও ঘন ঘন সার্ভে এবং বড় নমুনা মাপের মত নতুন সুযোগগুলি সক্ষম করে। উদাহরণস্বরূপ, অ-সম্ভাব্যতার পদ্ধতিগুলি ব্যবহার করে কোঅপারেটিভ কংগ্রেসনাল নির্বাচনী স্টাড (সিইএস) সম্ভাবনাময় নমুনা ব্যবহার করে আগের পাঠ্যক্রমের চেয়ে প্রায় 10 গুণ বেশি অংশগ্রহণ করতে সক্ষম। এই অনেক বড় নমুনা রাজনৈতিক গবেষকরা উপগোষ্ঠী এবং সামাজিক প্রেক্ষাপটে প্রতি দৃষ্টিভঙ্গি এবং আচরণের মধ্যে পার্থক্য অধ্যয়ন করতে সক্ষম হন। উপরন্তু, এই (Ansolabehere and Rivers 2013) সমস্ত স্কেল আনুমানিক মান (Ansolabehere and Rivers 2013) মধ্যে হ্রাস ছাড়া আসে।

বর্তমানে, সামাজিক গবেষণা জন্য স্যাম্পলিং প্রভাবশালী পদ্ধতি সম্ভাব্যতা নমুনা হয় । সম্ভাব্যতা স্যাম্পলিংয়ে, টার্গেট জনসংখ্যার সমস্ত সদস্যের একটি পরিচিত, নমুনা হওয়ার সম্ভাবনা নেই, এবং স্যাম্পেলকৃত সমস্ত লোক জরিপে সাড়া দেয়। যখন এই শর্ত পূরণ করা হয়, তখন মার্জিত গাণিতিক ফলাফলগুলি প্রতিযোগিতামূলক গ্যারান্টি প্রদান করে যা লক্ষ্যবস্তু জনসংখ্যার বিষয়ে তথ্য তৈরি করার জন্য নমুনা ব্যবহার করার একটি গবেষক এর ক্ষমতা সম্পর্কে।

বাস্তব জগতে, তবে, এই গাণিতিক ফলাফলের অন্তর্গত শর্তগুলি কদাচিৎ পূরণ হয়। উদাহরণস্বরূপ, প্রায়ই কভারেজ ত্রুটি এবং nonresponse আছে। এই সমস্যাগুলির কারণে, গবেষকরা তাদের নমুনা থেকে তাদের লক্ষ্য জনসংখ্যার অনুমান করার জন্য প্রায়ই বিভিন্ন পরিসংখ্যানগত সমন্বয়গুলি কাজে লাগাতে থাকে। সুতরাং, তত্ত্বের সম্ভাব্যতা স্যাম্পলিংয়ের মধ্যে পার্থক্য করা গুরুত্বপূর্ণ, যা তাত্ত্বিক তাত্ত্বিক গ্যারান্টি এবং অনুশীলনের সম্ভাব্যতা স্যাম্পলিং যা এই ধরনের কোন গ্যারান্টী দেয় না এবং বিভিন্ন পরিসংখ্যানগত সমন্বয়গুলির উপর নির্ভর করে।

সময়ের সাথে সাথে, তত্ত্ব এবং সম্ভাব্যতা স্যাম্পলিং পদ্ধতিতে সম্ভাব্যতার নমুনা মধ্যে পার্থক্য ক্রমবর্ধমান হয়েছে। উদাহরণস্বরূপ, উচ্চতর মানের, ব্যয়বহুল জরিপের (চিত্র 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) এমনকি অবাঞ্ছিত হারগুলি ক্রমান্বয়ে বৃদ্ধি পেয়েছে। বাণিজ্যিক টেলিফোন সার্ভেগুলিতে ননresponse হার অনেক বেশি- মাঝে মাঝে এমনকি 90% পর্যন্ত উচ্চতর (Kohut et al. 2012) । অবাধ প্রতিক্রিয়া এই বৃদ্ধি অনুমানের মান হুমকি কারণ গবেষণা ক্রমবর্ধমান পরিসংখ্যান মডেল যে researchers nonresponse জন্য সামঞ্জস্য ব্যবহার করে নির্ভর করে। অধিকতর, উচ্চ প্রতিক্রিয়া হার বজায় রাখার জন্য জরিপ গবেষকদের দ্বারা ক্রমবর্ধমান ব্যয়বহুল প্রচেষ্টার সত্ত্বেও এই মানের হ্রাস ঘটেছে। কিছু লোক ভয় পায় যে নিম্নমানের গুণমান এবং বর্ধিত খরচের এই দুই প্রবণতা জরিপ গবেষণা (National Research Council 2013) এর ভিত্তিকে হুমকির সম্মুখীন করে।

চিত্র 3.5: উচ্চমানের ব্যয়বহুল জরিপ (ন্যাশনাল রিসার্চ কাউন্সিল ২013; বি। ডি। মেয়ার, মোক এবং সুলেইভান ২015) এ অনিয়ন্ত্রিতভাবে ক্রমবর্ধমানভাবে ধীরে ধীরে বেড়ে চলেছে। বাণিজ্যিক টেলিফোন সার্ভেগুলির জন্য অ প্রতিক্রিয়া হার অনেক বেশি, কখনও কখনও এমনকি 90% পর্যন্ত উচ্চতর (Kohut et al। 2012)। Nonresponse এ দীর্ঘমেয়াদী প্রবণতা অর্থাত তথ্য সংগ্রহ আরো ব্যয়বহুল এবং অনুমান কম নির্ভরযোগ্য। বি। ডি। মেয়ার, মোক এবং সুলিভান (২015) থেকে চিত্রিত, চিত্র 1।

চিত্র 3.5: উচ্চমানের ব্যয়বহুল জরিপ (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) -তে অনিয়ন্ত্রিতভাবে ক্রমবর্ধমানভাবে ধীরে ধীরে বৃদ্ধি পেয়েছে। বাণিজ্যিক টেলিফোন সার্ভেগুলির জন্য অ প্রতিক্রিয়া হার অনেক বেশি, কখনও কখনও এমনকি 90% পর্যন্ত উচ্চতর (Kohut et al. 2012) । Nonresponse এ দীর্ঘমেয়াদী প্রবণতা অর্থাত তথ্য সংগ্রহ আরো ব্যয়বহুল এবং অনুমান কম নির্ভরযোগ্য। BD Meyer, Mok, and Sullivan (2015) , চিত্র 1 থেকে অভিযোজিত।

একই সময়ে সম্ভাব্যতা নমুনা পদ্ধতির জন্য ক্রমবর্ধমান সমস্যা রয়েছে, অ-সম্ভাব্যতার নমুনা পদ্ধতিতে উত্তেজনাপূর্ণ উন্নতি হয়েছে। অ প্রবণতা নমুনা পদ্ধতি বিভিন্ন শৈলী আছে, কিন্তু এক জিনিস যে তারা সাধারণ আছে যে তারা সহজেই সম্ভাব্যতা নমুনা (Baker et al. 2013) এর গাণিতিক কাঠামোর মধ্যে উপযুক্ত করতে পারে না। অন্য কথায়, অ-সম্ভাব্যতা স্যাম্পলিং পদ্ধতিতে সবাই অন্তর্ভুক্ত এবং অজৈরোষের সম্ভাবনা নেই। অ-সম্ভাব্যতা নমুনা পদ্ধতি সামাজিক গবেষকদের মধ্যে একটি ভয়ানক খ্যাতি আছে এবং তারা জরিপ গবেষকদের, যেমন লিটারারি ডাইজেস্ট ফ্যাসজো (পূর্বে আলোচনা করা) এবং "ডেভি ডেফেট ট্রুম্যান" -এর বেশিরভাগ নাটকীয় ব্যর্থতার সাথে যুক্ত হয়েছে, "মার্কিন সম্পর্কে ভুল ভবিষ্যদ্বাণী 1948 সালের রাষ্ট্রপতি নির্বাচনের (চিত্র 3.6)।

চিত্র 3.6: রাষ্ট্রপতি হ্যারি ট্রুম্যান একটি সংবাদপত্রের শিরোনাম তুলে ধরেছেন যা ভুলভাবে তার পরাজয় ঘোষণা করেছে। এই শিরোনাম অ প্রবণতা নমুনা (সর্বাধিক 1949; বিয়ান 1950; ফ্রিডম্যান, পিসানি, এবং পুর্স 2007) থেকে অনুমানের অংশে ভিত্তি করে ছিল। যদিও 1 9 48 সালে ডেভিট ট্রুম্যানকে হারিয়েছিল, তবুও এখনও কিছু গবেষক অ-সম্ভাব্যতা নমুনাগুলি থেকে আনুমানিক সম্পর্কে সন্দেহজনক বলে মনে করেন। উত্স: হ্যারি এস ট্রুম্যান গ্রন্থাগার ও যাদুঘর।

চিত্র 3.6: রাষ্ট্রপতি হ্যারি ট্রুম্যান একটি সংবাদপত্রের শিরোনাম তুলে ধরেছেন যা ভুলভাবে তার পরাজয় ঘোষণা করেছে। এই শিরোনাম অ প্রবণতা নমুনা (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) থেকে অনুমানের অংশে ভিত্তি করে ছিল। যদিও 1948 সালে "ডেভি ডেফেট ট্রুম্যান" ঘটেছিল, তবুও কিছু গবেষক অ-সম্ভাব্যতা নমুনাগুলি থেকে আনুমানিক সম্পর্কে সন্দেহজনক মনে করেন। উত্স: হ্যারি এস ট্রুম্যান গ্রন্থাগার ও যাদুঘর

অ-সম্ভাব্যতা স্যাম্পলিং এর একটি ফর্ম যা ডিজিটাল যুগের উপযোগী, অনলাইন প্যানেলের ব্যবহার। অনলাইন প্যানেল ব্যবহার করে গবেষকরা কিছু প্যানেল প্রদানকারীর উপর নির্ভর করে- সাধারণত একটি কোম্পানি, সরকার, বা বিশ্ববিদ্যালয়- এমন একটি বৃহৎ, বিভিন্ন গ্রুপ গঠন করতে যা সার্ভেগুলির জন্য উত্তরদাতা হিসাবে পরিবেশন করতে সম্মত হয়। এই প্যানেল অংশগ্রহণকারীদের প্রায়শই বিজ্ঞাপন ব্যানার বিজ্ঞাপনগুলি বিভিন্ন ধরনের বিজ্ঞাপন পদ্ধতি ব্যবহার করে নিয়োগ করা হয়। তারপর, একজন গবেষক প্যানেল প্রদানকারীকে উত্তরদাতাদের উত্তরদাতাদের একটি নমুনা অ্যাক্সেস করতে পারেন (যেমন, জাতীয়ভাবে প্রাপ্তবয়স্কদের প্রতিনিধি)। এই অনলাইন প্যানেল অ প্রবণতা পদ্ধতি কারণ সবাই না একটি পরিচিত, nonzero অন্তর্ভুক্তির সম্ভাবনা। যদিও অ-সম্ভাব্যতা অনলাইন প্যানেলগুলি ইতিমধ্যেই সামাজিক গবেষকদের (যেমন সিইসিএস) দ্বারা ব্যবহৃত হচ্ছে, এখনও তাদের কাছ থেকে আসে এমন পরিসংখ্যানের মান সম্পর্কে কিছু বিতর্ক আছে (Callegaro et al. 2014)

এই বিতর্ক সত্ত্বেও, আমি মনে করি দুটি গবেষণায় দেখা গেছে যে, কেন সামাজিক গবেষকদের অ-সম্ভাব্যতার নমুনা পুনর্বিবেচনা করার সময় সঠিক। প্রথমত, ডিজিটাল যুগে, অ-সম্ভাব্যতা নমুনার সংগ্রহ ও বিশ্লেষণে অনেক উন্নয়ন হয়েছে। এই নতুন পদ্ধতিগুলি অতীতের সমস্যার কারণে সৃষ্ট বিভিন্ন পদ্ধতির থেকে ভিন্ন। আমি মনে করি যে এটি তাদের "অ-সম্ভাব্যতা নমুনা ২.0।" হিসাবে বিবেচনা করতে পারে, গবেষকেরা অ-সম্ভাব্যতার নমুনা পুনর্বিবেচনার দ্বিতীয় কারণ হল সম্ভাব্যতা স্যাম্পলিং অনুশীলন ক্রমবর্ধমান কঠিন হয়ে ওঠে। যখন উচ্চতর হারের অ প্রতিক্রিয়া আছে - যেমন প্রকৃত জরিপ আছে- উত্তরদাতাদের অন্তর্ভুক্তির প্রকৃত সম্ভাবনাগুলি জানা যায় না, এবং এইভাবে, সম্ভাব্যতা নমুনা এবং অ-সম্ভাব্যতা নমুনা ভিন্ন নয় যেমন অনেক গবেষকরা বিশ্বাস করেন।

যেহেতু আমি আগেই বলেছি, বেশিরভাগ সামাজিক গবেষকদের দ্বারা অস্পষ্টতার নমুনাগুলি বেশ কিছু সন্দেহজনক মনে হয়, কারণ জরিপ গবেষণাগুলির শুরুতে বেশ কিছু অস্বস্তিকর ব্যর্থতার মধ্যে তাদের ভূমিকা ছিল। একটি অস্পষ্টতা নমুনার সঙ্গে আমরা কিভাবে আসা একটি স্পষ্ট উদাহরণ Wei Wang, ডেভিড Rothschild, Sharad Goel, এবং অ্যান্ড্রু Gelman (2015) যে সঠিকভাবে 2012 মার্কিন নির্বাচনের ফলাফল একটি অ প্রবণতা নমুনা ব্যবহার ফলাফল পুনরুদ্ধার আমেরিকান এক্সবক্স ব্যবহারকারীদের - আমেরিকানদের একটি নিখুঁতভাবে অ-ড্রামম নমুনা। এক্সবক্স গেমিং সিস্টেম থেকে উত্তরদাতা নিয়োগকারীরা, এবং আপনি আশা করতে পারেন যে, এক্সবক্সের নমুনাটি পুরুষ এবং স্কুডেড যুবককে ঘিরে ফেলছে: 18-২9 বছর বয়সী ছেলেমেয়েদের 19% ভোটার করে কিন্তু 65% এক্সব্লব নমুনা এবং পুরুষদের আপ 47% ভোটার কিন্তু 93% এক্সবক্স নমুনা (চিত্র 3.7)। এই শক্তিশালী জনতাত্ত্বিক পক্ষপাতের কারণে, কাঁচা এক্সবক্স তথ্য নির্বাচনী রিটার্নের একটি খারাপ সূচক ছিল। বারাক ওবামার ওপর মিট রমনির পক্ষে এটি একটি শক্তিশালী বিজয়। আবার, এটি কাঁচা, অপ্রয়োজনীয় অ প্রবণতা নমুনার বিপদগুলির অন্য একটি উদাহরণ এবং সাহিত্য ডাইজেস্ট ফ্যাসেক্সের স্মারক হিসেবে।

চিত্র 3.7: ডাব্লু ওয়াং এট আল এর উত্তরদাতাদের জনসংখ্যা (2015)। কারণ উত্তরদাতাদের XBox থেকে নিযুক্ত করা হয়, তারা বেশী তরুণ হতে পারে এবং সম্ভবত পুরুষ হতে পারে, 2012 সালে নির্বাচনের ভোটারদের আপেক্ষিক। ওয়াং এট আল থেকে অভিযোজিত (2015), চিত্র 1

চিত্র 3.7: W. Wang et al. (2015) এর উত্তরদাতাদের জনসংখ্যা W. Wang et al. (2015) । কারণ উত্তরদাতাদের XBox থেকে নিযুক্ত করা হয়, তারা বেশী তরুণ হতে পারে এবং সম্ভবত পুরুষ হতে পারে, 2012 সালে নির্বাচনের ভোটারদের আপেক্ষিক। W. Wang et al. (2015) থেকে অভিযোজিত W. Wang et al. (2015) , চিত্র 1

যাইহোক, ওয়াং এবং সহকর্মীরা এই সমস্যা সম্পর্কে সচেতন ছিলেন এবং অনুমান করার সময় তাদের অ-র্যান্ডম স্যাম্পলিং প্রক্রিয়ার সমন্বয় সাধন করার চেষ্টা করেছিলেন। বিশেষত, তারা পোস্ট-স্ট্র্যাটিফিকেশন ব্যবহার করে, এমন একটি টেকনিক যা প্রযোজ্যতা নমুনার সমন্বয় সাধন করা হয় যা কভারেজ ত্রুটি এবং অ-প্রতিক্রিয়া রয়েছে।

পোস্ট-স্ট্র্যাটিফিকেশন এর মূল ধারণাটি একটি নমুনা থেকে প্রাপ্ত অনুমানের উন্নতিতে লক্ষ্য জনসংখ্যার সহায়তাকারী তথ্য ব্যবহার করতে হয়। তাদের অ প্রবণতা নমুনা থেকে অনুমান করতে পোস্ট স্তরান্তকরণ ব্যবহার করার সময়, ওয়াং এবং সহকর্মী বিভিন্ন গোষ্ঠীতে জনসংখ্যা কেটে দিয়েছিল, প্রতিটি গ্রুপে ওবামার জন্য সমর্থন অনুমান করা হয়েছিল, এবং সামগ্রিক পরিসংখ্যান উত্পাদন করার জন্য গোষ্ঠীর অনুমানগুলির একটি গড়িত গড় নিয়েছিল। উদাহরণস্বরূপ, তারা জনসংখ্যাকে দুটি গ্রুপে পরিণত করতে পারে (পুরুষ ও নারী), পুরুষদের ও মহিলাদের মধ্যে ওবামার পক্ষে সমর্থন অনুমান করে, এবং তারপর ওবামার জন্য সামগ্রিক সমর্থন আনুমানিকভাবে একটি গড়িত গড় করে, যেগুলি নারীদের জন্য 53% ভোটদাতা এবং পুরুষ 47%। গোষ্ঠীর আকার সম্পর্কে অক্জিলিয়ারী তথ্য আনয়ন করে অবশেষে, পোস্ট-স্তরবিন্যাস অসামঞ্জস্যপূর্ণ নমুনার জন্য সঠিক করে তুলেছে।

পোস্ট-স্তরবিন্যাসের মূলটি হচ্ছে সঠিক গ্রুপগুলি গঠন করা। যদি আপনি জনসংখ্যার সংখ্যাগরিষ্ঠ জনগোষ্ঠীকে সমবয়সিত করতে পারেন যেমন প্রতিক্রিয়া প্রবণতা প্রতিটি দলের প্রত্যেকের জন্য একই, তাহলে পোস্ট স্তরবিন্যাস অনির্ধারিত আনুমানিক উত্পন্ন করবে। অন্য কথায়, লিঙ্গ দ্বারা স্তর স্তরবিন্যাস অস্পষ্ট অনুমান উত্পন্ন হবে যদি সমস্ত পুরুষদের প্রতিক্রিয়া প্রবণতা আছে এবং সমস্ত মহিলাদের একই প্রতিক্রিয়া প্রবণতা আছে। এই ধারণাকে বলা হয় একজাতীয়-প্রতিক্রিয়া-প্রতিক্রিয়া-গোষ্ঠীগুলির অনুমান, এবং আমি এই অধ্যায়ের শেষে গাণিতিক নোটগুলির মধ্যে একটি বিট আরো বর্ণনা করি।

অবশ্যই, এটা অসম্ভাব্য মনে হয় যে প্রতিক্রিয়া propensities সব পুরুষদের এবং সমস্ত মহিলাদের জন্য একই হবে যাইহোক, গোষ্ঠী-প্রতিক্রিয়া-প্রতিক্রিয়া-গ্রুপ-ধারণের মধ্যে আরও দৃঢ়তর হয়ে যায় কারণ গোষ্ঠীর সংখ্যা বৃদ্ধি পায়। মোটামুটিভাবে, যদি আপনি আরও গোষ্ঠী তৈরি করেন তবে জনগোষ্ঠিকে একজাতীয় গোষ্ঠীগুলির মধ্যে চূর্ণ করা সহজ হবে। উদাহরণস্বরূপ, এটা বোধগম্য মনে হতে পারে যে সমস্ত মহিলাদের একই প্রতিক্রিয়া প্রবণতা আছে, কিন্তু 18২9-এর মধ্যে যারা সমস্ত কলেজে স্নাতক হয় এবং যারা ক্যালিফোর্নিয়াতে বসবাস করছেন তাদের সকলের জন্য একই প্রতিক্রিয়ার প্রবণতা আছে বলে মনে হতে পারে। । এইভাবে, পোস্ট-স্তরান্তরণে ব্যবহৃত দলগুলির সংখ্যা বড় হয়ে গেলে, পদ্ধতিটি সমর্থন করার জন্য প্রয়োজনীয় অনুমানগুলি আরও যুক্তিসঙ্গত হয়ে ওঠে। এই সত্যের পরিপ্রেক্ষিতে, গবেষকরা প্রায়ই পোস্ট স্তরবিন্যাসের জন্য একটি বিশাল সংখ্যক গোষ্ঠী তৈরি করতে চান। যাইহোক, গ্রুপ সংখ্যা বৃদ্ধি হিসাবে, গবেষকরা একটি ভিন্ন সমস্যা চালানো: তথ্য sparsity। যদি প্রতিটি গোষ্ঠীর মধ্যে অল্পসংখ্যক লোকই থাকে, তাহলে অনুমান আরও অনিশ্চিত হবে এবং চরম ক্ষেত্রে যেখানে কোনও উত্তরদাতা নেই এমন একটি গোষ্ঠী আছে, তারপর পোস্ট স্তরবিন্যাস সম্পূর্ণভাবে ভেঙ্গে যায়।

সমগোত্রীয়-প্রতিক্রিয়া-প্রবণতা-মধ্যে-গোষ্ঠীগুলির অনুমানের প্রতিভা এবং প্রতিটি দলের যুক্তিসঙ্গত নমুনা মাপের দাবির মধ্যে এই সহজাত উত্তেজনা থেকে দুটি উপায় রয়েছে। প্রথমত, গবেষকরা একটি বৃহত্তর, আরো বৈচিত্রপূর্ণ নমুনা সংগ্রহ করতে পারেন, যা প্রতিটি গোষ্ঠীর যুক্তিসঙ্গত নমুনা আকারগুলি নিশ্চিত করতে সহায়তা করে। দ্বিতীয়ত, তারা গ্রুপগুলির মধ্যে অনুমান করার জন্য আরো উন্নততর পরিসংখ্যান মডেল ব্যবহার করতে পারে। এবং, বাস্তবিকই, কখনও কখনও গবেষক উভয়ই করেন, যেমনটি ওয়াং এবং সহকর্মীরা এক্সবক্স থেকে উত্তরদাতাদের ব্যবহার করে নির্বাচনের সঙ্গে তাদের গবেষণা করেছেন।

কারন তারা কম্পিউটার-প্রশাসিত সাক্ষাত্কারের সাথে একটি অ-সম্ভাব্যতা স্যাম্পলিং পদ্ধতি ব্যবহার করছে (আমি 3.5 সেকেন্ডের কম্পিউটার-পরিচালিত ইন্টারভিউ সম্পর্কে আরও আলোচনা করব), ওয়াং এবং সহকর্মীরা খুব সস্তা তথ্য সংগ্রহ করেছিল, যা তাদের 345,858 অনন্য অংশগ্রহণকারীদের কাছ থেকে তথ্য সংগ্রহ করতে সক্ষম হয়েছিল , নির্বাচনের ভোটের মান দ্বারা একটি বিশাল সংখ্যা। এই বিপুল নমুনা আকার তাদের একটি পোস্ট সংখ্যালঘু গ্রুপ বৃহত্তর সংখ্যা তৈরি করতে সক্ষম। যেহেতু পোস্ট স্তরান্তকরণ সাধারণত জনসংখ্যার শত শত গোষ্ঠীকে কাটাতে জড়িত থাকে, তাই ওয়াং এবং সহকর্মীরা জনসংখ্যা লিঙ্গ (2 টি বিভাগ), জাতি (4 টি বিভাগ), বয়স (4 টি বিভাগ), শিক্ষা (4 টি বিভাগ), শিক্ষা (4 টি বিভাগ) দ্বারা সংজ্ঞায়িত 176,256 টি গ্রুপে বিভক্ত। (51 টি বিভাগ), পার্টি আইডি (3 টি বিভাগ), মতাদর্শ (3 টি বিভাগ) এবং ২008 সালের ভোট (3 টি বিভাগ)। অন্য কথায়, তাদের বিশাল নমুনা আকার, যা কম খরচে ডেটা সংগ্রহের মাধ্যমে সক্ষম হয়েছে, তাদের মূল্যায়ন প্রক্রিয়ার মধ্যে তাদের আরো সুদৃঢ় ধারণা তৈরি করতে সক্ষম করেছে।

এমনকি 345,858 স্বতন্ত্র অংশগ্রহণকারীদের সাথে, এখনও অনেক, অনেক গ্রুপ ছিল যার জন্য ওয়াং এবং সহকর্মীরা প্রায় কোনও উত্তরদাতা ছিলেন না। অতএব, তারা প্রত্যেকটি দলের সমর্থন অনুমান করার জন্য বহুমাত্রিক রিগ্রেশন নামে একটি কৌশল ব্যবহার করে। মূলত, একটি নির্দিষ্ট গ্রুপের মধ্যে ওবামার জন্য সমর্থন অনুমান, অনেক ঘনিষ্ঠভাবে সম্পর্কিত গ্রুপ থেকে মাল্টিলেভেল রিগ্রেশন পুল্ড তথ্য। উদাহরণস্বরূপ, 18 থেকে ২9 বছর বয়সী মহিলা অধিবাসীদের মধ্যে ওবামার পক্ষে ওবামাকে সমর্থন করার চেষ্টা করায় কল্পনা করুন, যারা ডেমোক্রেটস নিবন্ধিত, যারা দার্শনিক নিবন্ধিত, যারা স্বায়ত্তশাসন হিসাবে আত্মপ্রকাশ করে এবং যারা ২008 সালে ওবামার পক্ষে ভোট দিয়েছিলেন। , খুব নির্দিষ্ট গ্রুপ, এবং এটি এই বৈশিষ্ট্য সঙ্গে নমুনা কেউ আছে যে সম্ভব। অতএব, এই গ্রুপ সম্পর্কে অনুমান করতে, বহুসংখ্যক রিগ্রেশন একসঙ্গে পুল করার একটি পরিসংখ্যান মডেল ব্যবহার করে একই গ্রুপগুলির মধ্যে থেকে মানুষের অনুমান।

সুতরাং, ওয়াং এবং সহকর্মীরা একটি পদ্ধতি ব্যবহার করে যা বহুমাত্রিক রিগ্রেশন এবং পোস্ট-স্ট্র্যাটিফিকেশনকে সমৃদ্ধ করে, তাই তারা তাদের স্ট্যাট্র্যাটিফিকেশন বা আরও বেশি স্নেহপূর্ণভাবে তাদের কৌশলকে মাল্টিলেভেল রিগ্রেশন বলে। " পি। "যখন ওয়াং এবং সহকর্মীরা জনাব পি। ব্যবহার করে এক্সবক্স অ-সম্ভাব্যতার নমুনা থেকে আনুমানিক আয় করেন, তখন তারা ২01২ সালের নির্বাচনে (চিত্র 3.8) ওবামাকে পেয়েছিলেন সামগ্রিক সমর্থনের আনুমানিক মূল্যায়ন করে। প্রকৃতপক্ষে তাদের অনুমানগুলি ঐতিহ্যগত জনমত জরিপে মোট সমপরিমাণ তুলনায় আরো সঠিক ছিল। সুতরাং, এই ক্ষেত্রে, পরিসংখ্যানগত সমন্বয় - বিশেষভাবে মিঃ পি .- একটি অসামর্থ্য তথ্য উপাত্ত সংশোধন একটি ভাল কাজ করতে মনে; অপ্রয়োজনীয় এক্সবক্স ডেটা থেকে আনুমানিক দিকে তাকালে দেখা যায় যে এটি স্পষ্ট দৃশ্যমান ছিল।

চিত্র 3.8: W. ওয়াং এট আল থেকে অনুমান (2015)। অপ্রয়োজনীয় এক্সবক্স নমুনা অগ্রহণযোগ্য অনুমান উত্পাদিত। কিন্তু, ওয়েটেড এক্সবক্স নমুনা উত্পাদিত অনুমান যে সম্ভাবনা সম্ভাব্য ভিত্তিক টেলিফোন সার্ভেগুলির তুলনায় আরো সঠিক ছিল। ওয়াং এট আল থেকে অভিযোজিত (2015), পরিসংখ্যান 2 এবং 3

চিত্র 3.8: W. Wang et al. (2015) থেকে অনুমান W. Wang et al. (2015) । অপ্রয়োজনীয় এক্সবক্স নমুনা অগ্রহণযোগ্য অনুমান উত্পাদিত। কিন্তু, ওয়েটেড এক্সবক্স নমুনা উত্পাদিত অনুমান যে সম্ভাবনা সম্ভাব্য ভিত্তিক টেলিফোন সার্ভেগুলির তুলনায় আরো সঠিক ছিল। W. Wang et al. (2015) থেকে অভিযোজিত W. Wang et al. (2015) , পরিসংখ্যান 2 এবং 3

ওয়াং এবং সহকর্মীদের গবেষণা থেকে দুটি প্রধান পাঠ রয়েছে। প্রথমত, অপ্রয়োজনীয় অ প্রবণতা নমুনার খারাপ অনুমান হতে পারে; এই একটি গবেষণায় অনেক গবেষক আগে শুনেছেন। দ্বিতীয় পাঠ, তবে, অ-সম্ভাব্যতার নমুনাগুলি, যখন সঠিকভাবে বিশ্লেষণ করা হয়, তখন আসলে ভাল অনুমান তৈরি করতে পারে; অ প্রবণতা নমুনা স্বয়ংক্রিয়ভাবে সাহিত্য ডাইজেস্ট ফ্যাসজ্যাক মত কিছু হতে হবে না।

এগিয়ে যাওয়া, আপনি একটি সম্ভাব্যতা নমুনা পদ্ধতি এবং একটি অ প্রবণতা স্যাম্পলিং পদ্ধতি ব্যবহার করে মধ্যে সিদ্ধান্ত নিতে চেষ্টা করছেন যদি আপনি একটি কঠিন পছন্দ সম্মুখীন। কখনও কখনও গবেষকরা একটি দ্রুত এবং কঠোর নিয়ম (যেমন, সর্বদা সম্ভাব্যতা নমুনা পদ্ধতি ব্যবহার) চান, কিন্তু এই ধরনের একটি নিয়ম প্রস্তাব করা ক্রমবর্ধমান কঠিন। গবেষকরা অনুশীলনের সম্ভাব্যতা স্যাম্পলিং পদ্ধতিগুলির মধ্যে একটি কঠিন পছন্দ সম্মুখীন হয়- যা তাত্ত্বিক ফলাফলগুলি থেকে অনেক বেশি ব্যয়বহুল এবং তাদের ব্যবহার-এবং অ-সম্ভাব্যতা স্যাম্পলিং পদ্ধতিকে ন্যায্যতা প্রদান করে- যা সস্তা এবং দ্রুততর, কিন্তু কম পরিচিত এবং আরো বৈচিত্রময়। তবে একথা পরিষ্কার যে, যদি আপনি অ-সম্ভাব্যতা নমুনা বা অ-প্রতিনিধিত্বমূলক বড় তথ্য সূত্র (অধ্যায় ২-এ ফিরে) নিয়ে কাজ করতে বাধ্য হয়ে থাকেন, তবে বিশ্বাস করার এক দৃঢ় কারণ আছে যে প্রাক-স্তরবিন্যাস এবং সংশ্লিষ্ট কৌশলগুলি অপ্রয়োজনিত, কাঁচা আনুমানিক তুলনায় আরো ভালো হবে।