4.4 সহজ পরীক্ষায় পরলোক মুভিং

চলুন শুরু করা যাক সহজ পরীক্ষা থেকে সরানো। তিনটি ধারণা সমৃদ্ধ গবেষণার জন্য উপযোগী: বৈধতা, চিকিত্সা প্রভাব এবং কার্যকারিতা।

গবেষকরা নতুন যারা গবেষণার জন্য প্রায়ই একটি খুব নির্দিষ্ট, সংকীর্ণ প্রশ্ন ফোকাস: এই চিকিত্সা "কাজ"? উদাহরণস্বরূপ, একটি স্বেচ্ছাসেবক থেকে একটি ফোন কল কাউকে ভোট দিতে উত্সাহিত করে? নীল থেকে সবুজ ক্লিক ক্লিকের মাধ্যমে একটি ওয়েবসাইট বাটন পরিবর্তন করে? দুর্ভাগ্যবশত, "কাজ" সম্পর্কে আলগা কথোপকথনটি আসলে কীভাবে বোঝায় তা বোঝা যায় যে সুরক্ষামূলকভাবে পরীক্ষা করা আসলেই কি একটি সাধারণ অর্থে একটি চিকিত্সা "কাজ" করে না। এর পরিবর্তে, সামান্য মনোযোগ নিবদ্ধ পরীক্ষায় আরো অনেক বেশি প্রশ্নের উত্তর দেওয়া হয়: এই সময়ে অংশগ্রহণকারীদের জনসংখ্যার এই নির্দিষ্ট বাস্তবায়নের সঙ্গে এই নির্দিষ্ট চিকিত্সাটির গড় প্রভাব কি? আমি এই সংকীর্ণ প্রশ্ন সহজ পরীক্ষা ফোকাস যে পরীক্ষা কল করব।

সহজ পরীক্ষাগুলি মূল্যবান তথ্য সরবরাহ করতে পারে, তবে তারা এমন অনেক প্রশ্নের উত্তর দিতে ব্যর্থ হয় যা উভয় গুরুত্বপূর্ণ এবং আকর্ষণীয়, যেমন এমন কিছু লোক আছে যাদের জন্য চিকিত্সার একটি বড় বা ছোট প্রভাব রয়েছে; আরেকটি চিকিত্সা আছে কিনা তা আরও কার্যকর হবে; এবং এই গবেষণায় বৃহত্তর সামাজিক তত্ত্বগুলির সাথে সম্পর্কিত কিনা।

সহজ পরীক্ষার বাইরে চলে যাওয়ার মান প্রদর্শন করার জন্য, আসুন পি। ওয়েসলি শুল্জ এবং সামাজিক রীতিনীতি এবং শক্তির খরচ (Schultz et al. 2007) মধ্যে সম্পর্কের সাথে সহকর্মীদের একটি এনালগ ক্ষেত্রের পরীক্ষা বিবেচনা করি। স্কুলেৎস এবং সহকর্মীরা ক্যালিফোর্নিয়ার সান মারকোসে 300 টি পরিবারে দোরগোড়ায় আক্রান্ত হন এবং এই ঘরের বাহিনী শক্তি সংরক্ষণের জন্য উত্সাহিত বিভিন্ন বার্তা বিতরণ করে। তারপর, শুল্জ এবং সহকর্মীরা এই বার্তাগুলির বিদ্যুতের ব্যবহার, এক সপ্তাহ এবং তিন সপ্তাহ পরে উভয়ই পরিমাপ করে; পরীক্ষামূলক নকশা আরও বিস্তারিত বিবরণের জন্য চিত্র 4.3 দেখুন।

চিত্র 4.3: Schultz এট আল থেকে পরীক্ষামূলক নকশা পরিকল্পিত (2007)। আট সপ্তাহের বেশি সময় ধরে ক্যালিফোর্নিয়ার সান মার্কোস শহরে প্রায় 300 টি পরিবার পরিদর্শন করা হয়েছে। প্রতিটি দর্শনে, গবেষকরা ম্যানুয়ালি গৃহ বিদ্যুৎ মিটার থেকে একটি পড়া গ্রহণ। দুই ভিজিটে, তারা প্রতিটি বাড়ির ঘরের ভেতর ঘরের শক্তির ব্যবহার সম্পর্কে কিছু তথ্য প্রদান করে। গবেষণা প্রশ্ন ছিল এই বার্তাগুলি কীভাবে শক্তির ব্যবহার প্রভাবিত করবে।

চিত্র 4.3: Schultz et al. (2007) থেকে পরীক্ষামূলক নকশা পরিকল্পিত Schultz et al. (2007) । আট সপ্তাহের বেশি সময় ধরে ক্যালিফোর্নিয়ার সান মার্কোস শহরে প্রায় 300 টি পরিবার পরিদর্শন করা হয়েছে। প্রতিটি দর্শনে, গবেষকরা ম্যানুয়ালি গৃহ বিদ্যুৎ মিটার থেকে একটি পড়া গ্রহণ। দুই ভিজিটে, তারা প্রতিটি বাড়ির ঘরের ভেতর ঘরের শক্তির ব্যবহার সম্পর্কে কিছু তথ্য প্রদান করে। গবেষণা প্রশ্ন ছিল এই বার্তাগুলির বিষয়বস্তু কীভাবে শক্তির ব্যবহার প্রভাবিত করবে।

পরীক্ষা দুটি শর্ত ছিল প্রথমত, ঘরের মধ্যে সাধারণ শক্তি-সংরক্ষণের টিপস (উদাহরণস্বরূপ, বায়ু কন্ডিশনারের পরিবর্তে অনুরাগীদের ব্যবহার) পাওয়া যায় এবং তাদের প্রতিবেশী এলাকায় গড় শক্তি ব্যবহারের তুলনায় তাদের শক্তি ব্যবহারের তথ্য। Schultz এবং সহকর্মীরা এই বর্ণনামূলক প্রথাগত অবস্থা বলেছে কারণ আশেপাশে শক্তির ব্যবহার সম্পর্কে তথ্য সাধারণ আচরণের (যেমন, একটি বর্ণনামূলক আদর্শ) তথ্য প্রদান করে। Schultz এবং সহকর্মীরা এই গ্রুপের ফলে শক্তি ব্যবহারের দিকে তাকিয়ে ছিল, চিকিত্সা কোন প্রভাব আছে বলে মনে হয়, সংক্ষিপ্ত বা দীর্ঘ মেয়াদী; অন্য কথায়, চিকিত্সা "কাজ" বলে মনে হয়নি (চিত্র 4.4)।

সৌভাগ্যবশত, Schultz এবং সহকর্মীরা এই সরলীকরণ বিশ্লেষণের জন্য স্থির করেনি। পরীক্ষা শুরু হওয়ার আগে, তারা যুক্তি দিয়েছিল যে বিদ্যুতের ভারী ব্যবহারকারীরা-গড়ের চেয়ে বেশি মানুষ তাদের খরচ কমাতে পারে, এবং বিদ্যুতের হালকা ব্যবহারকারীরা - গড়ের নিচে মানুষ-আসলে তাদের খরচ বৃদ্ধি করতে পারে। যখন তারা তথ্য দিকে তাকিয়ে, যে ঠিক কি তারা পাওয়া (চিত্র 4.4)। এইভাবে, কোন প্রভাব না থাকা এমন একটি চিকিত্সার মত লাগছিল যা প্রকৃতপক্ষে একটি চিকিত্সা ছিল যার দুটি অফসেটিং প্রভাব ছিল। হালকা ব্যবহারকারীদের মধ্যে এই বিকৃততা বৃদ্ধি একটি বুমেরং প্রভাবের একটি উদাহরণ, যেখানে একটি চিকিত্সা উদ্দেশ্য ছিল কি থেকে বিপরীত প্রভাব থাকতে পারে।

চিত্র 4.4: Schultz এট আল থেকে ফলাফল (2007)। প্যানেল (একটি) দেখায় যে বর্ণনামূলক আদর্শ চিকিত্সা একটি শূন্য গড় চিকিত্সা প্রভাব আছে। যাইহোক, প্যানেল (বি) দেখায় যে এই গড় চিকিত্সা প্রভাব আসলে দুটি অফসেটিং প্রভাব গঠিত হয়। ভারী ব্যবহারকারীদের জন্য, চিকিত্সা ব্যবহার কম হ'ল কিন্তু হালকা ব্যবহারকারীদের জন্য, চিকিত্সা বৃদ্ধি ব্যবহার। অবশেষে, প্যানেলটি (c) দেখায় যে দ্বিতীয় চিকিত্সা, যা বর্ণনামূলক এবং নিষ্ক্রিয় মানগুলি ব্যবহার করে, ভারী ব্যবহারকারীদের উপর প্রায় একই প্রভাব ফেলেছিল কিন্তু হালকা ব্যবহারকারীদের উপর বুমেরার প্রভাবকে প্রভাবিত করে। Schultz এট আল থেকে অভিযোজিত (2007)।

চিত্র 4.4: Schultz et al. (2007) থেকে ফলাফল Schultz et al. (2007) । প্যানেল (একটি) দেখায় যে বর্ণনামূলক আদর্শ চিকিত্সা একটি শূন্য গড় চিকিত্সা প্রভাব আছে। যাইহোক, প্যানেল (বি) দেখায় যে এই গড় চিকিত্সা প্রভাব আসলে দুটি অফসেটিং প্রভাব গঠিত হয়। ভারী ব্যবহারকারীদের জন্য, চিকিত্সা ব্যবহার কম হ'ল কিন্তু হালকা ব্যবহারকারীদের জন্য, চিকিত্সা বৃদ্ধি ব্যবহার। অবশেষে, প্যানেলটি (c) দেখায় যে দ্বিতীয় চিকিত্সা, যা বর্ণনামূলক এবং নিষ্ক্রিয় মানগুলি ব্যবহার করে, ভারী ব্যবহারকারীদের উপর প্রায় একই প্রভাব ফেলেছিল কিন্তু হালকা ব্যবহারকারীদের উপর বুমেরার প্রভাবকে প্রভাবিত করে। Schultz et al. (2007) থেকে অভিযোজিত Schultz et al. (2007)

প্রথম শর্ত বরাবর যুগ্ম, Schultz এবং সহকর্মীরা একটি দ্বিতীয় শর্ত দৌড়ে। দ্বিতীয় অবস্থানে থাকা পরিবারগুলি একই চিকিত্সা-সাধারণ শক্তি-সংরক্ষণের টিপস এবং তাদের পরিবারের শক্তি ব্যবহার সম্পর্কে তথ্য তাদের আশেপাশের এলাকার গড়ের তুলনায় - একটি ক্ষুদ্রতর যোগদানের সাথে মিলছে- নিম্নের গড় লোকেদের জন্য, গবেষকরা আরো বলেছিলেন: ) এবং উপরের উপায়ে ব্যবহারযোগ্য লোকেদের জন্য তারা যোগ করেছেন :( এই ইমোটিকনগুলিকে ডিজাইন করা হয়েছে যা কার্যকরী নির্দেশক বলা হয় । ইনজেক্টিক মানগুলি সাধারণত অনুমোদিত (এবং অননুমোদিত) অনুভূতিকে বোঝায়, যদিও বর্ণনামূলক নিয়মগুলি অনুধাবন বোঝায় কি সাধারণত করা হয় (Reno, Cialdini, and Kallgren 1993)

এই একটি ক্ষুদ্র ইমোটিকন যোগ করে, গবেষকরা নাটকীয়ভাবে বুরাইং প্রভাব হ্রাস (চিত্র 4.4)। সুতরাং, এই একটি সহজ পরিবর্তন করে-একটি পরিবর্তন যা একটি বিমূর্ত সামাজিক মনস্তাত্ত্বিক তত্ত্ব (Cialdini, Kallgren, and Reno 1991) দ্বারা অনুপ্রাণিত ছিল - গবেষকরা এমন একটি প্রোগ্রাম চালু করতে সক্ষম ছিলেন যা কাজ করে এমন একটিতে কাজ করে না বলে মনে হয়, এবং, একযোগে, তারা সামাজিক নিয়ম-নীতি মানব আচরণের উপর কিভাবে প্রভাব বিস্তার করে তার সাধারণ বোঝার অবদান রাখতে সক্ষম ছিল।

এই সময়ে, যাইহোক, আপনি লক্ষ্য করতে পারেন যে কিছু এই পরীক্ষা সম্পর্কে একটু ভিন্ন। বিশেষ করে, শ্যুলেটজ এবং সহকর্মীদের পরীক্ষাটি এমনভাবে নিয়ন্ত্রণ গ্রুপ নয় যেমন র্যান্ডমাইজড নিয়ন্ত্রিত পরীক্ষা করা হয়। এই নকশা এবং Restivo এবং ভান দে Rijt যে মধ্যে তুলনা দুটি প্রধান পরীক্ষামূলক ডিজাইন মধ্যে পার্থক্য ব্যাখ্যা। রেটিভো এবং ভ্যান ডি রিজটের মত -বিষয় ডিজাইনের মধ্যে একটি চিকিত্সা গ্রুপ এবং একটি কন্ট্রোল গ্রুপ রয়েছে। অভ্যন্তরীণ বিষয়ের নকশাগুলিতে , অন্যদিকে, অংশগ্রহণকারীদের আচরণের পূর্বে এবং পরে চিকিৎসার (Greenwald 1976; Charness, Gneezy, and Kuhn 2012) । একটি অভ্যন্তরীণ বিষয় পরীক্ষায় এটি প্রতিটি অংশগ্রহণকারী তার নিজের নিয়ন্ত্রণ গোষ্ঠী হিসাবে কাজ করে। মধ্যে-বিষয় ডিজাইনের শক্তি হল যে তারা confounders বিরুদ্ধে সুরক্ষা প্রদান (যেমন আমি আগে বর্ণিত), যখন অভ্যন্তরীণ পরীক্ষার শক্তি অনুমান যথার্থ বৃদ্ধি করা হয়। অবশেষে, এমন একটি ধারণা তৈরি করা যা পরবর্তীতে আসবে যখন আমি ডিজিটাল পরীক্ষামূলক ডিজাইন সম্পর্কে পরামর্শ দিই, একটি ডিজাইন ডিজাইন করা হয়- অভ্যন্তরীণ ডিজাইনের উন্নততর নির্ভুলতা এবং উভয়-বিষয় ডিজাইনের সংঘাতের বিরুদ্ধে সুরক্ষা (চিত্র 4.5)।

চিত্র 4.5: তিনটি পরীক্ষামূলক ডিজাইন। স্ট্যান্ডার্ড র্যান্ডমাইজড নিয়ন্ত্রিত পরীক্ষাগুলো-বিষয় ডিজাইনগুলির মধ্যে ব্যবহার করে। একটি দ্বি-বিষয় ডিজাইনের একটি উদাহরণ হল Restivo এবং van de Rijt's (2012) barnstars এবং গবেষণায় অবদানসমূহ গবেষণায় গবেষকরা র্যান্ডমভাবে অংশগ্রহণকারীদের চিকিত্সা ও নিয়ন্ত্রণ গোষ্ঠীতে বিভক্ত করে, চিকিত্সা গ্রুপের একটি বার্নস্টারে অংশগ্রহন করে এবং তাদের জন্য ফলাফলের তুলনা করে। দুই গ্রুপ দ্বিতীয় ধরনের নকশা হল একটি অভ্যন্তরীণ ডিজাইন। স্কেলৎস এবং সহকর্মীদের দুটি গবেষণায় (2007) সামাজিক নিয়ম ও শক্তি ব্যবহারের উপর গবেষণা একটি অভ্যন্তরীণ বিষয় ডিজাইনকে ব্যাখ্যা করে: গবেষণাকারীরা চিকিত্সার পূর্বে এবং পরে অংশগ্রহণকারীদের ব্যবহারের বিদ্যুৎ ব্যবহারের তুলনা করে। অভ্যন্তরীণ ডিজাইনগুলি উন্নত সংখ্যাতিকাল স্পষ্টতা প্রদান করে, তবে তারা সম্ভাব্য confounders (যেমন, প্রাক-চিকিত্সা এবং চিকিত্সা সময়ের মধ্যে আবহাওয়ার পরিবর্তন) (Greenwald 1976; চ্যারনেস, গনিয়েজ এবং কুহান ২01২) খোলা থাকে। অভ্যন্তরীণ ডিজাইনের মাঝে মাঝে মাঝে পুনরাবৃত্তিমূলক ব্যবস্থাগুলি বলা হয়। অবশেষে, মিশ্র ডিজাইনগুলি অভ্যন্তরীণ ডিজাইনের উন্নততর নির্ভুলতা এবং উভয়-বিষয় ডিজাইনের বিভ্রান্তির বিরুদ্ধে সুর সুরক্ষিত করে। একটি মিশ্র নকশা, একটি গবেষক চিকিত্সার এবং নিয়ন্ত্রণ গ্রুপে মানুষের জন্য ফলাফল পরিবর্তন তুলনা করে। গবেষকরা ইতিমধ্যে প্রাক চিকিত্সা তথ্য আছে, যেমন অনেক ডিজিটাল পরীক্ষা ক্ষেত্রে, মিশ্র ডিজাইন সাধারণত- বিষয় ডিজাইন যাও সাধারণত অগ্রাধিকার কারণ তারা অনুমান উন্নত নির্ভুলতা ফলে

চিত্র 4.5: তিনটি পরীক্ষামূলক ডিজাইন। স্ট্যান্ডার্ড র্যান্ডমাইজড নিয়ন্ত্রিত পরীক্ষাগুলো -বিষয় ডিজাইনগুলির মধ্যে ব্যবহার করে। একটি দ্বি-বিষয় ডিজাইনের একটি উদাহরণ হল Restivo এবং van de Rijt's (2012) barnstars এবং গবেষণায় অবদানসমূহ গবেষণায় গবেষকরা র্যান্ডমভাবে অংশগ্রহণকারীদের চিকিত্সা ও নিয়ন্ত্রণ গোষ্ঠীতে বিভক্ত করে, চিকিত্সা গ্রুপের একটি বার্নস্টারে অংশগ্রহন করে এবং তাদের জন্য ফলাফলের তুলনা করে। দুই গ্রুপ দ্বিতীয় ধরনের নকশা হল একটি অভ্যন্তরীণ ডিজাইন। স্কেলৎস এবং সহকর্মীদের দুটি গবেষণায় (2007) সামাজিক নিয়ম ও শক্তি ব্যবহারের উপর গবেষণা একটি অভ্যন্তরীণ বিষয় ডিজাইনকে ব্যাখ্যা করে: গবেষণাকারীরা চিকিত্সার পূর্বে এবং পরে অংশগ্রহণকারীদের ব্যবহারের বিদ্যুৎ ব্যবহারের তুলনা করে। অভ্যন্তরীণ ডিজাইনগুলি উন্নত পরিসংখ্যানগত বিশুদ্ধতা প্রদান করে, তবে তারা সম্ভাব্য confounders (উদাহরণস্বরূপ, প্রাক চিকিত্সা এবং চিকিত্সা সময়ের মধ্যে আবহাওয়া পরিবর্তন) (Greenwald 1976; Charness, Gneezy, and Kuhn 2012) । অভ্যন্তরীণ ডিজাইনের মাঝে মাঝে মাঝে পুনরাবৃত্তিমূলক ব্যবস্থাগুলি বলা হয়। অবশেষে, মিশ্র ডিজাইনগুলি অভ্যন্তরীণ ডিজাইনের উন্নততর নির্ভুলতা এবং উভয়-বিষয় ডিজাইনের বিভ্রান্তির বিরুদ্ধে সুর সুরক্ষিত করে। একটি মিশ্র নকশা, একটি গবেষক চিকিত্সার এবং নিয়ন্ত্রণ গ্রুপে মানুষের জন্য ফলাফল পরিবর্তন তুলনা করে। গবেষকরা ইতিমধ্যে প্রাক চিকিত্সা তথ্য আছে, যেমন অনেক ডিজিটাল পরীক্ষা ক্ষেত্রে, মিশ্র ডিজাইন সাধারণত- বিষয় ডিজাইন যাও সাধারণত অগ্রাধিকার কারণ তারা অনুমান উন্নত নির্ভুলতা ফলে

সামগ্রিকভাবে, Schultz এবং সহকর্মীবৃন্দ (2007) দ্বারা গবেষণা এবং ফলাফল সহজ পরীক্ষা থেকে আরও এগিয়ে চলার মান প্রদর্শন। সৌভাগ্যবশত, আপনি এই মত পরীক্ষামূলক ডিজাইন একটি সৃজনশীল প্রতিভা হতে হবে না। সামাজিক বিজ্ঞানীরা তিনটি ধারণা তৈরি করেছেন যা আপনাকে আরও উন্নততর পরীক্ষার দিকে পরিচালিত করবে: (1) বৈধতা, (2) চিকিত্সা প্রভাবের বৈচিত্র্য এবং (3) প্রক্রিয়া যে, আপনি আপনার পরীক্ষা ডিজাইন করা হয় যখন আপনি এই তিনটি ধারণা মনে রাখা, আপনি স্বাভাবিকভাবেই একটি আরো আকর্ষণীয় এবং দরকারী পরীক্ষা তৈরি হবে কর্মের এই তিনটি ধারণা ব্যাখ্যা করার জন্য, আমি কয়েকটি ফলো-আপ আংশিকভাবে ডিজিটাল ফিল্ডের পরীক্ষাগুলি বর্ণনা করব যা মার্জিত নকশা এবং Schultz এবং সহকর্মীদের উত্তেজনাপূর্ণ ফলাফল (2007) । আপনি দেখতে পাবেন, আরও যত্নশীল নকশা, বাস্তবায়ন, বিশ্লেষণ এবং ব্যাখ্যা মাধ্যমে, আপনি খুব সহজ পরীক্ষা থেকে দূরে সরাতে পারেন।