क्रियाएँ

यह बात एक कंप्यूटर द्वारा बनाया गया था। ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

क्रियाएँ

कुंजी:

कठिनाई के डिग्री: आसान , मध्यम , कठिन , बहुत मुश्किल
गणित की आवश्यकता है ( $गणित की आवश्यकता है$ )
आवश्यकता है कोडिंग ( )
डेटा संग्रहण ( )
मेरे पसंदीदा ( )

[ , ] Berinsky और उनके सहयोगियों (2012) तीन क्लासिक प्रयोगों नकल के हिस्से में मैकेनिकल तुर्क मूल्यांकन करता है। द्वारा क्लासिक एशियाई रोग तैयार प्रयोग को दोहराने Tversky and Kahneman (1981) । अपने परिणामों मैच Tversky और Kahneman है? अपने परिणामों मैच Berinsky और उनके सहयोगियों है? क्या, अगर कुछ भी करता है यह हमारे सर्वेक्षण के प्रयोगों के लिए मैकेनिकल तुर्क उपयोग के बारे में सिखाना?
[ , ] शीर्षक से एक हद तक जीभ में गाल पत्र में "हम को तोड़ने के लिए है," सामाजिक मनोवैज्ञानिक रॉबर्ट Cialdini के लेखकों में से एक Schultz et al. (2007) , ने लिखा है कि वह चुनौतियों क्योंकि वह एक अनुशासन (मनोविज्ञान) कि मुख्य रूप से प्रयोगशाला प्रयोगों का आयोजन करता है में क्षेत्र प्रयोगों कर रही सामना करना पड़ा के एक प्रोफेसर के रूप में अपने काम से जल्दी सेवानिवृत्त हो गया था भाग में, (Cialdini 2009) । Cialdini के अखबार पढ़ें, और उसे उसे आग्रह डिजिटल प्रयोगों की संभावनाओं के प्रकाश में अपने ब्रेक अप पुनर्विचार करने के लिए एक ईमेल लिखें। अनुसंधान कि उनकी चिंताओं को दूर के विशिष्ट उदाहरण का प्रयोग करें।
[ ] क्रम निर्धारित करने के लिए छोटे प्रारंभिक सफलताओं ताला जाए या फीका दूर, वैन डे Rijt और और उनके सहयोगियों (2014) बेतरतीब ढंग से चयनित प्रतिभागियों पर सफलता कन्यादान चार अलग-अलग प्रणालियों में हस्तक्षेप किया है, और फिर मापा इस मनमाने ढंग से सफलता के दीर्घकालिक प्रभावों। आप अन्य प्रणालियों के बारे में सोच सकते हैं, जिसमें आप इसी तरह के प्रयोगों चला सकता है? वैज्ञानिक मूल्य के मुद्दों के संदर्भ में इन प्रणालियों का मूल्यांकन, एल्गोरिथम confounding, और नैतिकता (अध्याय 2 देखें)।
[ , ] एक प्रयोग के परिणामों के प्रतिभागियों पर निर्भर कर सकते हैं। एक प्रयोग बनाएं और फिर अमेज़न मैकेनिकल तुर्क (Mturk) दो अलग अलग भर्ती रणनीतियों का उपयोग कर इसे चलाते हैं। ताकि परिणाम के रूप में संभव के रूप में अलग अलग हो जाएगा प्रयोग और भर्ती रणनीतियों लेने की कोशिश करें। उदाहरण के लिए, अपनी भर्ती रणनीतियों सुबह और शाम में प्रतिभागियों को भर्ती करने के लिए या उच्च और कम वेतन के साथ प्रतिभागियों को क्षतिपूर्ति करने के लिए हो सकता है। भर्ती रणनीति में मतभेद के इन प्रकार के प्रतिभागियों और विभिन्न प्रयोगात्मक परिणामों के विभिन्न पूल के लिए ले जा सकता है। कैसे अलग अपने परिणामों को बाहर बारी? कि Mturk पर प्रयोग चल रहा है के बारे में क्या पता चलता है?
[ , $गणित की आवश्यकता है$ , , ] कल्पना कीजिए कि आप भावनात्मक छूत अध्ययन योजना बना रहे थे (Kramer, Guillory, and Hancock 2014) । द्वारा एक पहले पर्यवेक्षणीय अध्ययन से परिणाम का प्रयोग Kramer (2012) हर हालत में प्रतिभागियों की संख्या तय करने के लिए। इन दोनों के अध्ययन से मेल नहीं खाते पूरी तरह से इतने स्पष्ट रूप से सभी मान्यताओं कि तुम बनाने सूचीबद्ध करने के लिए सुनिश्चित हो:
1. एक सिमुलेशन तय करेगा कि कितने प्रतिभागियों में प्रभाव के रूप में बड़े रूप में एक प्रभाव का पता लगाने के लिए जरूरी हो गया होता भागो Kramer (2012) \ के साथ (\ अल्फा = 0.05 \) और \ (1 - \ बीटा = 0.8 \)।
2. एक ही गणना विश्लेषणात्मक करो।
3. से परिणाम को देखते हुए Kramer (2012) था भावनात्मक छूत (Kramer, Guillory, and Hancock 2014) के ऊपर संचालित (यानी, यह जरूरत से अधिक प्रतिभागियों के लिए किया है)?
4. अनुमान है कि आप बना दिया है, जो अपने गणना पर सबसे बड़ा प्रभाव है की?
[ , $गणित की आवश्यकता है$ , , ] उपरोक्त सवाल का जवाब है, बल्कि द्वारा पहले पर्यवेक्षणीय अध्ययन का उपयोग करने से Kramer (2012) से पहले के एक प्राकृतिक प्रयोग से परिणाम का उपयोग Coviello et al. (2014) ।
[ ] दोनों Rijt et al. (2014) और Margetts et al. (2011) दोनों प्रयोगों है कि एक याचिका पर हस्ताक्षर करने वाले लोगों की प्रक्रिया का अध्ययन करते हैं। तुलना करें और डिजाइन और इन अध्ययनों के निष्कर्षों विपरीत।
[ ] Dwyer, Maki, and Rothman (2015) सामाजिक मानदंडों और proenvironmental व्यवहार के बीच संबंधों पर दो क्षेत्र प्रयोगों का आयोजन किया। यहाँ उनके कागज का सार है:

"कैसे साइकोलॉजिकल साइंस proenvironmental व्यवहार को प्रोत्साहित करने के लिए उपयोग किया जा सकता है? दो अध्ययनों में, सार्वजनिक बाथरूम में ऊर्जा संरक्षण के व्यवहार को बढ़ावा देने के उद्देश्य से हस्तक्षेप वर्णनात्मक मानदंडों और व्यक्तिगत जिम्मेदारी के प्रभावों की जांच की। अध्ययन में 1, प्रकाश स्थिति (यानी, पर या बंद) इससे पहले कि कोई एक खाली सार्वजनिक बाथरूम में प्रवेश किया, कि स्थापना के लिए वर्णनात्मक आदर्श संकेत चालाकी से किया गया था। प्रतिभागियों को काफी अधिक लाइट बंद करने के लिए अगर वे दूर थे, जब वे में प्रवेश की संभावना थी। अध्ययन 2 में, एक अतिरिक्त शर्त शामिल किया गया था, जिसमें प्रकाश बंद करने का आदर्श एक संघि के द्वारा प्रदर्शन किया गया था, लेकिन प्रतिभागियों को खुद इस पर निर्णायक के लिए जिम्मेदार नहीं थे। व्यक्तिगत जिम्मेदारी व्यवहार पर सामाजिक मानदंडों के प्रभाव संचालित; जब प्रतिभागियों प्रकाश पर बदल के लिए जिम्मेदार नहीं थे, आदर्श का प्रभाव कम हो गया था। इन परिणामों से संकेत मिलता है कि कैसे वर्णनात्मक मानदंडों और व्यक्तिगत जिम्मेदारी proenvironmental हस्तक्षेप की प्रभावशीलता को विनियमित सकता है। "

उनके अखबार पढ़ें और अध्ययन 1 के एक प्रतिकृति डिजाइन।
[ , ] पिछले प्रश्न पर बिल्डिंग, अब अपने डिजाइन के लिए बाहर ले।
1. कैसे परिणामों की तुलना करते हो?
2. क्या इन मतभेदों को समझा सकता है?
[ ] वहाँ अमेज़न मैकेनिकल तुर्क से भर्ती प्रतिभागियों का उपयोग करते हुए प्रयोगों के बारे में काफी बहस हुई है। समानांतर में, वहाँ भी स्नातक छात्र आबादी से भर्ती प्रतिभागियों का उपयोग करते हुए प्रयोगों के बारे में काफी बहस हुई है। एक दो पेज ज्ञापन तुलना और Turkers और शोधकर्ताओं ने प्रतिभागियों के रूप में स्नातक से नीचे के विषम लिखें। अपनी तुलना दोनों वैज्ञानिक और सैन्य मुद्दों की चर्चा में शामिल होना चाहिए।
[ ] जिम Manzi की पुस्तक अनियंत्रित (2012) के कारोबार में प्रयोग की शक्ति के रूप में एक अद्भुत परिचय है। पुस्तक में उन्होंने इस कहानी relayed:

"मैं एक सच्चे व्यापार प्रतिभा, एक स्वयं बनाया अरबपति जो प्रयोगों की शक्ति का एक गहरी, सहज समझने के लिए किया था के साथ एक बैठक में एक बार गया था। उनकी कंपनी ने महत्वपूर्ण संसाधनों को खर्च बड़ी दुकान विंडो प्रदर्शित करता है कि उपभोक्ताओं और बढ़ बिक्री को आकर्षित करेगा, के रूप में पारंपरिक ज्ञान ने कहा कि वे चाहिए बनाने के लिए कोशिश कर रहा। विशेषज्ञों का ध्यान से डिजाइन के बाद डिजाइन परीक्षण किया है, और रखा साल की अवधि की बिक्री पर प्रत्येक नए प्रदर्शन डिजाइन का कोई महत्वपूर्ण कारण प्रभाव दिखा भर में अलग-अलग टेस्ट की समीक्षा सत्रों में। वरिष्ठ विपणन और बिक्री के अधिकारियों के सीईओ के साथ मुलाकात की टोटो में इन ऐतिहासिक परीक्षा परिणामों की समीक्षा करने के लिए। प्रयोगात्मक डेटा के सभी पेश करने के बाद यह निष्कर्ष निकाला है कि वे पारंपरिक ज्ञान गलत है कि विंडो प्रदर्शित की बिक्री ड्राइव नहीं है था। उनकी सिफारिश कार्रवाई इस क्षेत्र में लागत और प्रयास को कम करने के लिए किया गया था। यह नाटकीय रूप से पारंपरिक ज्ञान को उलटने के लिए प्रयोग की क्षमता का प्रदर्शन किया। सीईओ की प्रतिक्रिया आसान था: 'मेरा निष्कर्ष है कि अपने डिजाइनरों बहुत अच्छा नहीं कर रहे हैं।' उसके समाधान दुकान प्रदर्शन डिजाइन में प्रयास बढ़ाने के लिए, और नए लोगों को ऐसा करने के लिए मिल गया था। " (Manzi 2012, 158–9)

वैधता की किस प्रकार सीईओ की चिंता का विषय है?
[ ] पिछले प्रश्न पर बिल्डिंग, कल्पना है कि आप मीटिंग जहां प्रयोगों के परिणामों पर चर्चा की गई पर थे। चार सवाल है कि आप पूछ सकते हैं, वैधता के प्रत्येक प्रकार (सांख्यिकीय, निर्माण, आंतरिक और बाह्य) के लिए एक क्या हैं?
[ ] Bernedo, Ferraro, and Price (2014) पानी की बचत के हस्तक्षेप में वर्णित के सात साल के प्रभाव का अध्ययन करता है Ferraro, Miranda, and Price (2011) (चित्रा 4.10 देखें)। इस पत्र में, Bernedo और सहयोगियों ने भी घरों में है और स्थानांतरित नहीं किया है के बाद उपचार के लिए दिया गया था कि के व्यवहार की तुलना द्वारा प्रभाव के पीछे तंत्र को समझने की कोशिश करते हैं। यही है, मोटे तौर पर, वे देखने के लिए उपचार के घर या homeowner पर असर पड़ा है कि क्या प्रयास करें।
1. , कागज पढ़ें उनके डिजाइन का वर्णन है, और अपने निष्कर्षों को संक्षेप। ख) अपने निष्कर्षों को प्रभावित हैं कैसे आप इसी तरह के हस्तक्षेप की लागत प्रभावशीलता का आकलन करना चाहिए? यदि हां, तो क्यों? यदि नहीं, तो क्यों नहीं?
[ ] के लिए एक अनुवर्ती में Schultz et al. (2007) , शुल्ज़ और उनके सहयोगियों ने दो संदर्भों (एक होटल और एक timeshare सम्मिलित) में एक अलग पर्यावरण व्यवहार (तौलिया का पुन: उपयोग) पर वर्णनात्मक और निषेधाज्ञा मानदंडों के प्रभाव पर तीन प्रयोगों की एक श्रृंखला प्रदर्शन (Schultz, Khazian, and Zaleski 2008) ।
1. डिजाइन और इन तीन प्रयोगों के निष्कर्षों को संक्षेप।
2. कैसे, अगर सब पर, वे की अपनी व्याख्या बदल सकता Schultz et al. (2007) ?
[ ] के जवाब में Schultz et al. (2007) , Canfield, Bruin, and Wong-Parodi (2016) बिजली के बिल के डिजाइन का अध्ययन करने के लिए प्रयोगशाला की तरह प्रयोगों की एक श्रृंखला में भाग गया। यहाँ कैसे वे इसे अमूर्त में वर्णन है:

"एक सर्वेक्षण के आधार पर प्रयोग में, प्रत्येक भागीदार एक काल्पनिक बिजली बिल एक परिवार के लिए अपेक्षाकृत अधिक बिजली का उपयोग के साथ देखा था, (क) ऐतिहासिक उपयोग के बारे में जानकारी को कवर, (ख) पड़ोसियों से तुलना, और (ग) उपकरण टूटने के साथ ऐतिहासिक उपयोग करें। प्रतिभागियों (ग) आइकन रेखांकन (ख) बार रेखांकन, सहित (क) टेबल, और तीन में से एक प्रारूप में सभी जानकारी प्रकार देखा। हम तीन मुख्य निष्कर्षों पर रिपोर्ट। सबसे पहले, उपभोक्ताओं को बिजली के लिए उपयोग जानकारी के प्रत्येक प्रकार से समझा सबसे जब यह एक तालिका में प्रस्तुत किया गया था, शायद इसलिए कि टेबल साधारण बात पढ़ने की सुविधा। दूसरा, वरीयताओं को और बिजली बचाने के लिए इरादों ऐतिहासिक उपयोग के बारे में जानकारी के लिए सबसे मजबूत, स्वरूप से स्वतंत्र थे। तीसरा, कम ऊर्जा की साक्षरता के साथ व्यक्तियों सभी जानकारी कम समझ में आया। "

अन्य अनुवर्ती अध्ययन के विपरीत, में ब्याज की मुख्य परिणाम Canfield, Bruin, and Wong-Parodi (2016) व्यवहार की सूचना दी वास्तविक व्यवहार नहीं है। ताकत और एक व्यापक अनुसंधान ऊर्जा बचत को बढ़ावा देने के कार्यक्रम में अध्ययन के इस प्रकार की कमजोरियों क्या हैं?
[ , ] Smith and Pell (2003) पैराशूट की प्रभावशीलता का प्रदर्शन अध्ययन की एक व्यंग्य मेटा-विश्लेषण है। वे निष्कर्ष:

"कई हस्तक्षेप खराब सेहत को रोकने का इरादा साथ के रूप में, पैराशूट की प्रभावशीलता नहीं कठोर मूल्यांकन करने के लिए यादृच्छिक नियंत्रित परीक्षण का उपयोग करके अधीन किया गया है। साक्ष्य आधारित चिकित्सा के पैरोकार केवल अवलोकन डेटा का उपयोग करके मूल्यांकन हस्तक्षेप की गोद लेने की आलोचना की है। हमें लगता है कि हर कोई करता है, तो साक्ष्य आधारित चिकित्सा के सबसे कट्टरपंथी मुख्य पात्र का आयोजन किया और एक डबल अंधा में भाग लिया लाभ हो सकता है, यादृच्छिक, प्लेसबो नियंत्रित पैराशूट के अंतरराष्ट्रीय परीक्षण। "

न्यूयॉर्क टाइम्स के रूप में एक सामान्य पाठकों समाचार पत्र, के लिए उपयुक्त एक सेशन एड लिखें, प्रयोगात्मक सबूत के fetishization के खिलाफ बहस। विशिष्ट, ठोस उदाहरण देते हैं। सुझाव: यह भी देखें, Bothwell et al. (2016) और Deaton (2010)
[ , , ] अंतर-में-मतभेद एक उपचार प्रभाव estimators अंतर-में-मतलब आकलनकर्ता की तुलना में अधिक सटीक हो सकते हैं। एक शुरू हुआ सोशल मीडिया एक ऑनलाइन प्रयोग चलाने के लिए अंतर-में-मतभेद दृष्टिकोण के मूल्य समझा कंपनी में ए / बी परीक्षण के आरोप में एक इंजीनियर को एक ज्ञापन लिखें। ज्ञापन समस्या का एक बयान है, जिन स्थितियों अंतर-में-अंतर आकलनकर्ता अंतर-में-मतलब आकलनकर्ता मात जाएगा के बारे में कुछ अंतर्ज्ञान, और एक सरल अनुकरण अध्ययन को शामिल करना चाहिए।
[ , ] गैरी Loveman Harrah है के सीईओ, दुनिया में सबसे बड़ा कैसीनो कंपनियों में से एक बनने से पहले हार्वर्ड बिजनेस स्कूल में प्रोफेसर थे। जब वह Harrah है करने के लिए ले जाया गया, Loveman एक लगातार उड़ाका की तरह वफादारी कार्यक्रम है कि ग्राहकों के व्यवहार के बारे में डेटा की भारी मात्रा में एकत्र के साथ कंपनी में बदल दिया। इस हमेशा पर माप प्रणाली के शीर्ष पर, कंपनी प्रयोगों चलने लगे। उदाहरण के लिए, वे एक प्रयोग एक विशिष्ट जुआ पैटर्न के साथ ग्राहकों के लिए एक नि: शुल्क होटल रात के लिए एक कूपन के प्रभाव का मूल्यांकन करने के लिए चला सकता है। यहाँ कैसे Loveman Harrah है हर रोज व्यापार प्रथाओं के लिए प्रयोग के महत्व का वर्णन किया है:

"ऐसा लगता है कि आप महिलाओं को परेशान नहीं है, तुम चोरी नहीं करते है, और आप एक नियंत्रण समूह है मिल गया है। यह चीजें हैं जो आप पर Harrah's नहीं एक नियंत्रण समूह को चलाने के लिए अपनी नौकरी खो सकते हैं में से एक है। " (Manzi 2012, 146)

एक नए कर्मचारी समझा क्यों Loveman सोचता है कि यह एक नियंत्रण समूह है के लिए बहुत महत्वपूर्ण है के लिए एक ईमेल लिखें। आप एक उदाहरण-या तो असली है या अप करने की अपनी बात उदाहरण देकर स्पष्ट कर दिया शामिल करने के लिए प्रयास करना चाहिए।
[ , $गणित की आवश्यकता है$ ] एक नया प्रयोग टीकाकरण तेज पर पाठ संदेश अनुस्मारक प्राप्त करने के प्रभाव का आकलन करना है। 150 क्लीनिक, 600 पात्र रोगियों के साथ एक, भाग लेने के लिए तैयार हैं। प्रत्येक क्लिनिक आप के साथ काम करना चाहते हैं के लिए 100 डॉलर की एक निश्चित लागत है, और यह कि आप भेजना चाहते प्रत्येक पाठ संदेश के लिए 1 डॉलर खर्च होती है। इसके अलावा, किसी भी क्लीनिक है कि आप के साथ काम कर रहे हैं परिणाम उपाय करेंगे मुक्त करने के लिए (किसी एक टीकाकरण प्राप्त है)। मान लें कि आप 1000 डॉलर का बजट है।
1. किन स्थितियों में यह बेहतर हो सकता है क्लीनिकों की एक छोटी संख्या पर और क्या शर्तों के तहत अपने संसाधनों को ध्यान केंद्रित करने के लिए यह बेहतर हो सकता है उन्हें और अधिक व्यापक रूप से फैला करने के लिए?
2. क्या कारकों छोटी से छोटी प्रभाव आकार है कि आप मज़बूती से अपने बजट के साथ पता लगाने के लिए सक्षम हो जाएगा का निर्धारण होता है?
3. एक ज्ञापन एक संभावित आर्थिक सहायता देने वाले इन व्यापार-नापसंद समझा लिखें।
[ , $गणित की आवश्यकता है$ ] ऑनलाइन पाठ्यक्रम के साथ एक बड़ी समस्या उदासीनता है; कई छात्रों को पाठ्यक्रम शुरू छोड़ने बाहर खत्म होता है। कल्पना कीजिए कि आप एक ऑनलाइन शिक्षा मंच पर काम कर रहे हैं, और मंच पर एक डिजाइनर के एक दृश्य प्रगति बार है कि वह सोचता है कि पाठ्यक्रम से बाहर छोड़ने से छात्रों को रोकने में मदद मिलेगी बनाया गया है। आप एक बड़े कम्प्यूटेशनल सामाजिक विज्ञान पाठ्यक्रम में छात्रों पर प्रगति बार के प्रभाव का परीक्षण करना चाहते हैं। किसी भी नैतिक मुद्दों है कि प्रयोग में पैदा हो सकता है को संबोधित करने के बाद, आप और आपके सहयोगियों चिंतित हैं कि बेशक मज़बूती से प्रगति बार के प्रभाव का पता लगाने के लिए पर्याप्त छात्रों नहीं हो सकता है मिलता है। आप नीचे गणना में छात्रों की है कि आधे मान सकते प्रगति बार और आधा नहीं प्राप्त होगा। इसके अलावा, आप कल्पना कर सकते हैं कोई हस्तक्षेप नहीं है। दूसरे शब्दों में, आप मान सकते हैं कि प्रतिभागियों को केवल कि क्या वे इलाज या नियंत्रण प्राप्त से प्रभावित कर रहे हैं; वे अन्य लोगों को इलाज या नियंत्रण (एक और अधिक औपचारिक परिभाषा के लिए, यह देखने के लिए कि क्या प्राप्त द्वारा नहीं प्रभावित कर रहे हैं Gerber and Green (2012) , चौधरी। 8)। कृपया किसी अतिरिक्त अनुमान है कि तुम बनाने का ट्रैक रखने के लिए।
1. मान लीजिए प्रगति बार छात्रों को, जो 1 प्रतिशत अंक से कक्षा खत्म के अनुपात में वृद्धि की उम्मीद है, नमूना आकार मज़बूती प्रभाव का पता लगाने के लिए की जरूरत क्या है?
2. मान लीजिए प्रगति बार, जो छात्रों के 10 प्रतिशत अंकों से कक्षा खत्म के अनुपात में वृद्धि की उम्मीद है, नमूना आकार मज़बूती प्रभाव का पता लगाने के लिए की जरूरत क्या है?
3. अब कल्पना करो कि आप प्रयोग और छात्रों को, जो पूरा कर लिया है सभी पाठ्यक्रम सामग्री एक अंतिम परीक्षा ले लिया है चलाने के लिए है। आप जो उन है कि, आप नहीं मिल रहा था, अपने आश्चर्य करने के लिए बहुत प्रगति बार प्राप्त है, छात्रों को, जो प्रगति बार प्राप्त नहीं किया था वास्तव में अधिक रन बनाए है कि छात्रों की अंतिम परीक्षा के स्कोर की तुलना करें। इसका मतलब यह है कि प्रगति बार कम जानने के लिए छात्रों का कारण? आप इस परिणाम के आंकड़ों से क्या सीख सकते हैं? (सुझाव: देखें Gerber and Green (2012) , चौधरी 7।)
[ , ] एक सुंदर पत्र में, Lewis and Rao (2015) ताजा यहां तक कि बड़े पैमाने पर प्रयोगों की एक मौलिक सांख्यिकीय सीमा को दर्शाते हैं। कागज जो मूल रूप से उत्तेजक शीर्षक "विज्ञापन के लिए रिटर्न मापने के पास पर असंभव था" दिखाता है कितना मुश्किल यह भी डिजिटल प्रयोगों ग्राहकों के लाखों लोगों को शामिल के साथ, ऑनलाइन विज्ञापन के निवेश पर वापसी को मापने के लिए है। आम तौर पर, कागज स्पष्ट रूप से पता चलता है कि यह शोर परिणाम डेटा के बीच छोटे उपचार प्रभाव का आकलन करना मुश्किल है। या diffently कहा, कागज से पता चलता है कि अनुमानित उपचार प्रभाव बड़े विश्वास अंतराल होगा जब प्रभाव के लिए मानक विचलन (\ (\ frac {\ डेल्टा \ बार {y}} {\ सिग्मा} \)) अनुपात छोटा है। इस पत्र से महत्वपूर्ण सामान्य सबक यह है कि छोटा सा प्रभाव के लिए मानक विचलन के अनुपात के साथ प्रयोगों से परिणाम (जैसे, विज्ञापन अभियानों के आरओआई) नाकाफी होगा। आपकी चुनौती है अपनी कंपनी के विपणन विभाग में किसी एक योजना बनाई प्रयोग evaluting एक विज्ञापन अभियान की लागत पर लाभ को मापने के लिए करने के लिए एक ज्ञापन लिखने के लिए होगा। अपने ज्ञापन कंप्यूटर सिमुलेशन के परिणामों के रेखांकन के साथ समर्थन किया जाना चाहिए।

यहाँ कुछ पृष्ठभूमि जानकारी है कि आप की जरूरत हो सकती है। इन संख्यात्मक मूल्यों के सभी वास्तविक प्रयोगों में सूचना के प्रतीक हैं Lewis and Rao (2015) :
- रॉय, ऑनलाइन विज्ञापन अभियानों के लिए एक महत्वपूर्ण मीट्रिक अभियान (अभियान का अभियान शून्य लागत से सकल लाभ) अभियान की लागत से विभाजित से शुद्ध लाभ होने की परिभाषित किया गया है। उदाहरण के लिए एक अभियान है कि बिक्री पर कोई प्रभाव नहीं -100% की एक रॉय और एक अभियान जहां उत्पन्न लाभ लागत के बराबर 0 के एक रॉय के लिए होता गया होता था।
- प्रति ग्राहक मतलब बिक्री $ 75 की एक मानक विचलन के साथ $ 7 है।
- अभियान ग्राहक प्रति $ 0.35 जो ग्राहक प्रति $ 0.175 के लाभ में वृद्धि से मेल खाती से बिक्री में वृद्धि की उम्मीद है। दूसरे शब्दों में, सकल मार्जिन 50% है।
- प्रयोग की योजना बनाई आकार 200,000 लोग, इलाज के समूह में आधा और नियंत्रण समूह में आधा है।
- अभियान की लागत भागीदार प्रति $ 0.14 है।
एक ज्ञापन इस प्रयोग evaluting लिखें। आप योजना के अनुसार इस प्रयोग को शुरू करने की सिफारिश करेंगे? यदि हां, तो क्यों? यदि नहीं, तो क्या परिवर्तन आप की सिफारिश करेंगे?

एक अच्छा ज्ञापन इस विशिष्ट मामले को संबोधित करेंगे; एक बेहतर ज्ञापन एक तरह से इस मामले से सामान्यीकरण होगा (जैसे, दिखाने के लिए कैसे प्रभाव के लिए मानक विचलन अनुपात के एक समारोह के रूप में निर्णय परिवर्तन); और एक महान ज्ञापन एक पूरी तरह से सामान्यीकृत परिणाम पेश करेंगे।
[ , $गणित की आवश्यकता है$ ] पिछले प्रश्न के रूप में ही है, बल्कि अनुकरण से आप विश्लेषणात्मक परिणामों का उपयोग करना चाहिए।
[ , $गणित की आवश्यकता है$ , ] पिछले प्रश्न के रूप में एक ही है, लेकिन दोनों सिमुलेशन और विश्लेषणात्मक परिणामों का उपयोग करें।
[ , $गणित की आवश्यकता है$ , ] कल्पना कीजिए कि आप ज्ञापन ऊपर का प्रयोग होता है आकलनकर्ता में एक अंतर के बजाय एक अंतर-में-मतभेद आकलनकर्ता इस्तेमाल की सिफारिश की या तो सिमुलेशन, विश्लेषणात्मक परिणाम, या विपणन विभाग की ओर से दोनों-और किसी को वर्णित लिखा है (धारा 4.6.2 देखें) । समझा कैसे प्रयोग के बाद प्रयोग से पहले बिक्री और बिक्री के बीच एक 0.4 सह-संबंध अपने निष्कर्ष बदल जाएगा एक नया छोटा ज्ञापन लिखें।
[ , $गणित की आवश्यकता है$ ] के क्रम में एक नया वेब आधारित कैरियर सेवा के प्रभाव का मूल्यांकन करने के लिए, एक विश्वविद्यालय के कैरियर सेवाओं के कार्यालय स्कूल के अंतिम वर्ष में प्रवेश 10,000 छात्रों के बीच एक यादृच्छिक नियंत्रण परीक्षण का आयोजन किया। अद्वितीय लॉग-इन जानकारी के साथ एक मुक्त सदस्यता, बेतरतीब ढंग से चयनित छात्रों के 5000 के लिए एक विशेष निमंत्रण ईमेल के माध्यम से भेजा गया था, जबकि अन्य 5,000 छात्रों नियंत्रण समूह में हैं और एक सदस्यता नहीं है। बारह महीने के बाद, एक अनुवर्ती सर्वेक्षण (कोई गैर प्रतिक्रिया के साथ) से पता चलता है कि दोनों को उपचार और नियंत्रण समूहों में, छात्रों के 70% के अपने चुने हुए क्षेत्र (तालिका 4.5) में पूर्णकालिक रोजगार सुरक्षित है। इस प्रकार, यह लगता है कि वेब आधारित सेवा कोई प्रभाव नहीं पड़ा।

हालांकि, विश्वविद्यालय में एक चतुर डेटा वैज्ञानिक डेटा पर थोड़ा और अधिक बारीकी से देखा और पाया कि इलाज के समूह में छात्रों का केवल 20% कभी ईमेल प्राप्त करने के बाद खाते में प्रवेश। इसके अलावा, और कुछ हद तक आश्चर्य की बात है, जो उन लोगों के वेबसाइट में लॉग इन किया है के बीच केवल 60% पूर्णकालिक रोजगार को अपने चुने हुए क्षेत्र है, जो कि लोगों को प्रवेश नहीं किया था के लिए दर से कम है और लोगों के लिए दर से कम था में सुरक्षित था नियंत्रण हालत (तालिका 4.6)।
1. क्या हो सकता है के लिए एक विवरण प्रदान करें।
2. इस प्रयोग में उपचार के प्रभाव की गणना करने के दो अलग अलग तरीके क्या हैं?
3. इस परिणाम को देखते हुए विश्वविद्यालय के कैरियर सेवा इस वेब आधारित सभी छात्रों के लिए कैरियर सेवा प्रदान करना चाहिए? अभी स्पष्ट होना करने के लिए, यह एक आसान जवाब के साथ सवाल नहीं है।
4. वे आगे क्या करना चाहिए?
सुझाव: यह सवाल इस अध्याय में शामिल सामग्री से परे चला जाता है, लेकिन प्रयोगों में आम मुद्दों के पते। प्रयोगात्मक डिजाइन इस प्रकार कभी कभी एक प्रोत्साहन डिजाइन कहा जाता है क्योंकि प्रतिभागियों इलाज में संलग्न करने के लिए प्रोत्साहित किया जाता है। यह समस्या क्या एक तरफा गैर अनुपालन कहा जाता है की एक उदाहरण है (देखें Gerber and Green (2012) , चौधरी। 5)
[ ] आगे की परीक्षा के बाद, यह पता चला है कि प्रयोग पिछले प्रश्न में वर्णित और भी अधिक जटिल था। यह पता चला है कि नियंत्रण समूह में लोगों के 10% सेवा के लिए उपयोग के लिए भुगतान किया है, और वे 65% (तालिका 4.7) के एक रोजगार दर के साथ समाप्त हो गया।
1. एक ईमेल लिखें सारांश आपको क्या लगता है कि क्या हो रहा है और कार्रवाई का एक कोर्स सलाह देते हैं।
सुझाव: यह सवाल इस अध्याय में शामिल सामग्री से परे चला जाता है, लेकिन प्रयोगों में आम मुद्दों के पते। यह समस्या क्या दो-तरफा गैर अनुपालन कहा जाता है की एक उदाहरण है (देखें Gerber and Green (2012) , चौधरी। 6)

टेबल 4.5: कैरियर सेवा प्रयोग से डेटा का सरल देखें।
समूह	आकार	रोज़गार दर
वेबसाइट को दी पहुँच	5000	70%
वेबसाइट का उपयोग नहीं दी	5000	70%

टेबल 4.6: कैरियर सेवा प्रयोग से डेटा के लिए अंतिम दृश्य।
समूह	आकार	रोज़गार दर
वेबसाइट का उपयोग करने दी गई है और में लॉग इन किया	1,000	60%
वेबसाइट का उपयोग करने दी गई है और में लॉग इन किया है कभी नहीं	4000	85%
वेबसाइट का उपयोग नहीं दी	5000	70%

टेबल 4.7: कैरियर सेवा प्रयोग से डेटा का पूरा ध्यान।
समूह	आकार	रोज़गार दर
वेबसाइट का उपयोग करने दी गई है और में लॉग इन किया	1,000	60%
वेबसाइट का उपयोग करने दी गई है और में लॉग इन किया है कभी नहीं	4000	72.5%
वेबसाइट का उपयोग करने के लिए दी और इसके लिए भुगतान नहीं	500	65%
वेबसाइट का उपयोग करने से नहीं दी गई है और इसके लिए भुगतान नहीं किया	4500	70.56%