4.4 تجاوز تجارب بسيطة

دعونا نتجاوز تجارب بسيطة. ثلاثة مفاهيم هي مفيدة لتجارب غنية: الصلاحية، عدم تجانس آثار العلاج، والآلية.

الباحثون الذين جديدة لتجارب غالبا ما تركز على مسألة محددة للغاية، ضيق: هل هذا العلاج "العمل"؟ على سبيل المثال، لا مكالمة هاتفية من أحد المتطوعين تشجيع شخص للتصويت؟ لا تغيير زر الموقع من الأزرق إلى الأخضر نسبة النقر إلى الظهور الزيادة؟ للأسف، صياغة فضفاضة حول ما "يعمل" يحجب حقيقة أن التجارب التركيز الضيق لا أقول لكم حقا ما إذا كان العلاج "تعمل" في الشعور العام. بدلا من ذلك، ركز بشكل ضيق التجارب تجيب على سؤال أكثر تحديدا بكثير: ما هو تأثير متوسط ​​هذا علاج محدد لهذا التنفيذ المحدد لهذه الفئة من السكان المشاركين في هذا الوقت؟ سأتصل التجارب التي تركز على هذا السؤال الضيق تجارب بسيطة.

يمكن أن تجارب بسيطة توفر معلومات قيمة، ولكن فشلوا في الإجابة على العديد من الأسئلة التي هي على حد سواء مهمة ومثيرة للاهتمام مثل: هل هناك بعض الناس الذين كان العلاج له أثر أكبر أو أصغر ؟؛ هناك علاج آخر من شأنه أن يكون أكثر فعالية ؟؛ وكيف ترتبط هذه التجربة إلى نظريات اجتماعية أوسع؟

من أجل إظهار قيمة تجاوز تجارب بسيطة، دعونا النظر في واحدة من المفضلة التجارب الميدانية التناظرية، ودراسة من قبل P. يسلي شولتز وزملاؤها في العلاقة بين القواعد الاجتماعية واستهلاك الطاقة (Schultz et al. 2007) . علقت شولتز وزملاؤها doorhangers على 300 أسرة في سان ماركوس، كاليفورنيا، وهذه doorhangers تسليم رسائل مختلفة تهدف إلى تشجيع الحفاظ على الطاقة. ثم، قياس شولتز وزملاؤه تأثير هذه الرسائل على استهلاك الكهرباء، على حد سواء بعد أسبوع واحد وثلاثة أسابيع. انظر الشكل 4.3 للحصول على وصف أكثر تفصيلا من التصميم التجريبي.

الشكل 4.3: رسم تخطيطي للتصميم من شولتز وآخرون. (2007). التجربة الميدانية يشمل زيارة حوالي 300 أسرة في سان ماركوس، كاليفورنيا خمس مرات على مدى فترة ثمانية أسابيع. على زيارة كل من الباحثين استغرق قراءة من السلطة متر المنزل يدويا. على اثنين من مرة وضع الباحثون doorhangers على المنزل وتوفير بعض المعلومات حول استخدام الطاقة لديها. كان سؤال البحث كيف أن محتوى هذه الرسائل سيؤثر استخدام الطاقة.

الشكل 4.3: رسم تخطيطي للتصميم من Schultz et al. (2007) . التجربة الميدانية يشمل زيارة حوالي 300 أسرة في سان ماركوس، كاليفورنيا خمس مرات على مدى فترة ثمانية أسابيع. على زيارة كل من الباحثين استغرق قراءة من السلطة متر المنزل يدويا. على اثنين من مرة وضع الباحثون doorhangers على المنزل وتوفير بعض المعلومات حول استخدام الطاقة لديها. كان سؤال البحث كيف أن محتوى هذه الرسائل سيؤثر استخدام الطاقة.

كانت تجربة شرطين. في الشرط الأول، تلقت أسرة نصائح توفير الطاقة العامة (على سبيل المثال، والمراوح استخدام بدلا من مكيفات الهواء) ومعلومات حول استخدام الطاقة المنزلية الخاصة بهم بالمقارنة مع متوسط ​​استهلاك الطاقة في حيهم. دعا شولتز وزملاؤها هذا الشرط المعيارية وصفية لأن المعلومات حول استخدام الطاقة في حيهم قدمت معلومات حول سلوك نموذجي (أي قاعدة صفية). عندما بدا شولتز وزملاؤها في ينجم عن ذلك من استهلاك الطاقة في هذه المجموعة، بدا أن العلاج لم يكن له أثر، سواء على المدى القصير أو على المدى الطويل. وبعبارة أخرى، فإن العلاج لا يبدو أن "العمل" (الشكل 4.4).

ولكن، لحسن الحظ، Schultz et al. (2007) لم يقبل هذا التحليل التبسيطي. قبل بدء التجربة ففكروا أن المستخدمين الثقيلة من الكهرباء الناس فوق المتوسط، قد تقلل من استهلاكها، ويمكن للمستخدمين ضوء الكهرباء الناس أقل من المتوسط، قد تزيد في الواقع استهلاكها. عندما نظرت إلى البيانات، وهذا بالضبط ما وجدوه (الشكل 4.4). وبالتالي، ما يشبه العلاج التي كان لها تأثير في الواقع لم يكن العلاج الذي كان اثنين من الآثار تعويض. ودعا الباحثون هذه الزيادة تأتي بنتائج عكسية بين المستخدمين الضوء على الأثر المرتد.

الشكل 4.4: نتائج من شولتز وآخرون. (2007). تظهر لوحة الأولى أن العلاج القاعدة وصفية لديها المقدرة متوسط ​​تأثير العلاج الصفر. ومع ذلك، تظهر لوحة ثانية أن هذا متوسط ​​تأثير العلاج هو فعلا مكون من اثنين من الآثار تعويض. للمستخدمين الثقيلة، انخفضت العلاج الاستخدام ولكن لمستخدمي خفيفة، زادت العلاج الاستخدام. وأخيرا، تظهر لوحة ثالثة المعالجة الثانية، التي تستخدم معايير وصفية وقضائية، كان تقريبا نفس التأثير على المستخدمين الثقيل ولكن التخفيف من تأثير يرتد على المستخدمين خفيفة.

الشكل 4.4: نتائج من Schultz et al. (2007) . تظهر لوحة الأولى أن العلاج القاعدة وصفية لديها المقدرة متوسط ​​تأثير العلاج الصفر. ومع ذلك، تظهر لوحة ثانية أن هذا متوسط ​​تأثير العلاج هو فعلا مكون من اثنين من الآثار تعويض. للمستخدمين الثقيلة، انخفضت العلاج الاستخدام ولكن لمستخدمي خفيفة، زادت العلاج الاستخدام. وأخيرا، تظهر لوحة ثالثة المعالجة الثانية، التي تستخدم معايير وصفية وقضائية، كان تقريبا نفس التأثير على المستخدمين الثقيل ولكن التخفيف من تأثير يرتد على المستخدمين خفيفة.

وعلاوة على ذلك، من المتوقع شولتز وزملاؤها هذا الاحتمال، وفي حالة الثانية التي نشرت معاملة مختلفة قليلا، واحد مصمم بشكل واضح للقضاء على الأثر المرتد. تلقت أسرة في الشرط الثاني بالضبط نفس نصائح توفير الطاقة المعالجة العامة والمعلومات حول استخدام الطاقة المنزلية الخاصة بهم مقارنة مع من حي مع إضافة صغيرة واحدة: للأشخاص الذين يعانون أقل من متوسط ​​الاستهلاك، قام الباحثون بإضافة :) ول الأشخاص الذين يعانون من فوق متوسط ​​استهلاك أضافوا :(. وقد صممت هذه المشاعر لتحريك ما وصفه الباحثون معايير قضائية. المعايير الإنصافي تشير إلى تصورات ما وافق عادة (وغير المقبولة)، في حين تشير المعايير الوصفية لتصورات ما يتم عادة (Reno, Cialdini, and Kallgren 1993) .

بإضافة هذه التعبيرات واحد صغير، والباحثين خفضت بشكل كبير من تأثير يرتد (الشكل 4.4). وهكذا، من خلال جعل هذا بسيط تغير تغييرا تلك التي كانت تنطلق من نظرية مجردة الاجتماعية والنفسية (Cialdini, Kallgren, and Reno 1991) كان -The الباحثون قادرين على تحويل البرنامج من واحد أن لا يبدو أن العمل في واحدة أن عملت، وفي وقت واحد، أنهم كانوا قادرين على المساهمة في الفهم العام لكيفية الأعراف الاجتماعية تؤثر على السلوك البشري.

في هذه المرحلة، ومع ذلك، قد لاحظت أن هناك شيئا مختلفا بعض الشيء عن هذه التجربة. على وجه الخصوص، تجربة شولتز وزملاؤها لا يملك في الواقع مجموعة المراقبة في بنفس الطريقة التي العشوائية تسيطر التجارب القيام به. المقارنة بين هذا التصميم وتصميم Restivo وفان دي Rijt يوضح الاختلافات بين تصميمين الرئيسية المستخدمة من قبل الباحثين. بين-موضوعات التصاميم، مثل Restivo وفان دي Rijt، هناك مجموعة العلاج والمجموعة الضابطة، وفي داخل المواضيع التصاميم سلوك المشاركين مقارنة قبل وبعد العلاج (Greenwald 1976; Charness, Gneezy, and Kuhn 2012) . في تجربة داخل تخضع هو كما لو يعمل كل مشارك كما لها مجموعة المراقبة الخاصة. قوة بين-تخضع التصاميم هو أنه يوفر الحماية ضد الإرباك (كما وصفت في وقت سابق)، وقوة من التجارب داخل موضوعات يتم زيادة الدقة في التقديرات. عندما يعمل كل مشارك كما سيطرتهم، والقضاء على التفاوت بين-مشارك (انظر الملحق الفني). لينذر من شأنها أن تأتي لاحقا عندما أقدم المشورة حول تصميم التجارب الرقمية، هناك التصميم النهائي، ودعا الى تصميم مختلط، يجمع بين الدقة المحسنة للتصاميم داخل الموضوعات وحماية ضد الخلط بين التصاميم بين-الموضوعات.

الشكل 4.5: ثلاثة تصاميم تجريبية. العشوائية مستوى التجارب تسيطر تستخدم بين-تخضع التصاميم. مثال على تصميم بين-المواد غير Restivo و(2012) التجربة فان دي Rijt على أوسمة والمساهمة في ويكيبيديا: الباحثون قسمت عشوائيا المشاركين إلى مجموعات علاجها ومكافحتها، وقدم المشاركين في مجموعة العلاج وbarnstar، ومقارنة النتائج لاثنين المجموعات. وهناك نوع ثان من التصميم هو التصميم داخل الموضوعات. التجربتين في شولتز وزميله (2007) دراسة عن المعايير الاجتماعية واستخدام الطاقة توضح تصميم داخل المواد: قارن الباحثون في استخدام الكهرباء من المشاركين قبل وبعد تلقي العلاج. في غضون موضوعات تقدم تصاميم تحسين الدقة الإحصائية من خلال القضاء بين تباين الموضوع (انظر الملحق الفني)، ولكنها مفتوحة إلى الإرباك المحتملة (مثل التغيرات في الطقس بين فترة ما قبل العلاج والعلاج) (غرينوالد 1976؛ Charness، Gneezy، و كون 2012). في غضون مواضيع التصاميم هي أيضا تدابير تسمى أحيانا المتكررة التصاميم. وأخيرا، تصاميم مختلطة تجمع بين الدقة المحسنة من داخل تخضع التصاميم والحماية من الخلط بين التصاميم بين-الموضوعات. في تصميم مختلط، وهو باحث يقارن التغيير في النتائج للناس في العلاج والسيطرة المجموعات. عندما يكون الباحثون بالفعل معلومات ما قبل المعالجة، كما هو الحال في العديد من التجارب الرقمية، والتصميمات المختلطة هي المفضلة لتصاميم بين-موضوعات بسبب المكاسب التي تحققت في الدقة (انظر الملحق الفني).

الشكل 4.5: ثلاثة تصاميم تجريبية. العشوائية مستوى التجارب تسيطر تستخدم بين-تخضع التصاميم. مثال على تصميم بين-المواد غير Restivo وفان دي Rijt في (2012) تجربة على أوسمة والمساهمة في ويكيبيديا: الباحثون قسمت عشوائيا المشاركين إلى مجموعات علاجها ومكافحتها، وقدم المشاركين في مجموعة العلاج وbarnstar، ومقارنة النتائج لاثنين المجموعات. وهناك نوع ثان من التصميم هو التصميم داخل الموضوعات. التجربتين في شولتز وزميل (2007) دراسة عن المعايير الاجتماعية واستخدام الطاقة توضح تصميم داخل المواد: قارن الباحثون في استخدام الكهرباء من المشاركين قبل وبعد تلقي العلاج. في غضون موضوعات تقدم تصاميم تحسين الدقة الإحصائية من خلال القضاء بين تباين الموضوع (انظر الملحق الفني)، ولكنها مفتوحة إلى الإرباك المحتملة (مثل التغيرات في الطقس بين فترة ما قبل العلاج والعلاج) (Greenwald 1976; Charness, Gneezy, and Kuhn 2012) . في غضون مواضيع التصاميم هي أيضا تدابير تسمى أحيانا المتكررة التصاميم. وأخيرا، تصاميم مختلطة تجمع بين الدقة المحسنة من داخل تخضع التصاميم والحماية من الخلط بين التصاميم بين-الموضوعات. في تصميم مختلط، وهو باحث يقارن التغيير في النتائج للناس في العلاج والسيطرة المجموعات. عندما يكون الباحثون بالفعل معلومات ما قبل المعالجة، كما هو الحال في العديد من التجارب الرقمية، والتصميمات المختلطة هي المفضلة لتصاميم بين-موضوعات بسبب المكاسب التي تحققت في الدقة (انظر الملحق الفني).

وعموما، فإن تصميم ونتائج Schultz et al. (2007) إظهار قيمة تجاوز تجارب بسيطة. لحسن الحظ، لا تحتاج لأن تكون عبقريا لخلق تجارب من هذا القبيل. وقد طور العلماء الاجتماعيين ثلاثة مفاهيم التي ستوجه لكم التعامل مع التجارب الإبداعية أكثر ثراء وأكثر من ذلك: 1) صحة، 2) عدم تجانس آثار العلاج، و 3) آليات. وهذا هو، اذا واصلتم هذه الأفكار الثلاثة في الاعتبار حين كنت تقوم بتصميم تجربتك، سوف تقوم بإنشاء طبيعي التجارب أكثر إثارة للاهتمام ومفيدة. من أجل توضيح هذه المفاهيم الثلاثة في العمل، وأنا أصف عدد من متابعة التجارب الميدانية الرقمية جزئيا التي بنيت على التصميم الأنيق والنتائج المثيرة في Schultz et al. (2007) . كما سترون، من خلال تصميم أكثر حذرا، والتنفيذ، والتحليل، والتفسير، وأنت أيضا يمكن أن نتجاوز تجارب بسيطة.