4.4 تجاوز تجارب بسيطة

دعونا نتجاوز التجارب البسيطة. ثلاثة مفاهيم مفيدة للتجارب الغنية: صحة ، عدم تجانس آثار العلاج ، والآليات.

غالباً ما يركز الباحثون الجدد على التجارب على سؤال ضيق للغاية: هل هذا العلاج "عمل"؟ على سبيل المثال ، هل تشجع مكالمة هاتفية من متطوع شخصًا ما على التصويت؟ هل يؤدي تغيير زر موقع الويب من اللون الأزرق إلى اللون الأخضر إلى زيادة معدل النقر إلى الظهور؟ لسوء الحظ ، فإن الصياغة الفضفاضة حول ما "يعمل" تحجب حقيقة أن التجارب المركزة بشكل ضيق لا تخبرك حقيقة ما إذا كان العلاج "يعمل" بالمعنى العام. بدلاً من ذلك ، تجيب التجارب ذات التركيز الضيق على سؤال أكثر تحديدًا: ما هو متوسط ​​تأثير هذا العلاج المحدد مع هذا التنفيذ المحدد لهذه المجموعة من المشاركين في هذا الوقت؟ سأتصل بالتجارب التي تركز على هذه التجارب البسيطة في السؤال الضيق.

يمكن أن تقدم التجارب البسيطة معلومات قيّمة ، لكنها تفشل في الإجابة على العديد من الأسئلة الهامة والمثيرة للاهتمام ، مثل ما إذا كان هناك بعض الأشخاص الذين كان للمعالجة تأثير أكبر أو أصغر ؛ ما إذا كان هناك علاج آخر يكون أكثر فعالية ؛ وما إذا كانت هذه التجربة تتعلق بنظريات اجتماعية أوسع.

من أجل إظهار قيمة تجاوز تجارب بسيطة ، دعنا نفكر في تجربة حقل تناظرية قام بها P. Wesley Schultz وزملاؤه حول العلاقة بين الأعراف الاجتماعية واستهلاك الطاقة (Schultz et al. 2007) . عمد شولتز وزملاؤه إلى تعليق عبّارات على 300 أسرة في سان ماركوس بولاية كاليفورنيا ، وأطلق هؤلاء باب الرسائل رسائل مختلفة تهدف إلى تشجيع الحفاظ على الطاقة. بعد ذلك ، قام شولتز وزملاؤه بقياس تأثير هذه الرسائل على استهلاك الكهرباء ، بعد أسبوع واحد وبعد ثلاثة أسابيع ؛ انظر الشكل 4.3 للحصول على وصف أكثر تفصيلاً للتصميم التجريبي.

الشكل 4.3: رسم تخطيطي للتصميم التجريبي من Schultz et al. (2007). تضمنت التجربة الميدانية زيارة حوالي 300 أسرة في سان ماركوس بكاليفورنيا خمس مرات على مدى ثمانية أسابيع. في كل زيارة ، أخذ الباحثون القراءة يدويًا من عداد الطاقة في المنزل. وفي اثنتين من الزيارات ، وضعوا بابين على كل منزل ، وقدموا بعض المعلومات حول استخدام الطاقة المنزلية. كان سؤال البحث هو كيف سيؤثر محتوى هذه الرسائل على استخدام الطاقة.

الشكل 4.3: رسم تخطيطي للتصميم التجريبي من Schultz et al. (2007) . تضمنت التجربة الميدانية زيارة حوالي 300 أسرة في سان ماركوس بكاليفورنيا خمس مرات على مدى ثمانية أسابيع. في كل زيارة ، أخذ الباحثون القراءة يدويًا من عداد الطاقة في المنزل. في اثنتين من الزيارات ، وضعوا بابين على كل منزل لتقديم بعض المعلومات حول استخدام الطاقة المنزلية. كان سؤال البحث هو كيف سيؤثر محتوى هذه الرسائل على استخدام الطاقة.

التجربة لديها شرطين. في البداية ، تلقت الأسر نصائح عامة لتوفير الطاقة (على سبيل المثال ، استخدام المراوح بدلاً من مكيفات الهواء) ومعلومات عن استهلاكها للطاقة مقارنةً بمتوسط ​​استهلاك الطاقة في المناطق المجاورة لها. وصف شولتز وزملاؤه هذا بالشرط الوصفي المعياري لأن المعلومات حول استخدام الطاقة في الجوار قدمت معلومات حول السلوك النموذجي (أي معيار وصفي). عندما نظر شولتز وزملاؤه في استخدام الطاقة الناتج في هذه المجموعة ، بدا أن العلاج لم يكن له أي تأثير ، سواء في المدى القصير أو الطويل ؛ وبعبارة أخرى ، لا يبدو أن المعاملة "تعمل" (الشكل 4.4).

لحسن الحظ ، لم يستقر شولتز وزملاؤه في هذا التحليل البسيط. قبل بدء التجربة ، أدركوا أن المستخدمين الكثيرين للكهرباء - أي الأشخاص فوق المتوسط ​​- قد يقللون من استهلاكهم ، وأن مستخدمي الكهرباء الخفيفين - أي الأشخاص دون المتوسط ​​- قد يزيدون بالفعل من استهلاكهم. عندما نظروا إلى البيانات ، هذا هو بالضبط ما وجدوه (الشكل 4.4). وهكذا ، فإن ما بدا وكأنه علاج لم يكن له أي تأثير كان في الواقع علاج له تأثيران متلازمان. هذه الزيادة العكسية بين مستخدمي الضوء هي مثال على تأثير يرتد ، حيث يمكن أن يكون للمعالجة تأثير معاكس من المقصود.

الشكل 4.4: النتائج من Schultz et al. (2007). توضح اللوحة (أ) أن المعالجة الوصفية للمعايير لها متوسط ​​تأثير تقديري للعلاج. ومع ذلك ، فإن اللوحة (ب) تُظهر أن هذا التأثير العلاجي المتوسط ​​يتألف فعلاً من اثنين من التأثيرات المعاكسة. بالنسبة للمستخدمين كثيري الاستخدام ، انخفض العلاج ولكن لمستخدمي الضوء ، زاد العلاج من الاستخدام. وأخيرًا ، توضح اللوحة (ج) أن المعالجة الثانية ، التي تستخدم معايير وصفية وأزرارًا ، كان لها نفس التأثير تقريباً على المستخدمين الثقيلين ولكنها خففت من تأثير بوميرانج على مستخدمي الضوء. مقتبس من شولتز وآخرون. (2007).

الشكل 4.4: النتائج من Schultz et al. (2007) . توضح اللوحة (أ) أن المعالجة الوصفية للمعايير لها متوسط ​​تأثير تقديري للعلاج. ومع ذلك ، فإن اللوحة (ب) تُظهر أن هذا التأثير العلاجي المتوسط ​​يتألف فعلاً من اثنين من التأثيرات المعاكسة. بالنسبة للمستخدمين كثيري الاستخدام ، انخفض العلاج ولكن لمستخدمي الضوء ، زاد العلاج من الاستخدام. وأخيرًا ، توضح اللوحة (ج) أن المعالجة الثانية ، التي تستخدم معايير وصفية وأزرارًا ، كان لها نفس التأثير تقريباً على المستخدمين الثقيلين ولكنها خففت من تأثير بوميرانج على مستخدمي الضوء. مقتبس من Schultz et al. (2007) .

بالتزامن مع الشرط الأول ، شولتز وزملاؤه أيضا بشرط ثانٍ. تلقت الأسر في الحالة الثانية نفس المعاملة - نصائح عامة حول توفير الطاقة ومعلومات حول استخدام الطاقة لأسرهم مقارنةً بمتوسط ​​حيهم - بإضافة واحدة صغيرة: بالنسبة للأشخاص الذين لديهم استهلاك أقل من المتوسط ​​، أضاف الباحثون: وبالنسبة للأشخاص الذين لديهم استهلاك أعلى من المتوسط ​​، أضافوا :(. وقد صممت هذه المشاعر لتحفيز ما وصفه الباحثون بالأعراف الزجرية. تشير القواعد الشرطية إلى تصورات ما هو مقبول عادة (وغير موافق عليه) ، بينما تشير المعايير الوصفية إلى تصورات ما يحدث عادة (Reno, Cialdini, and Kallgren 1993) .

بإضافة هذا الرمز المفرد الصغير ، قام الباحثون بتقليل التأثير الدراماتيكي بشكل كبير (الشكل 4.4). وهكذا ، من خلال جعل هذا التغيير بسيطًا واحدًا ، وهو التغيير الذي كان مدفوعًا بنظرية سيكولوجية اجتماعية مجردة (Cialdini, Kallgren, and Reno 1991) ، تمكن الباحثون من تحويل برنامج لا يبدو أنه يعمل في أحد البرامج التي نجحت ، وفي نفس الوقت ، تمكنوا من المساهمة في الفهم العام للكيفية التي تؤثر بها الأعراف الاجتماعية على السلوك البشري.

في هذه المرحلة ، قد تلاحظ أن شيئًا مختلفًا بعض الشيء عن هذه التجربة. على وجه الخصوص ، لا تحتوي تجربة شولتز وزملاؤه بالفعل على مجموعة تحكم بنفس الطريقة التي تتبعها التجارب المعشاة ذات الشواهد. توضح مقارنة بين هذا التصميم وتصميم Restivo و van de Rijt الاختلافات بين التصميمين التجريبيين الرئيسيين. في تصاميم بين الموضوعات ، مثل رستيفو وفان دي ريجيت ، هناك مجموعة علاج ومجموعة مراقبة. في التصميمات الداخلية ، من ناحية أخرى ، تتم مقارنة سلوك المشاركين قبل وبعد العلاج (Greenwald 1976; Charness, Gneezy, and Kuhn 2012) . في تجربة داخل الموضوع ، يبدو الأمر وكأن كل مشارك يتصرف كمجموعة تحكم خاصة به. إن قوة التصاميم بين الموضوعات هي أنها توفر الحماية ضد الإرباك (كما وصفت سابقاً) ، في حين أن قوة التجارب داخل الموضوع هي زيادة دقة التقديرات. وأخيرًا ، لتنبؤ بفكرة ستأتي لاحقًا عندما أقدم نصيحة حول تصميم التجارب الرقمية ، فإن التصميم _mixed_ يربط بين الدقة المحسنة لتصاميم المواد الداخلية والحماية من الخلط بين التصاميم بين الموضوعات (الشكل 4.5).

الشكل 4.5: ثلاث تصاميم تجريبية. تستخدم التجارب المعشاة ذات الشواهد المعيارية تصاميم بين المواد. مثال على تصميم بين الموضوعات هو Restivo و Van de Rijt's (2012) على تجربة barnstars والمساهمات في ويكيبيديا: قام الباحثون بتقسيم المشاركين عشوائيا إلى مجموعات العلاج والسيطرة ، وأعطى المشاركين في مجموعة العلاج barnstar ، ومقارنة النتائج من أجل مجموعتين. النوع الثاني من التصميم هو تصميم داخل الموضوع. توضح تجربتان في دراسة شولتز وزملاؤه (2007) حول الأعراف الاجتماعية واستخدام الطاقة تصميمًا داخليًا: قارن الباحثون استخدام الكهرباء للمشاركين قبل وبعد تلقي العلاج. تقدم التصميمات ضمن المواد الدراسية دقة إحصائية محسنة ، ولكنها مفتوحة أمام الإرباك المحتمل (على سبيل المثال ، التغيرات في الطقس بين فترات ما قبل المعالجة وفترات العلاج) (Greenwald 1976 ؛ Charness و Gneezy و Kuhn 2012). كما تسمى التصميمات الداخلية أيضًا أحيانًا بتدابير التدابير المتكررة. وأخيرًا ، تجمع التصاميم المختلطة بين الدقة المحسنة للتصاميم الداخلية وبين الحماية من الخلط بين التصاميم بين الأجناس. في تصميم مختلط ، يقارن الباحث التغيير في النتائج للناس في مجموعات العلاج والسيطرة. عندما يكون لدى الباحثين بالفعل معلومات ما قبل المعالجة ، كما هو الحال في العديد من التجارب الرقمية ، فإن التصاميم المختلطة تكون بشكل عام أفضل من التصاميم بين الموضوعات لأنها تؤدي إلى تحسين دقة التقديرات.

الشكل 4.5: ثلاث تصاميم تجريبية. تستخدم التجارب المعشاة ذات الشواهد المعيارية تصاميم بين المواد . مثال على تصميم بين الموضوعات هو Restivo و Van de Rijt's (2012) على تجربة barnstars والمساهمات في ويكيبيديا: قام الباحثون بتقسيم المشاركين عشوائيا إلى مجموعات العلاج والسيطرة ، وأعطى المشاركين في مجموعة العلاج barnstar ، ومقارنة النتائج من أجل مجموعتين. النوع الثاني من التصميم هو تصميم داخل الموضوع . توضح تجربتان في دراسة شولتز وزملاؤه (2007) حول الأعراف الاجتماعية واستخدام الطاقة تصميمًا داخليًا: قارن الباحثون استخدام الكهرباء للمشاركين قبل وبعد تلقي العلاج. تقدم التصميمات ضمن المواد الدراسية دقة إحصائية محسنة ، ولكنها مفتوحة لإرباك محتمل (على سبيل المثال ، التغيرات في الطقس بين فترات ما قبل المعالجة وفترات العلاج) (Greenwald 1976; Charness, Gneezy, and Kuhn 2012) . كما تسمى التصميمات الداخلية أيضًا أحيانًا بتدابير التدابير المتكررة. وأخيرًا ، تجمع التصاميم المختلطة بين الدقة المحسنة للتصاميم الداخلية وبين الحماية من الخلط بين التصاميم بين الأجناس. في تصميم مختلط ، يقارن الباحث التغيير في النتائج للناس في مجموعات العلاج والسيطرة. عندما يكون لدى الباحثين بالفعل معلومات ما قبل المعالجة ، كما هو الحال في العديد من التجارب الرقمية ، فإن التصاميم المختلطة تكون بشكل عام أفضل من التصاميم بين الموضوعات لأنها تؤدي إلى تحسين دقة التقديرات.

بشكل عام ، يوضح تصميم ونتائج الدراسة التي أجراها شولتز وزملاؤه (2007) قيمة الانتقال إلى ما وراء التجارب البسيطة. لحسن الحظ ، لست بحاجة إلى أن تكون عبقريًا مبدعًا لتصميم تجارب كهذه. طور علماء الاجتماع ثلاثة مفاهيم ترشدك إلى تجارب أكثر ثراءً: (1) صلاحية ، (2) عدم تجانس تأثيرات العلاج ، و (3) آليات. بمعنى أنه إذا أبقيت هذه الأفكار الثلاثة في ذهنك أثناء تصميم تجربتك ، فمن الطبيعي أن تقوم بتجربة أكثر إثارة وإثارة للاهتمام. من أجل توضيح هذه المفاهيم الثلاثة في العمل ، سوف أصف عددًا من التجارب الميدانية الرقمية الجزئية للمتابعة التي بنيت على التصميم الأنيق والنتائج المثيرة لشولتز وزملائه (2007) . كما سترى ، من خلال تصميم أكثر دقة ، وتنفيذ ، وتحليل ، وتفسير ، يمكنك أيضًا أن تتخطى التجارب البسيطة.