2.4.1 چیز شمارش

شمارش ساده می تواند جالب اگر شما یک سوال خوب با داده های خوب ترکیب کنید.

با وجودی که در زبان پیچیده پیچیده است، بسیاری از تحقیقات اجتماعی واقعا فقط شمارش چیزهاست. محققان می توانند در سن داده های بزرگ، بیش از هر زمان دیگری، شمارش کنند، اما این بدان معنا نیست که آنها فقط باید شروع به شمارش کنند. در عوض، محققان باید بپرسند: چه چیزی ارزش شمارش دارد؟ این ممکن است به نظر می رسد به طور کامل موضوع ذهنی، اما برخی از الگوهای عمومی وجود دارد.

اغلب دانش آموزان پژوهش های شمارش خود را مبنی بر این که می گویند: من قصد دارم چیزی را که هیچکس قبلا شمارش نکرده است، محاسبه کند. برای مثال، یک دانش آموز ممکن است بگوید که بسیاری از مردم مهاجران را مطالعه کرده اند و بسیاری از مردم دوقلو را مطالعه کرده اند، اما هیچکس دوقلوهای مهاجر را مطالعه نکرده است. در تجربه من، این استراتژی که انگیزه من توسط غیبت نامیده می شود معمولا به تحقیقات خوب منجر نمی شود. انگیزه توسط غیبت نوعی مانند گفتن است که سوراخ وجود دارد و من قصد دارم به کار بسیار سخت برای آن را پر کنید. اما هر سوراخ باید پر شود

من فکر می کنم که به جای مواجه شدن با غیبت، یک استراتژی بهتر است که سوالات تحقیقاتی که مهم یا جالب (و یا به صورت ایده آل هر دو) هستند را دنبال کنید. هر دو از این اصطلاحات کمی دشوار است، اما یک راه برای فکر کردن در مورد تحقیقات مهم این است که آن تا به برخی از تاثیر قابل اندازه گیری و یا تغذیه به یک تصمیم مهم از سیاست گذاران. به عنوان مثال، اندازه گیری نرخ بیکاری مهم است زیرا این شاخص اقتصادی است که تصمیمات سیاسی را در اختیار دارد. به طور کلی، من فکر می کنم محققان حس خوبی دارند که مهم است. بنابراین، در بقیه این بخش، من دو نمونه را ارائه می دهم که فکر می کنم شمارش جالب باشد. در هر مورد، محققان به طور تصادفی شمارش نکردند؛ در عوض، آنها در تنظیمات بسیار خاص حساب می کردند که دیدگاه های مهم را به ایده های عمومی تر درباره نحوه کارکرد سیستم های اجتماعی نشان داد. به عبارت دیگر، بسیاری از آنچه باعث می شود تمرکز شمارش خاص جالب باشد، داده های خود نیستند، از این ایده های کلی تر می آید.

یک مثال از قدرت ساده شمارش، از مطالعه هنری فاربر (2015) از رفتار رانندگان تاکسی شهر نیویورک است. اگر چه این گروه ممکن است به نظر جالب توجه نباشد، اما این یک سایت تحقیق استراتژیک برای آزمایش دو نظریه رقابتی در اقتصاد کار است. برای اهداف تحقیق Farber، دو ویژگی مهم در مورد محیط کار رانندگان تاکسی وجود دارد: (1) حقوق و دستمزد ساعتی آنها روز به روز تغییر می کند، در بخشی از عوامل مانند آب و هوا، و (2) تعداد ساعت ها که آنها کار می تواند هر روز بر اساس تصمیمات آنها نوسان کند. این ویژگی ها منجر به یک سوال جالب در مورد رابطه بین دستمزد ساعتی و ساعات کار می شود. مدل های نئوکلاسیک در اقتصاد پیش بینی می کنند که رانندگان تاکسی در روزهایی که بیشتر از ساعات کار روزانه دارند، بیشتر کار خواهند کرد. به جای آن، مدل های اقتصاد رفتاری دقیقا برعکس پیش بینی می کنند. اگر رانندگان هدف خاصی از درآمد خود را تعیین کنند، می گویند 100 دلار در روز - و تا زمانی که این هدف برآورده شود، کار می کند، سپس رانندگان در روزهایی که درآمد بیشتری کسب می کنند، کمتر ساعت کار می کنند. به عنوان مثال، اگر شما درآمد هدفمند بودید، ممکن است چهار ساعت کار در یک روز خوب (25 دلار در ساعت) و پنج ساعت در یک روز بد (20 دلار در هر ساعت) انجام دهید. بنابراین، آیا رانندگان ساعات بیشتری در روز با دستمزد ساعتی بالاتر (همانطور که توسط مدل های نئوکلاسیک پیش بینی شده) و یا بیشتر ساعت ها در روز با دستمزد ساعتی پایین تر (به عنوان پیش بینی های مدل های اقتصادی رفتاری) کار می کنند؟

برای پاسخ به این سوال Farber در هر سفر تاکسی که توسط کابین های شهر نیویورک از سال 2009 تا 2013 به دست آمده است، اطلاعاتی را که در حال حاضر در دسترس عموم قرار دارند، به دست آورد. این اطلاعات که توسط مترجم های الکترونیکی جمع آوری شده بود که شهر نیاز به استفاده از تاکسی دارد - شامل اطلاعات مربوط به هر سفر: زمان شروع، محل شروع، زمان پایان، محل پایان، کرایه و نوک (اگر نوک با کارت اعتباری پرداخت شود) . با استفاده از داده های تاکسی، فاربر متوجه شد که اکثر رانندگان در روزهایی که بیشترین دستمزد بالاتر است، مطابق با نظریه نئوکلاسیک کار می کنند.

علاوه بر این یافته اصلی، فربر توانست از اندازه داده ها برای درک بهتر ناهمگونی و دینامیک استفاده کند. او دریافت که در طول زمان، رانندگان جدیدتر به تدریج یاد می گیرند ساعتهای بیشتری را در روزهای باالرقابت کار کنند (به عنوان مثال، آنها می آموزند رفتار خود را پیش بینی کنند). و رانندگان جدید که رفتار بیشتری نسبت به درآمد هدفمند دارند بیشتر احتمال دارد که رانندگان تاکسی را ترک کنند. هر دو این یافته های ظریف تر که به توضیح رفتار مشاهده شده رانندگان فعلی کمک می کنند، تنها به دلیل اندازه مجموعه داده امکان پذیر است. آنها در مطالعات قبلی که از تعداد کمی از رانندگان تاکسی در طی مدت کوتاهی استفاده می کردند، غیرممکن بود (Camerer et al. 1997) .

مطالعه فاربر نزدیک به بهترین سناریو برای تحقیق با استفاده از یک منبع داده بزرگ بود، زیرا داده های جمع آوری شده توسط این شهر خیلی نزدیک به اطلاعاتی بود که Farber جمع آوری می کرد (یکی از تفاوت ها این است که Farber می خواست اطلاعات در کل پاداش به علاوه نکات - اما داده های شهرستان فقط شامل نکات پرداخت شده توسط کارت اعتباری). با این حال، داده ها به تنهایی کافی نبودند. کلید تحقیق Farber یک پرسش جالب در مورد داده ها بود، یک سوال که پیامدهای بزرگتری نسبت به این تنظیم خاص دارد.

مثال دوم شمارش چیزها از تحقیق گری کینگ، جنیفر پان و مولی رابرتز (2013) در مورد سانسور آنلاین توسط دولت چین است. با این حال، در این مورد، محققان باید داده های بزرگ خود را جمع آوری کنند و مجبور بودند با این واقعیت برخورد کنند که اطلاعاتشان ناقص بود.

پادشاه و همکاران از این واقعیت است که پست های رسانه های اجتماعی در چین توسط یک دستگاه دولتی عظیم که شامل ده ها هزار نفر می شود، سانسور می شود. محققان و شهروندان، با این حال، احساس کمی از این که چگونه این سانسور تصمیم بگیرند که چه محتوایی باید حذف شود. محققان چینی عملا انتظارات متضاد را در مورد کدام پست ها به احتمال زیاد حذف می کنند. برخی معتقدند که سانسور بر روی پست هایی است که از دولت انتقاد می کنند، در حالی که دیگران فکر می کنند که آنها بر روی پست هایی که رفتار جمعی، مانند اعتراضات را تشویق می کنند، تمرکز می کنند. مشخص است که کدام یک از این انتظارات صحیح است، پیامدهای این است که چگونه محققان چین و دیگر دولتهای اقتدارگرا را که در سانسور فعالیت می کنند، درک می کنند. بنابراین، پادشاه و همکارانش می خواستند پست هایی را که منتشر شده بودند مقایسه کنند و سپس با پست هایی منتشر شده و هرگز حذف نشدند.

جمع آوری این پست درگیر شاهکار مهندسی شگفت انگیز از خزنده بیش از 1000 وب سایت های هر رسانه های اجتماعی چینی با صفحه های مختلف طرح بندی یاب پست مربوطه، و پس از آن دوباره این پست را به دیدن که پس از آن حذف شده است. علاوه بر مشکلات مهندسی عادی مرتبط با مقیاس بزرگ وب خزنده، این پروژه چالش های اضافه شده که در آن مورد نیاز می شود بسیار سریع به دلیل بسیاری از پست سانسور در کمتر از 24 ساعت گرفته شده بود. به عبارت دیگر، یک خزنده آرام را بسیاری از پست ها که سانسور شد را از دست ندهید. علاوه بر این، خزنده حال برای انجام تمام این جمع آوری داده ها در حالی که فرار تشخیص مبادا وب سایت های رسانه های اجتماعی جلوگیری از دسترسی و یا در غیر این صورت تغییر سیاست های خود در پاسخ به مطالعه است.

تا زمانی که این وظیفه مهندسی عظیم به پایان رسید، پادشاه و همکارانش حدود 11 میلیون پست در 85 موضوع مختلف پیشنهادی به دست آوردند، هر کدام با حساسیت مورد انتظار قرار گرفتند. به عنوان مثال، موضوع حساسیت بالا Ai Weiwei، هنرمند مخالف است؛ یک موضوع حساسیت میانی، قدردانی و کاهش ارزش پول چین است و موضوع حساسیت کم، جام جهانی است. از این 11 میلیون پست، حدود 2 میلیون نفر سانسور شده اند. به تازگی شگفت آور، پادشاه و همکارانش دریافتند که پست هایی که در موضوعات بسیار حساس هستند، کمی بیشتر از پست های مربوط به موضوعات متوسط ​​و کم حساس سانسور شده اند. به عبارت دیگر، سانسورهای چینی به احتمال زیاد به سانسور یک پست اشاره می کنند که Ai Weiwei به عنوان پست ای که جام جهانی را ذکر می کند، است. این یافته ها از این ایده حمایت نمی کند که دولت سانسور همه پست ها در موضوعات حساس است.

با این وجود، محاسبه ساده نرخ سانسور بر اساس موضوع می تواند گمراه کننده باشد. به عنوان مثال، دولت می تواند پست هایی را که از Ai Weiwei حمایت می کنند، سانسور کند اما پست هایی را که از او انتقاد می کنند، ترک کند. محققان برای تمیز کردن پست ها با دقت بیشتر، نیاز به اندازه گیری احساسات هر پست داشتند. متأسفانه، با وجود کار زیاد، روش های کاملا خودکار شناسایی احساسات با استفاده از لغت نامه های موجود، هنوز در بسیاری از شرایط بسیار خوب نیست (فکر می کنم به مشکلات ایجاد یک جدول زمانی عاطفی در تاریخ 11 سپتامبر 2001 در بخش 2.3.9 توضیح داده شود). بنابراین، پادشاه و همکارانش راهی برای نشر 11 میلیون پست رسانه های اجتماعی در مورد اینکه آیا آنها (1) از دولت انتقاد داشتند، (2) حمایت از دولت، یا (3) گزارش های نامناسب یا واقعی در مورد وقایع، نیاز داشتند. این به نظر می رسد مانند یک کار بزرگ، اما آنها را با استفاده از یک ترفند قدرتمند که در علوم داده رایج است اما در علوم اجتماعی نسبتا نادر است: یادگیری تحت نظارت ؛ شکل 2.5 را ببینید

اولا، در مرحله ای که به طور پیش پردازشی نامیده می شد، محققان پست های رسانه های اجتماعی را به یک ماتریس سند محرمانه تبدیل کردند ، جایی که یک ردیف برای هر یک از سند و یک ستون وجود داشت که آیا پست دارای یک کلمه خاص بود (مثلا اعتراض یا ترافیک) . بعد، یک گروه از دستیاران تحقیق دست علامت احساس یک نمونه از پست. سپس، با استفاده از داده های دستی نشانه گذاری شده برای ایجاد یک مدل یادگیری ماشین، که می تواند احساس پست را بر اساس ویژگی های آن به دست آورد، استفاده می شود. در نهایت، از این مدل برای ارزیابی احساس تمام 11 میلیون پست استفاده کرد.

بنابراین، به جای خواندن و برچسب گذاری دستی 11 میلیون پست - که از لحاظ منطقی غیرممکن است، شاه و همکاران به صورت دستی تعداد پست های پست را برچسب گذاری کرده و سپس از یادگیری نظارت شده برای تخمین احساسات همه پست ها استفاده می کنند. پس از اتمام این تجزیه و تحلیل، آنها توانستند نتیجه بگیرند که تا حدی شگفت انگیز، احتمال پست شدن حذف شده به آن بستگی ندارد که آیا از حکومت یا حامی دولت برخوردار بود یا نه.

شکل 2.5: طرح ساده ای از روش استفاده شده توسط پادشاه، پان و رابرتز (2013) برای تخمین احساسات 11 میلیون پست رسانه های اجتماعی چینی. اول، در یک مرحله پیش پردازش، محققان پست های رسانه های اجتماعی را به یک ماتریس سند محرمانه تبدیل کردند (برای اطلاعات بیشتر Grimmer و Stewart (2013) را ببینید). دوم، آنها احساسات یک نمونه کوچک از نوشته ها را به صورت دسته بندی کرده اند. سوم، آنها یک مدل یادگیری تحت نظارت را برای طبقه بندی احساسات پست ها آموزش دادند. چهارم، آنها از مدل یادگیری نظارت شده برای تخمین احساسات همه پست ها استفاده می کردند. برای توضیح بیشتر، شاه، پان و رابرتز (2013) را ببینید.

شکل 2.5: طرح ساده ای از روش استفاده شده توسط King, Pan, and Roberts (2013) برای تخمین احساسات 11 میلیون پست رسانه های اجتماعی چینی. اول، در یک مرحله پیش پردازش ، محققان پست های رسانه های اجتماعی را به یک ماتریس سند محرمانه تبدیل کردند Grimmer and Stewart (2013) برای اطلاعات بیشتر Grimmer and Stewart (2013) را ببینید). دوم، آنها احساسات یک نمونه کوچک از نوشته ها را به صورت دسته بندی کرده اند. سوم، آنها یک مدل یادگیری تحت نظارت را برای طبقه بندی احساسات پست ها آموزش دادند. چهارم، آنها از مدل یادگیری نظارت شده برای تخمین احساسات همه پست ها استفاده می کردند. برای توضیح بیشتر King, Pan, and Roberts (2013) ببینید.

در نهایت، پادشاه و همکارانش کشف کردند که تنها سه نوع پست به طور مرتب سانسور شده اند: پورنوگرافی، انتقاد از سانسورها و کسانی که دارای پتانسیل عمل جمعی (یعنی احتمال وقوع اعتراضات گسترده). با مشاهده تعداد زیادی از پست هایی که حذف شد و پست هایی که حذف نشدند، پادشاه و همکاران توانستند با مشاهده و شمارش، سانسور کار کنند. علاوه بر این، پیش بینی موضوعی که در این کتاب رخ می دهد، رویکرد یادگیری نظارت شده ای است که آنها با استفاده از دست زدن به برخی نتایج و سپس ایجاد یک مدل یادگیری ماشین برای نشانه گذاری بقیه، به نظر می رسد در تحقیقات اجتماعی در عصر دیجیتال بسیار رایج است . شما تصاویری بسیار شبیه به شکل 2.5 در فصل 3 (درخواست سوالات) و 5 (ایجاد همکاری جمعی) خواهید دید. این یکی از اندیشه هایی است که در چند فصل به نظر می رسد.

این مثالها - رفتار کارکنان رانندگان تاکسی در نیویورک و رفتار سانسور رسانه های اجتماعی در دولت چین نشان می دهد که شمارش نسبتا ساده از منابع داده های بزرگ در بعضی موارد باعث تحقیقات جالب و مهم می شود. با این حال، در هر دو مورد، محققان باید سوالات جالبی را به منبع داده بزرگ ارائه دهند؛ داده ها به تنهایی کافی نبود