2.3.2 همیشه در

همیشه در داده های بزرگ را قادر می سازد مطالعه رویدادهای غیر منتظره و اندازه گیری زمان واقعی است.

بسیاری از سیستم های داده های بزرگ همیشه در؛ آنها به طور مداوم جمع آوری داده ها. این ویژگی همیشه در محققان با داده های طولی فراهم می کند (به عنوان مثال، داده های در طول زمان). بودن همیشه در دو پیامدهای مهمی برای پژوهش است.

اولا، جمع آوری داده های همیشه همیشه پژوهشگران را قادر می سازد تا حوادث غیر منتظره را به نحوی که ممکن است غیر ممکن باشد، مطالعه کنید. به عنوان مثال، محققان علاقه مند به مطالعه تظاهرات Occident Genes در ترکیه در تابستان سال 2013 معمولا بر رفتار معترضین در این رویداد تمرکز می کنند. Ceren Budak و دانکن واتس (2015) توانستند با استفاده از طبیعت همیشه در توییتر برای بررسی معترضانی که از توییتر قبل، در طول و پس از رویداد استفاده می کردند، بیشتر کار کنند. و، آنها توانستند یک گروه مقایسه غیر مشارکتکنندگان را قبل، در طول و پس از رویداد ایجاد کنند (شکل 2.2). در مجموع، هیئت مدیره پس از آن، توییت های 30،000 نفر در طول دو سال گذشته را شامل می شد. با تقویت داده های معمول استفاده شده از اعتراضات با استفاده از این اطلاعات دیگر، Budak و وات توانستند خیلی بیشتر یاد بگیرند: آنها توانستند برآورد کنند که چه افرادی بیشتر در معرض تظاهرات های ژجی قرار دارند و برآورد تغییرات در نگرش های شرکت کنندگان و شرکت کنندگان بدون در نظر گرفتن هر دو در کوتاه مدت (مقایسه قبل از Gezi به در طول Gezi) و در دراز مدت (مقایسه قبل از Gezi با post-Gezi).

شکل 2.2: طرح Budak و واتز (2015) برای مطالعه اعتراضات اشغالگرانه Gezi در ترکیه در تابستان 2013 استفاده شده است. با استفاده از طبیعت همیشه در توییتر، محققان آنچه را که آنها یک پانل ex-post نامیده اند، شامل می شوند 30000 نفر در طول دو سال. بر خلاف یک مطالعه معمول که بر شرکت کنندگان در جریان اعتراضات متمرکز بود، هیئت مدیره پس از اضافه کردن 1) اطلاعات از شرکت کنندگان قبل و بعد از رویداد و 2) داده های غیر از شرکت کنندگان قبل، در طول و پس از رویداد. این ساختار غنی شده، Budak و Watts را قادر می سازد تا برآورد کند که چه نوع افرادی بیشتر در معرض تظاهرات ژجی قرار دارند و برآورد تغییرات در نگرش شرکت کنندگان و غیرمستقیمان، هر دو در کوتاه مدت (مقایسه قبل از Gezi در طول Gezi ) و در بلندمدت (مقايسه قبل از Gezi با Post-Gezi).

شکل 2.2: طرح Budak and Watts (2015) برای مطالعه اعتراضات اشغالگرانه Gezi در ترکیه در تابستان 2013 استفاده شده است. با استفاده از طبیعت همیشه در توییتر، محققان آنچه را که آنها یک پانل ex-post نامیده اند، شامل می شوند 30000 نفر در طول دو سال. بر خلاف یک مطالعه معمول که بر شرکت کنندگان در جریان اعتراضات متمرکز بود، هیئت مدیره پس از اضافه کردن 1) اطلاعات از شرکت کنندگان قبل و بعد از رویداد و 2) داده های غیر از شرکت کنندگان قبل، در طول و پس از رویداد. این ساختار غنی شده، Budak و Watts را قادر می سازد تا برآورد کند که چه نوع افرادی بیشتر در معرض تظاهرات ژجی قرار دارند و برآورد تغییرات در نگرش شرکت کنندگان و غیرمستقیمان، هر دو در کوتاه مدت (مقایسه قبل از Gezi در طول Gezi ) و در بلندمدت (مقايسه قبل از Gezi با Post-Gezi).

یک شک و تردید ممکن است اشاره کند که برخی از این برآوردها می تواند بدون همیشه بر روی منابع جمع آوری داده ها (به عنوان مثال، برآورد های بلند مدت تغییر نگرش) ساخته شده باشد و این درست است، اگرچه چنین جمع آوری اطلاعات برای 30،000 نفر کاملا گران. با این حال، حتی با توجه به بودجه نامحدود، من نمی توانم از روش های دیگری که به طور محسوسی اجازه می دهد محققان در زمان سفر خود و به طور مستقیم از رفتار شرکت کنندگان در گذشته رعایت کنند، فکر نمی کنم. نزدیک ترین جایگزین برای جمع آوری گزارش های پسین از رفتار است، اما این گزارش ها می تواند جزئیات دقیق و دشواری سوالاتی باشد. جدول 2.1 نمونه های دیگری از مطالعاتی را ارائه می دهد که از یک منبع داده همیشه برای مطالعه یک رویداد غیر منتظره استفاده می کنند.

جدول 2.1: مطالعات مربوط به رویدادهای غیر منتظره با استفاده از منابع همیشه با داده های بزرگ.
رویداد غیر منتظره منبع داده همیشه همیشه استناد
اشغال جنبش گزی در ترکیه توییتر Budak and Watts (2015)
تظاهرات چتر در هنگ کنگ Weibo Zhang (2016)
شلیک پلیس در شهر نیویورک گزارش توقف و فریز Legewie (2016)
شخص پیوستن به ISIS توییتر Magdy, Darwish, and Weber (2016)
حمله 11 سپتامبر 2001 livejournal.com Cohn, Mehl, and Pennebaker (2004)
حمله 11 سپتامبر 2001 پیام های پیجر Back, Küfner, and Egloff (2010) ، Pury (2011) ، Back, Küfner, and Egloff (2011)

علاوه بر مطالعه رویدادهای غیر منتظره، همواره بر روی سیستم های اطلاعاتی بزرگ، محققان را قادر می سازد تا برآوردهای زمان واقعی را ایجاد کنند، که می تواند در تنظیمات مهم باشد که در آن سیاست گذاران - در دولت یا صنعت - می خواهند بر اساس آگاهی موقعیتی پاسخ دهند. به عنوان مثال، داده های رسانه های اجتماعی برای هدایت واکنش اضطراری به بلایای طبیعی (Castillo 2016) و استفاده از منابع مختلف داده های مختلف می توانند برآورد زمان واقعی فعالیت های اقتصادی (Choi and Varian 2012) .

در نتیجه، سیستمهای همیشه در دسترس، محققان را قادر به مطالعه رویدادهای غیر منتظره و ارائه اطلاعات در زمان واقعی به سیاست گذاران می کنند. با این حال، من فکر نمی کنم که همیشه در سیستم های داده ها مناسب برای ردیابی تغییرات در طول دوره های بسیار طولانی است. به این دلیل که بسیاری از سیستم های داده های بزرگ همواره در حال تغییر، یک فرایند است که من پاسخ بی اراده بعدا در این فصل (بخش 2.3.7).