2.3.2 دائمًا

دائما على بيانات كبيرة تمكن الدراسة من الأحداث غير المتوقعة وقياس الوقت الحقيقي.

العديد من أنظمة البيانات الكبيرة هي دائما على. انهم جمع البيانات باستمرار. توفر هذه الخاصية دائما على الباحثين مع البيانات الطولية (أي بيانات على مر الزمن). يجري دائما على اثنين من آثار هامة للبحث.

أولاً ، تمكن مجموعة البيانات دائمًا الباحثين من دراسة الأحداث غير المتوقعة بطرق لا يمكن تحقيقها. على سبيل المثال ، يركز الباحثون المهتمون بدراسة احتجاجات احتلال "جيزي" في تركيا في صيف عام 2013 على سلوك المتظاهرين خلال الحدث. تمكنت سيرين بوداك ودنكان واتس (2015) من القيام بالمزيد من خلال استخدام طبيعة Twitter دائمًا لدراسة المتظاهرين الذين استخدموا Twitter قبل وأثناء وبعد الحدث. وتمكنوا من إنشاء مجموعة مقارنة من غير المشاركين قبل وأثناء وبعد الحدث (الشكل 2.2). في المجموع ، تضمنت لوحة النشرات الخاصة بهما تويت 30،000 شخص على مدار عامين. من خلال زيادة البيانات المستخدمة بشكل شائع من الاحتجاجات بهذه المعلومات الأخرى ، كان بوداك وواتس قادرين على التعلم أكثر بكثير: فقد تمكنوا من تقدير أنواع الأشخاص الذين كانوا أكثر عرضة للمشاركة في احتجاجات غيزي ولتقدير التغييرات في مواقف المشاركين وغير المشاركين ، على حد سواء في المدى القصير (مقارنة ما قبل Gezi إلى أثناء Gezi) وعلى المدى الطويل (مقارنة ما قبل Gezi مع ما بعد Gezi).

الشكل 2.2: التصميم المستخدم من قبل Budak و Watts (2015) لدراسة احتجاجات احتلال Gezi في تركيا في صيف عام 2013. باستخدام الطبيعة الدائمة للتويتر ، أنشأ الباحثون ما وصفوه بلوحة سابقة تضمنت 30،000 شخص على مدى عامين. على النقيض من دراسة نموذجية ركزت على المشاركين أثناء الاحتجاجات ، تضيف لوحة المشاركة اللاحقة 1) بيانات من المشاركين قبل وبعد الحدث و 2) بيانات من غير المشاركين قبل وأثناء وبعد الحدث. مكنت بنية البيانات المثرية هذه بوداك وواتس من تقدير أنواع الأشخاص الأكثر احتمالية للمشاركة في احتجاجات غيزي ولتقدير التغييرات في مواقف المشاركين وغير المشاركين ، على المدى القصير (مقارنة ما قبل جيزي مع خلال جيزي ) وعلى المدى الطويل (مقارنة ما قبل Gezi مع ما بعد Gezi).

الشكل 2.2: التصميم المستخدم من قبل Budak and Watts (2015) لدراسة احتجاجات احتلال Gezi في تركيا في صيف عام 2013. باستخدام الطبيعة الدائمة للتويتر ، أنشأ الباحثون ما وصفوه بلوحة سابقة تضمنت 30،000 شخص على مدى عامين. على النقيض من دراسة نموذجية ركزت على المشاركين أثناء الاحتجاجات ، تضيف لوحة المشاركة اللاحقة 1) بيانات من المشاركين قبل وبعد الحدث و 2) بيانات من غير المشاركين قبل وأثناء وبعد الحدث. مكنت بنية البيانات المثرية هذه بوداك وواتس من تقدير أنواع الأشخاص الأكثر احتمالية للمشاركة في احتجاجات غيزي ولتقدير التغييرات في مواقف المشاركين وغير المشاركين ، على المدى القصير (مقارنة ما قبل جيزي مع خلال جيزي ) وعلى المدى الطويل (مقارنة ما قبل Gezi مع ما بعد Gezi).

قد يشير أحد المتشككين إلى أن بعض هذه التقديرات كان من الممكن أن يتم دون مصادر جمع البيانات على الدوام (على سبيل المثال ، التقديرات طويلة المدى لتغيير المواقف) ، وهذا صحيح ، على الرغم من أن جمع البيانات هذا لثلاثين ألف شخص كان سيحدث تمامًا. مكلفة. حتى لو أعطيت ميزانية غير محدودة ، فإنني لا أستطيع التفكير في أي طريقة أخرى تسمح للباحثين بالعودة إلى الماضي في الوقت المناسب وملاحظة سلوك المشاركين في الماضي بشكل مباشر. سيكون البديل الأقرب هو جمع تقارير بأثر رجعي عن السلوك ، ولكن هذه التقارير ستكون محدودة الدقة ودقة مشكوك فيها. يقدم الجدول 2.1 أمثلة أخرى للدراسات التي تستخدم مصدر بيانات دائمًا لدراسة حدث غير متوقع.

الجدول 2.1: دراسات عن الأحداث غير المتوقعة باستخدام مصادر البيانات الضخمة دائمًا.
حدث غير متوقع دائما على مصدر البيانات الاقتباس
احتل حركة Gezi في تركيا تغريد Budak and Watts (2015)
مظاهرات المظلة في هونغ كونغ ويبو Zhang (2016)
اطلاق النار على الشرطة في مدينة نيويورك تقارير وقف وفريسك Legewie (2016)
شخص ينضم إلى داعش تغريد Magdy, Darwish, and Weber (2016)
11 سبتمبر 2001 الهجوم livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 سبتمبر 2001 الهجوم رسائل النداء Back, Küfner, and Egloff (2010) ، Pury (2011) ، Back, Küfner, and Egloff (2011)

بالإضافة إلى دراسة الأحداث غير المتوقعة ، تمكن أنظمة البيانات الضخمة دائمًا الباحثين من إعداد تقديرات في الوقت الفعلي ، والتي يمكن أن تكون مهمة في الإعدادات حيث يرغب صانعو السياسات - في الحكومة أو الصناعة - في الاستجابة بناءً على الوعي الظرفي. على سبيل المثال ، يمكن استخدام بيانات وسائل الإعلام الاجتماعية لتوجيه استجابة الطوارئ للكوارث الطبيعية (Castillo 2016) ومجموعة متنوعة من مصادر البيانات الكبيرة المختلفة التي يمكن استخدامها لإنتاج تقديرات في الوقت الفعلي للنشاط الاقتصادي (Choi and Varian 2012) .

في الختام ، تمكّن أنظمة البيانات التي تعمل دائمًا الباحثين من دراسة الأحداث غير المتوقعة وتوفير معلومات في الوقت الفعلي لصانعي السياسات. ومع ذلك ، لا أعتقد أن أنظمة البيانات التي تعمل دائمًا مناسبة تمامًا لتتبع التغييرات على مدار فترات زمنية طويلة جدًا. وذلك لأن العديد من أنظمة البيانات الضخمة تتغير باستمرار - وهي عملية سأطالب بها في وقت لاحق في الفصل (القسم 2.3.7).