2.3.2 Her zaman

Her zaman büyük veri beklenmeyen olaylar ve gerçek zamanlı ölçüm çalışma sağlar.

Çok büyük veri sistemleri her zaman vardır; onlar sürekli veri toplama. Bu her zaman-karakteristik uzunlamasına verileri ile araştırmacılara sağlar (yani, zamanla verileri). her zaman açık olmak araştırma için iki önemli etkileri vardır.

İlk olarak, her zaman açık veri toplama, araştırmacıların beklenmedik olayları başka türlü mümkün olmayacak şekilde incelemelerini sağlar. Örneğin, 2013 yazında Türkiye'de Occupy Gezi protestolarını incelemekle ilgilenen araştırmacılar, olay boyunca protestocuların davranışlarına odaklanacaktır. Ceren Budak ve Duncan Watts (2015) Twitter'dan önce, etkinlik sırasında ve sonrasında Twitter'ı kullanan protestocuları incelemek için Twitter'ın her zaman açık yapısını kullanarak daha fazlasını yapabildiler. Ayrıca, olay öncesinde, sırasında ve sonrasında, katılımcılar olmayan bir karşılaştırma grubu oluşturabildiler (şekil 2.2). Toplamda, eski panelleri iki yıl boyunca 30.000 kişilik tweet'leri içeriyordu. Bu diğer bilgilerle birlikte protestolardan yaygın olarak kullanılan verileri arttırarak, Budak ve Watts daha fazla şey öğrenebildiler: Gezi protestolarına ne tür insanların katılma olasılığının daha yüksek olduğunu tahmin etmeyi ve tutumlardaki değişimleri tahmin etmeyi başardılar. Katılımcılar ve katılımcılar, hem kısa vadede (Gezi öncesi ile Gezi sırasında karşılaştırırlar) hem de uzun vadede (Gezi öncesi ile Gezi öncesinin karşılaştırılması).

Şekil 2.2: Budak ve Watts (2015) tarafından 2013 yazında Türkiye'deki Occupy Gezi protestolarını incelemek için kullanılan tasarım. Araştırmacılar, Twitter'ın her zaman açık olan yapısını kullanarak, söz konusu projeyi içeren bir post-post paneli dediler. İki yıl boyunca 30.000 kişi. Protestolar sırasında katılımcılara odaklanan tipik bir çalışmanın aksine, ex-post paneli 1) olaydan önce ve sonra katılımcılardan gelen verileri ve 2) olaydan önce, sırasında ve sonrasında katılmayanların verilerini ekler. Bu zenginleştirilmiş veri yapısı, Budak ve Watts'ın, ne tür insanların Gezi protestolarına katılma olasılığının daha yüksek olduğunu ve hem kısa vadede (hem de Gezi sırasında Gezi ile karşılaştırmanın) katılımcıların ve katılımcı olmayanların tutumlarındaki değişikliklerin tahmin edilmesini sağladı. ) ve uzun vadede (Gezi öncesindeki Gezi ile karşılaştırılması).

Şekil 2.2: Budak and Watts (2015) tarafından 2013 yazında Türkiye'deki Occupy Gezi protestolarını incelemek için kullanılan tasarım. Araştırmacılar, Twitter'ın her zaman açık olan yapısını kullanarak, söz konusu projeyi içeren bir post-post paneli dediler. İki yıl boyunca 30.000 kişi. Protestolar sırasında katılımcılara odaklanan tipik bir çalışmanın aksine, ex-post paneli 1) olaydan önce ve sonra katılımcılardan gelen verileri ve 2) olaydan önce, sırasında ve sonrasında katılmayanların verilerini ekler. Bu zenginleştirilmiş veri yapısı, Budak ve Watts'ın, ne tür insanların Gezi protestolarına katılma olasılığının daha yüksek olduğunu ve hem kısa vadede (hem de Gezi sırasında Gezi ile karşılaştırmanın) katılımcıların ve katılımcı olmayanların tutumlarındaki değişikliklerin tahmin edilmesini sağladı. ) ve uzun vadede (Gezi öncesindeki Gezi ile karşılaştırılması).

Şüpheci, bu tahminlerin bir kısmının her zaman veri toplama kaynakları (örneğin, uzun vadeli tutum değişikliği tahminleri) olmaksızın yapılmış olabileceğine işaret edebilir ve bu doğrudur, ancak 30.000 kişi için böyle bir veri toplama oldukça uygun olurdu. pahalı. Bununla birlikte, sınırsız bir bütçe olsa bile, aslında araştırmacıların zaman içinde geriye gitmelerine ve geçmişte katılımcıların davranışlarını doğrudan gözlemlemelerine izin veren başka bir yöntem düşünemiyorum. En yakın alternatif geriye dönük davranış raporları toplamak olacaktır, ancak bu raporlar sınırlı ayrıntılara ve şüpheli doğruluğa sahip olacaktır. Tablo 2.1, beklenmedik bir olayı incelemek için her zaman açık bir veri kaynağı kullanan diğer çalışma örneklerini sunmaktadır.

Tablo 2.1: Her zaman büyük veri kaynaklarını kullanan beklenmedik olaylarla ilgili çalışmalar.
Beklenmeyen olay Her zaman açık veri kaynağı alıntı
Türkiye'de Occupy Gezi hareketi heyecan Budak and Watts (2015)
Hong Kong'da şemsiye protestoları Weibo Zhang (2016)
New York'ta polisin vuruşu Dur-ve-frisk raporları Legewie (2016)
IŞİD'e katılan kişi heyecan Magdy, Darwish, and Weber (2016)
11 Eylül 2001 saldırısı livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 Eylül 2001 saldırısı çağrı mesajları Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Beklenmedik olayları incelemenin yanı sıra, her zaman büyük veri sistemleri araştırmacıların gerçek zamanlı tahminler üretmelerini mümkün kılar. Bu durum, politika yapıcıların (hükümet veya endüstride) durumsal farkındalığa dayanarak yanıt vermek istedikleri ortamlarda önemli olabilir. Örneğin, doğal afetlere acil müdahaleyi yönlendirmek için sosyal medya verileri kullanılabilir (Castillo 2016) ve çeşitli farklı büyük veri kaynakları ekonomik faaliyetin gerçek zamanlı tahminlerini üretebilir (Choi and Varian 2012) .

Sonuç olarak, her zaman açık olan veri sistemleri araştırmacıların beklenmedik olayları incelemesine ve politika yapıcılara gerçek zamanlı bilgi sağlamasına olanak tanır. Bununla birlikte, her zaman açık olan veri sistemlerinin çok uzun süreler boyunca değişimleri izlemek için çok uygun olduğunu düşünmüyorum. Birçok büyük veri sistemleri sürekli daha sonra bölüm (bölüm 2.3.7) sürüklenmeye arayacağım süreci-bir değişiyor olmasıdır.