2.3.1.2 항상에

항상에 빅 데이터 예상치 못한 이벤트를 실시간 측정에 대한 연구를 할 수 있습니다.

대부분의 빅 데이터 시스템은 항상 켜져; 그들은 지속적으로 데이터를 수집하고 있습니다. 이 상시 특징은 종 데이터와 연구자를 제공합니다 (즉, 시간이 지남에 따라 데이터). 항상-에있는 것은 연구에 대한 두 가지 중요한 의미를 가지고있다.

첫째, 항상 데이터 수집은 이전에는 불가능했던 방식으로 예기치 않은 사건을 연구하는 연구자 수 있습니다. 예를 들어, 2013 년 여름에 터키 게지 시위를 점령 공부에 관심이 연구자는 일반적으로 이벤트 기간 동안 시위대의 행동에 초점을 맞출 것입니다. Ceren 부닥과 던컨 와츠 (2015) 이전, 도중 트위터 사용 시위대를 연구하는 트위터의 항상 자연을 사용하여 더 많은 일을 할 수 있었다, 이벤트 후. 그리고, 그들은시 이전 (시위에 대해 트윗하지 않았거나 참가자) 비 참가자의 비교 그룹을 만들 수 있었다, 이벤트 후 (그림 2.1). 총 자신의 사후 패널은 2 년 동안 3만명의 트윗을 포함. 그들은 게지 시위에 참여 및 태도의 변화를 추정 할 가능성이 더 높았다 사람들이 어떤 종류의 추정 할 수 있었다 :이 다른 정보와 시위에서 일반적으로 사용되는 데이터를 보강하여 부닥 및 와트 훨씬 더 배울 수 있었다 참가자와 비 참가자들은 모두 단기적으로 (게지시에 사전 게지 비교) 및 장기적으로 (-게지를 작성하려면 사전 게지 비교).

그림 2.1 : 공부하는 부닥 및 와트 (2015)에 의해 사용되는 디자인은 트위터의 항상 자연을 이용하여 2013 년 여름에 터키 게지 시위를 점령, 연구자들은 약 포함 된 사후 패널라는 것을 만들어 2 년 동안 3만명. 반면에 시위 도중 참가자에 초점을 맞춘 전형적인 연구는 사후 패널은 이전과 이벤트 후시 이전에 비 참가자 2) 데이터, 이벤트 후 참가자 1) 데이터를 추가합니다. 이 풍부한 데이터 구조 (시에 사전 게지을 비교 단기적으로 둘 다 게지 시위에 참가할 참가자와 비 참가자의 태도의 변화를 추정 할 가능성이 더 높았다 사람들이 어떤 종류의 추정 부닥 및 와트를 사용 게지) 및 장기적으로 (비교 사전 게지에 게시-게지).

그림 2.1 :에서 사용하는 디자인 Budak and Watts (2015) 연구는 트위터의 항상 자연을 이용하여 2013 년 여름에 터키 게지 시위를 점령, 연구자들은 약 포함 된 사후 패널라는 것을 만들어 2 년 동안 3만명. 반면에 시위 도중 참가자에 초점을 맞춘 전형적인 연구는 사후 패널은 이전과 이벤트 후시 이전에 비 참가자 2) 데이터, 이벤트 후 참가자 1) 데이터를 추가합니다. 이 풍부한 데이터 구조 (시에 사전 게지을 비교 단기적으로 둘 다 게지 시위에 참가할 참가자와 비 참가자의 태도의 변화를 추정 할 가능성이 더 높았다 사람들이 어떤 종류의 추정 부닥 및 와트를 사용 게지) 및 장기적으로 (비교 사전 게지에 게시-게지).

이들 추정치의 일부가없이 수 있었던 것은 사실이다 상시 데이터 수집 소스 (예를 들어, 태도 변화의 장기 추정치) 30,000 명 등의 데이터 수집이 매우 비싼했을 않는다. 그리고, 심지어 무제한 예산을 주어, 나는 기본적으로 연구자가 시간을 거슬러 여행을 직접 과거에 참가자의 행동을 관찰 할 수있는 다른 방법을 생각할 수 없다. 가장 가까운 대안은 행동의 회고 보고서를 수집하는 것입니다,하지만이 보고서는 제한된 단위 및 의심 정확성이 될 것입니다. 표 2.1는 항상-에 데이터 소스 예기치 않은 사건을 연구하는 데 사용하는 연구의 다른 예제를 제공합니다.

표 2.1 : 상시 사용하여 큰 데이터 소스 예상치 못한 이벤트의 연구.
예기치 않은 이벤트 항상 데이터 소스 소환
터키 게지 차지 운동 지저귀다 Budak and Watts (2015)
홍콩 우산 시위 웨이 보 Zhang (2016)
뉴욕시에서 경찰의 총격 사건 보고서 - 및 - 몸수색을 중지 Legewie (2016)
사람 ISIS 가입 지저귀다 Magdy, Darwish, and Weber (2016)
2001년 9월 11일 공격 livejournal.com Cohn, Mehl, and Pennebaker (2004)
2001년 9월 11일 공격 호출기 메시지 Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

둘째, 항상 데이터 수집 정책 입안자는 단지 기존의 행동에서 배울뿐만 아니라 그것에 응답하지하려면 설정에서 중요 할 수있다 실시간 측정을 생산하기 위해 연구를 할 수 있습니다. 예를 들어, 소셜 미디어 데이터는 자연 재해에 대한 응답 안내 할 수 있습니다 (Castillo 2016) .

결론적으로, 항상 데이터 시스템은 예기치 않은 이벤트를 연구하고 정책 입안자에게 실시간 정보를 제공하기 위해 연구자 수 있습니다. 나는, 그러나, 항상-데이터 시스템은 오랜 기간 동안 변경 사항을 추적하기 위해 연구자을 사용하는 것이 제안하지 않았다. 많은 빅 데이터 시스템은 지속적으로 프로세스라는 드리프트 (제 2.3.2.4)-A를 변화 때문이다.