2.3 빅 데이터의 일반적인 특성

큰 데이터 소스는 열 특성을 갖는 경향이있다; 일부는 사회 연구를위한 좋은 일부는 나쁘다.

연구자들이 만들거나 수집하지 않았다 빅 데이터에서 배울려고하는 경우에, 그들은 그것의 일반적인 특성을 이해해야합니다. 오히려 플랫폼 방식으로 플랫폼을 복용보다 (예를 들어, 여기 당신이 트위터에 대해 알아야 할 무엇, 여기 당신이 Google 검색 데이터 등에 대해 알아야 할 기능), I는 빅 데이터의 열 일반적인 특성, 발생 특성을 설명하는거야 데이터는 사회 연구의 목적을 위해 생성되지 않았기 때문에. 각각의 특정 시스템의 세부 사항에서 돌아 스테핑 이러한 일반 특성을 조사하여 연구자들은 신속하게 기존의 데이터 소스에 대한 자세한 내용 및 미래의 데이터 소스에 적용 할 아이디어의 확고한 세트를 가질 수 있습니다.

나는 그룹 두 가지 범주로 특성이 도움이 :

  • 연구에 일반적으로 좋은 : 큰-에 항상 비 반응성
  • 일반적으로 연구에 나쁜 : 불완전, 액세스, 비 대표, 표류, 알고리즘, 접근 할 수없는 더러운, 민감한 혼동

넓게 말하면, 정부 관리 기록은 적은 비 대표, 이하 알고리즘 혼동, 덜 표류 있습니다. 한편, 영업 관리 기록은 상시 더 많은 경향이있다.