2.3 빅 데이터의 10 가지 공통 특성

큰 데이터 소스는 공통된 특징을 갖는 경향이 있습니다. 일부는 일반적으로 사회 조사에 유용하며 일부는 일반적으로 좋지 않습니다.

각 큰 데이터 소스가 뚜렷하지만, 반복적으로 반복되는 특정 특성이 있음을 알아두면 도움이됩니다. 따라서 플랫폼 별 접근 방식 (예 : 여기 Twitter에 대해 알아야 할 사항, Google 검색 데이터 등에 대해 알아야 할 사항 등) 대신 큰 10 가지 특성을 설명합니다. 데이터 소스. 특정 시스템의 세부 사항을 단계별로 돌아가서 이러한 일반적인 특성을 살펴봄으로써 연구자는 기존 데이터 소스에 대해 신속하게 학습하고 향후 작성 될 데이터 소스에 적용 할 수있는 일련의 아이디어를 얻을 수 있습니다.

데이터 소스의 원하는 특성이 연구 목표에 따라 다르더라도 10 가지 특성을 크게 두 가지 범주로 그룹화하는 것이 도움이된다는 것을 알았습니다.

  • 일반적으로 연구에 도움이됩니다. 크고 항상 켜져 있으며 반응이 없습니다.
  • 일반적으로 연구에 문제가있다 : 불완전하고, 접근하기 어렵고, 대표성이없고, 표류하고, 알고리즘 적으로 혼란스럽고, 더럽고 민감하다.

이러한 특성을 설명 할 때 큰 데이터 소스가 연구 목적으로 생성되지 않았기 때문에 종종 발생한다는 것을 알 수 있습니다.