2.3大數據的共同特徵

大數據源往往有十大特點;一些有利於社會的研究,有些是壞。

如果研究人員打算從大數據學習,他們沒有創造或收集,那麼他們必須了解它的一般特性。而不是通過平台的做法採取了一個平台(例如,這裡就是你需要知道的關於Twitter是什麼,這裡就是你需要知道的關於谷歌搜索數據等什麼),我將介紹大數據十個一般特徵,出現的特性因為數據沒有為社會研究的目的而創建。通過從每個特定系統的細節退一步,看著這些常規特性,研究人員可以迅速了解現有的數據源,並有一個堅定的一套想法應用到未來的數據源。

我發現它有助於群體的特點分為兩類:

  • 總體上是好的研究:大,永遠在線,無反應
  • 普遍不好研究:不全,交通不便,不​​具有代表性,漂流,算法混淆,人跡罕至,臟,敏感

從廣義上講,政府的行政記錄是不具有代表性,少算法混淆,少漂流。另一方面,業務管理記錄往往更大,更始終保持接通。