2.3ビッグデータの一般的な特性

ビッグデータ・ソースは、10の特性を有する傾向があります。いくつかは、社会調査のための優れている、いくつかは悪いです。

研究者は、彼らが作成または収集することはありませんでしたことをビッグデータから学習しようとしている場合、彼らはその一般的な特性を理解する必要があります。むしろプラットフォーム・アプローチにより、プラットフォームを取るよりも(例えば、ここでは、Twitterについて知っておくべきことですが、ここではなど、Googleの検索データについて知っておくべきです)、私は、ビッグデータの10の一般的な特性を説明するつもりですが生じる特性データは、社会調査の目的のために作成されなかったため。各特定のシステムの詳細からバックステッピングと、これらの一般的なプロパティを見ることで、研究者はすぐに既存のデータソースについての詳細を学び、将来のデータソースに適用するためのアイデアをしっかりセットを持つことができます。

私は2つのカテゴリに特性のグループにそれが参考します:

  • 研究のための一般的に良い:ビッグ、常時オン、非反応性
  • 一般的に研究に悪い:不完全、アクセス不能、非代表、漂流、アルゴリズム的混乱、アクセスできない、汚い、と敏感

大まかに言えば、政府行政記録は少ない非代表、少ないアルゴリズム混乱、およびより少ない漂流しています。一方、ビジネス行政記録は、常時オン大きく、よりになる傾向があります。