2.3 Sepuluh ciri umum data amba

Sumber data sing gedhe cenderung duwe sawetara ciri sing umum; sawetara sing umum apik kanggo riset sosial lan ana uga sing umum.

Sanajan saben sumber data gedhe béda, mbiyantu ngatonake yen ana ciri-ciri tartamtu sing cenderung kedadeyan maneh lan maneh. Mulane, tinimbang njupuk pendekatan platform-dening-platform (contone, apa sing sampeyan kudu ngerti babagan Twitter, kene sing perlu ngerti babagan data panelusuran Google, lan liya-liyane), aku bakal nemtokake sepuluh ciri umum saka gedhe sumber data. Mlumpat saka rincian saben sistem tartamtu lan ngerteni ciri-ciri umum iki mbisakake para panaliti supaya bisa sinau kanthi cepet babagan sumber data sing ana lan duwe gagasan ide sing mantep kanggo aplikasi sumber data sing bakal digawe ing mangsa ngarep.

Sanajan karakteristik data sing dikepengini gumantung marang tujuan paneliten, aku nemokake babagan mbiyantu ngelompokake ciri sepuluh kasebut ing rong kategori:

  • umume mbiyantu kanggo riset: gedhe, tansah-on, lan ora aktif
  • umum masalah kanggo riset: ora lengkap, ora bisa diakses, nonrepresentative, drifting, algorithmically confounded, reged, lan sensitif

Nalika aku njlentrehake ciri-ciri kasebut sampeyan bakal sok dong mirsani sing asring muncul amarga sumber data gedhe ora digawe kanggo tujuan riset.