2.3 Nodweddion cyffredin o ddata mawr

Ffynonellau data Mawr yn tueddu i fod ddeg nodwedd; mae rhai yn dda ar gyfer ymchwil gymdeithasol ac mae rhai yn ddrwg.

Os ymchwilwyr yn mynd i ddysgu oddi wrth ddata mawr nad oeddent yn creu neu'n casglu, yna mae'n rhaid iddynt ddeall ei nodweddion cyffredinol. Yn hytrach na chymryd llwyfan gan ddull llwyfan (ee, dyma beth mae angen i chi ei wybod am Twitter, dyma beth mae angen i chi ei wybod am ddata chwilio Google, ac ati), yr wyf i'n mynd i ddisgrifio ddeg nodweddion cyffredinol o ddata mawr, nodweddion sy'n codi oherwydd nad oedd y data ei greu ar gyfer y diben o ymchwil gymdeithasol. Drwy gamu yn ôl o'r manylion pob system benodol ac edrych ar eiddo cyffredinol hyn, gall ymchwilwyr dysgu'n gyflym mwy am ffynonellau data presennol ac mae ganddynt set gadarn o syniadau i wneud cais i ffynonellau data yn y dyfodol.

Yr wyf yn ei chael yn ddefnyddiol i grŵp nodweddion yn ddau gategori:

  • gyffredinol dda ar gyfer ymchwil: mawr, bob amser yn-on, di-adweithiol
  • drwg yn gyffredinol ar gyfer ymchwil: anghyflawn, anhygyrch, di-gynrychiolydd, drifftio, gwaradwyddir algorithmically, anhygyrch, yn fudr, ac yn sensitif

Yn fras, cofnodion gweinyddol y llywodraeth yn llai heb fod yn gynrychiolydd, gwaradwyddir llai algorithmically, ac yn llai Drifting. Ar y llaw arall, cofnodion gweinyddol busnes yn tueddu i fod yn fwy ac yn fwy bob amser-ar.