2.3.2.3 Di-gynrychiolydd

Dwy ffynhonnell nad ydynt yn cynrychioldeb yn wahanol boblogaethau a gwahanol batrymau defnydd.

data Big tueddu i gael eu tuedd systematig mewn dwy brif ffordd. Nid oes angen i hyn achosi problem ar gyfer pob math o ddadansoddiad, ond am ryw dadansoddiad gall fod yn nam beirniadol.

Mae ffynhonnell gyntaf o ragfarn systematig yw bod y bobl eu dal fel arfer nid bydysawd cyflawn o'r holl bobl neu sampl ar hap o unrhyw boblogaeth benodol. Er enghraifft, nid Americanwyr ar Twitter yn sampl ar hap o Americanwyr (Hargittai 2015) . Mae ail ffynhonnell o ragfarn systematig yw bod llawer o systemau data mawr cipio camau gweithredu, ac mae rhai pobl yn cyfrannu llawer mwy o gamau gweithredu nag eraill. Er enghraifft, mae rhai pobl ar Twitter gyfrannu gannoedd o weithiau yn fwy tweets nag eraill. Felly, gall y digwyddiadau ar lwyfan penodol fod myfyriol erioed yn drymach o rai is-grwpiau na'r llwyfan ei hun.

Fel arfer mae ymchwilwyr eisiau gwybod llawer am y data sydd ganddynt. Ond, o gofio natur heb fod yn gynrychioliadol o ddata mawr, mae'n ddefnyddiol hefyd i troi eich ffordd o feddwl. Mae angen i chi hefyd wybod llawer am y data nad oes gennych. Mae hyn yn arbennig o wir pan fydd y data nad oes gennych yn systematig wahanol i'r data y byddwch yn ei gael. Er enghraifft, os oes gennych gofnodion galwad gan gwmni ffôn symudol mewn gwledydd sy'n datblygu, dylech feddwl nid yn unig am y bobl yn eich set ddata, ond hefyd am y bobl a allai fod yn rhy dlawd i fod yn berchen ar ffôn symudol. Ymhellach, ym Mhennod 3, byddwn yn dysgu am sut y pwysoliad galluogi ymchwilwyr i wneud amcangyfrifon gwell o ddata nad ydynt yn gynrychioliadol.