2.3.1.3 Non-tendaji

Vipimo ni kidogo sana uwezekano wa kubadili tabia katika vyanzo kubwa data.

Changamoto moja la utafiti wa kijamii ni kwamba watu wanaweza kubadili tabia zao wakati wanajua kwamba wao ni kuwa kuzingatiwa na watafiti. Wanasayansi ya jamii kwa ujumla wito huu mabadiliko ya tabia katika kukabiliana na mtafiti kipimo reactivity (Webb et al. 1966) . Moja ya sehemu ya data kubwa kwamba watu wengi mtafiti kupata kuahidi ni kwamba washiriki kwa ujumla hawatambui kwamba data zao ni kuwa alitekwa au wamekuwa hivyo wamezoea hii ukusanyaji wa takwimu kwamba hakuna tena mabadiliko ya tabia zao. Kwa sababu wao ni yasiyo ya tendaji, kwa hiyo, vyanzo vingi vya data kubwa inaweza kutumika kujifunza tabia ambayo haijawahi amendable kwa kipimo sahihi hapo awali. Kwa mfano, Stephens-Davidowitz (2014) kutumika kiwango cha maambukizi ya suala ubaguzi wa rangi katika maswali search injini kupima animus ubaguzi wa rangi katika mikoa mbalimbali ya Marekani. yasiyo ya tendaji na big (tazama sehemu ya awali) asili ya data search kuwezeshwa vipimo kwamba itakuwa vigumu kwa kutumia njia nyingine, kama vile tafiti.

Zisizo reactivity, hata hivyo, haina kuhakikisha kwamba data hizi ni kwa namna fulani moja kwa moja kutafakari ya tabia au mitazamo ya watu. Kwa mfano, kama kujibu moja aliiambia Newman et al. (2011) , "Siyo kwamba mimi si kuwa na matatizo, mimi tu si kuweka kwenye Facebook." Kwa maneno mengine, ingawa baadhi ya vyanzo kubwa data ni yasiyo ya tendaji, wao si daima bure ya kijamii desirability upendeleo , tabia ya watu kutaka kuwasilisha wenyewe kwa njia nzuri iwezekanavyo. Zaidi ya hayo, kama mimi itabidi kuelezea zaidi chini, hizi vyanzo data ni wakati mwingine wanashikiliwa na malengo ya wamiliki jukwaa, tatizo aitwaye algorithmic confounding (ilivyoelezwa zaidi hapo chini).

Ingawa zisizo reactivity ni faida kwa ajili ya utafiti, kufuatilia tabia ya watu bila ridhaa yao na ufahamu huwafufua wasiwasi kimaadili kujadiliwa chini na kwa undani katika sura ya 6. kuwepo kwa kuzorota kwa umma dhidi ya kuongezeka kwa ufuatiliaji digital inaweza kusababisha mifumo kubwa data kuwa zaidi tendaji baada ya muda, na nguvu wasiwasi kuhusu digital ufuatiliaji inaweza hata kusababisha baadhi ya watu kujaribu opt-out ya mifumo kubwa data kabisa, kuongeza wasiwasi kuhusu zisizo uwezo wa kuwakilishwa (ilivyoelezwa zaidi hapo chini).

Hawa watatu mali nzuri ya data kubwa kwa jamii ya utafiti-kubwa, daima-on, na yasiyo ya tendaji-kwa ujumla kutokea kwa sababu hizi vyanzo data hawakuumbwa na watafiti kwa ajili ya utafiti. Sasa, mimi itabidi kurejea kwa mali saba ya vyanzo kubwa data ambazo ni mbaya kwa utafiti. Makala haya pia huwa na kutokea kwa sababu data hii haikuwa kuundwa kwa watafiti kwa ajili ya utafiti.