2.3.2.5 algorithmically kawirangan

Prilaku ing data ketemu ora alam, iku mimpin dening gol engineering saka sistem.

Senajan akeh sumber data ketemu sing non-reaktif amarga wong ora weruh data sing kang direkam (Section 2.3.1.3), peneliti ora kudu nimbang prilaku ing sistem online dadi "alami" utawa "murni." Ing kasunyatan, ing sistem digital sing prilaku rekaman sing Highly dirancang kanggo panggawe tindak tanduk tartamtu kayata ngeklik ing iklan utawa posting isi. Cara sing gol saka perancang sistem bisa introduce pola menyang data diarani confounding algoritma. confounding algoritma punika relatif ora dingerteni kanggo ilmuwan sosial, nanging punika badhan utama antarane ilmuwan data ati. Lan, kados sawetara masalah karo ngambah digital, confounding algoritma iki umumé katon.

Conto relatif prasaja saka confounding algoritma iki kasunyatan sing ing Facebook ana nomer anomalously dhuwur saka panganggo kira-kira 20 kanca (Ugander et al. 2011) . Ilmuwan nganalisa karo data iki tanpa pangerten carane Facebook dianggo diyakini bisa generate akeh crita bab carane 20 sawetara jenis nomer sosial gaib. Nanging, Ugander lan kolega wis pangerten substansial saka proses sing kui data, lan padha sumurup Facebook diwanti-wanti wong sawetara sambungan ing Facebook kanggo nggawe kanca liyane nganti tekan 20 kanca. Senajan Ugander lan kolega ora ngomong iki ing kertas, privasi iki minangka digawe dening Facebook supaya kasurung kedhaftar anyar kanggo dadi luwih aktif. Tanpa ngerti bab wontenipun kawicaksanan iki, Nanging, iku gampang kanggo tarik kesimpulan salah saka data. Ing tembung liyane, nomer kaget dhuwur saka wong bab 20 kanca ngandhani liyane babagan Facebook saka prilaku manungsa.

More pernicious saka conto sadurungé iki ngendi confounding algoritma diprodhuksi asil quirky sing peneliti ati bisa neliti luwih, ana sing versi malah trickier saka confounding algoritma sing occurs nalika perancang sistem online sing weruh saka teori lan banjur panggangan teori iki menyang digunakake sing sistem. Ilmuwan sosial nelpon performativity iki: nalika teori ngganti donya ing kuwi cara sing padha nggawa donya liyane menyang baris karo teori. Ing kasus confounding algoritma performative, alam kawirangan saka data ing kamungkinan siro.

Tuladha saka pola digawe dening performativity punika transitivity ing jaringan sosial online. Ing taun 1970-an lan 1980-an, peneliti bola-bali ketemu sing yen kekancan karo Alice lan sing kanca-kanca karo Bob, banjur Bob lan Alice luwih kamungkinan kanggo dadi kanca karo saben liyane saka wong loro milih acak. Lan, pola banget padha ketemu ing graph sosial ing Facebook (Ugander et al. 2011) . Mangkono, siji bisa nganakke sing pola Persahabatan ing Facebook nurun pola friendships offline, ing paling ing syarat-syarat transitivity. Nanging, gedhene transitivity ing graph sosial Facebook sebagian mimpin dening confounding algoritma. Sing, data ilmuwan ing Facebook sumurup saka riset empiris lan teori babagan transitivity banjur baking menyang carane Facebook dianggo. Facebook wis "Wong Sampeyan Muga Ngerti" fitur sing tabet kanca anyar, lan salah siji cara sing Facebook nemtokaken sing kanggo suggest kanggo kowe transitivity. Kang, Facebook luwih kamungkinan kanggo suggest sing dadi kanca karo kanca-kanca saka kanca-kanca. Fitur iki saéngga nduweni pengaruh saka nambah transitivity ing graph sosial Facebook; ing tembung liyane, téori transitivity ndadekke donya menyang baris karo ramalan saka teori (Healy 2015) . Wau, nalika sumber data amba katon ngasilaken ramalan teori sosial, kita kudu manawa teori iku ora panggang menyang carane sistem makarya.

Luwih saka mikir saka sumber data amba minangka ngisi wong ing setelan alam, kiasan luwih cocok wis ngisi wong ing casino. Casinos Highly dirancang lingkungan dirancang kanggo panggawe tindak tanduk tartamtu, lan peneliti tau nyana yen prilaku ing casino bakal nyedhiyani jendhela unfettered menyang prilaku manungsa. Mesti wae, kita bisa sinau soko bab prilaku sinau wong manungsa ing kasino-nyatane casino uga setelan becik kanggo sinau hubungan antarane konsumsi alkohol lan resiko pilihan-nanging yen kita digatèkaké sing data iki kang digawe ing casino kita bisa cidhuken Serat ala.

Sayange, dealing with confounding algoritma iki utamané angel amarga akeh fitur saka sistem online sing tertutup, lingkungan nyathet, lan saya ganti. Contone, kaya aku bakal nerangake mengko ing bab iki, confounding algoritma iki siji panjelasan sing mungkin kanggo bertahap break-mudhun saka Google Flu Trends (Section 2.4.2), nanging klaim iki ana hard kanggo netepke amarga workings utama saka Google algoritma sing tertutup. Umumé dinamis confounding algoritma salah siji wangun sistem mabur. confounding algoritma tegese kita kudu ngati-ati bab apa pratelan prilaku manungsa sing asalé saka sistem digital single, ora prakara cara amba.