2.3.8 Algorithmically confounded

Ang kinaiya sa dagkong sistema sa datos dili natural; kini gipadagan sa mga tumong sa engineering sa mga sistema.

Bisan tuod daghang mga tinubdan sa datos ang dili aktibo tungod kay ang mga tawo wala mahibalo nga ang ilang datos gitala (seksyon 2.3.3), ang mga tigdukiduki kinahanglan dili mag-isip sa kinaiya niining mga online nga sistema nga "natural nga nahitabo." Sa pagkatinuod, ang mga digital nga sistema nga nagrekord sa kinaiya kaayo nga gihimong engineered aron mapukaw ang piho nga kinaiya sama sa pag-klik sa mga patalastas o pag-post content. Ang mga paagi nga ang mga tumong sa mga tigdisenyo sa sistema makahimo sa pagpaila sa mga sumbanan ngadto sa datos gitawag nga algorithmic confounding . Ang pagkalibog sa algoritmiko wala kaayo mahibal-an sa mga sosyal nga siyentipiko, apan usa kini ka dakong kabalaka sa mga maalam nga datos nga mga siyentista. Ug, dili sama sa uban nga mga suliran nga adunay digital nga mga timailhan, ang pagkalibang sa algorithm dili makita.

Ang usa ka simple nga pananglitan sa algorithmic confounding mao ang kamatuoran nga sa Facebook adunay anomalously taas nga gidaghanon sa mga tiggamit uban sa gibana-bana nga 20 mga higala, ingon nga nadiskobrehan sa Johan Ugander ug mga kauban (2011) . Ang mga siyentista nga nag-analisar niini nga kasayuran nga walay bisan unsa nga pagsabut kon sa unsang paagi ang mga buhat sa Facebook sa walay duhaduha makamugna og daghan nga mga sugilanon mahitungod kon unsa ang 20 usa ka matang sa sosyal nga numero sa kaanyag Maayo na lang, Ugander ug iyang mga kaubanan adunay igong pagsabot sa proseso nga nakamugna sa datos, ug nahibal-an nila nga ang Facebook nagdasig sa mga tawo nga dunay pipila ka mga koneksyon sa Facebook aron makabaton og dugang nga mga higala hangtud nga sila nakaabut sa 20 ka mga higala. Bisan tuod ang Ugander ug mga kaubanan wala moingon niini sa ilang papel, kini nga palisiya gituohan nga gimugna sa Facebook aron madasig ang bag-ong mga tiggamit nga mahimong mas aktibo. Apan, kon wala'y kahibalo mahitungod sa paglungtad sa niini nga palisiya, sayon ​​ang pag-drawing sa sayop nga konklusyon gikan sa datos. Sa laing pagkasulti, ang katingala nga taas nga gidaghanon sa mga tawo nga dunay mga 20 ka mga higala nagsulti kanato og dugang mahitungod sa Facebook kaysa sa tawhanong kinaiya.

Niining miaging pananglitan, ang pagkalibog sa algorithm naghatag og usa ka resulta nga usa ka maid-id nga tigdukiduki nga makamatikod ug makasusi pa. Bisan pa, dunay usa ka mas maliputon nga bersyon sa algorithmic confounding nga mahitabo sa diha nga ang mga tigdesinyo sa mga online nga sistema nahibalo sa sosyal nga mga teorya ug dayon giluto kining mga teyorya ngadto sa pagtrabaho sa ilang mga sistema. Ang mga sosyal nga siyentipiko nagtawag niini nga paghimo : kung ang usa ka teorya mag-usab sa kalibutan sa ingon nga paagi nga kini makadala sa kalibutan nga labaw pa sa linya sa teorya. Sa kaso sa pagpanghimo sa algorithmic, ang kalibog nga kinaiya sa datos lisud kaayo nga makita.

Ang usa ka panig-ingnan sa usa ka sumbanan nga gihimo sa pagkamapasundayag mao ang transitivity sa social network sa internet. Sa mga tuig 1970 ug 1980, ang mga tigdukiduki balikbalik nga nakit-an nga kon ikaw higala uban ni Alice ug Bob, unya si Alice ug Bob mas lagmit nga managhigala sa usag usa kay sa kung duha sila nga mga pinili nga tawo. Ang mao gihapon nga sumbanan nakit-an sa social graph sa Facebook (Ugander et al. 2011) . Busa, ang usa makahinapos nga ang mga sumbanan sa panaghigalaay sa Facebook nag-usab sa mga sumbanan sa mga panaghigalaay sa gawas sa kalibutan, bisan sa mga termino sa transitivity. Bisan pa, ang kadako sa transitivity sa social graph sa Facebook bahin nga gimaneho sa algorithmic confounding. Kana, ang mga datos nga mga siyentipiko sa Facebook nasayud sa empirical ug theoretical nga panukiduki mahitungod sa transitivity ug dayon nagluto niini kung giunsa ang Facebook nagtrabaho. Ang Facebook may usa ka "Mga Tawo nga Mahimong Mahibaloan" nga nagpaila sa bag-ong mga higala, ug usa ka paagi nga ang Facebook mohukom kon kinsa ang mosugyot nga ikaw usa ka transitivity. Kana, ang Facebook mas lagmit nga mosugyot nga ikaw mahimong higala sa mga higala sa imong mga higala. Tungod niini nga bahin adunay epekto sa pagdugang sa transitivity sa Facebook social graph; sa laing mga pulong, ang teoriya sa transitivity nagdala sa kalibutan sa linya sa mga panagna sa teorya (Zignani et al. 2014; Healy 2015) . Busa, sa diha nga ang dagkong mga tinubdan sa datos nagpakita sa paghatag sa mga panagna sa sosyal nga teorya, kinahanglan gayud nga masiguro nato nga ang teoriya mismo wala maugdaw kon giunsa ang sistema nagtrabaho.

Imbes maghunahuna sa mga tinubdan nga dunay impormasyon sama sa pag-obserbar sa mga tawo sa kinaiyanhon nga kahimtang, ang usa ka mas haom nga metapora mao ang pagtan-aw sa mga tawo sa casino. Ang mga casino mga inhinyero nga maayo ang pagkahan-ay nga gihimo aron sa pagdani sa pipila nga mga kinaiya, ug ang usa ka tigdukiduki dili magdahum nga ang kinaiya sa usa ka kasino maghatag sa usa ka dili mapapas nga bintana ngadto sa kinaiya sa tawo. Siyempre, makat-on ka sa usa ka butang mahitungod sa kinaiya sa tawo pinaagi sa pagtuon sa mga tawo sa mga kasino, apan kung wala nimo panumbalinga nga ang datos gibuhat sa usa ka kasino, mahimo ka nga magdala og dili maayo nga mga konklusyon.

Ikasubo, ang pag-atubang sa algorithmic confounding ilabi na lisud tungod kay daghang mga bahin sa online nga mga sistema ang adunay proprietary, dili maayo nga dokumentado, ug kanunay nga nag-usab. Pananglitan, ingon sa akong gipatin-aw sa ulahi niining kapituloha, ang pagsagol sa algorithm mao ang usa ka posible nga katin-awan alang sa hinay-hinay nga pagkahugno sa Google Flu Trends (seksyon 2.4.2), apan kini nga pag-angkon lisud mahibal-an tungod kay ang sulod nga mga pamaagi sa Google search algorithm proprietary. Ang dinamikong kinaiya sa algorithmic confounding usa ka matang sa drift system. Ang pagkalibog sa algorithmic nagpasabot nga kita kinahanglan magbinantayon mahitungod sa bisan unsang pag-angkon mahitungod sa kinaiya sa tawo nga naggikan sa usa ka digital nga sistema, dili igsapayan.