2.3.8 Mearbhall go huimhíoch

Níl an iompar i gcórais sonraí mór nádúrtha; tá sé á threorú ag spriocanna innealtóireachta na gcóras.

Cé go bhfuil go leor foinsí sonraí móra neamhghníomhacha toisc nach bhfuil a fhios ag daoine nach bhfuil a gcuid sonraí á dtaifeadadh (roinn 2.3.3), níor cheart go ndéanfadh taighdeoirí iompar sna córais ar líne seo "go nádúrtha." Go deimhin, is iad na córais dhigiteacha a thaifeadann iompar iad ard-innealtóireacht chun iompar ar leith a chothú, mar shampla cliceáil ar fhógraí nó ábhar a phostáil. Is iad na bealaí inar féidir le spriocanna na ndearthóirí córais patrúin a thabhairt isteach i sonraí a dtugtar confound algorithmic . Ní bhíonn eolaithe sóisialta réasúnta ar eolaithe sóisialta, ach is mór imní é eolaithe cúraimí sonraí. Agus, murab ionann agus cuid de na fadhbanna eile a bhfuil rianta digiteacha ann, níl sé dofheicthe den chuid is mó ó thaobh algoramhach.

Sampla réasúnta simplí a bhaineann le hábhar halgartaíochta ná go bhfuil líon mór úsáideoirí ar Facebook ann le timpeall 20 chairde, mar a d'aimsigh Johan Ugander agus comhghleacaithe (2011) . D'fhéadfadh eolaithe a dhéanann anailís ar na sonraí seo gan aon thuiscint ar conas a oibríonn Facebook a lán scéalta a ghiniúint faoi conas is ionann cineál 20 de líon sóisialta draíochta. Ar an drochuair, bhí tuiscint mhór ag Ugander agus a chomhghleacaithe ar an bpróiseas a ghiniúint na sonraí, agus bhí a fhios acu go spreagfadh Facebook le daoine a bhfuil beagán naisc acu ar Facebook chun cairde níos mó a dhéanamh go dtí go bhfuair siad 20 chairde. Cé nach n-éiríonn Ugander agus comhghleacaithe seo ina bpáipéar, b'fhéidir gur chruthaigh Facebook an beartas seo chun úsáideoirí nua a spreagadh chun bheith níos gníomhaí. Gan a fhios agam go bhfuil an beartas seo ann, áfach, tá sé éasca an gconclúid mícheart a tharraingt ó na sonraí. I bhfocail eile, tugann an líon iontasach daoine a bhfuil thart ar 20 cairde in iúl dúinn níos mó faoi Facebook ná mar gheall ar iompar daonna.

Sa sampla seo roimhe seo, d'eascair as a chéile go raibh drochthionchar algartamach ann gur féidir le taighdeoir cúramach breis a bhrath agus a imscrúdú. Mar sin féin, tá leagan fiú níos deacra de dhlúthdhleathachas halgartaíochta a tharlaíonn nuair a bhíonn dearthóirí na gcóras ar líne ar an eolas faoi theoiricí sóisialta agus ansin na teoiricí seo a bhácáil i gcuid oibre a gcóras. Glaonn eolaithe sóisialta ar an gcumas seo: nuair a athraíonn teoiric ar fud an domhain ar bhealach a chuirfidh sé an domhan i gcomhréir leis an teoiric. I gcás comhdhéanamh algartamach taibheach, tá an-deacair nádúr mearbhall na sonraí a bhrath.

Sampla amháin de phátrún a chruthaítear trí fheidhmíocht ná idirthurasacht i líonraí sóisialta ar líne. Sna 1970í agus sna 1980idí, aimsigh taighdeoirí arís agus arís eile go bhfuil Alice agus Bob níos mó seans go mbeifeá ina chairde lena chéile seachas dá mba daoine a roghnaíodh go randamach iad dá mba Alice agus Bob iad araon. Fuarthas an patrún céanna seo sa ghraf sóisialta ar Facebook (Ugander et al. 2011) . Dá bhrí sin, d'fhéadfadh duine a thabhairt i gcrích go n-athraíonn patrúin cairdeas ar Facebook patrúin cairdeas as líne, ar a laghad i dtéarmaí iompair. Mar sin féin, tá méid iomarcachta sa ghraf sóisialta Facebook tiomanta go páirteach ag confound algorithmic. Is é sin ná go raibh a fhios ag eolaithe sonraí ag Facebook ar an taighde eimpíreach agus teoiriciúil faoi iomparacht agus ansin bácáil sé ar conas a oibríonn Facebook. Tá gné ag "Facebook a D'fhéadfadh a fhios agat" ag Facebook a thugann le fios do chairde nua, agus ar bhealach amháin a chinneann Facebook cé a thugann le fios duit go bhfuil sé iomarcach. Is é sin, is dóichí go gcuirfí le Facebook go bhfuil tú cairde le cairde do chairde. Dá bhrí sin, tá sé mar thoradh ar an ngné seo iomarcacht a mhéadú i ngraf sóisialta Facebook; i bhfocail eile, tugann an teoiric transitivity an domhan i gcomhréir leis na tuartha ar an teoiric (Zignani et al. 2014; Healy 2015) . Dá bhrí sin, nuair a dhealraíonn foinsí sonraí móra tuartha ar theoiric shóisialta a atáirgeadh, ní mór dúinn a bheith cinnte nach ndearnadh an teoiric féin a bhácáilte ar an gcaoi a d'oibrigh an córas.

In áit a bheith ag smaoineamh ar fhoinsí móra sonraí mar bhreathnú a dhéanamh ar dhaoine i suíomh nádúrtha, tá meatar níos oiriúnaí ag breathnú ar dhaoine i gcásín. Tá timpeallachtaí an-innealtóireachta ag casinos a ceapadh chun iompar áirithe a spreagadh, agus ní bheadh ​​súil ag taighdeoir iompar i gcásín chun fuinneog neamhchinnte a chur ar fáil d'iompraíocht an duine. Ar ndóigh, d'fhéadfá rud éigin a fhoghlaim faoi iompraíocht an duine trí staidéar a dhéanamh ar dhaoine i gceasaíneonna, ach má thug tú neamhaird ar an bhfíric go raibh na sonraí á gcruthú i gcásín, d'fhéadfá drochchonclúidí a tharraingt.

Ar an drochuair, tá an-deacair ag déileáil le hamhlú halgartaíochta mar go bhfuil go leor gnéithe de chórais ar líne dílseánaigh, droch-dhoiciméadú, agus ag athrú i gcónaí. Mar shampla, mar a mhínigh mé ina dhiaidh sin sa chaibidil seo, ba mhíniú amháin a d'fhéadfaí a dhéanamh ar an gclúdach algoramhach ar mhaithe le briseadh síos de réir Fliú Treochtaí Google (roinn 2.4.2), ach bhí an t-éileamh seo deacair a mheas mar go bhfuil obair inmheánach algartam cuardaigh Google ann dílseánaigh. Is é an cineál dinimiciúil atá ag confound algartamach ná cineál amháin de shruth an chórais. Ciallaíonn confounding algorithmic gur chóir dúinn a bheith cúramach faoi aon éileamh maidir le hiompar daonna a thagann ó chóras digiteach aonair, is cuma cé chomh mór.