2.3.2.5 Algorithmically confounded

Giùlan ann a lorg nach eil dàta nàdarra, tha e air a stiùireadh leis an innleadaireachd amasan na siostaman.

Ged a tha mòran a lorg tobraichean dàta a tha neo-mheasaichte a chionn daoine nach eil mothachail air an dàta a thathar a chlàradh (Earrann 2.3.1.3), luchd-rannsachaidh Cha bu chòir beachdachadh air giùlan na loidhne ann an siostaman airson a bhith "nàdarra" no "fior-ghlan." Ann an da-rìribh, a ' didseatach shiostaman a 'chlàr giùlan gu mòr innleachadh airson adhbhar sònraichte giùlanan leithid bhith a' briogadh air sanasan no susbaint a phostadh. Tha dòighean anns a bheil na h-amasan aig an t-siostam dealbhachaidh a gabhail a-steach pàtrain a-steach dàta a ghairm algorithmic confounding. Algorithmic confounding tha an ìre mhath neo-aithnichte a-saidheans sòisealta, ach tha e na adhbhar dragh mòr am measg cùramach dàta luchd-saidheans. Agus, eu-coltach ri cuid de na duilgheadasan eile le comharran didseatach, algorithmic confounding tha gu ìre mhòr neo-fhaicsinneach.

Tha an ìre mhath sìmplidh mar eisimpleir de algorithmic confounding 'se gu bheil air Facebook tha an anomalously àireamh àrd de luchd-cleachdaidh le mu 20 caraidean (Ugander et al. 2011) . Tha luchd-saidheans a 'dèanamh anailis le dàta seo gun chead sam bith an tuigse air mar a tha Facebook ag obair dh'fhaodadh doubtlessly ghineadh mòran sgeulachdan mu dheidhinn mar a tha 20 air choireigin draoidheach sòisealta àireamh. Ach, Ugander agus a cho-obraichean bha susbainteach tuigse air a 'phròiseas a chruthachadh an dàta, agus bha fios aca gur Facebook a' brosnachadh dhaoine le beagan cheanglaichean air Facebook a 'dèanamh barrachd caraidean gus an do ràinig iad 20 caraidean. Ged Ugander agus co-oibrichean ag ràdh nach eil seo anns a 'phàipear, am poileasaidh seo a rèir coltais chaidh a chruthachadh le Facebook gus luchd-cleachdaidh ùr a bhrosnachadh gu bhith nas gnìomhaiche. Gun a bhith eòlach mu na bith a 'phoileasaidh seo, ge-tà, tha e furasta a tharruing an co-dhùnadh ceàrr bho an dàta. Ann am briathran eile, na iongnadh àireamh àrd de dhaoine le mu 20 caraidean ag innse dhuinn tuilleadh mu Facebook daonna na giùlan.

Tuilleadh pernicious na seo roimhe mar eisimpleir far a bheil algorithmic confounding dhèanamh annasach thoradh gun cùramach rannsachaidh a dh'fhaodadh sgrùdadh a bharrachd, tha fiù 's bu doirbhe dreach de algorithmic confounding sin a' tachairt nuair a dheilbh loidhne siostaman a tha mothachail air sòisealta teòraidhean agus an uair sin a 'fuine na teòiridhean a-steach an-obrach siostaman aca. Sòisealta saidheans fòn performativity seo: nuair a smuaintean air atharrachadh an t-saoghail ann an leithid de dhòigh agus gu bheil iad a 'toirt an t-saoghail tuilleadh loidhne a-steach leis an teòiridh. Ann an cùisean performative algorithmic confounding, an confounded nàdar an dàta e coltach neo-fhaicsinneach.

Aon eisimpleir de phàtran a chruthachadh le performativity tha transitivity ann an loidhne lìonraidhean sòisealta. Anns na 1970an agus na 1980an, luchd-rannsachaidh tric lorg gu bheil ma tha thu caraidean le Alice agus tha thu caraidean le Bob, agus an uair sin Bob Alice tha nas buailtiche a bhith caraidean le chèile na dà thaghadh air thuaiream daoine. Agus, seo fìor aon phàtran a chaidh a lorg ann an sòisealta graf air Facebook (Ugander et al. 2011) . Mar sin, dh'fhaodadh aon cho-dhùnadh gu bheil pàtrain càirdeas air Facebook amhladh pàtrain offline chàirdeas, co-dhiù a thaobh transitivity. Ach, meud an transitivity ann an Facebook sòisealta graf Tha pàirt air a stiùireadh le algorithmic confounding. 'S e sin, aig Facebook dàta luchd-saidheans eòlach a' deuchainneach agus rannsachadh teòiridheach mu transitivity agus an uair sin a dhèanamh de dh'fhuine i a-steach mar a tha Facebook ag obair. Tha Facebook "Tha daoine a bhios fios agaibh" feart gu bheil a 'moladh caraidean ùra, agus aon dòigh anns a bheil Facebook a' co-dhùnadh a mholadh dhuibh e transitivity. Is e sin, Facebook tha e nas coltaiche gu robh thu 'nad charaid do caraidean do charaidean. Am feart seo agus mar sin tha a 'bhuaidh a bha aig a' meudachadh transitivity ann an Facebook sòisealta graf; ann am facail eile, an teòiridh transitivity an t-saoghail a 'toirt a-steach loidhne leis a' ro-innse air an teòiridh (Healy 2015) . Mar sin, nuair mòr tobraichean dàta coltach gu gintinn ro-innsean sòisealta teòiridh, feumaidh sinn a bhith cinnteach gu bheil an teòiridh fhèin nach robh a 'fuine a-steach mar a tha an siostam ag obair.

Seach a bhith a 'smaoineachadh air mòr tobraichean dàta mar ag amharc air daoine ann an suidheachadh nàdarrach, nas ullamh meatafor a tha ag amharc air daoine ann an Casino. Casinoan tha fìor innleachadh àrainneachdan a dhealbhadh gus ar cuid giùlain, agus cha bhiodh luchd-rannsachaidh an dùil gu bheil giùlan ann an Casino Bheireadh unfettered uinneig a-steach daonna giùlan. Gu dearbh, b 'urrainn dhuinn rudeigin ionnsachadh mun daonna giùlan ag ionnsachadh dhaoine ann an casinoan-ann gu dearbh a' chasino a dh'fhaodadh a bhith na shàr suidheachadh airson 'dèanamh an dàimh eadar dheoch-làidir agus cunnart Roghainnean-ach ma tha sinn a leigeil seachad gu bheil an dàta a bhathar a chruthachadh ann an Casino sinn a dh' fhaodadh a 'tarraing cuid de dhroch cho-dhùnaidhean.

Gu mì-fhortanach, a 'dèiligeadh ri algorithmic confounding tha e gu sònraichte duilich a chionn mòran dhe na feartan air-loidhne a tha siostaman dìlseanach, a dhroch sgrìobhadh, agus a' sìor atharrachadh. Mar eisimpleir, mar a tha mi a mhìneachadh nas fhaide air adhart sa chaibideil seo, algorithmic confounding bha aon ghabhas mìneachadh airson mean air mhean briseadh-sìos de Google a 'chnatain mhòir Pàtrain (Earrann 2.4.2), ach tha an tagradh seo bha cruaidh gus measadh a dhèanamh air sgàth an taobh a-staigh obair rannsachadh Ghoogle algairim tha dìlseanach. Tha nàdar innsgineach de algorithmic confounding tha aon riochd siostam drift. Algorithmic confounding a 'ciallachadh gum bu chòir dhuinn a bhith cùramach mu sam bith tagradh airson daonna giùlan sin a' tighinn bho aon siostam didseatach, ge bith dè cho mòr.