2.3.8 algorithmig

Nid yw ymddygiad mewn systemau data mawr yn naturiol; mae'n cael ei yrru gan nodau peirianneg y systemau.

Er bod llawer o ffynonellau data mawr yn anweithredol oherwydd nad yw pobl yn ymwybodol bod eu data yn cael ei gofnodi (adran 2.3.3), ni ddylai ymchwilwyr ystyried bod ymddygiad yn y systemau ar-lein hyn yn digwydd yn naturiol. "Mewn gwirionedd, mae'r systemau digidol sy'n cofnodi ymddygiad yn peirianneg uchel i ysgogi ymddygiadau penodol megis clicio ar hysbysebion neu bostio cynnwys. Mae'r ffyrdd y gall nodau dylunwyr y system gyflwyno patrymau yn ddata eu galw'n ddamcaniaeth algorithmig . Mae anghydfod algorithmig yn gymharol anhysbys i wyddonwyr cymdeithasol, ond mae'n bryder mawr ymhlith gwyddonwyr data gofalus. Ac, yn wahanol i rai o'r problemau eraill sydd â olion digidol, yn anweledig i raddau helaeth yn algorithmig.

Enghraifft gymharol syml o ddryslyd algorithmig yw'r ffaith bod nifer anomalus o ddefnyddwyr ar Facebook yn cynnwys tua 20 o ffrindiau, fel y darganfuwyd gan Johan Ugander a chydweithwyr (2011) . Gallai gwyddonwyr sy'n dadansoddi'r data hwn heb unrhyw ddealltwriaeth o sut y mae Facebook yn gweithio, yn ddiffygiol, gynhyrchu llawer o straeon am sut mae 20 yn rhyw fath o rif cymdeithasol hudol. Yn ffodus, roedd gan Ugander a'i gydweithwyr ddealltwriaeth sylweddol o'r broses a gynhyrchodd y data, ac roedden nhw'n gwybod bod Facebook yn annog pobl â phrin gysylltiadau ar Facebook i wneud mwy o ffrindiau nes iddynt gyrraedd 20 ffrind. Er nad yw Ugander a chydweithwyr yn dweud hyn yn eu papur, mae'n debyg y crewyd y polisi hwn gan Facebook er mwyn annog defnyddwyr newydd i ddod yn fwy egnïol. Heb wybod am fodolaeth y polisi hwn, fodd bynnag, mae'n hawdd tynnu casgliad anghywir o'r data. Mewn geiriau eraill, mae'r nifer syndod o uchel o bobl â rhyw 20 o ffrindiau yn dweud mwy wrthym am Facebook nag am ymddygiad dynol.

Yn yr enghraifft flaenorol hon, roedd dryswch algorithmig wedi cynhyrchu canlyniad cryno y gallai ymchwilydd gofalus ei ganfod a'i ymchwilio ymhellach. Fodd bynnag, mae yna fersiwn hyd yn oed anoddach o ddryslyd algorithmig sy'n digwydd pan fydd dylunwyr systemau ar-lein yn ymwybodol o theorïau cymdeithasol ac yna'n deffro'r damcaniaethau hyn i weithrediad eu systemau. Mae gwyddonwyr cymdeithasol yn galw'r perfformrwydd hwn: pan fydd theori'n newid y byd mewn modd sy'n dod â'r byd yn fwy unol â'r theori. Yn achos gwrthdaro algorithmig perfformiadol, mae'n anodd iawn canfod natur ddryslyd y data.

Un enghraifft o batrwm a grëir gan berfformgarwch yw trawsleddedd mewn rhwydweithiau cymdeithasol ar-lein. Yn yr 1970au a'r 1980au, canfu'r ymchwilwyr dro ar ôl tro, os ydych chi'n ffrindiau â Alice a Bob, yna mae Alice a Bob yn fwy tebygol o fod yn ffrindiau â'i gilydd na phe baent yn ddau o bobl a ddewiswyd ar hap. Canfuwyd yr un patrwm hwn yn y graff cymdeithasol ar Facebook (Ugander et al. 2011) . Felly, gallai un ddod i'r casgliad bod patrymau cyfeillgarwch ar Facebook yn dyblygu patrymau cyfeillgarwch all-lein, o leiaf yn nhermau transitivity. Fodd bynnag, mae maint trawsleddedd yn y graff cymdeithasol Facebook yn cael ei yrru'n rhannol gan ddryslyd algorithmig. Hynny yw, gwyddonwyr data ar Facebook yn gwybod am yr ymchwil empirig a damcaniaethol ynglŷn â thrawsledd ac yna'n ei bacio i mewn i sut mae Facebook yn gweithio. Mae gan Facebook nodwedd "People You May Know" sy'n awgrymu ffrindiau newydd, ac un ffordd y mae Facebook yn penderfynu pwy i'w awgrymu yw trawsrywedd. Hynny yw, mae Facebook yn fwy tebygol o awgrymu eich bod yn dod yn ffrindiau gyda ffrindiau eich ffrindiau. Felly mae gan y nodwedd hon effaith cynyddu trawsleddedd yn y graff cymdeithasol Facebook; mewn geiriau eraill, mae'r theori trawsnewidiol yn dod â'r byd yn unol â rhagfynegiadau'r theori (Zignani et al. 2014; Healy 2015) . Felly, pan fo ffynonellau data mawr yn ymddangos i atgynhyrchu rhagfynegiadau o theori gymdeithasol, rhaid inni fod yn siŵr nad oedd y theori ei hun wedi'i bacio i mewn i'r ffordd y mae'r system yn gweithio.

Yn hytrach na meddwl am ffynonellau data mawr wrth arsylwi pobl mewn lleoliad naturiol, mae mwy addas o ran mesur yn arsylwi pobl mewn casino. Mae casinos yn amgylcheddau peirianneg iawn a gynlluniwyd i ysgogi rhai ymddygiad, ac ni fyddai ymchwilydd byth yn disgwyl ymddygiad mewn casino i ddarparu ffenestr heb ei osod yn ymddygiad dynol. Wrth gwrs, gallech ddysgu rhywbeth am ymddygiad dynol trwy astudio pobl mewn casinos, ond os anwybyddoch y ffaith bod y data'n cael ei greu mewn casino, fe allech chi dynnu casgliadau gwael.

Yn anffodus, mae delio ag anghydfod algorithmig yn arbennig o anodd oherwydd bod llawer o nodweddion systemau ar-lein yn berchnogol, wedi'u dogfennu'n wael, ac yn newid yn gyson. Er enghraifft, fel y byddaf yn esbonio yn ddiweddarach yn y bennod hon, roedd dryslyd algorithmig yn un esboniad posibl ar gyfer dadansoddiad graddol o Google Flu Trends (adran 2.4.2), ond roedd yr hawliad hwn yn anodd ei asesu oherwydd bod gwaith mewnol algorithm chwilio Google yn perchnogol. Mae natur ddynamig cyfaddef algorithmig yn un math o drifft system. Mae gwrthdaro algorithmig yn golygu y dylem fod yn ofalus am unrhyw hawliad ynglŷn ag ymddygiad dynol sy'n deillio o un system ddigidol, waeth pa mor fawr ydyw.