2.3.2.1 aan dhammeystirneyn

No arrinta sida "weyn" aad "data weyn" waxa ay u badan tahay in uusan haysan macluumaadka aad rabto.

Inta badan ilaha xogta weyn waa dhamaystirnayn, ee dareenka ah in aysan haysan macluumaad ah in aad rabto in aad doontaa cilmi-baaris. Tani waa muuqaal caadi ah ee xogta la abuuray ee aan ahayn ujeedada cilmi. saynisyahano bulshada badan ayaa hore u lahaa waayo-aragnimo ah ee wax ka qabashada incompleteness ah, sida baadhitaanka ah ee hadda jira aan weydiin su'aal aad u doonayay. Nasiib darro, dhibaatooyinka incompleteness u muuqdaan in ay noqon ka badan xad-dhaaf ah ee xogta weyn. In aan waayo-aragnimo, xogta weyn u egtahay in la maqan saddex nooc oo macluumaad waxtar leh cilmi bulsho, tirakoobka, dhaqanka on dhufto ee kale, iyo xogta si hirgeliyo dhista teori.

Dhamaan seddex ka mid ah noocyadan incompleteness waxaa lagu muujiyey daraasad ay Gueorgi Kossinets iyo Duncan Watts (2006) oo ku saabsan horumar ee shabakada bulshada ee jaamacadda. Kossinets iyo Watts bilaabay Guda email ka jaamacadda, kaas oo lahaa macluumaad sax ah oo ku saabsan kuwa soo diray emails kan markii (cilmi ma ay helaan content ee emails ah). diiwaanka email Kuwani dhawaajin sida dataset la yaab leh, laakiin, iyagu waa-inkastoo ay size iyo granularity-aasaas dhamaystirnayn. Tusaale ahaan, abuse email ma waxaa ka mid ah xogta ku saabsan dabeecadaha dadka ardayda, sida jinsiga iyo da'da. Dheeraad ah, abuse email ma waxaa ka mid ah warbixin ku saabsan xidhiidhka dhex warbaahinta kale, sida taleefan, fariin qoraal, ama wada hadallada fool-ka-fool ah. Ugu dambeyntii, abuse email ku aadan si toos ah kuma jiraan macluumaad ku saabsan xidhiidhada, ku dhista teori in aragtiyaha badan oo jira. Later cutubkii, marka aan ka hadlo xeeladaha cilmi, aad arki doonaa sida Kossinets iyo Watts xalin dhibaatooyinkan.

Of saddex nooc oo incompleteness, dhibaatada xogta aan dhamaystirnayn in hirgeliyo dhista teori waa ugu adag si ay u xaliyaan, iyo in aan waayo-aragnimo, waxaa inta badan filaan ah looma eego by xogta saynisyahano. Ku dhowaad, dhista teori yihiin fikradaha caqliga oo culumadu bulshada bartaan, laakiin, nasiib daro, dhista, kuwaas oo aan had iyo jeer la unambiguously qeexi karaa oo wuxuu qiyaasay. Tusaale ahaan, bal aynu qiyaasi isku dayaya in ay u mareysa tijaabin sheegashada muuqata fudud in dadka ka maskax lacag dheeraad ah. Si loo tijaabiyo labo geesood ah oo aad u baahan tahay si loo cabbiro "sirdoonka." Laakiin, waa maxay sirdoonka? Tusaale ahaan, Gardner (2011) ku dooday in ay jiraan dhab ahaan waa sideed noocyada kala duwan ee sirdoonka. Markaasaa, waxaa jira hanaanka in si sax ah loo cabbiro laga yaabaa mid ka mid ah noocyadan sirdoonka? Inkastoo tiro aadka u badan ee shaqo by psychologists, su'aalahan weli aadan haysan jawaabo dirayaan. Sidaas darteed, xitaa a sheegashada-qof oo fudud, kuwaas oo ka maskax kasban dheeraad ah lacag-adag tahay in la qiimeeyo u mareysa noqon sababta oo ah waxa uu noqon karaa mid adag tahay in la hirgeliyo dhista teori in xogta. Tusaalayaasha kale ee dhista teori in ay muhiim yihiin, laakiin ay adag tahay in hirgeliyo waxaa ka mid ah "caadooyinka," "raasamaal bulsheed," iyo "dimuqraadiyadda." Saynisyahano Social wac kulanka u dhexeeya dhista af iyo saxsanaanta xogta dhisida (Cronbach and Meehl 1955) . Markaasaa, sida liiska this of dhista soo jeedisay, dhisaan ansax waa dhibaato in saynisyahano bulshada ayaa la dagaallamay muddo aad u dheer, xitaa marka ay la xogta la ururiyey ujeedo cilmi shaqeeya. Marka la xogta la soo ururiyay ee aan ahayn ujeedada cilmi shaqeeya, dhibaatooyinka ansax dhisida waa ka sii adag (Lazer 2015) .

Marka aad akhrineysid warqad cilmi baadhis ah, hal hab degdeg ah oo waxtar leh si ay u qiimeeyaan walaac ku saabsan ansax dhisida waa in ay qaataan dalab weyn ee warqada, kaas oo inta badan ka muujiyay in marka la eego dhista, oo waxay dib-u-muujin la eego xogta loo isticmaalo. Tusaale ahaan, u fiirsada laba waxbarashada khiyaali ah oo sheeganayay inay muujiyaan in dad badan oo caqli u helaan lacag dheeraad ah:

  • Study 1: dadka si wanaagsan dhalin on Test-a Raven Progressive Matrices baaritaanka sidoo bartay sirdoonka analytic (Carpenter, Just, and Shell 1990) dilaayo ama dakhliga sare sheegay canshuur celinta ay
  • Study 2: dadka on Twitter kuwaas oo loo isticmaalo erayo dhaadheer u badan tahay in la xuso noocyada raaxada

In labada kiisaska, cilmi caddayn kari waayeen in ay muujiyeen in dad badan oo caqli u helaan lacag dheeraad ah. Laakiin, in baadhitaankii ugu horreeyay ee dhista teori si fiican u lahaayeen by xogta, iyo kii labaad, ma ay joogin. Dheeraad ah, sida tusaale ahaan this muujinayaa, xog dheeraad ah oo aanu si toos ah u xaliyaan dhibaatooyinka la ansax dhisida. Waa in aad shaki natiijada Study 2 in ay ku lug a million tweets, a billion Twitter, ama a trillion Twitter. Waayo, cilmi ma yaqaanaan fikradda ah ansax dhisida, Shaxda 2.2 siiyaa tusaalayaal qaar ka mid ah waxbarashada in ay lahaayeen dhista teori isticmaalaya xogta raad digital.

Shaxda 2.2: Tusaale ahaan of raad digital in loo isticmaalo sida kor oo ah fikradaha ka badan aan la taaban karin akhriska. Saynisyahano Social wac this ansax dhisida kulan oo ay tahay caqabad weyn oo la isticmaalayo ilaha xogta weyn baadhitaan bulsho (Lazer 2015) .
raad Digital dhisida teori yeerida
Guda email ka jaamacad (Meta-data oo kaliya) xiriirka bulshada Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
posts warbaahinta bulshada on Weibo hawlgelinta Civic Zhang (2016)
Guda email ka shirkad (Meta-xogta iyo text dhameystiran) taam Dhaqanka ee urur Goldberg et al. (2015)

Inkastoo dhibaatada xogta aan dhamaystirnayn for dhista teori operationalizing waa quruxsan adag si ay u xaliyaan, waxaa jira saddex xal caadi ah in dhibaatada xogta dadka aan dhamaystirnayn iyo macluumaadka aan dhameystirneyn ee dabeecada ku dhufto ee kale. marka hore waa in la dhab ururiyaan xogta aad u baahan tahay; Waxaan kuu sheegi doonaa ah oo ku saabsan tusaale u ah in cutubka 3 markii aan kuu sheego oo ku saabsan sahan. Nasiib darro, noocan oo kale ah xog ururinta suurtogal ma aha had iyo jeer. The xal labaad ugu weyn waa inaan sameeyo waxa saynisyahano xogta wac baxayn user-sifo iyo waxa saynisyahano bulshada wac imputation. In habkan, cilmi isticmaalaan macluumaadka si ay u leeyihiin on dadka qaar in ay xawilaan sifooyinka dadka kale. ay suurtagal tahay xal-ka mid saddexaad ee ay isticmaalaan Kossinets iyo Watts-ahaa in la isu geeyo ilo xog badan. Nidaamkan waxaa mararka qaarkood loo yaqaan biirtay ama diiwaanka ku xirid. Tusaalahan aan ugu jeclaa ee habka this waxaa la soo jeediyay in cutubka ugu horeysay warqad ugu horeysay abid ku qoran diiwaanka ku xirid (Dunn 1946) :

"Qof walba oo adduunka abuuraa Kitaab of Life. Book Tani bilaabataa dhalmada iyo dhamaataa marka qofku dhinto. pages Its ka kooban yihiin diiwaanka dhacdooyinka mabda'a nolosha. xirid Record waa magaca la siiyay habka of ururinayo bogagga kitaabkan galay mugga a. "

Qoraalkan waxaa lagu qoray 1946, oo wakhtigaas, qof ayaa ku fikiraya in ay Book of Life ka mid noqon kara dhacdooyinka waaweyn ee nolosha sida dhalashada, guurka, furiinka, iyo dhimasho. Si kastaba ha ahaatee, hadda in macluumaad aad u badan oo ku saabsan dadka waxaa lagu diiwaangeliyaa, ee Book of Life waxay noqon kartaa sawirka cajiib ah oo faahfaahsan, haddii kuwa pages kala duwan (tusaale ahaan, raad our digital), la wada xidhay karo. Tani Book of Life waxay noqon kartaa kheyraadka weyn u cilmi. Laakiin, ee Book of Life ayaa sidoo kale laga yaabaa inuu database a halaag (Ohm 2010) , taas oo loo isticmaali karo oo dhan cayn kasta oo ujeeddo xumo, sida ku cad hoos marka aan ka hadlo nooca xasaasi ah macluumaadka laga soo ururiyey by ilaha xogta weyn hoose iyo cutubka 6 (Ethics).