2.3.4 Dili kompleto

Bisan unsa ka dako ang imong dagko nga datos, tingali wala kini nga impormasyon nga imong gusto.

Kadaghanan sa mga tinubdan sa datos dili kompleto , sa diwa nga wala sila'y impormasyon nga imong gusto alang sa imong pagsiksik. Kini usa ka komon nga bahin sa datos nga gimugna alang sa mga katuyoan gawas sa pagsiksik. Daghang mga sosyal nga siyentipiko ang adunay kasinatian sa pagsagubang sa dili pagkompleto, sama sa usa ka kasamtangan nga survey nga wala mangutana sa pangutana nga gikinahanglan. Ikasubo, ang mga suliran sa dili pagkompleto lagmit nga labaw pa kaayo sa dagkong datos. Sa akong kasinatian, ang dagkong datos lagmit nga kulang sa tulo ka matang sa kasayuran nga mapuslanon alang sa social research: demographic nga impormasyon mahitungod sa mga partisipante, kinaiya sa ubang mga plataporma, ug data sa pag-operate sa mga construct nga teoretikal.

Sa tulo ka matang sa dili pagkompleto, ang sulud sa dili kompleto nga datos sa pagpalihok sa theoretical constructs mao ang labing lisud nga sulbaron. Ug sa akong kasinatian, kini sagad nga wala tuyoa. Sa kinatibuk-an, ang mga pagtukod sa teoretikal nga mga ideya nga ang mga sosyal nga siyentipiko nga nagtuon ug nagpadagan sa usa ka teoretikal nga pagtukod nagpasabut sa usa ka paagi sa pagkuha niini nga nagtukod sa makita nga datos. Ikasubo, kining yano nga tunog nga proseso sa kasagaran nalisdan. Pananglitan, hunahunaon nato ang pagsulay sa empiris nga pagsulay sa yano nga pag-angkon nga ang mga tawo nga labaw ka intelihente makaangkon og dugang nga kwarta. Aron masulayan kini nga pag-angkon, gikinahanglan nimo ang pagsukod sa "salabutan." Apan unsa ang salabutan? Gardner (2011) nag-ingon nga adunay tinuod nga walo ka nagkalainlaing porma sa paniktik. Ug aduna bay mga pamaagi nga tukmang makasukod sa bisan unsang mga matang sa paniktik? Bisan pa sa dako nga kantidad sa trabaho sa mga psychologist, kini nga mga pangutana wala pa'y dili klaro nga mga tubag.

Busa, bisan ang usa ka yano nga pag-angkon-ang mga tawo nga labaw ka intelihente makaangkon og dugang nga kwarta-mahimong malisod sa pagsusi sa empiriyal tungod kay lisud ang pagpaandar sa teoretikal nga pagtukod sa datos. Ang ubang mga pananglitan sa mga pagtukod sa teoretikal nga importante apan lisud nga operahan naglakip sa "mga lagda," "kapital sa sosyedad," ug "demokrasya." Ang mga siyentipiko sa sosyal nga pagtawag nag-ingon tali sa teoretikal nga mga pagtukod ug datos nga nagtukod sa balido (Cronbach and Meehl 1955) . Ingon sa gisugyot niining mubo nga lista sa mga pagtukod, ang pagtukod sa balido usa ka problema nga ang mga sosyal nga mga siyentipiko nakigbisog alang sa dugay nga panahon. Apan sa akong kasinatian, ang mga problema sa pagtukod sa balido mas dako pa kon magtrabaho uban sa mga datos nga wala gibuhat alang sa mga katuyoan sa pagsiksik (Lazer 2015) .

Sa diha nga imong gisusi ang usa ka resulta sa panukiduki, ang usa ka dali ug mapuslanon nga paagi sa pag-usisa sa pagkamatuud mao ang pagkuha sa resulta, nga kasagaran gipahayag sa mga termino sa pagtukod, ug ipahayag pag-usab kini sa mga datos nga gigamit. Pananglitan, tagda ang duha ka hypothetical nga mga pagtuon nga nag-ingon nga nagpakita nga ang mga tawo nga labaw ka intelihente nakaganansya. Sa una nga pagtuon, nakita sa tigdukiduki nga ang mga tawo nga maayo ang iskor sa Raven Progressive Matrices Test - usa ka maayo nga pagtuon sa pagsulay sa analytic intelligence (Carpenter, Just, and Shell 1990) -nga mas taas nga gitaho nga kita sa ilang tax returns. Sa ikaduha nga pagtuon, nakita sa tigdukiduki nga ang mga tawo sa Twitter kinsa migamit og mas taas nga mga pulong mas lagmit nga maghisgot sa maluhong mga tatak. Sa duha nga mga kaso, kini nga mga tigdukiduki mahimo nga moangkon nga ilang gipakita nga ang mga tawo nga labaw ka intelihente makaangkon og mas daghang salapi. Apan, sa una nga pagtuon ang teoretikal nga mga pagtukod maayo nga gipaandar sa datos, samtang sa ikaduha dili kini. Dugang pa, ingon sa gipakita niini nga pananglitan, dugang datus dili awtomatik nga pagsulbad sa mga problema sa pagtukod sa balido. Kinahanglan ka magduhaduha sa mga resulta sa ikaduha nga pagtuon kung kini naglakip sa usa ka milyon nga mga tweets, usa ka bilyon nga tweet, o usa ka trilyon nga mga tweet. Alang sa mga tigdukiduki nga dili pamilyar sa ideya sa pagtukod sa balido, ang lamesa 2.2 naghatag og pipila ka mga pananglitan sa mga pagtuon nga nagpadagan sa mga teoretikal nga pagtukod gamit ang digital nga datos sa pagsubay.

Table 2.2: Mga panig-ingnan sa Digital Traces nga gigamit sa pagpalihok sa teoretikal nga mga pagtukod
Ang tinubdan sa datos Pagtukod sa teoretikal Mga reperensya
Mga troso sa email gikan sa unibersidad (meta-data lamang) Mga relasyon sa katilingban Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010)
Mga post sa social media sa Weibo Civic engagement Zhang (2016)
Mga troso sa email gikan sa usa ka kompanya (meta-data ug kompleto nga teksto) Ang kultura nga angay sa usa ka organisasyon Srivastava et al. (2017)

Bisan tuod ang sulud sa dili kompleto nga mga datos sa pagkuha sa theoretical constructs lisud sulbaron, adunay mga komon nga mga solusyon sa uban pang mga komon nga tipo sa dili pagkompleto: dili kompleto nga impormasyon sa demograpiko ug dili kompleto nga impormasyon sa pamatasan sa ubang mga plataporma. Ang unang solusyon mao ang aktwal nga pagkolekta sa datos nga imong gikinahanglan; Sultian ko ikaw mahitungod sa nga sa kapitulo 3 sa diha nga ako mosulti kanimo mahitungod sa survey. Ang ikaduha nga pangunang kasulbaran mao ang paghimo kung unsa nga datos ang gitawag sa mga siyentipiko nga paghatag sa kinaiya sa mga gumagamit ug ang mga social scientist nagtawag sa pagpatuman . Niini nga pamaagi, gigamit sa mga tigdukiduki ang kasayuran nga anaa sa pipila ka mga tawo aron mahibal-an ang mga hiyas sa ubang mga tawo. Ang ikatlo nga posible nga solusyon mao ang pagsagol sa daghang mga tinubdan sa datos. Kini nga proseso usahay gitawag nga linkage nga rekord . Ang akong paborito nga metapora alang niini nga proseso gisulat ni Dunn (1946) sa unang paragraph sa unang papel nga gisulat sa rekord nga rekord:

"Ang matag tawo sa kalibutan nagmugna og Libro sa Kinabuhi. Kini nga Libro magsugod sa pagkatawo ug matapos sa kamatayon. Ang mga pahina niini gilangkuban sa mga rekord sa mga pangunang hitabo sa kinabuhi. Ang pag-link sa linkage mao ang ngalan nga gihatag sa proseso sa pag-assemble sa mga panid niini nga libro ngadto sa usa ka tomo. "

Sa diha nga gisulat ni Dunn ang yugto nga iyang gihunahuna nga ang Libro sa Kinabuhi mahimong maglakip sa dagkong mga panghitabo sa kinabuhi sama sa pagkatawo, kaminyoon, diborsyo, ug kamatayon. Bisan pa, karon nga daghan kaayo nga kasayuran mahitungod sa mga tawo ang natala, ang Book of Life mahimong usa ka talagsaon nga detalyado nga hulagway, kon kadtong lainlaing mga panid (ie, ang atong mga digital nga agianan) mahimong mahiusa. Kini nga Libro sa Kinabuhi mahimong usa ka maayong kapanguhaan alang sa mga tigdukiduki. Apan, kini mahimo usab nga tawgon nga database sa pagkaguba (Ohm 2010) , nga mahimong gamiton alang sa tanang matang sa dili angay nga mga katuyoan, ingon sa akong paghulagway sa kapitulo 6 (Etika).