3.3 La tuta enketo eraro kadro

Tuta enketo eraro = reprezento eraroj + mezuraj eraroj.

La taksoj, kiuj venas de specimenaj enketoj ofte estas malperfektaj. Tio estas, kutime ekzistas diferenco inter la takso produktita de specimeno enketo (ekz., La estimata averaĝa alteco de studentoj en lernejo) kaj la vera valoro en la loĝantaro (ekz., La reala averaĝa alteco de studentoj en lernejo). Kelkfoje tiuj eraroj estas tiel malgrandaj, ke ili estas nemalhaveblaj, sed kelkfoje bedaŭrinde ili povas esti grandaj kaj konsekvencaj. En provo kompreni, mezuri kaj redukti erarojn, esploristoj iom post iom kreis solan, ĝeneralan konceptan kadron por la eraroj kiuj povas okazi en specimaj enketoj: la tuta enketa erara kadro (Groves and Lyberg 2010) . Kvankam la disvolviĝo de ĉi tiu kadro komenciĝis en la 1940-aj jaroj, mi pensas, ke ĝi ofertas al ni du helpemajn ideojn por enketa esplorado en la cifereca aĝo.

Unue, la tuta enketa erara kadro klarigas, ke ekzistas du tipoj de eraroj: prezo kaj varianco . Proksime, paŭzo estas sistema eraro kaj varianco estas hazarda eraro. Alivorte, imagu kurante 1,000 replikoj de la sama specimeno enketo kaj poste rigardante la distribuon de la taksoj el tiuj 1,000 replikoj. La paŭzo estas la diferenco inter la meznombro de ĉi tiuj replikataj taksoj kaj la vera valoro. La varianco estas la variablo de ĉi tiuj taksoj. Ĉio cetera egalas, ni ŝatus proceduron sen paŭzo kaj malgranda varianco. Bedaŭrinde, pro multaj realaj problemoj, tiaj ne-biasaj, malgrandaj-varianca proceduroj ne ekzistas, kio metas al esploristoj en la malfacila pozicio decidi kiel ekvilibrigi la problemojn prezentitajn per paŝo kaj varianco. Iuj esploristoj instinkte preferas senpreciajn procedurojn, sed senkonsidera fokuso sur parolado povas esti eraro. Se la celo estas produkti takson, kiu estas pli proksima al la vero (tio estas, kun la plej malgranda ebla eraro), tiam vi eble pli boniĝos per proceduro, kiu havas malgrandan antaŭjuĝon kaj malgrandan variancon ol kun unu senbazebla sed havas grandan variancon (figuro 3.1). Alivorte, la tuta enketa erara kadro montras, ke, kiam vi taksas enketajn esplor-procedojn, vi devus konsideri ambaŭ preĝejojn kaj varian.

Figuro 3.1: Biaso kaj varianco. Ideale, esploristoj havus senkonsentan kaj malaltan varian procedon. Fakte, ili ofte devas fari decidojn, kiuj kreas interŝanĝon inter paŭzo kaj varianco. Kvankam iuj esploristoj instinkte preferas senpreciajn procedurojn, kelkfoje malgranda paŭzo, malgranda-varian proceduro povas produkti pli precizajn taksojn ol senprecia proceduro kiu havas altan variancon.

Figuro 3.1: Biaso kaj varianco. Ideale, esploristoj havus senkonsentan kaj malaltan varian procedon. Fakte, ili ofte devas fari decidojn, kiuj kreas interŝanĝon inter paŭzo kaj varianco. Kvankam iuj esploristoj instinkte preferas senpreciajn procedurojn, kelkfoje malgranda paŭzo, malgranda-varian proceduro povas produkti pli precizajn taksojn ol senprecia proceduro kiu havas altan variancon.

La dua ĉefa kompreno de la tuta enketa erara kadro, kiu organizos multajn ĉi tiun ĉapitron, estas ke ekzistas du fontoj de eraroj: problemoj rilatigitaj kun kiuj vi parolas ( reprezento ) kaj problemoj rilatigitaj kun tio, kion vi lernas de tiuj konversacioj ( mezurado ). Ekzemple, vi eble interesiĝas pri taksado de sintenoj pri interreta privateco inter plenkreskuloj vivantaj en Francio. Faranta ĉi tiujn taksojn postulas du malsamajn tipojn de inferencia. Unue, de la respondoj, kiujn respondas doni, vi devas inferi siajn sintenojn pri interreta privateco (kiu estas problemo de mezurado). Due, de la diferencaj sintenoj inter la enketitaj, vi devas konkludi la sintenojn en la tuta popolo (kio estas problemo de reprezento). Perfekta ekzamenado kun malbonaj enketaj demandoj produktos malbonajn taksojn, kiel malbona provado kun perfekta enketa demandoj. Alivorte, bonaj taksoj postulas sonajn alirojn por mezurado kaj reprezento. Konsiderante tiun fonon, mi revizios, kiel esploristoj esploris pri reprezento kaj mezuro en la pasinteco. Tiam mi montros, kiel ideoj pri prezento kaj mezuro povas gvidi enketojn pri ciferecaj enketoj.