3.4.2 testa Non-sîlahan: giraniya

Bi testa non-sîlahan, pîvan dikarin berovajî, ku ji ber pêvajoya mînakan tê texmînkirin, betal bike.

Bi heman awayî, ku lêkolînerên giraniya bersivên ji testa sîlahan, ew jî dikarin bersivên ji testa non-sîlahan giraniya. Ji bo nimûne, wek alternatîf bo şahîdîyê, xeyal, ku tu reklaman de pankarta li ser bi hezaran malperên danîn ji bo peydakirina beşdaran ji bo lêkolînê ji bo texmîn dikin ku rêjeya bêkariyê. Elbet, hûn dê bi gûman ku navê de yên sade testa te dê bibe texmîn baş yên ku rêjeya bêkariyê. gumanbarîya li te ye, dibe ji ber ku hûn difikirin ku hin kesên ku bêtir ji bo bidawîkirina lêgerîna te ji yên din. Ji bo nimûne, mirov, ku gelek wext li ser înternetê derbas ne ku ev rewş kêmtir bidawîkirina lêgerîna te.

Ji ber ku em di beşa dawî de dît, lê belê, eger em dizanin çawa ku test bête hilbijartin-wek ku hat em bi ihtîmaleke çi testan-hingî em dikarin berovajî ji ber pêvajoya Tehlîlwergirtina betal bike. Mixabin, dema kar bi testa non-sîlahan, em nizanin ku çawa ku test bête hilbijartin. Lê belê, em dikarin bêy li ser pêvajoya mînakan de bide û piştre serî giraniya jî bi heman awayî. Eger ev pêşmercên rast in, îdî giraniya wê xirabbûna ji ber pêvajoya Tehlîlwergirtina betal bike.

Ji bo nimûne, difikirin ku di bersiva ads banner te, tu 100,000 peydekirin. Lê hûn bawer nakin ku ev 100,000 pişikdaran mestereyeke hêsan ya mezinan Amerîkî ne. Di rastiyê de, gava ku tu beşadaran re muqayese bike ji bo xelkê Amerîka, hûn bibînin ku mirovên ji hin dewletan (wek nimûne, New York) li ser-temsîlkirin û kesên ku ji hin dewletan (wek nimûne, Alaska) ne di bin-temsîlkirin in. Bi vî awayî rêjeya bêkariyê, ji testa xwe muhtemel e ku bibin texmînek xerab yên ku rêjeya bêkariyê li xelkê hedef.

Yek rê ji bo betal bike berovajîkirina ku di pêvajoya mînakan de qewimî ye ji bo assign pîvan ji bo her kesî; giraniya wê ya jêrê ji bo kesên ji welatên ku bi ser-temsîlkirin di mînaka (wek nimûne, New York) û pîvan bilindtir ji bo kesên ji welatên ku di bin-temsîlkirin di mînaka (wek nimûne, Alaska). Bi taybetî, ji giraniya ji bo her anketê ji bo belavbûna wan li xizmekî testa te related to berfirebûna xwe li xelkê Amerîka. Ev kirarî giraniya navê post-asûna, û fikra xwe ya bi giraniya divê hûn ji mînaka li Beþ 3.4.1 bi bîr ku beşdarên ku ji Rhode Island weight kêmtir ji beşdarên ku ji California hat dayîn. Post-Pêkhatina daxwaz dike ku, tu dizanî ku bes ku beşdarên ku te nav û komên ku bizanin rêjeya nifûsa hedef Di her komê de.

Tevî ku giraniya testa sîlahan û yên ku test non-sîlahan in ku matematîkê heman (li pêvek teknîkî dibînin), ew baş di rewşên cuda de dixebitin. Ger ku lêkolîner heye test bi îhtimaleke perfect (ango, no error firehî û no non-bersiva), wê giraniya wê bi texmînî bêalî, ji bo hemû taybetiyên ku di hemû rewşan de hilberîne. Ev garantiya teorîk jî gelekî xurt e çima parêzvanên testan sîlahan peyda ji wan re ewqas balkêş. Li aliyê din jî, balafirên non-sîlahan giraniya wê bi tenê berhemên bi texmînî bêalî, ji bo hemû taybetiyên eger propensities bersiv di heman ji bo her kesî Di her komê de ne. Bi gotineke din, difikire back to nimuneya me de, bi bikaranîna post-Pêkhatina wê bi texmînî bêalî berhemên eger her kesî li New Yorkê xwedî heman sîlahan yên beşdar û her kesî li Alaska heye di heman sîlahan yên beşdar û da ser. Ev nerînê de tê gotin û nerînê de homojen-bersiva-propensities-nava-koman, û ew roleke sereke di naskirina dilîze, eger post-asûna baş bi testa non-sîlahan kar bikin.

Mixabin, li nimuneya me de, bi nerînê de homojen-bersiva-propensities-nava-komên serîlêdan zehmete bê rastîn xuya dike. Ku, ew weha xuya dike ku her kes li Alaska heye di heman sîlahan yên ku di lêgerîna te. Lê belê, ne sê xalên girîng di hişê xwe de bigirin li ser post-asûna, hemû yên ku ew jî xuya hêviyê zêdetir heye.

Yekem, homojen-bersiva-propensities-nava-komên nerînê de herîkêm zêdetir wekî hejmara komên zêdekirina dibe. Û, lêkolîner ji bo komên tenê li ser aliyê cografîk yek li sînorkirî ne. Ji bo nimûne, em dikarin komên li ser bingeha dewletê, temen, sex, û asta perwerdeyê biafirîne. Ev xuya dike bahana zêdetir e ku propensities bersiva homojen di nava komeke ji 18-29 heye, derçûyên jin, college ku li Alaska ji nava komeke ji hemû kesên ku li Alaska. Bi vî awayî, gava ku hejmara komên bikaranîn ji bo post-asûna zêdebin, rawêjên pêwîst ji bo piştgiriya bûye maqûl zêdetir. Ji ber vê rastiyê de, wisa xuya ye, wek lêkolîner dê dixwazin bi jimareke mezin ji komên ji bo post-asûna. sparsity Daneyên: Lê, gava ku hejmara komên zêdebin, lêkolînerên nav pirsgirêkeke cuda bixebitîne. Eger ne bi tenê dikarî hejmarek piçûk a gelê Di her komê de hene, wê demê li gor wê ne diyar zêdetir, û di doza extreme li wir e komeke ku ti beşdarên ku li wir, paşê post-asûna bi temamî perçe. in bi du awayan ji vê tansyona pêgirê di navbera gengazbûna ji homogeneous- bersiva-propensity-nava-komên nerînê de û daxwaza ji bo sizes test maqûl Di her komê de hene. Yek helwest e ku koçî modela îstatîstîkî yên sofîstîke jî ji bo hesabkirina pîvan û ya din jî ji bo komkirina a mestir de, nimûneyên cihêreng, ku mirov misoger sizes test maqûl Di her komê de. Û, carna lêkolîneran hem do, wek ku ez ê bi berfirehî li jêr saloxdana.

A çavan duyem dema xebatê bi post-asûna ji testa non-îhtimaleke mezin e ku mefhûma homojen-bersiva-propensity-nava-komên ji niha ve gelek caran hatine çêkirin dema ku ev xebat, mînakên sîlahan. Sedema ku vê nerînê de ji bo testa sîlahan di pratîkê de pêwîst e ev e ku, mînakên sîlahan heye non-bersiv, û şêwazê herî berbelav ji bo nexşerêya ji bo non-bersiva post-asûna e wek ku li jor. Bê guman, ji ber ku gelek lêkolîner bide Eşkere hin nayê wê wateyê ku divê hun wê bikin. Lê belê, ev nayê wê wateyê ku dema ku danberheva testên non-sîlahan ji bo testa sîlahan di pratîkê de, em divê di hiş de, ku hem li ser pêşmercên û agahî derekî û ji bo ku berhem bi texmînî girêdayî biparêze. Li settings realîst e, tenê tu nêzîkatiya azad-nerînê de ji bo analîzên li wir.

Di dawiyê de, eger tu li ser yek texmîn di xema taybetî-di nimûne bêkariyê ya me rêjeya-hingî divê rewşa qelstir e homojen-bersiva-propensity-nava-komên nerînê de. Bi taybetî, ne lazime hun bi Texmîn ew e ku hemû kes li propensity bersiva heman, tu dikarî pêdivî bi hizir e, ku tu heyînî di navbera propensity bersiv û rêjeya bêkariyê di nav her komê heye. Bê guman, heta ev rewşa çêbibe, wê ne di hin rewşan de bigirin. Ji bo nimûne, di xeyala nirxandin, rêjeya Amerîkî ku do xebata bêberamber. Eger kesên ku kar dilxwaz in, bêtir ji bo li hev bikin ku di lêkolînê be, lêkolîner dê bi awayekî sîstematîk li ser-texmîn dikin ku miqdara ku dilxwazî, heta eger ew çi lihevanîna post-asûna, di encama hatiye ku ezmûnî ji aliyê xwepêşandan dîtin Abraham, Helms, and Presser (2009) .

Wekî min got, testa non-sîlahan bi bi bi şik mezin ji aliyê zanistên civakî, ji ber rola xwe li hin ji yên ku şkestin şermê ye ku di rojên destpêkê yên lêkolînên bînrawe, di part. A nimûne zelal yên çawa niha em bi testa non-sîlahan bê lêkolîna Wei Wang, David Rothschild, Sharad Goel, û Andrew Gelman ku kardike encama 2012 hilbijartinên Amerîka dîmenęn bikaranîna test non-îhtimaleke mezin ji bikarhênerên Xbox Amerîkî ye -a test bi biryardarî non-random ya Amerîkî (Wang et al. 2015) . Lêkolîneran beşdarên ku ji sîstema lîstîkan XBox wergirtin, û wek ku tu bende, test Xbox nêr Prodîkos û Prodîkos û ciwan: 18 - salî 29 sal 19% ji hêrsan, di heman demê de 65% ji mînaka li Xbox make up û mêr 47% make up yên di hibijartinan de û 93% ji mînaka li Xbox (WÊNE 3.4). Ji ber van rewşên demografîk bi hêz, welat raw Xbox a nîşana belengaz ji encamên hilbijartinê bû. Ev pêşbînî dike serkeftina xurt ji bo Mitt Romney li ser Barack Obama. Dîsa, ev mînakeke din ya xetereyên ji raw, testa non-sîlahan unadjusted e û bi bîr xist ku fîyasko Literary Digest e.

Figure 3.4: Demographics pişikdaran li Wang et al. (2015). Ji ber ku beşdarên ku ji XBox ve dihatin wergirtin, ew bêtir ji ciwan û îhtîmala male, xizmekî ji bo hilbijêran di hilbijartinên 2012 de bûn.

Figure 3.4: Demographics pişikdaran li Wang et al. (2015) . Ji ber ku beşdarên ku ji XBox ve dihatin wergirtin, ew bêtir ji ciwan û îhtîmala male, xizmekî ji bo hilbijêran di hilbijartinên 2012 de bûn.

Lê belê, Wang û hevalên xwe yên van pirsgirêkan agahdar bûn û hewl da ku giraniya beşdaran ji bo sererast ji bo pêvajoya mînakan de. Bi taybetî jî, ew bi formeke sofîstîke ya post-asûna ez ji we re li ser tê bikaranîn. Ev hêjayî hîn jî hinekî li ser helwesta wan, ji ber ku, ava intuition li ser post-asûna e, û versiyona taybetî Wang û hevalên xwe tê bikaranîn, yek ji helwestên herî bi kelecan ji bo testa non-sîlahan giraniya e.

Di nimuneya me li ser nirxandin, bêkariyê li Beþ 3.4.1, em xelkê nav komên dabeş li ser bingeha dewletê yên rûniştinê. Bi berevajiya wê, Wang û hevalên xelkê nav nav 176.256 komên defined by dubendî: zayendî (2 categories), nijad, (4 categories), temenê (4 categories), perwerdeyî (4 categories), dewletê (51 categories), ID partiya (3 categories), îdeolojiya (3 categories) û 2008 deng (3 categories). Bi komên din, lêkolînerên ku hêvî dikir ku ew ê bi her diçe dûre, ku di nav her komê, propensity bersiva uncorrelated bi piştgiriya ji bo Obama bû. Next, bêtir ji avakirina pîvan-asta şexsî, wek ku em di mînaka me, Wang û hevalên xwe bi kar modela kompleks bi texmîn dikin ku rêjeya kesên di Di her komê de ku dê ji bo Obama jî dengê xwe bidin. Di dawiyê de, ew van hejmaran komeke piştgiriya bi size zanîn yên her komekê re bi hev re ji bo hilberîna an asta giştî ya texmînî yên piştgiriya. Bi gotineke din, ew hurkirin up nifûsa nav komên cuda, bi piştgiriya ji bo Obama Di her komê de tê texmînkirin, û piştre rahişt weighted average ji texmînên koma bo hilberîna an texmîn giştî.

Bi vî awayî, li hember mezin li nêzîkatiya wan ew e ku texmîn dikin ku piştgiriya ji bo Obama li her yek ji van 176.256 komên. Tevî ku panel xwe de 345.858 beşdaran yekane, jimareke mezin ji aliyê standartên yên lokala hilbijartinê, bûn gelek, gelek komên din ji bo ku Wang û hevalên hema bêje ti beşdarên anketê bû. Ji ber vê yekê, ji bo texmîn dikin ku piştgiriya Di her komê de ew a teknîkê de tê bikaranîn bi navê regresyonê multilevel bi post-asûna, ku lêkolînerên hezkirin birêz P. bang rastiyê, ji bo texmîn dikin ku piştgiriya ji bo Obama di nava komeke taybetî, birêz P. adaniyê agahî ji gelek ji nêz ve komên girêdayî ye. Ji bo nimûne, bala xwe jî di warê nirxandin, piştgiriya ji bo Obama di nav îspanî jin,,,, di navbera 18-29 salî, ku derçûyên zanîngehê de, ku bi Demokratên qeydkirî, ku ji xwe-diyarkirina wek nerm in, û yên ku ji bo Obama li 2008. Ev deng komeke pir, pir taybet e, û mumkin e ku tu kes li ku test bi van taybetiyan heye. Ji ber vê yekê, ji bo ku bi texmînî li ser vê komê, birêz P. Gola Xamirpêtê ya bi hev re ji kesên ku di komên pir dişibe texmîn dike.

Bi bikaranîna vê stratejiya analysis, Wang û hevalên xwe bi kar ku test non-sîlahan XBox ji pir ji nêz ve texmîn dikin ku piştgiriya giştî ku Obama di hilbijartina 2012 qebûl bûn (WÊNE 3.5). Di rastiyê de bi texmînî r'astin zêdetir an pź ya raya giştî bûn. Ji ber vê yekê, di vê rewşê de, giraniya-bi taybetî ji birêz P.-xuya dike ji bo ku ez karekî baş r'astkirinê meylekê li welat non-sîlahan; rewşên ku tên dîtin ji dema ku tu li texmînî ji welat Xbox unadjusted binêrin.

Figure 3.5: texmînkirin ku ji Wang et al. (2015). test XBox Unadjusted çêkirin texmîn dike xelet in. Lê belê, mînaka li XBox weighted texmîn dike ku di rasteqîne zêdetir navînî anketên telefonê-based sîlahan hatine çêkirin.

Figure 3.5: texmînkirin ku ji Wang et al. (2015) . test XBox Unadjusted çêkirin texmîn dike xelet in. Lê belê, mînaka li XBox weighted texmîn dike ku di rasteqîne zêdetir navînî anketên telefonê-based sîlahan hatine çêkirin.

du dersên sereke ji vê lêkolînê yên Wang û hevalên li wir. Yekem, testa non-sîlahan unadjusted dikarin texmînên xerab rê; vê dersê ku gelek lêkolîner, berî bihîst e. Lê belê, di dersê de duyemîn e ku testa non-sîlahan, dema ku baş pîvan, bi rastî berhemên texmînên pir baş. Di rastiyê de, bi texmînî r'astin bêtir ji texmînên ji pollster.com, an cudabûnan ​​zêdetir pirsînan hilbijartinê kevneşop bûn.

Di dawiyê de, sînorên girîng e ji bo ku tiştên ku em ji ev yek xebata taybetî hîn tune. Ji ber ku post-asûna baş di vê rewşê de bi taybetî jî kar, e tuneye ku ev baş di rewşên din de kar li wê derê hene. Di rastiyê de, hilbijartinên in, belkî yek ji yên herî hêsan settings ji ber ku pollsters dixwînin hilbijartinên ji bo 100 salan e, Deng nîzamî (em dikarin bibînin ku di hilbijartinên serdikeve), û nasnameya xwe partî hene û taybetmendiyên demografîk nisbeten pêşdîtinê ya dengdanê ne. Di vî warî de, em kêm teoriya zexm û tecrubeya ampîrîk bi dizanim ku gava giraniya lihevanîna ji bo testa non-îhtimaleke mezin dê bi texmînî têra xwe deqîq hilberîne. Yek ji wan tiştan e ku ne zelal e, lê belê, e eger tu bi zorê ji bo xebatê bi testa non-sîlahan, hingê e sedemek xurt ji bo bawer dikin ku bi texmînî eyar çêtir texmînên non-hebę wê heye.