3.4.2 Ez-probabilitatea laginak: haztapen

Itzulpengintza Hau da, ordenagailu batek sortu zuen. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.2 Ez-probabilitatea laginak: haztapen

Ez-probabilitatea laginak batera, pisuak bere gain hartu laginketa prozesua eragindako distortsio desegin dezakezu.

duten ikertzaile pisua erantzunak probabilitatea laginak era berean, ez-probabilitatea laginak erantzunak ere pisua izango dute. Adibidez, CPS alternatiba gisa, pentsa iragarki jarritako duzula milaka webgune parte hartzaile bildu nahi inkesta bat langabezia tasa kalkulatzeko da. Jakina, eszeptikoa zure lagin batezbesteko sinplea dela ona langabezia tasa aurrekontua izango litzateke duzu. Zure eszeptizismoa da seguruenik uste duzu pertsona batzuk gehiago egongo dira zure inkesta besteak baino osatzeko delako. Esate baterako, ez duten denbora asko igaro webean pertsona gutxiago dira zure inkesta osatzeko.

ikusi bezala, azken atalean dugu, ordea, ezagutzen badugu zenbat lagin hautatutako-as zen egin dugun probabilitatea laginak-orduan laginketa prozesua eragindako distortsio desegin ahal izango dugu. Zoritxarrez, ez-probabilitatea laginekin lan, ez dakigu nola lagina hautatu zuten. Baina, laginketa-prozesuari buruzko hipotesiak egin ahal izango dugu, eta, ondoren, ponderazio aplikatuko modu berean. hipotesi horiek zuzenak badira, orduan ponderazio laginketa prozesua eragindako distortsio desegin egingo.

Esate baterako, pentsa, zure iragarki erantzunez, 100.000 inkestatuen kontrataturiko duzu. Hala ere, ez duzu uste 100.000 inkestatuen horiek ausazko American helduen lagin sinple bat dira. Izan ere, zure inkestatuen alderatu US biztanleriaren behar duzu, estatu batzuetan (adibidez, New York) ra pertsonak direla estatu batzuetan (adibidez, Alaska) jendearekin baino ordezkapen eta hori pean irudikatzen dira aurkituko duzu. Horrela, langabezia zure lagin-tasa litekeena langabezia xede biztanleriaren tasaren estimazio txarra izan da.

distortsio hori laginketa prozesua gertatu desegin modu bat da, pertsona bakoitzaren pisuak esleitzeko; Jende pisu txikiagoa estatutan direla lagina (adibidez, New York) eta pisuak handiagorik jendea hasi baino ordezkapen direla lagina (adibidez, Alaska) pean irudikatzen estatu batetik. Zehatzago, erantzuleak bakoitzaren pisua bere prebalentzia lotuta dago zure lagina erlatiboa beren US biztanlerian prebalentzia da. Ponderazio Prozedura hau postestratifikazioa deritzo, eta pisatzen ideiaren duzu gogorarazi behar Adibidearen 3.4.1 atalean non Rhode Island batetik, inkestatuen Kaliforniatik inkestatuen baino ematen ziren pisu gutxiago. Postestratifikazioa nahikoa zure inkestatuen jarri taldetan eta xede-biztanleriaren proportzioa talde bakoitzeko jakin badakiela eskatzen.

Probabilitate laginaren eta ez-probabilitatea lagin pisuan matematikoki bera (ikus eranskinean teknikoa) izan arren, ondo lan egiten dute, hainbat egoeratan. ikertzailearen perfektua probabilitatea lagin bat (hau da, ez estaldura error eta ez ez-erantzuna) badu, kasu guztietan ezaugarri guztiak kalkuluen inpartziala sortuko dituzte haztapen. berme teoriko hori indartsua dela-eta probabilitatea laginak defendatzaileak aurkitzeko hain erakargarria. Bestalde, ponderazio ez-probabilitatea laginak izango bakarrik ekoizten ezaugarri guztiak kalkuluen inpartziala bada erantzuna joera talde bakoitzeko guztiontzat berdinak dira. Beste era batera esanda, atzera pentsatzen gure adibidez, postestratifikazioa erabiliz inpartziala kalkuluen sortuko dituzte New Yorken, denek parte hartzen eta Alaska, denek parte hartzen duten eta, beraz, probabilitate bera probabilitate bera badu. Hipotesi hau deitzen da homogeneoa-erantzun-joera-barruan-talde hipotesi, eta paper garrantzitsua jokatzen du, jakinda ere postestratifikazioa ondo funtzionatuko badu ez-probabilitatea laginekin.

Zoritxarrez, gure adibidean, homogeneoa-erantzun-joera-barruan-talde hipotesi Nekez egia izango dela dirudi. Hori da, zaila dirudi Alaska guztiek zure inkesta egoteko probabilitate bera. Baina, hiru puntu garrantzitsu postestratifikazioa buruz kontuan mantentzeko, horrek guztiak egin gehiago itxaropentsua badirudi daude.

Lehenengoa, homogeneoa-erantzun-joera-barruan-talde hipotesi gehiago talde kopurua handitzen gisa sinesgarri bihurtzen. Eta, ikertzaileak ez dira besterik oinarritutako dimentsio geografiko bakar batean talde mugatu. Adibidez, talde oinarritutako egoera, adina, sexua, eta hezkuntza-mailaren sortu ahal izan genuen. gehiago sinesgarri ez dagoela homogeneoa erantzuna 18-29 taldean joera dela dirudi, emakumezkoak, unibertsitateko tituludun Alaska bizi Alaska bizi diren pertsona guztien talde barruan baino. Horrela, postestratifikazioa handitzen erabilitako talde kopurua bezala, hipotesi gehiago zentzuzko bihurtu da hori onartzeko beharrezko. Honetan, ikertzaile bat bezala postestratifikazioa dagoen talde kopuru handi bat sortu nahi luke badirudi. Datu sparsity: Baina, talde kopurua handitzen bezala, ikertzaileek beste arazo bat sartu exekutatu. badira talde bakoitzeko pertsona kopuru txiki bat bakarrik bada, orduan balioespenak gehiago incierto izango da, eta muturreko kasu non ez dagoela inkestatuen ez du talde bat da, eta, ondoren postestratifikazioa erabat hausten behera. Bi modu daude homogeneous- erantzunik-joeraren-barruan-talde hipotesi egiatasuna eta arrazoizko lagin talde bakoitzaren tamainak eskariaren arteko berezko tentsioa honen. hurbilketa bat da, eredu estatistiko sofistikatuagoa mugitzeko pisuak kalkulatzeko eta bestea da handiago, anitzagoak lagina, eta horrek bermatu arrazoizko lagin-tamainak talde bakoitzeko laguntzen biltzeko. Eta, batzuetan, ikertzaileek egin bai, beheko dut deskribatzeko xehetasun gehiago.

Bigarren gogoetak denean postestratifikazioa ez-probabilitatea lagin batekin lan egiten da homogeneoa-erantzun-joeraren-barruan-talde hipotesi hori dagoeneko maiz egiten denean probabilitatea laginak aztertuz. Arrazoia hipotesi hori beharrezkoa da probabilitatea laginak praktikan da probabilitatea laginak duten ez-erantzuna, eta ez-erantzunaren egokituz metodo ohikoena postestratifikazioa da gorago aipatu bezala. Jakina, ikertzaile asko egin hipotesi jakin bat, ez du esan nahi, zerbait egin behar duzu too besterik ez delako. Baina, esan nahi du, ez-probabilitatea laginak alderatuta probabilitatea laginak praktikan hori, gogoan duten bi hipotesi eta informazio osagarriaren mendekoak ordena kalkuluen ekoizteko ere mantendu behar dugu. ezarpenak errealista ere, ez da, besterik gabe hipotesi-free hurbilketa inferentzia.

Azkenik, Laguntza ere estimazio bat buruz bada gure adibide langabezia zehatz-tasa-orduan baldintza bat homogeneoa-erantzun-joeraren-barruan-talde hipotesi baino ahulagoa behar duzu. Hain zuzen ere, ez duzu behar da guztiek erantzun bera Cotado du bere gain hartzen, bakarrik behar duzu ez dagoela erantzunik joeraren eta langabezia tasa arteko korrelazioa ez talde bakoitzaren barruan dago bereganatzeko. Jakina, nahiz eta baldintza ahulagoa hau ez da egoera batzuetan eutsi. Esate baterako, pentsa estatubatuar boluntario lana egin duten proportzioa kalkulatzeko. Pertsona boluntario lan egiten duten gehiago egongo dira inkesta bat izan ados bada, orduan ikertzaileek egingo sistematikoki baino balioesteko boluntariotza zenbatekoa, postestratifikazioa egokitzapenak egin badute ere, emaitza bat dela frogatu enpirikoki arabera Abraham, Helms, and Presser (2009) .

Esan dudan bezala, ez-probabilitatea laginak eszeptizismoa handiz ikusten dira gizarte zientzialarien arabera, zati batean dutelako da inkesta ikerketa lehen egunetan gehien lotsa porrotak batzuk rola. noraino ez-probabilitatea laginekin etorri dugu adibide argia Wei Wang, David Rothschild, Sharad Goel, eta Andrew Gelman ikerketa behar bezala berreskuratu du 2012 US hauteskunde emaitza ez-probabilitatea American Xbox erabiltzaile lagin bat erabiliz -a decidedly ez-ausazko estatubatuar lagin (Wang et al. 2015) . ikertzaile kontratatu inkestatuen Xbox joko-sistema batetik, eta espero dezakezun bezala, Xbox lagina gizonezkoa jasateko eta gazte jasateko: 18 - 29 urte bitarteko osatzen hautesleen% 19 baina Xbox laginaren% 65 eta gizonen osatzen% 47 hautesleak eta Xbox lagin (3.4 irudia) guztien% 93. Horiek indartsu lodirik demografikoa, gordinak Xbox datuak hauteskunde itzultzen adierazle txarra izan zen. Mitt Romney Barack Obama baino garaipen sendoa iragarri. Berriz ere, hau gordinak, unadjusted ez-probabilitatea laginak arriskuez beste adibide bat da eta Literatur Digest fiasco gogorarazten da.

3.4 irudia: Wang et al inkestatuen demografia. (2015). inkestatuen XBox kontratatu ziren delako, gehiago litekeena gazte eta gehiago litekeena gizonezkoa, hautesleek erlatiboa 2012ko hauteskundeetan izango zirela.

3.4 irudia: inkestatuen demografia Wang et al. (2015) . inkestatuen XBox kontratatu ziren delako, gehiago litekeena gazte eta gehiago litekeena gizonezkoa, hautesleek erlatiboa 2012ko hauteskundeetan izango zirela.

Hala ere, Wang eta lankideek arazo horien jakitun ziren eta inkestatuen pisua laginketa prozesua zuzendu saiatu. Bereziki, postestratifikazioa hemen aipatu nizun forma sofistikatuagoa bat erabili zuten. Merezi bit beren planteamendu buruz gehiago ikasteko a postestratifikazioa buruzko intuizio eraikitzen delako da, eta bereziki bertsioa Wang eta lankideek erabilitako haztapen ez-probabilitatea laginak den planteamendu zirraragarrienetariko bat da.

Gure langabezi estimatzea 3.4.1 atalean buruzko adibide errazak, biztanleen banatzen dugu taldetan oinarritutako bizi zaren egoeraren. Aitzitik, Wang eta lankideek banatzen biztanleriaren sartu definitutako 176.256 taldetan: genero (2 kategoria), lasterketa (4 mailak), adinaren arabera (4 mailak), hezkuntza (4 mailak), egoera (51 mailak), festa ID (3 mailak), ideologia (3 kategoria) eta 2008 boto (3 kategoria). talde gehiago, ikertzaileek espero zuela gero eta litekeena dela talde bakoitzaren barruan, erantzuna Cotado Obama laguntza uncorrelated zen izango litzateke. Ondoren, baizik eta banako-maila pisuak eraikitzeko, gure adibidean egin dugun bezala baino, Wang eta lankideek erabilitako eredu konplexu bat pertsonen proportzioa kalkulatzeko talde bakoitzak Obama botoa ere. Azkenik, konbinatu dute talde ezaguna talde bakoitzaren tamaina duen laguntza-aurreikuspen horiek laguntza-maila orokorra estimatu ekoizteko. Beste era batera esanda, eman txikituta dute biztanleriaren talde desberdinetan, Obama laguntza estimatu talde bakoitzean, eta, ondoren, talde estimazioak batez besteko haztatua hartu estimazio globala egin ahal izateko.

Horrela, beren planteamendu erronka handia da Obama laguntza kalkulatzeko 176.256 talde horietako bakoitzean. beren panel barne 345.858 parte-hartzaile bakarra, kopuru handi bat hauteskunde hauteslekuak arauak arren, askotan, talde askok bertan Wang eta lankide ia ez inkestatuen izan ziren bertan. Hori dela eta, talde bakoitzak teknika bat erabili zuten postestratifikazioa anitzeko erregresio izeneko ikertzaile maitasunez deitzen Mr. P. Funtsean, Obama laguntza kalkulatzeko talde zehatz batean, Mr. P. igerileku askotako informazioa euskarri balioesteko estuki lotutako talde. Demagun, adibidez, emakumezkoak, Hispanistas artean Obama laguntza kalkulatzeko erronka, 18-29 urte bitartekoak, college tituludun, aurkeztu dira demokratak, nor moderatu gisa auto-identifikatu dira, eta nor Obama bozkatu 2008an This talde oso, oso zehatz bat da, eta posible da ez dagoela ezaugarri horiek dituen lagina ere inork da. Hori dela eta, talde honi buruzko estimazioak egiteko, Mr. P. igerilekuak elkarrekin oso antzeko talde jendeak estimatzen du.

Analisi estrategia hori erabiltzea, Wang eta lankideei XBox ez-probabilitatea lagin erabiltzeko oso hurbiletik balioesteko laguntza orokorra dela Obama 2012ko hauteskundeetan jaso ahal izan ziren (3,5 irudia). Izan ere, haien kalkuluen iritzi publikoak agregatu bat baino zehatzagoak izan ziren. Horrela, kasu honetan, ponderazio-zehazki, Mr. P.-dirudi lan ona ez-probabilitatea datuak ere alborapenak zuzentzeko egin; lodirik ikusgai dauden begiratzen du unadjusted Xbox datuak kalkuluak at duzu.

3.5 irudia: Wang et al kalkuluak. (2015). Unadjusted XBox lagin ekoiztu zehaztugabeak kalkuluen. Baina, haztatuen XBox lagin ekoiztu kalkuluen duten probabilitatea oinarritutako telefono inkesten batez beste baino zehatzagoak izan ziren.

3.5 irudia: batetik Kalkuluen Wang et al. (2015) . Unadjusted XBox lagin ekoiztu zehaztugabeak kalkuluen. Baina, haztatuen XBox lagin ekoiztu kalkuluen duten probabilitatea oinarritutako telefono inkesten batez beste baino zehatzagoak izan ziren.

Wang eta lankideek azterketaren bi ikasgai nagusi daude. Lehenengoa, unadjusted ez-probabilitatea laginak kalkuluen txarrak ekar dezake; hau ikasgai bat ikertzaile askok aurretik entzun izan da. Hala ere, bigarren ikasgaia dela ez-probabilitatea laginak, ondo haztatuta, benetan ekoizteko ahal kalkuluen nahiko ona. Izan ere, haien kalkuluen pollster.com, gehiago tradizionalak hauteskunde inkesten baturik kalkuluak baino zehatzagoak izan ziren.

Azkenik, zer azterketa zehatz honetan ikasi ahal izango dugu muga garrantzitsuak daude. postestratifikazioa ondo aritu Just delako kasu honetan, ez da bermerik ondo lan egingo du, beste kasu batzuetan da. Izan ere, hauteskundeak dira agian ezarpenak errazena bat pollsters dute hauteskundeetan ikasten delako ia 100 urte, han erregular feedback (nork irabazi hauteskundeetan ikusiko dugu), eta alderdiaren identifikazioa da eta ezaugarri demografiko erlatiboki bozketara iragarlea dira. Puntu honetan, teoria sendo eta esperientzia enpirikoa ez-probabilitatea laginak doikuntzek koefiziente Horreen kalkuluen sortzen da jakitea falta zaigu. Gauza bat dago argi, ordea, behartuta zaude, bada, ez-probabilitatea laginekin lan egiten, orduan ez dago arrazoi indartsuak egokitu kalkuluen ez-doituaren aurreikusitakoa baino hobea izango dela uste da.