3.4.1 Հավանականություն նմուշառման Տվյալների հավաքագրման եւ տվյալների վերլուծություն

Այս թարգմանությունը ստեղծվել է համակարգչի համար. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.1 Հավանականություն նմուշառման Տվյալների հավաքագրման եւ տվյալների վերլուծություն

Կշիռները կարող շրջել աղավաղումները միտումնավոր կերպով հասցվել է նմուշառման գործընթացի:

Հավանականությունը նմուշները են, որտեղ բոլոր մարդիկ պետք է հայտնի, ոչ զրոյական հավանականություն ներառելու, եւ ամենապարզ հավանականությունը նմուշառման դիզայն պարզ է պատահական ընտրանքի, որտեղ յուրաքանչյուր մարդ ունի հավասար հավանականությունը ներառման. Երբ հարցվողները ընտրված են միջոցով պարզ պատահական ընտրանքի կատարյալ կատարման (օրինակ, ոչ ծածկույթի սխալի եւ ոչ-պատասխան), ապա գնահատական է պարզ է, քանի որ նմուշ-ին միջին լինել մանրանկարչություն տարբերակը բնակչության.

Պարզ պատահական ընտրանք հազվադեպ օգտագործվում է, սակայն գործնականում. Փոխարենը, հետազոտողները միտումնավոր ընտրեք մարդկանց անհավասար հավանականությունների ընդգրկվելու նպատակով նվազեցնել ծախսերը եւ բարձրացնել ճշգրտությունը. Երբ հետազոտողները միտումնավոր ընտրեք մարդկանց հետ տարբեր հավանականությունների ընդգրկվածության, ապա ճշգրտումները, որոնք անհրաժեշտ է շրջել աղավաղումների հետեւանքով առաջացած նմուշառման գործընթացի: Այլ կերպ ասած, թե ինչպես ենք մենք ընդհանրացնել մի նմուշ կախված է նրանից, թե ինչպես է նմուշ ընտրվել:

Օրինակ, ներկայիս բնակչությունն Survey (CPS), որն օգտագործվում է ԱՄՆ կառավարության գնահատել գործազրկության մակարդակը: Ամեն ամիս մոտ 100.000 մարդ, հարցազրույց, կամ երես առ երես, կամ ավելի հեռախոսով, եւ արդյունքները օգտագործվում են արտադրել գնահատված գործազրկության մակարդակը: Քանի որ կառավարությունը ցանկանում է գնահատել գործազրկության մակարդակը յուրաքանչյուր պետության, դա չի կարող անել մի պարզ պատահական նմուշ մեծահասակների քանի որ զիջի եւս մի քանի պատասխանողներին երկրներում փոքր բնակչության (օրինակ, Ռոդ Այլենդ) եւ չափից շատ է երկրների մեծ բնակչության (օրինակ, , Կալիֆորնիայի). Փոխարենը, ԵԳՌ նմուշները մարդիկ տարբեր պետություններում տարբեր դրույքաչափերով, մի գործընթաց, որը կոչվում է շերտավորված ընտրանք անհավասար հավանականության ընտրության. Օրինակ, եթե ԵԳՌ ցանկացել է 2000 հարցվածներին մեկ պետության, ապա մեծահասակները, Ռոդ կղզի, որ պետք է մոտ 30 անգամ ավելի բարձր հավանականություն ներառելու քան մեծահասակների Կալիֆորնիայում (Rhode Island: 2,000 հարցվողները մեկ 800.000 մեծահասակների vs Կալիֆորնիայում `2,000 հարցվողները մեկ 30,000,000 մեծահասակների): Քանի որ մենք տեսնում ենք, ավելի ուշ, այս տեսակ նմուշառման հետ անհավասար հավանականությամբ տեղի է ունենում առցանց աղբյուրների տվյալների, բայց ի տարբերություն CPS, նմուշառման մեխանիզմը սովորաբար հայտնի չէ կամ վերահսկվում են հետազոտողի:

Հաշվի առնելով նրա նմուշառում դիզայն, CPS չէ ուղղակիորեն ներկայացուցիչը ԱՄՆ, այն ներառում է չափազանց շատ մարդկանց Ռոդ Այլենդ եւ շատ քիչ է Կալիֆորնիայում: Հետեւաբար, այն կլիներ գնահատել գործազրկության մակարդակը երկրում, ինչպես նաեւ գործազրկության մակարդակը նմուշի. Փոխարենը նմուշ է նշանակում, որ դա ավելի լավ է վերցնել կշռված միջինը, որտեղ կշիռները հաշիվ այն բանի համար, որ մարդիկ Ռոդ Այլենդ էին, ավելի հավանական է, որ ընդգրկված է, քան մարդկանց Կալիֆորնիայում: Օրինակ, յուրաքանչյուր մարդ, Կալիֆորնիայից կլինի upweighted- են, որ հաշվել ավելի գնահատականներով-ի եւ յուրաքանչյուր անձի Այլենդից կլինի downweighted-են, որ հաշվում ավելի քիչ գնահատականի: Ըստ էության, դուք տրվում ավելի ձայնը մարդկանց, որոնք դուք ավելի քիչ հավանական է իմանալ, թե.

Սա toy օրինակը ցույց է տալիս, կարեւոր, բայց սովորաբար misunderstood կետ: նմուշ կարիք չունի լինել մանրանկարչություն տարբերակը բնակչության որպեսզի արտադրել լավ նախահաշիվները: Եթե բավականաչափ հայտնի է, թե ինչպես է տվյալները հավաքագրվել, ապա այդ տեղեկատվությունը կարող է օգտագործվել, երբ գնահատումների նմուշի: Մոտեցումը Ես պարզապես նկարագրել եւ, որ ես նկարագրել, մաթեմատիկորեն տեխնիկական հավելվածում-ընկնում շրջանակներում դասական հավանականությունը նմուշառման շրջանակներում: Հիմա, ես ցույց կտամ, թե ինչպես է, որ նույն գաղափարը կարող է կիրառվել ոչ հավանականություն նմուշների.