3.4.1 સંભવના નમૂના: ડેટા સંગ્રહ અને માહિતી વિશ્લેષણ

વજન વિકૃતિઓનો ઈરાદાપૂર્વક નમૂના પ્રક્રિયા કારણે પૂર્વવત્ કરી શકો છો.

સંભવના નમૂનાઓ જ્યાં તે તમામ લોકો જાણીતી, બિન-શૂન્ય સમાવેશ સંભાવના હોય છે, અને સરળ સંભાવના નમૂના ડિઝાઇન રેન્ડમ નમૂના જ્યાં દરેક વ્યક્તિ સમાવેશ સમાન સંભાવના ધરાવે છે સરળ છે. ઉત્તરદાતાઓ સંપૂર્ણ અમલ (દા.ત., કોઈ કવરેજ ભૂલ અને કોઈ બિન-પ્રતિભાવ) સાથે સરળ રેન્ડમ નમૂના દ્વારા પસંદ કરવામાં આવે છે, ત્યારે પછી અંદાજ છે, કારણ કે નમૂના કરશે પર વસ્તી એક લઘુ આવૃત્તિ સરેરાશ બની સરળ છે.

સરળ રેન્ડમ નમૂના ભાગ્યે જ વ્યવહારમાં ઉપયોગ થાય છે, તેમ છતાં. તેના બદલે, સંશોધકો ઈરાદાપૂર્વક ક્રમમાં ખર્ચ ઘટાડવા અને ચોકસાઈ વધારવા માટે સમાવેશ અસમાન સંભાવનાઓ સાથે લોકો પસંદ કરો. સંશોધકો ઈરાદાપૂર્વક સમાવેશ વિવિધ સંભાવનાઓ સાથે લોકો પસંદ કરે છે, ત્યારે પછી ગોઠવણો નમૂના પ્રક્રિયા કારણે વિકૃતિઓનો પૂર્વવત્ કરવા માટે જરૂરી છે. બીજા શબ્દોમાં કહીએ તો, અમે કેવી રીતે નમૂના માંથી સામાન્ય કેવી રીતે નમૂના પસંદ કરવામાં આવી હતી પર આધાર રાખે છે.

ઉદાહરણ તરીકે, વર્તમાન વસ્તી સર્વે (CPS) બેરોજગારી દર અંદાજ માટે યુએસ સરકાર દ્વારા ઉપયોગ થાય છે. દર મહિને આશરે 1,00,000 લોકો મુલાકાત આવે છે, ક્યાં તો ચહેરો-થી-ચહેરો અથવા ફોન પર છે, અને પરિણામો અંદાજ બેરોજગારીનો દર પેદા કરવા માટે વપરાય છે. કારણ કે સરકાર દરેક રાજ્યમાં બેરોજગારીનો દર અંદાજ કરવા ઈચ્છે છે, તે કારણ કે નાની વસ્તી માટે (દા.ત., રોડે આઇલેન્ડ) અને મોટી વસતી સાથે સ્ટેટસથી ઘણા રાજ્યો માં પણ થોડા ઉત્તરદાતાઓ પેદા કરશે પુખ્ત એક સરળ રેન્ડમ નમૂના ન કરી શકો (દા.ત. , કેલિફોર્નિયા). તેના બદલે, જુદા જુદા દરે વિવિધ રાજ્યોમાં CPS નમૂનાઓ લોકો એક પ્રક્રિયા પસંદગી અસમાન સંભાવના સાથે સ્તરીય નમૂના કહેવાય છે. ઉદાહરણ તરીકે, જો CPS 2,000 ઉત્તરદાતાઓ ઇચ્છતા રાજ્ય દીઠ, તો પછી રોડે આઇલેન્ડ પુખ્ત કેલિફોર્નિયામાં પુખ્ત કરતાં સમાવેશ લગભગ 30 ગણું વધારે સંભાવના હશે (રોડે આઇલેન્ડ: 800,000 પુખ્ત દીઠ 2,000 ઉત્તરદાતાઓ વિ કેલિફોર્નિયા: 30,000,000 પુખ્ત દીઠ 2,000 ઉત્તરદાતાઓ). અમે પાછળથી જોશો છે, અસમાન સંભાવના સાથે નમૂના આ પ્રકારની પણ માહિતી ઓનલાઇન સ્રોતો સાથે થાય છે, પરંતુ CPS જેમ નહિં પણ, નમૂના પદ્ધતિ સામાન્ય રીતે જાણીતી અથવા સંશોધક દ્વારા નિયંત્રિત છે.

તેના નમૂના ડિઝાઇન આપેલ છે, CPS સીધા પ્રતિનિધિ નથી; તે રોડે આઇલેન્ડ થી ઘણા બધા લોકો અને કેલિફોર્નિયાના ખૂબ થોડા સમાવેશ થાય છે. તેથી, તે નમૂના બેરોજગારીનો દર સાથે દેશમાં બેરોજગારીનો દર અંદાજ ખોટો હશે. તેના બદલે નમૂના સરેરાશ, તે સરેરાશ, જ્યાં વજન હકીકત માટે એકાઉન્ટ છે રોડે આઇલેન્ડ લોકો વધુ કેલિફોર્નિયાના લોકો કરતાં સમાવેશ થવાની શક્યતા હતી લેવા માટે સારી છે. ઉદાહરણ તરીકે, કેલિફોર્નિયા દરેક વ્યક્તિ હશે upweighted- તેઓ રોડે આઇલેન્ડ થી અંદાજ અને દરેક વ્યક્તિ હશે વધુ ગણતરી કરશે downweighted તેઓ અંદાજ ઓછી ગણતરી કરશે. જરૂરીયાતમાં, તમે લોકો કે જે તમે ઓછી વિશે જાણવા માટે શક્યતા છે વધુ અવાજ આપવામાં આવે છે.

આ રમકડું ઉદાહરણ એક મહત્વપૂર્ણ પરંતુ સામાન્ય રીતે ગેરસમજ બિંદુ સમજાવે છે: એક નમૂનો ક્રમમાં સારી અંદાજ પેદા કરવા માટે વસ્તી એક લઘુ આવૃત્તિ હોઈ જરૂર નથી. પૂરતી કેવી રીતે માહિતી એકત્રિત કરવામાં આવી હતી વિશે ઓળખાય છે, તો પછી તે માહિતીનો ઉપયોગ જ્યારે નમૂના માંથી અંદાજો વાપરી શકાય છે. અભિગમ હું ફક્ત વર્ણવેલ અને છે કે હું ટેકનિકલ માં ગાણિતિક વર્ણન શાસ્ત્રીય સંભાવના નમૂના માળખામાં squarely પરિશિષ્ટ-પડે છે. હવે, હું કેવી રીતે તે જ વિચાર બિન-સંભાવના નમૂનાઓ માટે લાગુ પાડી શકાય બતાવીશું.