3.4 કોણ પૂછી

ડિજિટલ વય પ્રેક્ટિસમાં સંભાવનાનું સેમ્પલિંગ સખત બનાવે છે અને બિન-સંભાવના નમૂના માટે નવી તક ઊભી કરી રહ્યું છે.

નમૂનાના ઇતિહાસમાં, બે સ્પર્ધાત્મક અભિગમો છે: સંભાવના નમૂના પદ્ધતિઓ અને બિન-સંભાવના નમૂના પદ્ધતિઓ. નમૂનાના પ્રારંભિક દિવસોમાં બંને અભિગમોનો ઉપયોગ થતો હોવા છતાં, સંભાવનાનું નમૂના પ્રભુત્વ બન્યું છે, અને ઘણા સામાજિક સંશોધકોને મહાન નાસ્તિકતા સાથે બિન-સંભાવના નમૂના જોવાનું શીખવવામાં આવે છે. તેમ છતાં, જેમ હું નીચે વર્ણન કરું છું, ડિજિટલ વય દ્વારા બનાવવામાં આવેલા ફેરફારોનો મતલબ એવો થાય છે કે સંશોધકો માટે બિન-સંભાવના નમૂના પર પુનર્વિચાર કરવાની સમય છે. ખાસ કરીને, સંભાવના નમૂના પ્રેક્ટિસમાં કરવું મુશ્કેલ થઈ રહ્યું છે, અને બિન-સંભાવના નમૂના ઝડપી, સસ્તો, અને વધુ સારી રીતે મેળવવામાં આવે છે. વધુ ઝડપી અને સસ્તું સર્વેક્ષણો માત્ર પોતાની જાતે જ સમાપ્ત થતા નથી: તેઓ વધુ વારંવાર સર્વેક્ષણ અને મોટા સેમ્પલ માપો જેવા નવા તકોને સક્ષમ કરે છે. ઉદાહરણ તરીકે, બિન-સંભાવના પદ્ધતિઓનો ઉપયોગ કરીને કોઓપરેટિવ કોંગ્રેશનલ ઇલેક્શન સ્ટડી (સીસીઇએસ) સંભાવના નમૂનાનો ઉપયોગ કરતા પહેલાંના અભ્યાસો કરતા આશરે 10 ગણો વધારે સહભાગીઓ ધરાવે છે. આ મોટા પ્રમાણમાં સેમ્પલ રાજકીય સંશોધકોને પેટા જૂથો અને સામાજિક સંદર્ભમાં વલણ અને વર્તનમાં વિવિધતાના અભ્યાસ માટે સક્રિય કરે છે. વધુમાં, અંદાજિત ગુણવત્તા (Ansolabehere and Rivers 2013) માં ઘટાડા વગર આ ઉમેરવામાં આવેલ તમામ પાયે આવ્યાં.

હાલમાં, સામાજિક સંશોધન માટે નમૂનારૂપ અભિગમ સંભાવના નમૂના છે . સંભાવના નમૂનામાં, લક્ષ્ય વસ્તીના તમામ સભ્યોની જાણ કરવામાં આવે છે, નોનઝોરોની સંભાવનાને સેમ્પલ કરવામાં આવે છે, અને સેમ્પલ કરવામાં આવેલા બધા લોકો સર્વેક્ષણનો પ્રતિસાદ આપે છે. જ્યારે આ શરતો પૂર્ણ થાય છે, ત્યારે ભવ્ય ગાણિતિક પરિણામો પ્રાયોગિક બાંયધરી આપે છે, જે લક્ષ્યાંક વસ્તી વિશેના સંદર્ભમાં નમૂના બનાવવા માટે સંશોધકની ક્ષમતા વિશેની તક આપે છે.

વાસ્તવિક દુનિયામાં, જો કે, આ ગાણિતિક પરિણામોની અંતર્ગત શરતો ભાગ્યે જ મળ્યા છે. ઉદાહરણ તરીકે, ઘણીવાર કવરેજની ભૂલો અને બિનપ્રસાર છે. આ સમસ્યાઓના કારણે, સંશોધકોને ઘણી વખત સંખ્યાત્મક ગોઠવણોનો ઉપયોગ કરવો પડે છે જેથી તેમના નમૂનામાંથી તેમના લક્ષ્યાંક વસ્તીમાં અનુમાન લગાવવા માટે. આમ, થિયરીમાં સંભાવના નમૂનાની વચ્ચે તફાવત હોવાનું જણાય છે , જેમાં મજબૂત સૈદ્ધાંતિક બાંયધરી છે, અને વ્યવહારમાં સંભાવના નમૂના છે , જે આ પ્રકારની બાંયધરી આપતી નથી અને વિવિધ આંકડાકીય ગોઠવણો પર આધાર રાખે છે.

સમય જતાં સિદ્ધાંતમાં સંભાવના સેમ્પલિંગ અને વ્યવહારમાં સંભાવના સેમ્પલિંગ વચ્ચેનો તફાવત વધી રહ્યો છે. ઉદાહરણ તરીકે, ઉચ્ચ ગુણવત્તાવાળા, ખર્ચાળ સર્વેક્ષણો (આંકડાની 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) માં પણ બિનઅનુભવી દર સતત વધી રહી છે. વાણિજ્યિક ટેલિફોન સર્વેમાં નોનપ્રોપ્સ દર ખૂબ ઊંચો છે-ક્યારેક તો 90% જેટલા ઊંચા (Kohut et al. 2012) . બિનસત્તાધિકારીમાં આ વધારો અંદાજોની ગુણવત્તાને ધમકાવે છે કારણ કે અંદાજો વધુને વધુ આંકડાકીય મોડલ પર આધાર રાખે છે કે જે સંશોધકો નોન-પ્રતિસાદ માટે સંતુલિત કરવા માટે ઉપયોગ કરે છે. વધુમાં, ઉચ્ચ પ્રતિભાવ દર જાળવવા મોજણી સંશોધકો દ્વારા વધુ મોંઘા પ્રયત્નો હોવા છતાં ગુણવત્તામાં આ ઘટાડો થયો છે. કેટલાક લોકોને ડર છે કે ગુણવત્તામાં ઘટાડો અને વધતા ખર્ચના આ ટ્વીન વલણો સર્વેક્ષણ સંશોધન (National Research Council 2013) ના પાયાને ધમકાવે છે.

આકૃતિ 3.5: ઉચ્ચ ગુણવત્તાવાળી મોંઘા સર્વેક્ષણો (નેશનલ રિસર્ચ કાઉન્સિલ 2013; બી.ડી. મેયર, મોક અને સુલિવાન 2015) માં બિનપ્રસન્નતા સતત વધી રહી છે. વાણિજ્યિક ટેલિફોન્સ સર્વેક્ષણો માટે નોનપ્રોપ્સ દર ખૂબ ઊંચો છે, કેટલીક વાર 90% જેટલા ઊંચા (કોહટ એટ અલ .2012). બિનસાદેશમાં આ લાંબા ગાળાના ટ્રેન્ડ્સનો મતલબ એ છે કે ડેટા સંગ્રહ વધુ મોંઘા છે અને અંદાજો ઓછા વિશ્વસનીય છે. બી ડી મેયર, મોક, અને સુલિવાન (2015), આકૃતિ 1 માંથી તારવેલી.

આકૃતિ 3.5: ઉચ્ચ ગુણવત્તાવાળી મોંઘા સર્વેક્ષણો (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) માં બિનપ્રસન્નતા સતત વધી રહી છે. વાણિજ્યિક ટેલિફોન્સ સર્વેક્ષણો માટે નોનપ્રોપ્સ દર ખૂબ ઊંચો છે, કેટલીક વાર 90% જેટલા ઊંચા (Kohut et al. 2012) . બિનસાદેશમાં આ લાંબા ગાળાના ટ્રેન્ડ્સનો મતલબ એ છે કે ડેટા સંગ્રહ વધુ મોંઘા છે અને અંદાજો ઓછા વિશ્વસનીય છે. BD Meyer, Mok, and Sullivan (2015) , આકૃતિ 1 થી અપનાવવામાં આવ્યું.

તે જ સમયે સંભાવના નમૂના પદ્ધતિઓ માટે વધતી મુશ્કેલીઓ આવી રહી છે, બિન-સંભાવના નમૂના પદ્ધતિઓમાં આકર્ષક વિકાસ પણ છે. બિન-સંભાવના નમૂના પદ્ધતિઓના વિવિધ પ્રકારો છે, પરંતુ એક વસ્તુ જે તેમની પાસે સામાન્ય છે તે છે કે તેઓ સંભવિતતાના નમૂનાના ગાણિતીક માળખામાં સરળતાથી બેસી શકતા નથી (Baker et al. 2013) . બીજા શબ્દોમાં કહીએ તો, બિન-સંભાવના નમૂનારૂપ પદ્ધતિમાં દરેક વ્યક્તિને સામેલ કરવાની જાણીતી અને નોનઝોરો સંભાવના નથી. બિન-સંભાવના નમૂના પદ્ધતિઓ સામાજિક સંશોધકો વચ્ચે ભયંકર પ્રતિષ્ઠા ધરાવે છે અને તેઓ સર્વેક્ષણ સંશોધકો, જેમ કે લિટરરી ડાઇજેસ્ટ ફિયાસ્કા (અગાઉની ચર્ચા) અને "ડ્યૂઇ ડેફિટ્સ ટ્રુમૅન" જેવી કેટલીક નાટ્યાત્મક નિષ્ફળતા સાથે સંકળાયેલા છે, યુએસ વિશે ખોટી આગાહીઓ 1 9 48 ની રાષ્ટ્રપ્રમુખની ચુંટણી (આંકડા 3.6)

આકૃતિ 3.6: પ્રમુખ હેરી ટ્રુમૅન એક અખબારની હેડલાઇન ધરાવે છે જે ખોટી રીતે તેની હારની જાહેરાત કરી હતી. આ હેડલાઇન બિન-સંભાવનાના નમૂનાના અંદાજ પર આધારિત હતી (સૌથી વધુ વિક્રેતા 1949; બીન 1950; ફ્રીડમેન, પિસાની, અને પુર્વોસ 2007). ડેવી ડેફેટ્સ ટ્રુમૅન 1 9 48 માં થયું હોવા છતાં, તે હજુ પણ છે કારણ કે કેટલાક સંશોધકો બિન-સંભાવના નમૂનાઓમાંથી અંદાજો વિશે શંકાસ્પદ છે. સોર્સ: હેરી એસ ટ્રુમૅન લાઇબ્રેરી એન્ડ મ્યુઝિયમ.

આકૃતિ 3.6: પ્રમુખ હેરી ટ્રુમૅન એક અખબારની હેડલાઇન ધરાવે છે જે ખોટી રીતે તેની હારની જાહેરાત કરી હતી. આ હેડલાઇન બિન-સંભાવનાના નમૂનાના અંદાજ પર આધારિત હતી (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) . 1 9 48 માં "ડેવી ડેફેટ્સ ટ્રુમૅન" બન્યું હોવા છતાં, તે હજુ પણ છે કારણ કે કેટલાક સંશોધકો બિન-સંભાવના નમૂનાઓમાંથી અંદાજ વિશે શંકાસ્પદ છે. સોર્સ: હેરી એસ ટ્રુમૅન લાઇબ્રેરી એન્ડ મ્યુઝિયમ .

બિન-સંભાવના નમૂનારૂપ એક સ્વરૂપ જે ડિજિટલ વય માટે યોગ્ય છે તે ઓનલાઇન પૅનલ્સનો ઉપયોગ છે. ઓનલાઇન પૅનલોના ઉપયોગથી સંશોધકો કેટલાક પેનલ પ્રદાતાઓ-સામાન્ય રીતે એક કંપની, સરકાર અથવા યુનિવર્સિટી-પર આધાર રાખે છે-સર્વેક્ષણો માટે પ્રતિસ્પર્ધીઓ તરીકે સેવા આપવા માટે સંમત થાય તેવા લોકોના વિશાળ, વિવિધ જૂથનું નિર્માણ કરો. આ પેનલ સહભાગીઓને વિવિધ પ્રકારના એડ હૉક પદ્ધતિઓનો ઉપયોગ કરીને ભરતી કરવામાં આવે છે જેમ કે ઓનલાઇન બેનર જાહેરાતો. પછી, સંશોધક ઇચ્છિત લાક્ષણિકતાઓ (ઉદાહરણ તરીકે, પુખ્ત વયના રાષ્ટ્રીય પ્રતિનિધિઓ) સાથે ઉત્તરદાતાઓના નમૂનાની ઍક્સેસ માટે પેનલ પ્રદાતાને ચૂકવણી કરી શકે છે. આ ઓનલાઈન પેનલ્સ બિન-સંભાવના પદ્ધતિઓ છે કારણ કે દરેકમાં કોઈ જાણીતી નથી, તેમાં શામેલ થવાની સંભાવના છે. બિન-સંભાવના ઑનલાઇન પેનલ સામાજિક સંશોધકો (દા.ત. સીસીઇએસ) દ્વારા પહેલેથી જ ઉપયોગમાં લેવામાં આવે છે, તેમ છતાં, તેમાંથી અંદાજોની ગુણવત્તા વિશે કેટલીક ચર્ચા હજુ પણ છે (Callegaro et al. 2014) .

આ ચર્ચાઓ હોવા છતાં, મને લાગે છે કે બે કારણો શા માટે સામાજિક સંશોધકો માટે બિન સંભાવના નમૂના પુનર્વિચાર સમય યોગ્ય છે. પ્રથમ, ડિજિટલ વયમાં, બિન-સંભાવના નમૂનાઓના સંગ્રહ અને વિશ્લેષણમાં ઘણાં વિકાસ થયા છે. આ નવી પદ્ધતિઓ એવી પદ્ધતિઓથી અલગ છે જે ભૂતકાળમાં સમસ્યા ઊભી કરે છે જે મને લાગે છે કે તેને "બિન-સંભાવના નમૂના 2.0 તરીકે ગણવામાં આવે છે." બીજું કારણ સંશોધકોએ બિન-સંભાવના નમૂના લેવાનું પુનર્વિચારવું જોઈએ કારણ કે સંભાવના નમૂનામાં પ્રથા વધુને વધુ મુશ્કેલ બની છે જ્યારે બિન-પ્રતિક્રિયાના ઊંચા દરો હોય છે - કારણ કે ત્યાં વાસ્તવિક સર્વેક્ષણો છે-ઉત્તરદાતાઓ માટેના સમાવેશની વાસ્તવિક સંભાવનાઓને ઓળખવામાં આવતી નથી, અને તેથી, સંભાવનાના નમૂના અને બિન-સંભાવનાના નમૂનાઓ અલગ નથી કારણ કે ઘણા સંશોધકો માને છે.

મેં અગાઉ જણાવ્યું તેમ, ઘણા સામાજિક સંશોધકો દ્વારા બિન-સંભાવનાના નમૂનાઓને મહાન નાસ્તિકતા સાથે જોવામાં આવે છે, કારણ કે મોજણી સંશોધનના પ્રારંભિક દિવસોમાં કેટલીક કેટલીક મૂંઝવતી નિષ્ફળતાઓમાં તેમની ભૂમિકાને કારણે અમે બિન-સંભાવનાના નમૂનાઓ સાથે કેવી રીતે આવ્યા છીએ તેનું સ્પષ્ટ ઉદાહરણ એ છે કે વેઇ વાંગ, ડેવિડ રોથ્સચાઇલ્ડ, શરદ ગોયલ અને એન્ડ્રુ ગેલમેન (2015) દ્વારા સંશોધન કરવામાં આવ્યું છે, જે 2012 ના યુ.એસ. ચૂંટણીના પરિણામને બિન-સંભાવના નમૂનાનો ઉપયોગ કરીને પુનઃપ્રાપ્ત કરે છે. અમેરિકન એક્સબોક્સ વપરાશકર્તાઓ-અમેરિકનોના નિશ્ચિતપણે બિન-રેન્ડમ નમૂના સંશોધકોએ XBox ગેમિંગ સિસ્ટમમાંથી ઉત્તરદાતાઓની ભરતી કરી હતી, અને તમે અપેક્ષા રાખી શકો છો કે, એક્સબોક્સના નમૂનામાં નર અને નકામા યુવાનનો સમાવેશ થાય છે: 18- થી 29 વર્ષની વયના લોકો 19% મતદારો બનાવે છે, પરંતુ 65% એક્સબોક્સના નમૂના અને પુરુષો અપ 47% મતદાર મતો પરંતુ 93% એક્સબોક્સ સેમ્પલ (આકૃતિ 3.7). આ મજબૂત વસ્તીવિષયક પૂર્વગ્રહના કારણે, રોકડ એક્સબોક્સ ડેટા ચૂંટણીના વળતરના નબળા સૂચક હતા. તે બરાક ઓબામા ઉપર મિટ રોમાની માટે મજબૂત વિજયની આગાહી કરે છે. ફરીથી, આ કાચા, બિનજરૂરી બિન-સંભાવનાવાળા નમૂનાઓના જોખમોનું બીજું ઉદાહરણ છે અને સાહિત્યિક ડાઇજેસ્ટ ફિયાસ્કોની યાદ અપાવે છે.

આકૃતિ 3.7: ડબ્લ્યુ. વાંગ એટ અલમાં ઉત્તરદાતાઓના વસતીવિષયક (2015). કારણ કે ઉત્તરદાતાઓને XBox માંથી ભરતી કરવામાં આવી હતી, 2012 ના ચૂંટણીમાં મતદારોને લગતી, તેઓ યુવાન અને વધુ પુરૂષ બનવાની સંભાવના ધરાવતા હતા. ડબ્લ્યુ. વેંગ એટ અલ પરથી રૂપાંતરિત. (2015), આકૃતિ 1.

આકૃતિ 3.7: W. Wang et al. (2015) ઉત્તરદાતાઓના વસતીવિષયક W. Wang et al. (2015) . કારણ કે ઉત્તરદાતાઓને XBox માંથી ભરતી કરવામાં આવી હતી, 2012 ના ચૂંટણીમાં મતદારોને લગતી, તેઓ યુવાન અને વધુ પુરૂષ બનવાની સંભાવના ધરાવતા હતા. W. Wang et al. (2015) પરથી રૂપાંતરિત W. Wang et al. (2015) , આકૃતિ 1.

જો કે, વાંગ અને સહકાર્યકરો આ સમસ્યાઓથી વાકેફ હતા અને અંદાજ કરતી વખતે તેમના બિન-રેન્ડમ નમૂનાકરણ પ્રક્રિયા માટે સંતુલિત કરવાનો પ્રયાસ કર્યો હતો. ખાસ કરીને, તેઓ પોસ્ટ-સ્તરીકરણનો ઉપયોગ કરતા હતા, એવી તકનીક જેનો ઉપયોગ સંભવના નમૂનાઓને વ્યવસ્થિત કરવા માટે પણ કરવામાં આવે છે જેમાં કવરેજ ભૂલો અને બિન-પ્રતિસાદ હોય છે.

પોસ્ટ-સ્તરીકરણનો મુખ્ય વિચાર લક્ષ્ય વસ્તી વિશે સહાયક માહિતીનો ઉપયોગ કરવો છે, જે નમૂનામાંથી આવેલો અંદાજ સુધારવામાં મદદ કરે છે. તેમના બિન-સંભાવના નમૂનામાંથી અંદાજ કાઢવા માટે પોસ્ટ-સ્તરીકરણનો ઉપયોગ કરતી વખતે, વૅંગ અને સહયોગીએ વસ્તીને જુદા જુદા જૂથોમાં અદૃશ્ય કરીને, દરેક જૂથમાં ઓબામાને ટેકો આપ્યો હોવાનો અંદાજ કાઢ્યો અને પછી એકંદરે અંદાજનું નિર્માણ કરવા માટે જૂથ અંદાજોની ભારિત સરેરાશ લીધી. ઉદાહરણ તરીકે, તેઓ વસ્તીને બે જૂથો (પુરૂષો અને સ્ત્રીઓ) માં વિભાજિત કરી શક્યા હોત, પુરુષો અને સ્ત્રીઓ વચ્ચે ઓબામા માટેના સમર્થનને અંદાજ આપ્યો હતો અને ત્યારબાદ હકીકત એ છે કે મહિલાઓને બનાવવા માટે ભારિત સરેરાશને લઈને ઓબામા માટે એકંદરે સપોર્ટનો અંદાજ છે 53 ટકા મતદારો અને 47 ટકા પુરુષો. સમૂહોના કદ વિશે સહાયક માહિતી લાવીને આશરે પોસ્ટ-સ્તરીકરણ અસંતુલિત નમૂના માટે યોગ્ય ઠરે છે.

પોસ્ટ સ્તરીકરણની ચાવી યોગ્ય જૂથો રચે છે. જો તમે વસતીને સમાન સમૂહોમાં વિભાજીત કરી શકો છો, જેમ કે, પ્રત્યેક સમૂહમાં પ્રત્યેક પ્રતિક્રિયાઓ સમાન છે, પછી પોસ્ટ-સ્તરીકરણ અસ્પષ્ટ અંદાજો ઉત્પન્ન કરશે. બીજા શબ્દોમાં કહીએ તો, જાતિ દ્વારા થાકી ગયેલી ઉચ્ચારણથી નિશ્ચિત અંદાજ ઉત્પન્ન થાય છે જો બધા પુરુષોની પ્રતિક્રિયા હોય અને બધી સ્ત્રીઓની જ પ્રતિભાવની પ્રકૃતિ હોય. આ ધારણાને સમરૂપ-પ્રતિક્રિયા-પ્રતિકારકતા-જૂથોની ધારણા કહેવામાં આવે છે, અને હું આ પ્રકરણના અંતમાં ગાણિતિક નોંધોમાં થોડી વધુ વર્ણન કરું છું.

અલબત્ત, અસંભવિત લાગે છે કે પ્રતિક્રિયા પ્રગતિ તમામ પુરુષો અને તમામ મહિલાઓ માટે સમાન હશે. જો કે, સમૂહો-પ્રતિક્રિયા-પ્રત્યાઘાતો-જૂથોમાં ધારણા વધુ પ્રતિષ્ઠિત બની જાય છે કારણ કે જૂથોની સંખ્યા વધે છે. જો તમે વધુ જૂથો બનાવો છો તો લગભગ સમાન જનતાને વસ્તીમાં વિનિમય કરવો સરળ છે. દાખલા તરીકે, એવું લાગે છે કે બધી સ્ત્રીઓની પ્રતિક્રિયા સમાન હોય છે, પરંતુ તે વધુ પ્રતિબદ્ધ લાગે છે કે 18-29 વર્ષની વયના તમામ મહિલાઓ માટે તે જ પ્રતિક્રિયા ઝોક છે, જેમણે કોલેજમાંથી સ્નાતકની પદવી મેળવી છે અને કેલિફોર્નિયામાં જીવે છે. . આ રીતે, પોસ્ટ-સ્તરીકરણમાં ઉપયોગમાં લેવાતા જૂથોની સંખ્યા વધુ મોટો બની જાય છે, પદ્ધતિને ટેકો આપવા માટે ધારણા વધુ વાજબી હોય છે. આ હકીકતને ધ્યાનમાં રાખીને, સંશોધકો ઘણી વખત પોસ્ટ-સ્તરીકરણ માટે જૂથોની વિશાળ સંખ્યા બનાવવા માંગે છે. જોકે, જૂથોની સંખ્યામાં વધારો થતાં, સંશોધકો એક અલગ સમસ્યામાં ચાલે છે: ડેટા સ્પારિસી. જો દરેક સમૂહમાં માત્ર થોડા જ લોકો હોય, તો અંદાજ વધુ અનિશ્ચિત હશે, અને અત્યંત કિસ્સામાં જ્યાં કોઈ પ્રતિવાદીઓ ધરાવતા જૂથ હશે, પછી પોસ્ટ-સ્તરીકરણ સંપૂર્ણપણે તૂટી જાય છે

સમોમત-પ્રતિભાવ-વલણ-સમૂહોની ધારણા અને દરેક સમૂહમાં યોગ્ય નમૂના માપોની માંગની દૃષ્ટિએ આ અંતર્ગત તણાવમાંથી બે માર્ગો છે. પ્રથમ, સંશોધકો મોટા, વધુ વૈવિધ્યસભર નમૂના એકત્રિત કરી શકે છે, જે દરેક જૂથમાં વાજબી નમૂનો માપોને સુનિશ્ચિત કરવામાં મદદ કરે છે. બીજું, તેઓ જૂથોમાં અંદાજ કરવા માટે વધુ સુસંસ્કૃત આંકડાકીય મોડલનો ઉપયોગ કરી શકે છે. અને, વાસ્તવમાં, ક્યારેક સંશોધકો બંને કરે છે, કારણ કે વાંગ અને સહકાર્યકરોએ એક્સબોક્સના ઉત્તરદાતાઓનો ઉપયોગ કરીને ચૂંટણીના અભ્યાસ સાથે કર્યું છે.

કારણ કે તેઓ કમ્પ્યુટર-વહીવટ ઇન્ટરવ્યુ સાથે બિન-સંભાવના નમૂના પદ્ધતિનો ઉપયોગ કરતા હતા (હું વિભાગ 3.5 માં કોમ્પ્યુટર-વહીવટી મુલાકાતો વિશે વધુ વાત કરીશ), વાંગ અને તેના સાથીઓએ ખૂબ સસ્તું માહિતી સંગ્રહ કર્યો હતો, જે તેમને 345,858 અનન્ય સહભાગીઓ પાસેથી માહિતી એકત્ર કરવા સક્ષમ બનાવ્યું હતું , ચૂંટણી મતદાનના ધોરણો દ્વારા એક વિશાળ સંખ્યા. આ વિશાળ નમૂનાનું કદ તેમને પોસ્ટ-સ્તરીકરણ જૂથોની વિશાળ સંખ્યા બનાવવા માટે સક્રિય કરે છે. વસ્તી અને સહકર્મીઓએ વસ્તીને સેંકડો જૂથોમાં કાપવાનો સમાવેશ કરે છે, જ્યારે જાતિ (2 શ્રેણીઓ), જાતિ (4 શ્રેણીઓ), વય (4 વર્ગો), શિક્ષણ (4 વર્ગો), શિક્ષણ (4 વર્ગો), રાજ્ય દ્વારા વ્યાખ્યાયિત 176,256 જૂથોમાં વસ્તીને વિભાજિત કરી છે. (51 શ્રેણીઓ), પાર્ટી આઈડી (3 વર્ગો), વિચારધારા (3 વર્ગો), અને 2008 મત (3 વર્ગો). બીજા શબ્દોમાં કહીએ તો, તેમના વિશાળ નમૂનાનું કદ, જે ઓછા ખર્ચે ડેટા સંગ્રહ દ્વારા સક્ષમ હતું, તેમને તેમના અંદાજ પ્રક્રિયાની વધુ પ્રતિષ્ઠિત ધારણા કરવા સક્ષમ બનાવ્યું.

પણ 345,858 અનન્ય સહભાગીઓ સાથે, તેમ છતાં, હજુ પણ ઘણા, ઘણા જૂથો હતા, જેના માટે વાંગ અને તેના સાથીઓ પાસે લગભગ કોઈ ઉત્તરદાતાઓ નથી. તેથી, તેઓ દરેક જૂથમાં ટેકોનો અંદાજ કાઢવા માટે મલ્ટિલેવલ રિગેશન તરીકે ઓળખાતી તકનીકનો ઉપયોગ કરે છે. અનિવાર્યપણે, એક ચોક્કસ જૂથમાં ઓબામાને ટેકો આપવાનો અંદાજ કાઢવા માટે, ઘણા નજીકના સંબંધિત જૂથોમાંથી મલ્ટિલેવલ રીગ્રેસન પૂલ કરે છે. ઉદાહરણ તરીકે, 18 થી 29 વર્ષના વચ્ચેના મહિલા હિસ્પેનિક્સમાં ઓબામાને ટેકો આપવાનો પ્રયાસ કરવાની કલ્પના કરો, જેઓ કૉલેજ ગ્રેજ્યુએટ છે, જેઓ ડેમોક્રેટ્સ રજિસ્ટર્ડ છે, જેઓ મધ્યસ્થી તરીકે પોતાની ઓળખ ધરાવે છે અને 2008 માં ઓબામા માટે મતદાન કર્યું હતું. , ખૂબ વિશિષ્ટ ગ્રુપ, અને શક્ય છે કે આ લાક્ષણિકતાઓ સાથે નમૂનામાં કોઇ નથી. તેથી, આ જૂથ વિશે અંદાજ કાઢવા માટે, મલ્ટિલેવલ રીગ્રેસન આંકડાકીય મોડલનો ઉપયોગ કરે છે, જેમાં સમાન જૂથોમાં લોકોના અંદાજનો સમાવેશ થાય છે.

આમ, વાંગ અને સહકાર્યકરોએ એક અભિગમનો ઉપયોગ કર્યો છે જે બહુસ્તરીય રીગ્રેસન અને પોસ્ટ-સ્તરીકરણને એકત્રિત કરે છે, જેથી તેઓ પોસ્ટ-સ્તરીકરણ સાથે અથવા વધુ પ્રેમથી તેમની વ્યૂહરચના મલ્ટિલેવલ રીગ્રેસન કહે છે. પી. "જ્યારે વાંગ અને સહકર્મીઓએ શ્રી પી. નો ઉપયોગ એક્સબોક્સ નોન-સંભાવના નમૂનામાંથી અંદાજ કાઢવા માટે કર્યો, ત્યારે તેમણે 2012 ના ચુંટણી (આંક 3.8) માં ઓબામાને મળેલા સમગ્ર સમર્થનની નજીક અંદાજ કાઢ્યો. વાસ્તવમાં તેમના અંદાજો પરંપરાગત જાહેર અભિપ્રાય મતદાનના એકંદર કરતા વધુ ચોક્કસ હતા. આમ, આ કિસ્સામાં, આંકડાકીય ગોઠવણો-ખાસ કરીને શ્રી પી.-બિન-સંભાવના ડેટામાં પૂર્વગ્રહને સુધારવામાં સારી નોકરી કરવા લાગે છે; પૂર્વગ્રહો જે સ્પષ્ટ રીતે દૃશ્યમાન હતા જ્યારે તમે અનઝેડ કરેલા એક્સબોક્સ ડેટામાંથી અંદાજો જુઓ છો

આકૃતિ 3.8: ડબ્લ્યુ. વેંગ એટ અલ પરથી અંદાજ (2015). અનઝેડ્ડ XBox નમૂના અચોક્કસ અંદાજો પેદા. પરંતુ, ભારિત એક્સબોક્સ સેમ્પલનો અંદાજ કાઢવામાં આવ્યો હતો જે સંભાવના આધારિત ટેલિફોન સર્વેક્ષણોની તુલનામાં વધુ ચોક્કસ હતા. ડબ્લ્યુ. વેંગ એટ અલ પરથી રૂપાંતરિત. (2015), આંકડાઓ 2 અને 3

આકૃતિ 3.8: W. Wang et al. (2015) પરથી અંદાજ W. Wang et al. (2015) . અનઝેડ્ડ XBox નમૂના અચોક્કસ અંદાજો પેદા. પરંતુ, ભારિત એક્સબોક્સ સેમ્પલનો અંદાજ કાઢવામાં આવ્યો હતો જે સંભાવના આધારિત ટેલિફોન સર્વેક્ષણોની તુલનામાં વધુ ચોક્કસ હતા. W. Wang et al. (2015) પરથી રૂપાંતરિત W. Wang et al. (2015) , આંકડાઓ 2 અને 3

વાંગ અને સહકર્મીઓના અભ્યાસમાંથી બે મુખ્ય પાઠ છે. પ્રથમ, બિનજરૂરી બિન-સંભાવના નમૂનાઓ ખરાબ અંદાજો તરફ દોરી શકે છે; આ એક પાઠ છે જે ઘણા સંશોધકોએ પહેલાં સાંભળ્યું છે. બીજા પાઠ, તેમછતાં, બિન-સંભાવનાના નમૂનાઓ, જ્યારે યોગ્ય રીતે વિશ્લેષણ કરવામાં આવે છે, ખરેખર સારા અંદાજો પેદા કરી શકે છે; બિન-સંભાવનાના નમૂનાઓને આપમેળે લીટરરી ડાઈજેસ્ટ ફિયાસ્કો જેવી કોઈ વસ્તુ તરફ લઈ જવાની જરૂર નથી.

આગળ વધવું, જો તમે સંભાવના નમૂનાનો અભિગમ અને બિન-સંભાવના નમૂનારૂપ અભિગમનો ઉપયોગ કરવા વચ્ચે નિર્ણય કરવાનો પ્રયાસ કરી રહ્યા હોવ તો તમને મુશ્કેલ પસંદગીનો સામનો કરવો પડશે. ક્યારેક સંશોધકો ઝડપી અને સખત નિયમ (દા.ત., હંમેશાં સંભાવના નમૂના પદ્ધતિઓનો ઉપયોગ કરે છે) ઇચ્છે છે, પરંતુ આવા નિયમ પ્રદાન કરવાનું વધુ મુશ્કેલ છે. સંશોધકો વ્યવહારમાં સંભાવના નમૂના પદ્ધતિઓ વચ્ચે મુશ્કેલ પસંદગીનો સામનો કરે છે - જે વધુને વધુ ખર્ચાળ છે અને સૈદ્ધાંતિક પરિણામોથી દૂર છે જે તેમના ઉપયોગ અને બિન-સંભાવના નમૂના પદ્ધતિઓને સચોટ બનાવે છે - જે સસ્તી અને ઝડપી છે, પરંતુ ઓછા પરિચિત અને વધુ વૈવિધ્યસભર છે. એક વસ્તુ જે સ્પષ્ટ છે, જો કે, જો તમને બિન-સંભાવનાના નમૂનાઓ અથવા બિન-પ્રતિનિધિત્વ કરતા મોટા ડેટા સ્ત્રોતો (પ્રકરણ 2 પર પાછા આવો) સાથે કામ કરવાની ફરજ પાડવામાં આવે છે, તો પછી માનવું એક મજબૂત કારણ છે કે અંદાજ પોસ્ટ-સ્તરીકરણ અને અનિશ્ચિત, કાચા અંદાજો કરતા સંબંધિત તકનીકો વધુ સારી રહેશે.