3.6.1 ആവർത്തിക്കപ്പെട്ടു ആവശ്യപ്പെട്ട്

ഡിജിറ്റൽ ട്രെയ്സുകൾ നിങ്ങളുടെ സർവേ ലിങ്കുചെയ്യുന്നു എല്ലാകാലത്തും എല്ലാവർക്കും നിങ്ങളുടെ ചോദ്യങ്ങൾ ചോദിക്കുന്ന പോലെ കഴിയും.

സാമ്പിൾ സർവ്വേകളും censuses: പൊതുവിൽ ചോദിക്കൽ പ്രധാനമായും രണ്ട് വിഭാഗങ്ങളിലായാണ് വരുന്നു. നിങ്ങൾ ഒരു ചെറിയ എണ്ണം ആക്സസ് എവിടെ സാമ്പിൾ സർവേകൾ, വഴങ്ങുന്ന സമയോചിതവും താരതമ്യേന വിലകുറഞ്ഞ കഴിയും. എന്നിരുന്നാലും, മാതൃകാവ്യാപ്തിനിർണ്ണയത്തിന്റെ, കാരണം അവർ ഒരു സാമ്പിൾ അടിസ്ഥാനമാക്കിയാണ് പലപ്പോഴും അവരുടെ ചിത്രം പരിമിതപ്പെടുത്തിയിരിക്കുന്നു; ഒരു സാമ്പിൾ സർവേ, അതു പ്രത്യേക ഭൂമിശാസ്ത്ര പ്രദേശങ്ങളിൽ കുറിച്ച് അല്ലെങ്കിൽ നിർദ്ദിഷ്ട ജനസംഖ്യാപരമായ ഗ്രൂപ്പുകൾക്ക് എസ്റ്റിമേറ്റുകൾ വരുത്തുവാൻ പലപ്പോഴും ബുദ്ധിമുട്ടാണ്. Censuses, മറുവശത്ത്, ജനസംഖ്യയിൽ എല്ലാവർക്കും അഭിമുഖം ശ്രമിക്കും. (അവർ ചോദ്യങ്ങൾ മാത്രം ഒരു ചെറിയ നമ്പർ ഉൾപ്പെടുന്നു) വലിയ റെസലൂഷൻ എങ്കിലും പൊതുവെ വില, ഫോക്കസിൽ വീതികുറഞ്ഞ, സമയബന്ധിതമായ അല്ല (അവർ പോലുള്ള ഓരോ 10 വർഷം ഒരു നിശ്ചിത ഷെഡ്യൂൾ, സംഭവിക്കാം) (Kish 1979) . ഗവേഷകർ സാമ്പിൾ സർവ്വേകളും censuses ഏറ്റവും മികച്ച സ്വഭാവസവിശേഷതകൾ സംയോജിപ്പിച്ച് കഴിഞ്ഞില്ല എങ്കിൽ ഇപ്പോൾ ഭാവനയിൽ; ഗവേഷകർ എല്ലാ ദിവസവും എല്ലാവർക്കും ഓരോ ചോദ്യം ചോദിക്കാം എങ്കിൽ ഭാവനയിൽ.

സ്പഷ്ടമായി, ഈ നിരന്തരഹോമയാഗത്തിന്നും, സാർവത്രികമായി എപ്പോഴും സർവേ സോഷ്യൽ സയൻസ് ഫാന്റസി ഒരു തരം. പക്ഷേ, ഞങ്ങൾ പല ആളുകളിൽ നിന്ന് ഡിജിറ്റൽ ട്രെയ്സുകൾ ഉള്ള ആളുകളുടെ ചെറിയ എണ്ണം നിന്ന് സർവേ ചോദ്യങ്ങൾ സംയോജിപ്പിച്ചാണ് ഏതാണ്ട് തുടങ്ങാം എന്ന് തോന്നുന്നു. ഞാൻ കോമ്പിനേഷൻ പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന ഈ തരം വിളിക്കും. നന്നായി, അത് ഞങ്ങൾക്ക് (ചെറിയ ഭൂപ്രദേശങ്ങൾ വേണ്ടി) കൂടുതൽ പ്രാദേശിക കണക്കാക്കുന്നു, കൂടുതൽ അനുരൂപമാണെന്നും (നിർദ്ദിഷ്ട ജനസംഖ്യാപരമായ ഗ്രൂപ്പുകൾക്കായി), കൂടുതൽ കൃത്യ നൽകുന്നു സഹായിക്കാൻ കഴിഞ്ഞില്ല.

പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന ഒരു ഉദാഹരണം ദരിദ്രരാജ്യങ്ങളിൽ വികസനം മികവുറ്റ സഹായിക്കുന്ന ഡാറ്റ ശേഖരിക്കാൻ ആഗ്രഹിച്ച യോശുവ Blumenstock, ജോലിക്കു വരുന്നു. പോരാഞ്ഞ്, Blumenstock സമ്പത്തും സർവേ സൌകര്യത്തോടുകൂടിയ ആവൃത്തി ഒരു സെൻസസ് പൂർണത കൂട്ടിച്ചേർക്കാം ആ ക്ഷേമത്തിനും അളക്കാൻ ഒരു സിസ്റ്റം സൃഷ്ടിക്കാൻ ആഗ്രഹിച്ചു (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . സത്യത്തിൽ, ഞാൻ ഇതിനകം Blumenstock പ്രവൃത്തി ചുരുക്കത്തിൽ അദ്ധ്യായം 1 വിവരിച്ച ഞങ്ങൾ.

ആരംഭിക്കുന്നതിന്, Blumenstock റുവാണ്ട ഏറ്റവും വലിയ മൊബൈൽ ഫോൺ ദാതാവ് പങ്കാളിത്തത്തിൽ. കമ്പനി രേഖകൾ പോലുള്ള ആരംഭ സമയം ഓരോ കോളിനും, ടെക്സ്റ്റ് സന്ദേശം, ദൈർഘ്യവും, കോളർ ആൻഡ് റിസീവർ ഏകദേശം ഭൂമിശാസ്ത്ര ലൊക്കേഷൻ വിവരങ്ങൾ ഉൾപ്പെടുന്ന അവനെ 2005 മുതൽ സ്വഭാവം മൂടുകയും 1.5 മില്യൺ ഉപഭോക്താക്കളിൽ നിന്നും അജ്ഞാതമാക്കിയ ഇടപാട് റെക്കോർഡുകൾ 2009 നൽകി. ഞങ്ങൾ സ്റ്റാറ്റിസ്റ്റിക്കൽ പ്രശ്നങ്ങളെക്കുറിച്ചാണ് സംസാരിക്കുന്നത് ആരംഭിക്കുന്നതിന് മുമ്പ്, ഈ ആദ്യപടി .എതിര്പ്പ് കൂട്ടത്തിലായിരിക്കുവാൻ വേണ്ടിയത്രെ ചൂണ്ടിക്കാണിച്ചിരുന്നു രൂപയുടെ. അദ്ധ്യായം 2 പോലെ, മിക്ക ഡിജിറ്റൽ ട്രെയ്സ് ഡാറ്റ ഗവേഷകർ കഴിയില്ല എന്നത്. പിന്നെ, കാരണം ഇത് സ്വകാര്യ നിരവധി കമ്പനികൾ അവരുടെ ഡാറ്റ പങ്കിടാൻ പറയട്ടെ മടിക്കും; ആ ഉപഭോക്താക്കൾ ഒരുപക്ഷേ റെക്കോർഡുകൾ പങ്കിട്ടു-ഇൻ ചെയ്യും ബൾക്ക്-ഉപയോഗിച്ച് ഗവേഷകർ പ്രതീക്ഷിച്ചിരുന്നില്ല എന്നതാണ്. ഈ സാഹചര്യത്തിൽ, ഗവേഷകർ ഡാറ്റ അജ്ഞാതമാക്കി ശ്രദ്ധാലുക്കളായിരിക്കണം നടപടികൾ കൈക്കൊണ്ടു അവരുടെ ജോലി ഒരു മൂന്നാം-കക്ഷി (അതായത്, തങ്ങളുടെ IRB) പ്രകാരം overseen ചെയ്തു. എന്നാൽ, ഈ പരിശ്രമം ഉണ്ടെങ്കിലും, ഈ ഡാറ്റ ഇപ്പോഴും തിരിച്ചറിയാനാകുന്നെങ്കിൽ അവർ സാധ്യത തന്ത്രപ്രധാനമായ വിവരങ്ങൾ അടങ്ങിയിരിക്കാൻ (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . ഞാൻ അദ്ധ്യായം 6 ഈ നൈതിക ചോദ്യം മടങ്ങിയെത്തും.

Blumenstock സമ്പത്തും ക്ഷേമവും അളന്നു ലെ താൽപര്യമില്ല എന്നും ഓർക്കുക. എന്നാൽ, ഈ സ്വഭാവവിശേഷങ്ങൾ കോൾ റെക്കോർഡുകൾ നേരിട്ട് അല്ല. മറ്റു വാക്കുകളിൽ, ഈ കോൾ റെക്കോർഡുകൾ, ഈ റിസർച്ച് അപൂർണ്ണമാണ് പാഠം 2. വിശദമായി ചർച്ച ഡിജിറ്റൽ പ്രകടമാകുന്നത് ഒരു സാധാരണ സവിശേഷത പക്ഷേ, ഇത് കോൾ റെക്കോർഡുകൾ ഒരുപക്ഷേ സ്വത്തും ക്ഷേമത്തിൽ ചില വിവരങ്ങൾ അറിയാൻ സാദ്ധ്യത ഉണ്ട്. അതുകൊണ്ട്, Blumenstock ചോദ്യത്തിന് ആവശ്യപ്പെട്ട് ഒരു മാർഗമാണ് കഴിഞ്ഞില്ല; അതു ആരെങ്കിലും അവരുടെ ഡിജിറ്റൽ ട്രെയ്സ് ഡാറ്റ അടിസ്ഥാനമാക്കിയുള്ള സർവേയിലാണ് എങ്ങനെ പ്രതികരിക്കും പ്രവചിക്കാൻ സാധ്യമാണ്? അങ്ങനെയാണെങ്കിൽ, കുറച്ച് ആളുകൾ ചോദിച്ചുകൊണ്ട് നമുക്ക് ഏവരുടെയും ഉത്തരങ്ങൾ ഊഹിക്കാൻ കഴിയും.

ആശങ്കകളെ ഈ വിലയിരുത്താൻ, ശാസ്ത്ര സാങ്കേതിക കിഗലി ഇൻസ്റ്റിറ്റിയൂട്ട് ഓഫ് Blumenstock ഗവേഷണ അസിസ്റ്റന്റുമാർ ഏകദേശം ആയിരം മൊബൈൽ ഫോൺ ഉപഭോക്താക്കൾക്ക് ഒരു സാമ്പിൾ വിളിച്ചു. ഗവേഷകർ പദ്ധതിയുടെ ലക്ഷ്യങ്ങൾ പങ്കെടുക്കുന്നവർക്ക് "നിങ്ങൾ അത് ഒരു ഉണ്ടോ പോലെ വിശദീകരിച്ചു കോൾ രേഖകൾ സർവേ പ്രതികരണങ്ങൾ കണ്ണികളുണ്ട് അവരുടെ സമ്മതം ചോദിച്ചു, തുടർന്ന് അവരുടെ സ്വത്തുക്കളും സൗഖ്യവും അളക്കാൻ ചോദ്യങ്ങൾ ഒരു പരമ്പര അവരോടു ചോദിച്ചു റേഡിയോ? "എന്നും" നിങ്ങൾ ഒരു സൈക്കിൾ സ്വന്തമാക്കിയോ? "(ചിത്രം 3.11 കാണും ഭാഗിക പട്ടിക വേണ്ടി). സർവേ എല്ലാ പങ്കെടുക്കുന്നവർ സാമ്പത്തികമായി നഷ്ടപരിഹാരം ചെയ്തു.

സൂപ്പർവൈസുചെയ്ത പഠന പിന്നാലെ സവിശേഷത എഞ്ചിനീയറിംഗ്: അടുത്തതായി, Blumenstock രണ്ട് ഘട്ട നടപടിക്രമം ഡാറ്റ ശാസ്ത്രം സാധാരണമാണ് ഉപയോഗിച്ചു. ആദ്യം, സവിശേഷത എൻജിനീയറിങ് ഘട്ടത്തിൽ, അഭിമുഖം എന്ന് എല്ലാവർക്കും, Blumenstock കോൾ രേഖകള് ഓരോ വ്യക്തിയെ സംബന്ധിച്ച സ്വഭാവസവിശേഷതകൾ ഒരു കൂട്ടം പരിവർത്തനം; ഡാറ്റ ശാസ്ത്രജ്ഞർ വിളിക്കാന് ". വേരിയബിളുകൾ" ഇതിൻറെ "സവിശേഷതകൾ" സാമൂഹിക ശാസ്ത്രജ്ഞരും അവരെ വിളിക്കും ഉദാഹരണത്തിന്, ഓരോ വ്യക്തി, പ്രവർത്തനമുള്ള ദിവസം Blumenstock കണക്കുകൂട്ടുന്നത് മൊത്തം എണ്ണം, വ്യത്യസ്തമായ ആളുകളുടെ എണ്ണം ഒരു വ്യക്തി സമ്പർക്കം ചെയ്തു, തുക പണം അങ്ങനെയുള്ളവ എയർടൈം ന് ചെലവഴിച്ചതിന്റെ. വിമർശനാത്മകമായി നല്ല സവിശേഷത എഞ്ചിനിയറിംഗ് റിസർച്ച് ക്രമീകരണം അറിവ് ആവശ്യമാണ്. ഉദാഹരണത്തിന്, ആഭ്യന്തര, അന്താരാഷ്ട്ര കോളുകൾ തമ്മിൽ വേർതിരിച്ചു പ്രധാനമാണ് എങ്കിൽ (നാം അന്താരാഷ്ട്രതലത്തിൽ ആളുകളെ വിളിക്കുമ്പോൾ സമ്പന്ന ആയിരിക്കും പ്രതീക്ഷിക്കാം), തുടർന്ന് ഈ സവിശേഷത എഞ്ചിനീയറിംഗ് ഘട്ടത്തിലും ചെയ്യണം. റുവാണ്ട ചെറിയ ബുദ്ധി ഉപയോഗിച്ച് ഒരു ഗവേഷകൻ ഈ സവിശേഷത ലഭ്യമല്ല, തുടർന്ന് മോഡൽ പ്രവചിക്കാനാകുന്നത് പ്രകടനം ബാധിക്കും.

അടുത്തതായി, സൂപ്പർവൈസുചെയ്ത ലേണിംഗ് ഘട്ടത്തിൽ, Blumenstock അവരുടെ സവിശേഷതകൾ അടിസ്ഥാനമാക്കി ഓരോ വ്യക്തിയും സർവേ പ്രതികരണവും പ്രവചിക്കാൻ ഒരു സ്റ്റാറ്റിസ്റ്റിക്കൽ മോഡൽ പണിതു. ഈ സാഹചര്യത്തിൽ, Blumenstock 10 മടങ്ങ് ക്രോസ്-മൂല്യനിർണ്ണയ കൂടെ ലോജിസ്റ്റിക്സ് റിഗ്രഷൻ ഉപയോഗിച്ചു, എന്നാൽ അവൻ മറ്റു സ്റ്റാറ്റിസ്റ്റിക്കൽ അല്ലെങ്കിൽ മെഷീൻ ലേണിംഗ് സമീപനങ്ങളുടെ മുറികൾ ഉപയോഗിച്ച കഴിയുമായിരുന്നു.

അതുകൊണ്ട് എത്ര നന്നായി ജോലി ചെയ്തു? കോൾ രേഖകള് കഥകളിയുടെ സവിശേഷതകൾ ഉപയോഗിച്ച് Blumenstock പോലുള്ള ചോദ്യങ്ങൾ സർവേയിൽ ഉത്തരങ്ങൾ പ്രവചിക്കാൻ കഴിഞ്ഞു "നിങ്ങൾ ഒരു റേഡിയോ ഉണ്ടോ?" എന്നും "നിങ്ങൾ ഒരു സൈക്കിൾ ഉണ്ടോ?"? അടുക്കുക. പ്രവചനങ്ങളുടെ കൃത്യത ചില സ്വഭാവവിശേഷങ്ങൾ (ചിത്രം 3.11) ഉയർന്ന ആയിരുന്നു. പക്ഷേ, ആ ലളിതമായ ബദൽ നേരെ ഒരു സങ്കീർണ്ണമായ പ്രവചന രീതി താരതമ്യം പ്രധാനമാണ് എപ്പോഴും. ഈ സാഹചര്യത്തിൽ, ഒരു ലളിതമായ ബദൽ എല്ലാവർക്കും ഏറ്റവും സാധാരണമായ ഉത്തരം തരും എന്ന് പ്രവചിക്കാൻ ആണ്. ഉദാഹരണത്തിന്, 97.3% Blumenstock എല്ലാവർക്കും തന്റെ സങ്കീർണ്ണമായ നടപടിക്രമം (97.6% കൃത്യത) പ്രകടനം ഫീല്ഡ് സമാനമാണ് 97.3%, ഒരു കൃത്യത ഉണ്ടായിരുന്നു ഒരു റേഡിയോ ഉടമസ്ഥതയുള്ള റിപ്പോർട്ടുചെയ്യാൻ പ്രവചിച്ചത് എങ്കിൽ അങ്ങനെ ഒരു റേഡിയോ ഉടമസ്ഥതയുള്ള റിപ്പോർട്ട്. മറ്റു വാക്കുകളിൽ, എല്ലാ ഫാൻസി ഡാറ്റയും മോഡലിങ് 97.6% ലേക്ക് 97.3% നിന്ന് പ്രവചന കൃത്യത വർദ്ധിച്ചു. എന്നിരുന്നാലും, ഇത്തരം 'നിങ്ങൾ ഒരു സൈക്കിൾ ഉണ്ടോ? "പോലുള്ള മറ്റ് ചോദ്യങ്ങൾ, വേണ്ടി, പ്രവചനങ്ങൾ 54.4% മുതൽ 67.6% ലേക്ക് മെച്ചപ്പെട്ടു. കൂടുതൽ സാധാരണയായി, ചിത്രം 3.12 ചില സ്വഭാവവിശേഷങ്ങൾ ഷോകള് Blumenstock വെറും ലളിതമായ രേഖയെ പ്രവചന making അപ്പുറം വളരെ മെച്ചപ്പെടുത്താൻ, മറിച്ച് മറ്റ് സ്വഭാവവിശേഷങ്ങൾ ചില മെച്ചപ്പെടുത്തൽ ഉണ്ടായിരുന്നു.

ചിത്രം 3.11: കോൾ രേഖകളുമായി പരിശീലനം സ്റ്റാറ്റിസ്റ്റിക്കൽ മാതൃക പ്രവചന കൃത്യത. Blumenstock (2014) പട്ടിക 2 ഫലങ്ങൾ.

ചിത്രം 3.11: കോൾ രേഖകളുമായി പരിശീലനം സ്റ്റാറ്റിസ്റ്റിക്കൽ മാതൃക പ്രവചന കൃത്യത. പട്ടിക 2 നിന്നുള്ള ഫലങ്ങൾ Blumenstock (2014) .

ചിത്രം 3.12 ലളിത രേഖയെ പ്രവചന കോൾ രേഖകളുമായി പരിശീലനം സ്റ്റാറ്റിസ്റ്റിക്കൽ മാതൃക പ്രവചിക്കാനാകുന്നത് കൃത്യത വ്യത്യാസങ്ങൾ. പോയിൻറുകൾ ചെറുതായി ഓവർലാപ്പ് ഒഴിവാക്കാൻ jittered ചെയ്യുന്നു; കൃത്യമായ മൂല്യങ്ങൾ വേണ്ടി Blumenstock (2014) പട്ടിക 2 കാണും.

ചിത്രം 3.12 ലളിത രേഖയെ പ്രവചന കോൾ രേഖകളുമായി പരിശീലനം സ്റ്റാറ്റിസ്റ്റിക്കൽ മാതൃക പ്രവചിക്കാനാകുന്നത് കൃത്യത വ്യത്യാസങ്ങൾ. പോയിൻറുകൾ ചെറുതായി ഓവർലാപ്പ് ഒഴിവാക്കാൻ jittered ചെയ്യുന്നു; പട്ടിക 2 കാണും Blumenstock (2014) കൃത്യമായ മൂല്യങ്ങൾ വേണ്ടി.

ഈ ഘട്ടത്തിൽ നിങ്ങൾ രണ്ടു സഹപ്രവർത്തകരെ ഗബ്രിയൽ Cadamuro റോബർട്ട് ഈ ഫലങ്ങൾ ഒരു ബിറ്റ് നിരാശാജനകമായിരുന്നു കരുതി തക്കവണ്ണം, പക്ഷേ ഒരു വർഷം കഴിഞ്ഞ് Blumenstock ഓൺ പ്രസിദ്ധീകരിച്ച ഗണ്യമായി മെച്ചപ്പെട്ട ഫലങ്ങൾ കൂടെ ശാസ്ത്രം ഒരു പേപ്പർ (Blumenstock, Cadamuro, and On 2015) . (ഉദാ 1) അവർ വഴക്കങ്ങൾ രീതികൾ (അതായത്, എഞ്ചിനീയറിംഗ്, ഒരു വഴക്കങ്ങൾ മെഷീൻ ലേണിംഗ് മോഡൽ ഫീച്ചർ പുതിയ സമീപനം) ലിങ് 2) വ്യക്തിഗത സർവേ ചോദ്യങ്ങൾക്കുള്ള പ്രതികരണങ്ങൾ അനുമാനിക്കാൻ ശ്രമിക്കുന്നതോടൊപ്പം അധികം: അവിടെ മെച്ചപ്പെടുത്തൽ രണ്ടു പ്രധാന സാങ്കേതിക കാരണങ്ങളാൽ ആയിരുന്നു "നിങ്ങൾ ഒരു റേഡിയോ സ്വന്തമാക്കിയോ?") അവർ ഒരു സംയോജിത ധനം സൂചിക അനുമാനിക്കാൻ ശ്രമിച്ചു.

Blumenstock സഹപ്രവർത്തകരും രണ്ടു വഴികളിൽ അവരുടെ സമീപനം പ്രകടനം പ്രകടമാക്കി. ആദ്യം അവർ സാമ്പിൾ ജനങ്ങൾക്ക് വേണ്ടി അവർ കോൾ രേഖകള് (ചിത്രം 3.14) അവരുടെ ധനം ഷിതമായത് ഒരു സാമാന്യം നല്ല ജോലി ചെയ്യാൻ കഴിഞ്ഞിരുന്നില്ല. രണ്ടാമത്തേത്, എന്നേക്കും കൂടുതൽ പ്രധാനമായി, Blumenstock സഹപ്രവർത്തകരും അവരുടെ നടപടിക്രമങ്ങൾ റുവാണ്ട സമൃദ്ധിയുടെ ഭൂമിശാസ്ത്രപരമായ വിതരണം ഉയർന്ന നിലവാരമുള്ള എസ്റ്റിമേറ്റുകൾ ഉത്പാദിപ്പിക്കാൻ കഴിഞ്ഞില്ല എന്നാണ്. പോരാഞ്ഞ്, അവർ കോൾ രേഖകള് എല്ലാ 1.5 ദശലക്ഷം ജനങ്ങളുടെ ധനം പ്രവചിക്കാൻ, ഏത് 1000 ജനത്തിന്റെ സാമ്പിൾ പരിശീലനം തങ്ങളുടെ മെഷീൻ ലേണിംഗ് മോഡൽ, ഉപയോഗിച്ചു. എന്നുതന്നെയല്ല, (കോൾ ഡാറ്റ ഓരോ കോളിനും അടുത്തുള്ള സെൽ ടവർ ലൊക്കേഷൻ ഉൾപ്പെടുന്നു ഓർക്കുക) കാൾ ഡാറ്റ അന്തർലീനമാക്കപ്പെടുന്നു സ്ഥല ഡാറ്റ ഉപയോഗിച്ച് ഗവേഷകർ ഓരോ വ്യക്തിയുടെയും താമസിക്കുന്ന ഏകദേശ സ്ഥലം കണക്കാക്കാൻ സാധിച്ചു. ഈ രണ്ടു കണക്കുകളെ ഇടുന്നതു, ഗവേഷണം വളരെ നേർത്ത സ്പേഷ്യൽ ഗ്രാനുലാരിറ്റിയുടെ ന് സബ്സ്ക്രൈബർ സമ്പത്തിന്റെ ഭൂമിശാസ്ത്രപരമായ വിതരണം മതിപ്പ് നിർമ്മിക്കുന്നത്. ഉദാഹരണത്തിന്, റുവാണ്ട ന്റെ 2148 സെല്ലുകൾ (രാജ്യത്തെ ഏറ്റവും ചെറിയ ഭരണ യൂണിറ്റ്) ഓരോ ശരാശരി സമ്പത്ത് കണക്കാക്കാൻ കഴിഞ്ഞില്ല. ഈ ധനം മൂല്യങ്ങൾ അവ ചെക്ക് ബുദ്ധിമുട്ടായിരുന്നുവത്രേ അങ്ങനെ അനുരൂപമാണെന്നും ആയിരുന്നു പ്രവചിച്ചത്. അതുകൊണ്ട് ഗവേഷകർ റുവാണ്ട ൻറെ 30 ജില്ലകളിൽ ശരാശരി സമ്പത്ത് ഏകദേശ ഉത്പാദിപ്പിക്കാൻ അവരുടെ ഫലങ്ങൾ സമാഹരിച്ച. ഈ ജില്ലാതല എസ്റ്റിമേറ്റുകൾ ഒരു ഗോൾഡ് സ്റ്റാൻഡേർഡ് പരമ്പരാഗത സർവേ റുവാണ്ടൻ ജനസംഖ്യാപരമായ ആരോഗ്യ സർവേ (ചിത്രം 3.14) മുതൽ കണക്കുകൾ ശക്തമായി സംബന്ധിച്ചാണ്. രണ്ടു കോണുകളിൽ നിന്ന് കണക്കുകളെ സമാനമായ ആയിരുന്നു ആണെങ്കിലും, Blumenstock സഹപ്രവർത്തകരും ൽ നടന്ന 50 തവണ വിലകുറഞ്ഞ 10 തവണ വേഗത്തിൽ (ലെ ചിലവു വേരിയബിൾ ചെലവ് അടിസ്ഥാനത്തിലാണ് ചെയ്യുമ്പോൾ) ആയിരുന്നു. കുറഞ്ഞ ഈ നാടകീയമായ കുറയുന്നു പകരം ഓരോ ഏതാനും വർഷങ്ങൾ-റൺ മാത്രമായിരുന്നു ജനസംഖ്യാപരമായ ആൻഡ് ഹെൽത്ത് മാനദണ്ഡം എന്ന് സർവേ-ബിഗ് ഡിജിറ്റൽ ട്രെയ്സ് ഡാറ്റ കൂടിച്ചേർന്ന് ചെറിയ സർവേയുടെ ഹൈബ്രിഡ് എല്ലാ മാസവും പ്രവർത്തിപ്പിക്കാൻ കഴിയുമെന്നാണ്.

ചിത്രം 3.13: Blumenstock, Cadamuro, ഓൺ (2015) വട്ടമിട്ടിരുന്നല്ലോ. ഫോൺ വിളിക്കുക കമ്പനിയിൽ നിന്നും ഡാറ്റ ഓരോ വ്യക്തിയും ഒന്നു വരി ഓരോ സവിശേഷത (അതായത്, വേരിയബിൾ) വേണ്ടി ഒരു കോളം ഒരു മാട്രിക്സ് മാറ്റി. അടുത്തത് ഗവേഷകർ സവിശേഷത മാട്രിക്സ് വഴി വ്യക്തിയിൽ നിന്ന് സർവേ പ്രതികരണങ്ങൾ പ്രവചിക്കാൻ ഒരു സൂപ്പർവൈസുചെയ്ത പഠന മോഡൽ പണിതു. പിന്നെ, സൂപ്പർവൈസുചെയ്ത പഠന മോഡൽ എല്ലാവർക്കും സർവേ പ്രതികരണങ്ങൾ ചുമത്തരുതേ ഉപയോഗിച്ചു. തത്വത്തിൽ, ഗവേഷകർ കുറിച്ച് ഒരു ദശലക്ഷം ജനങ്ങളുടെ ധനം ചുമത്തരുതേ ഏകദേശം ആയിരം ആൾക്കാർ പ്രതികരണങ്ങൾ ഉപയോഗിച്ചു. എതിരെ, ഗവേഷകർ തങ്ങളുടെ കോളുകൾ ലൊക്കേഷനുകൾ അടിസ്ഥാനമാക്കി എല്ലാ 1.5 ദശലക്ഷം ജനങ്ങൾക്ക് താമസിക്കുന്ന ഏകദേശ സ്ഥലം കണക്കാക്കപ്പെടുന്നു. ഈ രണ്ട് എസ്റ്റിമേറ്റുകൾ സംയോജിത-ചെയ്തപ്പോൾ കണക്കാക്കിയ സമ്പത്തും കണക്കാക്കിയ സ്ഥലം റസിഡൻസ്-ഫലങ്ങളും ജനസംഖ്യാപരമായ ആരോഗ്യ സർവെ ഒരു സ്വർണം-സാധാരണ പരമ്പരാഗത സർവേ (ചിത്രം 3.14) മുതൽ കണക്കുകൾ സമാനമായ ആയിരുന്നു.

ചിത്രം 3.13: വട്ടമിട്ടിരുന്നല്ലോ Blumenstock, Cadamuro, and On (2015) . ഫോൺ വിളിക്കുക കമ്പനിയിൽ നിന്നും ഡാറ്റ ഓരോ വ്യക്തിയും ഒന്നു വരി ഓരോ സവിശേഷത (അതായത്, വേരിയബിൾ) വേണ്ടി ഒരു കോളം ഒരു മാട്രിക്സ് മാറ്റി. അടുത്തത് ഗവേഷകർ സവിശേഷത മാട്രിക്സ് വഴി വ്യക്തിയിൽ നിന്ന് സർവേ പ്രതികരണങ്ങൾ പ്രവചിക്കാൻ ഒരു സൂപ്പർവൈസുചെയ്ത പഠന മോഡൽ പണിതു. പിന്നെ, സൂപ്പർവൈസുചെയ്ത പഠന മോഡൽ എല്ലാവർക്കും സർവേ പ്രതികരണങ്ങൾ ചുമത്തരുതേ ഉപയോഗിച്ചു. തത്വത്തിൽ, ഗവേഷകർ കുറിച്ച് ഒരു ദശലക്ഷം ജനങ്ങളുടെ ധനം ചുമത്തരുതേ ഏകദേശം ആയിരം ആൾക്കാർ പ്രതികരണങ്ങൾ ഉപയോഗിച്ചു. എതിരെ, ഗവേഷകർ തങ്ങളുടെ കോളുകൾ ലൊക്കേഷനുകൾ അടിസ്ഥാനമാക്കി എല്ലാ 1.5 ദശലക്ഷം ജനങ്ങൾക്ക് താമസിക്കുന്ന ഏകദേശ സ്ഥലം കണക്കാക്കപ്പെടുന്നു. ഈ രണ്ട് എസ്റ്റിമേറ്റുകൾ സംയോജിത-ചെയ്തപ്പോൾ കണക്കാക്കിയ സമ്പത്തും കണക്കാക്കിയ സ്ഥലം റസിഡൻസ്-ഫലങ്ങളും ജനസംഖ്യാപരമായ ആരോഗ്യ സർവെ ഒരു സ്വർണം-സാധാരണ പരമ്പരാഗത സർവേ (ചിത്രം 3.14) മുതൽ കണക്കുകൾ സമാനമായ ആയിരുന്നു.

ചിത്രം 3.14: Blumenstock, Cadamuro, ഓൺ (2015) ഫലങ്ങൾ. വ്യക്തിഗത-തലത്തിൽ, ഗവേഷകർ തങ്ങളുടെ കോൾ രേഖകളിൽ നിന്നും ഒരാളുടെ സമ്പത്ത് ഷിതമായത് ഒരു ന്യായമായ ജോലി ചെയ്യാൻ സാധിച്ചു. ജില്ലാതല വെൽത്ത് ഏത് വസതിയിൽ-ഫലങ്ങളും ജനസംഖ്യാപരമായ ആരോഗ്യ സർവെ ഒരു സ്വർണം-സാധാരണ പരമ്പരാഗത സർവേ നിന്നുള്ള ഫലങ്ങൾക്ക് സമാനമായ ആയിരുന്നു ധനവും സ്ഥലത്തെ വ്യക്തിഗത-ലവൽ മതിപ്പ് അടിസ്ഥാനമാക്കി ചെയ്തു കണക്ക്.

ചിത്രം 3.14: നിന്നുള്ള ഫലങ്ങൾ Blumenstock, Cadamuro, and On (2015) . വ്യക്തിഗത-തലത്തിൽ, ഗവേഷകർ തങ്ങളുടെ കോൾ രേഖകളിൽ നിന്നും ഒരാളുടെ സമ്പത്ത് ഷിതമായത് ഒരു ന്യായമായ ജോലി ചെയ്യാൻ സാധിച്ചു. ജില്ലാതല വെൽത്ത് ഏത് വസതിയിൽ-ഫലങ്ങളും ജനസംഖ്യാപരമായ ആരോഗ്യ സർവെ ഒരു സ്വർണം-സാധാരണ പരമ്പരാഗത സർവേ നിന്നുള്ള ഫലങ്ങൾക്ക് സമാനമായ ആയിരുന്നു ധനവും സ്ഥലത്തെ വ്യക്തിഗത-ലവൽ മതിപ്പ് അടിസ്ഥാനമാക്കി ചെയ്തു കണക്ക്.

ഉപസംഹാരമായി, Blumenstock സ്വർണം-സ്റ്റാൻഡേർഡ് സർവേ കണക്കാക്കപ്പെട്ടിട്ടുണ്ട് താരതമ്യപ്പെടുത്താവുന്ന എസ്റ്റിമേറ്റുകൾ ഉത്പാദിപ്പിക്കാൻ ഡിജിറ്റൽ ട്രെയ്സ് ഡാറ്റ ഉപയോഗിച്ച് സമീപനം സംയോജിത സർവേ ഡാറ്റ ആവശ്യപ്പെട്ട് പെരുപ്പിച്ചുകാട്ടൽ. ഈ പ്രത്യേക മാതൃക പുറമേ പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന പരമ്പരാഗത സർവേ രീതികൾ തമ്മിലുള്ള വ്യാപാര ഓഫിൽ ചില വ്യക്തമാക്കുന്നു. ആദ്യം, പെരുപ്പിച്ചുകാട്ടൽ ആവശ്യപ്പെട്ട് കണക്കുകളെ ഗണ്യമായി വിലകുറഞ്ഞ, കൂടുതൽ അനുരൂപമാണെന്നും, കൂടുതൽ ആയിരുന്നു. എന്നാൽ, മറുവശത്ത്, ഈ സമയം അവിടെ പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന ഇത്തരത്തിലുള്ള വേണ്ടി ശക്തമായ സൈദ്ധാന്തിക അടിത്തറ. അതാണ് അത് സന്ദർഭം വേല ചെയ്യുന്ന ഈ ഒരു ഉദാഹരണം കാണിക്കില്ല ആണ്. എന്നുതന്നെയല്ല, പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന സമീപനം ഇതുവരെ അതിന്റെ കണക്കുകളെ ചുറ്റും അനിശ്ചിതത്വം വഴികൂടിയായിരുന്നു നല്ല വഴികൾ ഇല്ല. എന്നാൽ, പെരുപ്പിച്ചുകാട്ടൽ ചോദിക്കുന്ന സ്ഥിതിവിവരക്കണക്കുകൾ-മോഡൽ അധിഷ്ഠിത പോസ്റ്റ്-നാടകമുണ്ടായിരുന്നു മൂന്ന് വലിയ പ്രദേശങ്ങൾ അഗാധമായി കണക്ഷനുകൾ ഉണ്ട് (Little 1993) , ബിഷപ്പ് (Rubin 2004) , ചെറിയ-ഏരിയ മതിപ്പു (Rao and Molina 2015) കളിയാടുമെന്നാണ് അതിനാൽ ആ പുരോഗതി പ്രതീക്ഷിക്കുന്നതിൽ ദ്രുതഗതിയിലുള്ള ആയിരിക്കും.

പെരുപ്പിച്ചുകാട്ടൽ അഭ്യർത്ഥിച്ചുകൊണ്ട് നിങ്ങളുടെ പ്രത്യേക സാഹചര്യത്തിൽ ഇടയുള്ള കഴിയുന്ന ഒരു അടിസ്ഥാന പാചകക്കുറിപ്പ് പിന്തുടരുകയും. രണ്ടു ചേരുവകൾ രണ്ടു ഘട്ടങ്ങൾ ഉണ്ട്. രണ്ടു ചേരുവകൾ 1) വിസ്താരവും എന്നാൽ നേർത്ത ഒരു ഡിജിറ്റൽ അംശമോ ഡാറ്റാഗണത്തിന്റെ (അത് പലരും നിങ്ങൾ ഓരോ ആളുകളെപ്പറ്റിയുള്ള ചെയ്യേണ്ട വിവരങ്ങൾ ഉണ്ട് എന്നാൽ, ആണ്) 2) ഇടുങ്ങിയ എന്നാൽ കട്ടിയുള്ള ഒരു സർവേ (അതായത് അതിന്റെ ഉണ്ട് ഏതാനും ആളുകൾ, പക്ഷെ ആ ആളുകളുമായി കുറിച്ച് ചെയ്യേണ്ട വിവരങ്ങൾ ഉണ്ട്). പിന്നെ, രണ്ടു ഘട്ടങ്ങൾ ഇവയാണ്. ആദ്യം രണ്ട് ഡാറ്റ ഉറവിടങ്ങളിൽ ജനങ്ങൾക്ക് വേണ്ടി, സർവേ ഉത്തരങ്ങൾ പ്രവചിക്കാൻ ഡിജിറ്റൽ ട്രെയ്സ് ഡാറ്റ ഉപയോഗിക്കുന്ന ഒരു മെഷീൻ ലേണിംഗ് മോഡൽ പണിയും. അടുത്തതായി, ഡിജിറ്റൽ ട്രെയ്സ് ഡാറ്റ എല്ലാവരുമായും സർവേ ഉത്തരങ്ങൾ ചുമത്തരുതേ ആ മെഷീൻ ലേണിംഗ് മോഡൽ ഉപയോഗിക്കുക. അതിനാൽ, നിങ്ങൾ ധാരാളം ആളുകൾ ആവശ്യപ്പെടാൻ ആഗ്രഹിക്കുന്ന ചില ചോദ്യം ഉണ്ടെങ്കിൽ അവരുടെ ഉത്തരം പ്രവചിക്കാൻ ഉപയോഗിച്ചേക്കാവുന്ന ആ ആളുകൾ നിന്നും ഡിജിറ്റൽ ട്രെയ്സ് ഡാറ്റ നോക്കി.

തുടക്കം അവസാനമല്ല: പ്രശ്നം മൂന്നാം കാലഘട്ടത്തിൽ രണ്ടാമത്തെ കാലഘട്ടത്തിന്റെ മാറ്റം ഒരു പാഠമാണ് ഉദാഹരിക്കുന്ന ന് Blumenstock ആദ്യ രണ്ടാമത്തെ ശ്രമം സമാനമാണെന്നും ഗവേഷണം സർവെയിലാണ് സമീപിക്കുന്നു. അതാണ് പല തവണ, ആദ്യം സമീപനം മികച്ച കഴിയില്ല, പക്ഷേ ഗവേഷകർ തൊഴിലാളി തുടരുന്നതിലൂടെ എങ്കിൽ നന്നായി ലഭിക്കും. കൂടുതൽ സാധാരണയായി, ഡിജിറ്റൽ യുഗത്തിൽ സോഷ്യൽ ഗവേഷണ സമീപനത്തെ വിലയിരുത്തുമ്പോൾ, അതു രണ്ട് വ്യത്യസ്ത വാല്മൊഴി വരുത്തുവാൻ പ്രധാനപ്പെട്ടതാണ്: 1) എത്ര നന്നായി ഇപ്പോൾ പ്രവർത്തിക്കുന്നില്ല കൂടാതെ 2) ഈ ഡാറ്റ വിശാല ഭാവിയിൽ പ്രവർത്തിക്കുന്ന എത്ര നന്നായി കരുതുന്നത് മാറ്റങ്ങൾ ഗവേഷകരും പ്രശ്നം കൂടുതൽ ശ്രദ്ധ മടങ്ങുകയും പോലെ. ഗവേഷകർ (ഗവേഷണങ്ങളുടെ ഈ പ്രത്യേക ഭാഗം എങ്ങനെ നല്ലതു) മൂല്യനിർണ്ണയത്തിൽ ആദ്യ തരത്തിലുള്ള ഉണ്ടാക്കാൻ പരിശീലനം എങ്കിലും, രണ്ടാമത്തെ പലപ്പോഴും കൂടുതൽ പ്രധാനമാണ്.