3.6.1 Amplified ຂໍ

ການເຊື່ອມຕໍ່ສໍາຫຼວດຂອງທ່ານທີ່ຈະຕິດຕາມດິຈິຕອນສາມາດຈະຄ້າຍຄືຂໍໃຫ້ທຸກຄົນຄໍາຖາມຂອງທ່ານໃນທຸກເວລາ.

ຖາມມັກຈະມາໃນສອງປະເພດຕົ້ນຕໍ: ການສໍາຫຼວດຕົວຢ່າງແລະການສໍາຫຼວດພົນ. ການສໍາຫຼວດຕົວຢ່າງ, ບ່ອນທີ່ທ່ານເຂົ້າເຖິງຈໍານວນຂະຫນາດນ້ອຍຂອງປະຊາຊົນ, ສາມາດຈະປ່ຽນແປງໄດ້, ທັນເວລາ, ແລະລາຄາຂ້ອນຂ້າງ. ຢ່າງໃດກໍຕາມ, ການສໍາຫຼວດຕົວຢ່າງ, ເນື່ອງຈາກວ່າພວກເຂົາເຈົ້າແມ່ນອີງໃສ່ຕົວຢ່າງ, ມັກຈະຈໍາກັດໃນການແກ້ໄຂບັນຫາຂອງພວກເຂົາ; ກັບການສໍາຫລວດຕົວຢ່າງ, ມັນມັກຈະເປັນການຍາກທີ່ຈະເຮັດໃຫ້ການຄາດຄະເນກ່ຽວກັບພູມິພາກສະເພາະໃດຫນຶ່ງຫຼືສໍາລັບກຸ່ມຂອງພົນລະເມືອງສະເພາະ. ການສໍາຫຼວດພົນ, ກ່ຽວກັບການອື່ນໆ, ພະຍາຍາມສໍາພາດບຸກຄົນທຸກຄົນໃນປະຊາກອນ. ພວກເຂົາເຈົ້າມີການແກ້ໄຂທີ່ຍິ່ງໃຫຍ່, ແຕ່ພວກເຂົາເຈົ້າມີລາຄາແພງໂດຍທົ່ວໄປ, ແຄບໃນຈຸດສຸມ (ເຂົາເຈົ້າພຽງແຕ່ປະກອບດ້ວຍຈໍານວນຂະຫນາດນ້ອຍຂອງຄໍາຖາມ), ແລະໃຊ້ເວລາ (ພວກເຂົາເຈົ້າເກີດຂຶ້ນໃນເວລາກໍານົດ, ເຊັ່ນ: ທຸກໆ 10 ປີ) (Kish 1979) . ໃນປັດຈຸບັນຈິນຕະນາການຖ້າຫາກວ່ານັກຄົ້ນຄວ້າສາມາດສົມທົບລັກສະນະທີ່ດີທີ່ສຸດຂອງການສໍາຫຼວດຕົວຢ່າງແລະການສໍາຫຼວດພົນ; ຈິນຕະນາການຖ້າຫາກວ່ານັກຄົ້ນຄວ້າສາມາດຮ້ອງຂໍໃຫ້ຄໍາຖາມທຸກໃຫ້ທຸກຄົນທຸກວັນ.

ແນ່ນອນ, ນີ້ຢ່າງຕໍ່ເນື່ອງ, ແພ່ຫລາຍ, ສະເຫມີໄປ, ການສໍາຫຼວດແມ່ນປະເພດຂອງປັນວິທະຍາສາດສັງຄົມ. ແຕ່ວ່າ, ປະກົດວ່າພວກເຮົາສາມາດເລີ່ມຕົ້ນທີ່ຈະປະມານນີ້ໂດຍການສົມທົບຄໍາຖາມການສໍາຫຼວດການຈໍານວນຂະຫນາດນ້ອຍຂອງປະຊາຊົນທີ່ມີຕາມຮອຍດິຈິຕອນຈາກຈໍານວນຫຼາຍປະຊາຊົນ. ຂ້າພະເຈົ້າໂທຫາປະເພດຂອງການປະສົມປະສານນີ້ຂະຫຍາຍການສະເຫນີຂໍ. ຖ້າຫາກວ່າເຮັດໄດ້ດີ, ມັນຈະສາມາດຊ່ວຍໃຫ້ພວກເຮົາສະຫນອງການຄາດຄະເນທີ່ມີທ້ອງຖິ່ນຫລາຍຂຶ້ນ (ສໍາລັບເຂດພື້ນທີ່ຂະຫນາດນ້ອຍ), ລະອຽດຍິ່ງຂຶ້ນ (ສໍາລັບກຸ່ມປະຊາກອນສະເພາະໃດຫນຶ່ງ), ແລະໃຊ້ເວລາຫຼາຍ.

ຕົວຢ່າງຫນຶ່ງຂອງການສະເຫນີຂໍຂະຫຍາຍມາຈາກການເຮັດວຽກຂອງ Joshua Blumenstock, ຜູ້ທີ່ຕ້ອງການທີ່ຈະເກັບກໍາຂໍ້ມູນທີ່ຈະຊ່ວຍໃຫ້ການພັດທະນາຄູ່ມືໃນບັນດາປະເທດທີ່ທຸກຍາກ. ຫຼາຍໂດຍສະເພາະ, Blumenstock ຕ້ອງການຢາກສ້າງລະບົບການວັດແທກຄວາມຮັ່ງມີແລະສະຫວັດດີທີ່ອະນຸຍາດຄົບຖ້ວນຂອງການສໍາຫລວດທີ່ມີຄວາມຍືດຫຍຸ່ນແລະຄວາມຖີ່ຂອງການສໍາຫຼວດໄດ້ (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . ໃນຄວາມເປັນຈິງ, ຂ້າພະເຈົ້າໄດ້ອະທິບາຍແລ້ວເຮັດວຽກ Blumenstock ຂອງໄລຍະສັ້ນໆໃນບົດທີ 1.

ເພື່ອເລີ່ມຕົ້ນການ, Blumenstock ຮ່ວມມືກັບຜູ້ໃຫ້ບໍລິການໂທລະສັບມືຖືທີ່ໃຫຍ່ທີ່ສຸດໃນ Rwanda. ບໍລິສັດໄດ້ສະຫນອງໃຫ້ການບັນທຶກການເຮັດທຸລະກໍາບໍລິຈາກເງິນຈາກປະມານ 15 ລ້ານລູກຄ້າກວມເອົາພຶດຕິກໍາຈາກ 2005 ແລະ 2009 ບັນທຶກປະກອບດ້ວຍຂໍ້ມູນກ່ຽວກັບແຕ່ລະຄົນໂທແລະຂໍ້ຄວາມຂໍ້ຄວາມດັ່ງກ່າວເປັນເວລາເລີ່ມຕົ້ນ, ໄລຍະເວລາ, ແລະສະຖານທີ່ພູມິພາກໂດຍປະມານຂອງການໂທແລະຜູ້ຮັບ. ກ່ອນທີ່ພວກເຮົາເລີ່ມຕົ້ນການເວົ້າກ່ຽວກັບບັນຫາສະຖິຕິ, ມັນແມ່ນຕົກເປັນມູນຄ່າການຊີ້ອອກວ່າຂັ້ນຕອນທໍາອິດນີ້ອາດຈະເປັນຫນຶ່ງທີ່ຍາກທີ່ສຸດ. ໃນຖານະເປັນອະທິບາຍໃນບົດທີ 2, ທີ່ສຸດຂໍ້ມູນການຕິດຕາມດິຈິຕອນເປັນມູນຫຍຸ້ງຍາກຫລາຍທີ່ຈະຄົ້ນຄ້ວາ. ແລະຫລາຍບໍລິສັດມີ justifiably ລັງເລທີ່ຈະແບ່ງປັນຂໍ້ມູນຂອງເຂົາເຈົ້າເນື່ອງຈາກວ່າມັນແມ່ນເອກະຊົນ; ທີ່ເປັນລູກຄ້າຂອງເຂົາເຈົ້າອາດຈະບໍ່ໄດ້ຄາດຫວັງວ່າການບັນທຶກການຂອງເຂົາເຈົ້າຈະໄດ້ຮັບການແບ່ງປັນໃນກຸ່ມທີ່ມີນັກຄົ້ນຄວ້າ. ໃນກໍລະນີນີ້, ນັກຄົ້ນຄວ້າໄດ້ຂັ້ນຕອນລະມັດລະວັງເພື່ອ anonymize ຂໍ້ມູນແລະການເຮັດວຽກຂອງເຂົາເຈົ້າໄດ້ກວດກາແລະພາກສ່ວນທີສາມ (ie, IRB ຂອງເຂົາເຈົ້າ). ແຕ່, ເຖິງວ່າຈະມີຄວາມພະຍາຍາມເຫຼົ່ານີ້, ຂໍ້ມູນເຫຼົ່ານີ້ແມ່ນອາດຈະຍັງກໍານົດຕົນຕົວແລະພວກເຂົາເຈົ້າອາດຈະປະກອບດ້ວຍຂໍ້ມູນຂ່າວສານທີ່ລະອຽດອ່ອນ (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . ຂ້າພະເຈົ້າຈະກັບຄືນໄປຫາຄໍາຖາມດ້ານຈັນຍາບັນເຫຼົ່ານີ້ຢູ່ໃນບົດທີ 6.

ໃຫ້ຈື່ໄວ້ວ່າ Blumenstock ມີຄວາມສົນໃຈໃນການວັດແທກຄວາມຮັ່ງມີແລະສະຫວັດດີ. ແຕ່ລັກສະນະການເຫຼົ່ານີ້ແມ່ນບໍ່ໄດ້ໂດຍກົງໃນບັນທຶກການໂທໄດ້. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ການເຫຼົ່ານີ້ການບັນທຶກການໂທທີ່ບໍ່ຄົບຖ້ວນສໍາລັບການຄົ້ນຄ້ວານີ້, ຄຸນນະສົມບັດທົ່ວໄປຂອງຕາມຮອຍດິຈິຕອນທີ່ໄດ້ປຶກສາຫາລືໃນລາຍລະອຽດໃນບົດທີ 2 ແຕ່ວ່າ, ມັນເບິ່ງຄືວ່າບັນທຶກການໂທໄດ້ອາດຈະມີຂໍ້ມູນບາງຢ່າງກ່ຽວກັບຄວາມຮັ່ງມີແລະສະຫວັດດີ. ດັ່ງນັ້ນ, ວິທີການຫນຶ່ງຂອງການສະເຫນີຂໍຄໍາຖາມ Blumenstock ອາດຈະ: ມັນເປັນໄປໄດ້ທີ່ຈະຄາດຄະເນວິທີການຄົນທີ່ຈະຕອບສະຫນອງຕໍ່ການສໍາຫຼວດໂດຍອີງໃສ່ຂໍ້ມູນການຕິດຕາມດິຈິຕອນຂອງເຂົາເຈົ້າ? ຖ້າເປັນດັ່ງນັ້ນ, ຫຼັງຈາກນັ້ນໂດຍການຖາມບໍ່ພໍເທົ່າໃດປະຊາຊົນພວກເຮົາສາມາດຄາດເດົາຄໍາຕອບຂອງຄົນອື່ນໄດ້.

ການປະເມີນນີ້ຕົວຈິງ, Blumenstock ແລະການຄົ້ນຄວ້າການຊ່ວຍເຫຼືອຈາກ Kigali ສະຖາບັນວິທະຍາສາດແລະເຕັກໂນໂລຊີທີ່ເອີ້ນວ່າຕົວຢ່າງຂອງການກ່ຽວກັບການເປັນພັນລູກຄ້າໂທລະສັບມືຖືເປັນ. ນັກຄົ້ນຄວ້າໄດ້ອະທິບາຍເປົ້າຫມາຍຂອງໂຄງການໃຫ້ຜູ້ເຂົ້າຮ່ວມໄດ້ຂໍຮ້ອງໃຫ້ຍິນຍອມເຫັນດີຂອງເຂົາເຈົ້າທີ່ຈະເຊື່ອມຕໍ່ການຕອບສະຫນອງການສໍາຫຼວດໃນການບັນທຶກການໂທໄດ້, ແລະຫຼັງຈາກນັ້ນຮ້ອງຂໍໃຫ້ເຂົາເຈົ້າຂອງຄໍາຖາມທີ່ເປັນການວັດແທກຄວາມຮັ່ງມີແລະສະຫວັດດີຂອງເຂົາເຈົ້າ, ເຊັ່ນ: "ທ່ານເປັນເຈົ້າຂອງ ວິທະຍຸ? "ແລະ" ທ່ານເປັນເຈົ້າຂອງລົດຖີບ? "(ເບິ່ງຮູບ 311 ສໍາລັບບັນຊີລາຍຊື່ບາງສ່ວນ). ຜູ້ເຂົ້າຮ່ວມທັງຫມົດໃນການສໍາຫຼວດໄດ້ຮັບຄ່າແຮງງານທາງດ້ານທຶນຮອນ.

ຕໍ່ໄປ, Blumenstock ນໍາໃຊ້ຂັ້ນຕອນການທັງສອງຂັ້ນຕອນທົ່ວໄປໃນວິທະຍາສາດຂໍ້ມູນ: ວິສະວະກໍາຄຸນນະສົມບັດປະຕິບັດຕາມໂດຍການຮຽນຮູ້ຄວບຄຸມ. ຫນ້າທໍາອິດ, ໃນຂັ້ນຕອນທີ່ຄຸນນະສົມບັດວິສະວະກໍາ, ສໍາລັບທຸກຄົນທີ່ໄດ້ໃຫ້ສໍາພາດ, Blumenstock ແປງບັນທຶກການໂທເຂົ້າໄປໃນທີ່ກໍານົດໄວ້ຂອງລັກສະນະກ່ຽວກັບແຕ່ລະຄົນ; ວິທະຍາສາດຂໍ້ມູນອາດຈະໂທຫາຄຸນລັກສະນະເຫຼົ່ານີ້ "ລັກສະນະ" ແລະວິທະຍາສາດສັງຄົມຈະໂທຫາພວກເຂົາ "ການປ່ຽນແປງ." ສໍາລັບການຍົກຕົວຢ່າງ, ສໍາລັບແຕ່ລະຄົນ, Blumenstock ຄິດໄລ່ຈໍານວນທັງຫມົດຂອງວັນກັບກິດຈະກໍາ, ຈໍານວນຂອງປະຊາຊົນທີ່ແຕກຕ່າງກັນຂອງບຸກຄົນທີ່ໄດ້ຮັບໃນການພົວພັນກັບຈໍານວນເງິນທີ່ ຂອງເງິນທີ່ຈ່າຍໃນອອກອາກາດ, ແລະອື່ນໆ. ສໍາຄັນ, ວິສະວະກໍາຄຸນນະສົມບັດທີ່ດີຕ້ອງມີຄວາມຮູ້ຂອງການຕັ້ງຄ່າການຄົ້ນຄວ້າ. ສໍາລັບການຍົກຕົວຢ່າງ, ຖ້າຫາກວ່າມັນເປັນສິ່ງສໍາຄັນເພື່ອຈໍາແນກລະຫວ່າງການໂທພາຍໃນປະເທດແລະລະຫວ່າງປະເທດ (ພວກເຮົາອາດຈະຄາດຫວັງວ່າປະຊາຊົນຜູ້ທີ່ໃຫ້ໂທຕ່າງປະເທດຈະຮັ່ງມີ), ຫຼັງຈາກນັ້ນນີ້ຈະຕ້ອງເຮັດຢູ່ໃນຂັ້ນຕອນຄຸນນະສົມບັດວິສະວະກໍາ. ນັກວິໄຈທີ່ມີຄວາມເຂົ້າໃຈພຽງເລັກນ້ອຍຂອງລະວັນດາອາດຈະບໍ່ປະກອບມີຄຸນນະສົມບັດນີ້, ແລະຫຼັງຈາກນັ້ນການປະຕິບັດຄາດຄະເນຂອງຕົວແບບນີ້ຈະທໍລະມານ.

ຕໍ່ໄປ, ໃນຂັ້ນຕອນການຮຽນຮູ້ການຊີ້ນໍາ, Blumenstock ສ້າງເປັນຕົວແບບທາງສະຖິຕິການຄາດຄະເນການຕອບສະຫນອງການສໍາຫຼວດສໍາລັບການແຕ່ລະຄົນໂດຍອີງໃສ່ລັກສະນະຂອງເຂົາເຈົ້າ. ໃນກໍລະນີນີ້, Blumenstock ໃຊ້ regression logistic ກັບ 10 ເທົ່າການກວດສອບຂ້າມ, ແຕ່ວ່າຈະສາມາດໄດ້ນໍາໃຊ້ແນວພັນຂອງວິທີການສະຖິຕິຫລືເຄື່ອງຮຽນຮູ້ອື່ນໆ.

ດັ່ງນັ້ນວິທີທີ່ດີບໍ່ໄດ້ເຮັດວຽກ? ແມ່ນ Blumenstock ສາມາດທີ່ຈະຄາດຄະເນຄໍາຕອບການສໍາຫລວດຄົນຖາມວ່າ "ທ່ານເປັນເຈົ້າຂອງວິທະຍຸບໍ?" ແລະ "ທ່ານເປັນເຈົ້າຂອງລົດຖີບ?" ການນໍາໃຊ້ຄຸນນະສົມບັດທີ່ໄດ້ຈາກການບັນທຶກການໂທບໍ່? ການຈັດລຽງຂອງ. ຄວາມຖືກຕ້ອງຂອງການຄາດຄະເນທີ່ສູງສໍາລັບບາງລັກສະນະ (ຮູບສະແດງທີ 311). ແຕ່, ມັນບໍ່ສໍາຄັນສະເຫມີເພື່ອປຽບທຽບວິທີການຄາດຄະເນສະລັບສັບຊ້ອນຕໍ່ເປັນທາງເລືອກທີ່ງ່າຍດາຍ. ໃນກໍລະນີນີ້, ເປັນທາງເລືອກທີ່ງ່າຍດາຍແມ່ນການຄາດຄະເນວ່າທຸກຄົນຈະໃຫ້ຄໍາຕອບທີ່ທົ່ວໄປທີ່ສຸດ. ສໍາລັບການຍົກຕົວຢ່າງ, 973% ລາຍງານການເປັນເຈົ້າຂອງວິທະຍຸດັ່ງນັ້ນຖ້າຫາກວ່າ Blumenstock ໄດ້ຄາດຄະເນວ່າທຸກຄົນສາມາດລາຍງານການເປັນເຈົ້າຂອງວິທະຍຸເຂົາຈະມີຄວາມຖືກຕ້ອງຂອງ 973%, ຊຶ່ງເປັນເລື່ອງແປກທີ່ຄ້າຍຄືກັນກັບການປະຕິບັດຂອງລະບຽບການສະລັບສັບຊ້ອນຫຼາຍຂອງຕົນ (ຄວາມຖືກຕ້ອງ 976%) ທີ່ຕົນເອງໄດ້. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ຂໍ້ມູນ fancy ທັງຫມົດແລະສ້າງແບບຈໍາລອງເພີ່ມຂຶ້ນຄວາມຖືກຕ້ອງຂອງການຄາດຄະເນຈາກ 973% ກັບ 976%. ຢ່າງໃດກໍຕາມ, ສໍາລັບຄໍາຖາມອື່ນໆ, ເຊັ່ນ: "ທ່ານເປັນເຈົ້າຂອງລົດຖີບ?", ການຄາດຄະເນການປັບປຸງຈາກ 544% ກັບ 676%. ຫຼາຍໂດຍທົ່ວໄປ, ຮູບ 3.12 ສະແດງໃຫ້ເຫັນສໍາລັບການລັກສະນະບາງ Blumenstock ບໍ່ໄດ້ປັບປຸງຫຼາຍນອກຈາກພຽງແຕ່ເຮັດໃຫ້ການຄາດຄະເນພື້ນຖານງ່າຍດາຍ, ແຕ່ວ່າສໍາລັບການລັກສະນະອື່ນໆທີ່ມີການປັບປຸງຈໍານວນຫນຶ່ງ.

ຕົວເລກ 311: ຄວາມຖືກຕ້ອງຄາດຄະເນສໍາລັບຮູບແບບທາງສະຖິຕິການຝຶກອົບຮົມທີ່ມີການບັນທຶກການໂທ. ຜົນໄດ້ຮັບຈາກຕາຕະລາງທີ່ 2 ຈາກທັງ Blumenstock (2014).

ຕົວເລກ 311: ຄວາມຖືກຕ້ອງຄາດຄະເນສໍາລັບຮູບແບບທາງສະຖິຕິການຝຶກອົບຮົມທີ່ມີການບັນທຶກການໂທ. ຜົນໄດ້ຮັບຈາກຕາຕະລາງທີ່ 2 ຈາກທັງ Blumenstock (2014) .

ຕົວເລກ 312: ການສົມທຽບຂອງຄວາມຖືກຕ້ອງຄາດຄະເນສໍາລັບຮູບແບບທາງສະຖິຕິການຝຶກອົບຮົມມີການບັນທຶກການໂທຫາກັບການຄາດຄະເນພື້ນຖານງ່າຍດາຍ. ຈຸດທີ່ມີ jittered ເລັກນ້ອຍເພື່ອຫຼີກເວັ້ນການຊ້ໍາຊ້ອນ; ເບິ່ງຕາຕະລາງ 2 ຂອງ Blumenstock (2014) ສໍາລັບຄຸນຄ່າຄືກັນອ້ອຍຕ້ອຍ.

ຕົວເລກ 312: ການສົມທຽບຂອງຄວາມຖືກຕ້ອງຄາດຄະເນສໍາລັບຮູບແບບທາງສະຖິຕິການຝຶກອົບຮົມມີການບັນທຶກການໂທຫາກັບການຄາດຄະເນພື້ນຖານງ່າຍດາຍ. ຈຸດທີ່ມີ jittered ເລັກນ້ອຍເພື່ອຫຼີກເວັ້ນການຊ້ໍາຊ້ອນ; ເບິ່ງຕາຕະລາງ 2 ຂອງ Blumenstock (2014) ສໍາລັບຄຸນຄ່າຄືກັນອ້ອຍຕ້ອຍ.

ໃນຈຸດນີ້ທ່ານອາດຈະຄິດວ່າຜົນໄດ້ຮັບເຫຼົ່ານີ້ແມ່ນເປັນຄວາມຜິດຫວັງ, ແຕ່ວ່າພຽງແຕ່ຫນຶ່ງປີຕໍ່ມາ, Blumenstock ແລະເພື່ອນຮ່ວມງານ, Gabriel Cadamuro ແລະ Robert ກ່ຽວກັບການຈັດພີມມາເປັນເອກະສານໃນວິທະຍາສາດທີ່ມີຜົນຢ່າງຫຼວງຫຼາຍທີ່ດີກວ່າ (Blumenstock, Cadamuro, and On 2015) . ມີສອງເຫດຜົນດ້ານວິຊາການສໍາຄັນສໍາລັບການປັບປຸງ: 1) ພວກເຂົາເຈົ້ານໍາໃຊ້ວິທີການທີ່ທັນສະໄຫມຫຼາຍ (ie, ເປັນວິທີການໃຫມ່ທີ່ຈະມີວິສະວະກໍາແລະຮູບແບບການຮຽນຮູ້ຂອງເຄື່ອງ sophisticated ຫຼາຍ) ແລະ 2) ແທນທີ່ຈະກ່ວາພະຍາຍາມທີ່ຈະສະຫຼຸບຕອບຄໍາຖາມການສໍາຫຼວດສ່ວນບຸກຄົນ (ຕົວຢ່າງ, "ທ່ານເປັນເຈົ້າຂອງວິທະຍຸບໍ?"), ພວກເຂົາເຈົ້າພະຍາຍາມເພື່ອສະຫຼຸບເປັນດັດຊະນີຄວາມຮັ່ງມີປະກອບ.

Blumenstock ແລະເພື່ອນຮ່ວມງານສະແດງໃຫ້ເຫັນການປະຕິບັດຂອງວິທີການຂອງເຂົາເຈົ້າໃນສອງວິທີການ. ຫນ້າທໍາອິດ, ພວກເຂົາເຈົ້າໄດ້ພົບເຫັນວ່າສໍາລັບປະຊາຊົນຢູ່ໃນຕົວຢ່າງຂອງພວກເຂົາ, ພວກເຂົາເຈົ້າສາມາດເຮັດໄດ້ວຽກເຮັດງານທໍາທີ່ດີງາມຂອງການຄາດການຄວາມຮັ່ງມີຂອງພວກເຂົາຈາກບັນທຶກການໂທ (ຮູບສະແດງທີ 314). ຄັ້ງທີສອງ, ແລະເຄີຍສໍາຄັນຫຼາຍ, Blumenstock ແລະເພື່ອນຮ່ວມງານສະແດງໃຫ້ເຫັນວ່າລະບຽບການຂອງເຂົາເຈົ້າສາມາດຜະລິດຄາດຄະເນຄຸນນະພາບສູງຂອງການແຜ່ກະຈາຍທາງພູມິສາດຂອງຄວາມຮັ່ງມີໃນ Rwanda. ຫຼາຍໂດຍສະເພາະ, ພວກເຂົາເຈົ້ານໍາໃຊ້ຮູບແບບການຮຽນຮູ້ເຄື່ອງຂອງເຂົາເຈົ້າ, ທີ່ໄດ້ຝຶກອົບຮົມກ່ຽວກັບຕົວຢ່າງຂອງເຂົາເຈົ້າປະມານ 1,000 ຄົນ, ການຄາດຄະເນຄວາມຮັ່ງມີຂອງທັງຫມົດ 15 ລ້ານຄົນໃນບັນທຶກການໂທໄດ້. ນອກຈາກນັ້ນ, ກັບຂໍ້ມູນ geospatial ໄດ້ຝັງຢູ່ໃນຂໍ້ມູນການໂທ (ຈື່ໄດ້ວ່າຂໍ້ມູນການໂທທີ່ປະກອບມີສະຖານທີ່ຂອງ tower ມືຖືທີ່ໃກ້ທີ່ສຸດສໍາລັບແຕ່ລະການໂທ), ນັກຄົ້ນຄວ້າໄດ້ສາມາດປະເມີນສະຖານທີ່ໂດຍປະມານຂອງທີ່ຢູ່ອາໄສຂອງແຕ່ລະຄົນ. ການວາງເຫຼົ່ານີ້ທັງສອງການຄາດຄະເນກັນ, ການຄົ້ນຄວ້າການຜະລິດເປັນການຄາດຄະເນຂອງກະຈາຍຄວາມຮັ່ງມີຂອງສະຫມາຊິກທີ່ granularity ທາງກວ້າງຂອງພື້ນທີ່ດີທີ່ສຸດ. ສໍາລັບການຍົກຕົວຢ່າງ, ພວກເຂົາເຈົ້າສາມາດປະເມີນຄວາມຮັ່ງມີໂດຍສະເລ່ຍໃນແຕ່ລະວັນດາຂອງ 2148 ຈຸລັງ (ຫນ່ວຍບໍລິການການບໍລິຫານຂະຫນາດນ້ອຍສຸດໃນປະເທດ). ເຫຼົ່ານີ້ຄ່າຄວາມຮັ່ງມີການຄາດຄະເນໄດ້ສະນັ້ນ granular ພວກເຂົາເຈົ້າມີຄວາມຫຍຸ້ງຍາກເພື່ອກວດກາເບິ່ງ. ດັ່ງນັ້ນ, ນັກຄົ້ນຄວ້າໄດ້ລວມຜົນຂອງເຂົາເຈົ້າໃນການຜະລິດຄາດຄະເນຂອງຄວາມຮັ່ງມີຂອງສະເລ່ຍຂອງ Rwanda ຂອງ 30 ເມືອງ. ເຫຼົ່ານີ້ປະມານຂັ້ນເມືອງທີ່ກ່ຽວຂ້ອງຢ່າງແຂງແຮງເພື່ອການຄາດຄະເນຈາກການສໍາຫຼວດພື້ນເມືອງຄໍາມາດຕະຖານ, ລະວັນດາປະຊາກອນແລະສຸຂະພາບການສໍາຫຼວດ (ຮູບສະແດງທີ 314). ເຖິງແມ່ນວ່າການຄາດຄະເນຈາກແຫຼ່ງຂໍ້ມູນສອງແມ່ນຄ້າຍຄືກັນ, ການຄາດຄະເນຈາກ Blumenstock ແລະເພື່ອນຮ່ວມງານໄດ້ປະມານ 50 ລາຄາຖືກແລະໄວຂຶ້ນ 10 ຄັ້ງ (ໃນເວລາທີ່ຄ່າໃຊ້ຈ່າຍໃນການວັດແທກໃນການຄ່າໃຊ້ຈ່າຍຂອງຕົວປ່ຽນແປງ). ນີ້ຫຼຸດລົງຕື່ນເຕັ້ນໃນການຄ່າໃຊ້ຈ່າຍມີຄວາມຫມາຍວ່າແທນທີ່ຈະຖືກດໍາເນີນໃນທຸກໆປີ, ເປັນມາດຕະຖານສໍາລັບປະຊາກອນແລະສຸຂະພາບການສໍາຫຼວດ, ການປະສົມຂອງການສໍາຫຼວດຂະຫນາດນ້ອຍອະນຸຍາດຂອງທີ່ມີຂໍ້ມູນການຕິດຕາມດິຈິຕອນຂະຫນາດໃຫຍ່ສາມາດໄດ້ຮັບການດໍາເນີນການແຕ່ລະເດືອນ.

ຕົວເລກ 313: Schematic ຂອງ Blumenstock, Cadamuro, ແລະກ່ຽວກັບ (2015). ຂໍ້ມູນການໂທຈາກບໍລິສັດໂທລະສັບໄດ້ປ່ຽນໃຈເຫລື້ອມໃສຕາຕະລາງເປັນຫນຶ່ງຕິດຕໍ່ກັນສໍາລັບແຕ່ລະຄົນແລະຫນຶ່ງຄໍລໍາແຕ່ລະຄຸນນະສົມບັດ ( i.e. , ການປ່ຽນແປງ). ຕໍ່ໄປ, ຄົ້ນຄ້ວາການກໍ່ສ້າງຮູບແບບການຮຽນຮູ້ຕິດຕາມເພື່ອຄາດຄະເນການຕອບສະຫນອງການສໍາຫຼວດຈາກຄົນໂດຍຄຸນນະສົມບັດຕາຕະລາງ. ຫຼັງຈາກນັ້ນ, ຮູບແບບການຮຽນຮູ້ຄວບຄຸມໄດ້ຖືກນໍາໃຊ້ກັບ impute ການຕອບສະຫນອງການສໍາຫຼວດສໍາລັບທຸກຄົນ. ໃນເນື້ອແທ້ແລ້ວ, ນັກຄົ້ນຄວ້າໄດ້ນໍາໃຊ້ການຕອບສະຫນອງປະມານຫນຶ່ງພັນຄົນກັບ impute ຄວາມຮັ່ງມີຂອງປະມານຫນຶ່ງລ້ານຄົນ. ນອກຈາກນັ້ນ, ນັກຄົ້ນຄວ້າໄດ້ປະມານສະຖານທີ່ໂດຍປະມານຂອງທີ່ຢູ່ອາໄສສໍາລັບການທັງຫມົດ 15 ລ້ານຄົນໂດຍອີງໃສ່ສະຖານທີ່ຂອງການໂທຂອງເຂົາເຈົ້າ. ໃນເວລາທີ່ເຫຼົ່ານີ້ທັງສອງການຄາດຄະເນຖືກອະນຸຍາດ, ຄວາມຮັ່ງມີຂອງການຄາດຄະເນແລະສະຖານທີ່ການຄາດຄະເນຂອງທີ່ຢູ່ອາໄສ, ຜົນໄດ້ຮັບທີ່ຄ້າຍຄືກັນກັບການຄາດຄະເນຈາກປະຊາກອນແລະການສໍາຫຼວດສຸຂະພາບ, ເປັນການສໍາຫຼວດພື້ນເມືອງຄໍາມາດຕະຖານ (ຮູບສະແດງທີ 314).

ຕົວເລກ 313: Schematic ຂອງ Blumenstock, Cadamuro, and On (2015) . ຂໍ້ມູນການໂທຈາກບໍລິສັດໂທລະສັບໄດ້ປ່ຽນໃຈເຫລື້ອມໃສຕາຕະລາງເປັນຫນຶ່ງຕິດຕໍ່ກັນສໍາລັບແຕ່ລະຄົນແລະຄໍລໍາຫນຶ່ງສໍາລັບແຕ່ລະຄຸນນະສົມບັດ (ie, ການປ່ຽນແປງ). ຕໍ່ໄປ, ຄົ້ນຄ້ວາການກໍ່ສ້າງຮູບແບບການຮຽນຮູ້ຕິດຕາມເພື່ອຄາດຄະເນການຕອບສະຫນອງການສໍາຫຼວດຈາກຄົນໂດຍຄຸນນະສົມບັດຕາຕະລາງ. ຫຼັງຈາກນັ້ນ, ຮູບແບບການຮຽນຮູ້ຄວບຄຸມໄດ້ຖືກນໍາໃຊ້ກັບ impute ການຕອບສະຫນອງການສໍາຫຼວດສໍາລັບທຸກຄົນ. ໃນເນື້ອແທ້ແລ້ວ, ນັກຄົ້ນຄວ້າໄດ້ນໍາໃຊ້ການຕອບສະຫນອງປະມານຫນຶ່ງພັນຄົນກັບ impute ຄວາມຮັ່ງມີຂອງປະມານຫນຶ່ງລ້ານຄົນ. ນອກຈາກນັ້ນ, ນັກຄົ້ນຄວ້າໄດ້ປະມານສະຖານທີ່ໂດຍປະມານຂອງທີ່ຢູ່ອາໄສສໍາລັບການທັງຫມົດ 15 ລ້ານຄົນໂດຍອີງໃສ່ສະຖານທີ່ຂອງການໂທຂອງເຂົາເຈົ້າ. ໃນເວລາທີ່ເຫຼົ່ານີ້ທັງສອງການຄາດຄະເນຖືກອະນຸຍາດ, ຄວາມຮັ່ງມີຂອງການຄາດຄະເນແລະສະຖານທີ່ການຄາດຄະເນຂອງທີ່ຢູ່ອາໄສ, ຜົນໄດ້ຮັບທີ່ຄ້າຍຄືກັນກັບການຄາດຄະເນຈາກປະຊາກອນແລະການສໍາຫຼວດສຸຂະພາບ, ເປັນການສໍາຫຼວດພື້ນເມືອງຄໍາມາດຕະຖານ (ຮູບສະແດງທີ 314).

ຕົວເລກ 314 ຜົນການຄົ້ນຫາຈາກ Blumenstock, Cadamuro, ແລະກ່ຽວກັບ (2015). ຢູ່ໃນລະດັບບຸກຄົນ, ນັກຄົ້ນຄວ້າໄດ້ສາມາດເຮັດໄດ້ວຽກເຮັດງານທໍາທີ່ເຫມາະສົມໃນການຄາດການຄວາມຮັ່ງມີຂອງຜູ້ໃດຜູ້ຫນຶ່ງຈາກບັນທຶກການໂທຂອງເຂົາເຈົ້າ. ການຄາດຄະເນຂອງເມືອງລະດັບຄວາມຮັ່ງມີ, ທີ່ໄດ້ຮັບການອີງໃສ່ການຄາດຄະເນສ່ວນບຸກຄົນໃນລະດັບຂອງຄວາມຮັ່ງມີແລະສະຖານທີ່ຂອງທີ່ຢູ່ອາໄສ, ຜົນໄດ້ຮັບທີ່ຄ້າຍຄືກັນກັບຜົນໄດ້ຮັບຈາກປະຊາກອນແລະສຸຂະພາບການສໍາຫຼວດ, ການສໍາຫຼວດພື້ນເມືອງຄໍາມາດຕະຖານ.

ຕົວເລກ 314 ຜົນການຄົ້ນຫາຈາກ Blumenstock, Cadamuro, and On (2015) . ຢູ່ໃນລະດັບບຸກຄົນ, ນັກຄົ້ນຄວ້າໄດ້ສາມາດເຮັດໄດ້ວຽກເຮັດງານທໍາທີ່ເຫມາະສົມໃນການຄາດການຄວາມຮັ່ງມີຂອງຜູ້ໃດຜູ້ຫນຶ່ງຈາກບັນທຶກການໂທຂອງເຂົາເຈົ້າ. ການຄາດຄະເນຂອງເມືອງລະດັບຄວາມຮັ່ງມີ, ທີ່ໄດ້ຮັບການອີງໃສ່ການຄາດຄະເນສ່ວນບຸກຄົນໃນລະດັບຂອງຄວາມຮັ່ງມີແລະສະຖານທີ່ຂອງທີ່ຢູ່ອາໄສ, ຜົນໄດ້ຮັບທີ່ຄ້າຍຄືກັນກັບຜົນໄດ້ຮັບຈາກປະຊາກອນແລະສຸຂະພາບການສໍາຫຼວດ, ການສໍາຫຼວດພື້ນເມືອງຄໍາມາດຕະຖານ.

ໃນການສະຫລຸບ, Blumenstock ຂອງການຂະຫຍາຍການສະເຫນີຂໍວິທີການອະນຸຍາດຂໍ້ມູນການສໍາຫຼວດທີ່ມີຂໍ້ມູນການຕິດຕາມດິຈິຕອນການຜະລິດຄາດຄະເນເມື່ອທຽບກັບທີ່ມີຄໍາມາດຕະຖານການຄາດຄະເນການສໍາຫຼວດ. ຕົວຢ່າງນີ້ໂດຍສະເພາະແມ່ນຍັງອະທິບາຍບາງສ່ວນຂອງການຄ້າ, ການແຂ່ງຂັນລະຫວ່າງການສະເຫນີຂໍຂະຫຍາຍແລະວິທີການການສໍາຫຼວດພື້ນເມືອງ. ຫນ້າທໍາອິດ, ການຂະຫຍາຍການສະເຫນີຂໍການຄາດຄະເນໄດ້ໃຊ້ເວລາຫຼາຍ, ຢ່າງຫຼວງຫຼາຍລາຄາຖືກກວ່າ, ແລະລະອຽດຍິ່ງຂຶ້ນ. ແຕ່ວ່າ, ໃນອີກດ້ານຫນຶ່ງ, ໃນເວລານີ້, ບໍ່ມີບໍ່ແມ່ນບົນພື້ນຖານທິດສະດີທີ່ເຂັ້ມແຂງສໍາລັບການປະເພດຂອງການສະເຫນີຂໍຂະຫຍາຍນີ້. ທີ່ນີ້ຕົວຢ່າງຫນຶ່ງບໍ່ໄດ້ສະແດງໃຫ້ເຫັນໃນເວລາທີ່ມັນຈະເຮັດວຽກແລະໃນເວລາທີ່ມັນຈະບໍ່ໄດ້. ນອກຈາກນັ້ນ, ການສະເຫນີຂໍວິທີການຂະຫຍາຍບໍ່ທັນມີວິທີການທີ່ດີເພື່ອສັງລວມການຄວາມບໍ່ແນ່ນອນປະມານຄາດຄະເນຂອງຕົນ. ຢ່າງໃດກໍຕາມ, ການສະເຫນີຂໍຂະຫຍາຍມີການເຊື່ອມຕໍ່ລະສາມເຂດຂະຫນາດໃຫຍ່ໃນສະຖິຕິຮູບແບບທີ່ຕອບ stratification (Little 1993) , ການກ່າວຫາ (Rubin 2004) , ແລະການຄາດຄະເນພື້ນທີ່ນ້ອຍໆ (Rao and Molina 2015) ແລະແບູ່ງອອກນັ້ນຂ້າພະເຈົ້າຄາດຫວັງວ່າມີຄວາມຄືບຫນ້າຈະ ເປັນຢ່າງໄວວາ.

ການສະເຫນີຂໍຂະຫຍາຍຕໍ່ໄປນີ້ເປັນສູດພື້ນຖານທີ່ສາມາດໄດ້ຮັບການສອດຄ່ອງກັບສະຖານະການສະເພາະໃດຫນຶ່ງຂອງທ່ານ. ມີສອງສ່ວນປະ​​ກອບແລະຂັ້ນຕອນມີ. ທັງສອງອົງປະກອບທີ່ 1) ເປັນຊຸດຂໍ້ມູນທີ່ຕິດຕາມດິຈິຕອນທີ່ກ້ວາງແຕ່ບາງ (ວ່າແມ່ນ, ມັນມີປະຊາຊົນຈໍານວນຫຼາຍແຕ່ບໍ່ແມ່ນຂໍ້ມູນທີ່ທ່ານຕ້ອງການກ່ຽວກັບແຕ່ລະບຸກຄົນ) ແລະ 2) ການສໍາຫຼວດມີຄວາມຫ່າງແຄບແຕ່ຫນາ (ທີ່ເປັນ, ມັນມີ ມີພຽງແຕ່ປະຊາຊົນບໍ່ຫຼາຍປານໃດ, ແຕ່ວ່າມັນມີຂໍ້ມູນທີ່ທ່ານຕ້ອງການກ່ຽວກັບການປະຊາຊົນຜູ້ທີ່). ຫຼັງຈາກນັ້ນ, ແມ່ນມີສອງຂັ້ນຕອນ. ຫນ້າທໍາອິດ, ສໍາລັບປະຊາຊົນໃນແຫລ່ງຂໍ້ມູນທັງສອງ, ການກໍ່ສ້າງຮູບແບບການຮຽນຮູ້ເຄື່ອງທີ່ນໍາໃຊ້ຂໍ້ມູນການຕິດຕາມດິຈິຕອນການຄາດຄະເນຄໍາຕອບການສໍາຫຼວດ. ຕໍ່ໄປ, ການນໍາໃຊ້ແບບຈໍາລອງການຮຽນຮູ້ເຄື່ອງກັບ impute ຄໍາຕອບທີ່ການສໍາຫຼວດຂອງທຸກຄົນຢູ່ໃນຂໍ້ມູນຕິດຕາມການດິຈິຕອນ. ດັ່ງນັ້ນ, ຖ້າຫາກວ່າມີຄໍາຖາມບາງຢ່າງທີ່ທ່ານຕ້ອງການທີ່ຈະຮ້ອງຂໍໃຫ້ lots ຂອງປະຊາຊົນ, ເບິ່ງສໍາລັບຂໍ້ມູນຕິດຕາມດິຈິຕອນຈາກປະຊາຊົນຜູ້ທີ່ອາດຈະຖືກນໍາໃຊ້ເພື່ອຄາດຄະເນຄໍາຕອບຂອງເຂົາເຈົ້າ.

ການປຽບທຽບຄວາມພະຍາຍາມທໍາອິດແລະທີສອງ Blumenstock ຂອງບັນຫາຍັງສະແດງໃຫ້ເຫັນບົດຮຽນທີ່ສໍາຄັນກ່ຽວກັບການປ່ຽນແປງຈາກຍຸກທີສອງກັບວິທີການຍຸກທີສາມໃນການສໍາຫລວດຄົ້ນຄ້ວາ: ການເລີ່ມຕົ້ນ, ບໍ່ແມ່ນການທີ່ສຸດ. ນັ້ນແມ່ນ, ການຈໍານວນຫຼາຍເວລາ, ວິທີການທໍາອິດບໍ່ໄດ້ຈະດີທີ່ສຸດ, ແຕ່ຖ້າຫາກວ່ານັກຄົ້ນຄວ້າການເຮັດວຽກຢ່າງຕໍ່ເນື່ອງ, ສິ່ງທີ່ສາມາດໄດ້ຮັບທີ່ດີກວ່າ. ຫຼາຍໂດຍທົ່ວໄປ, ໃນເວລາທີ່ການປະເມີນວິທີການໃຫມ່ທີ່ຈະຄົ້ນຄ້ວາສັງຄົມໃນອາຍຸສູງສຸດດິຈິຕອນ, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະເຮັດໃຫ້ທັງສອງການປະເມີນຜົນທີ່ແຕກຕ່າງກັນ: 1) ວິທີການດຽວກັນກັບການເຮັດວຽກນີ້ໃນປັດຈຸບັນແລະ 2) ວິທີການດຽວກັນກັບທີ່ທ່ານຄິດວ່ານີ້ອາດຈະເຮັດວຽກໃນອະນາຄົດເປັນພູມສັນຖານຂໍ້ມູນ ການປ່ຽນແປງແລະເປັນນັກຄົ້ນຄວ້າຄວາມເອົາໃຈໃສ່ເພີ່ມເຕີມຕໍ່ກັບບັນຫາ. ເຖິງແມ່ນວ່າ, ນັກຄົ້ນຄວ້າກໍາລັງຝຶກອົບຮົມເພື່ອເຮັດໃຫ້ການປະເພດທໍາອິດຂອງການປະເມີນ (ວິທີການທີ່ດີແມ່ນສິ້ນນີ້ໂດຍສະເພາະຂອງການວິໄຈ), ຄັ້ງທີສອງມັກຈະເປັນສິ່ງສໍາຄັນຫຼາຍ.