3.4.1 ຫນ້າຈະເປັນການເກັບຕົວຢ່າງ: ການເກັບກໍາຂໍ້ມູນແລະວິເຄາະຂໍ້ມູນ

ການແປພາສານີ້ໄດ້ສ້າງຕັ້ງຂື້ນໂດຍຄອມພິວເຕີ. ×

You are reading the Open Review Edition of Bit by Bit. Click here to read the 1st Edition.

3.4.1 ຫນ້າຈະເປັນການເກັບຕົວຢ່າງ: ການເກັບກໍາຂໍ້ມູນແລະວິເຄາະຂໍ້ມູນ

ນ້ໍາສາມາດຍົກເລີກການບິດເບືອນເຈຕະນາທີ່ເກີດຈາກຂະບວນການຕົວຢ່າງການ.

ຕົວຢ່າງອາດຈະມີຜູ້ທີ່ທັງຫມົດປະຊາຊົນມີທີ່ຮູ້ຈັກ, ບໍ່ແມ່ນສູນຄາດຄະເນການຂອງການລວມ, ແລະການອອກແບບການເກັບຕົວຢ່າງອາດຈະ simplest ແມ່ນງ່າຍດາຍສຸ່ມຕົວຢ່າງບ່ອນທີ່ແຕ່ລະຄົນມີການຄາດຄະເນເທົ່າທຽມກັນຂອງລວມມີ. ໃນເວລາທີ່ຕອບໄດ້ຖືກຄັດເລືອກໂດຍຜ່ານການສຸ່ມຕົວຢ່າງງ່າຍດາຍດ້ວຍການປະຕິບັດທີ່ດີເລີດ (ຕົວຢ່າງ, ຄວາມຜິດພາດການຄຸ້ມຄອງທີ່ບໍ່ມີແລະບໍ່ມີບໍ່ແມ່ນການຕອບສະຫນອງ), ຫຼັງຈາກນັ້ນການປະເມີນແມ່ນ straightforward ເນື່ອງຈາກວ່າຕົວຢ່າງທີ່ຈະກ່ຽວກັບການສະເລ່ຍ, ເປັນສະບັບພາສາ miniature ຂອງປະຊາກອນ.

ສຸ່ມຕົວຢ່າງງ່າຍດາຍແມ່ນບໍ່ຄ່ອຍຈະຖືກນໍາໃຊ້ໃນການປະຕິບັດ, ຢ່າງໃດກໍຕາມ. ແນ່ນອນວ່າ, ນັກຄົ້ນຄວ້າມີເຈດຕະນາເລືອກປະຊາຊົນທີ່ມີອາດຈະບໍ່ເທົ່າທຽມກັນຂອງລວມຢູ່ໃນຄໍາສັ່ງທີ່ຈະຫຼຸດຜ່ອນຄ່າໃຊ້ຈ່າຍແລະເພີ່ມທະວີຄວາມຖືກຕ້ອງ. ໃນເວລາທີ່ນັກຄົ້ນຄວ້າມີເຈດຕະນາເລືອກຄົນທີ່ມີຄວາມຫນ້າຈະເປັນທີ່ແຕກຕ່າງກັນຂອງການລວມ, ຫຼັງຈາກນັ້ນການປັບຕົວແມ່ນຈໍາເປັນໃນການແກ້ໄຂມີການບິດເບືອນທີ່ເກີດຈາກຂະບວນການຕົວຢ່າງການ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ວິທີການທີ່ພວກເຮົາທົ່ວໆໄປຈາກຕົວຢ່າງຂຶ້ນຢູ່ກັບວິທີການຕົວຢ່າງໄດ້ຖືກຄັດເລືອກ.

ສໍາລັບການຍົກຕົວຢ່າງ, ການສໍາຫຼວດປະຊາກອນໃນປະຈຸບັນ (CPS) ໄດ້ຖືກນໍາໃຊ້ໂດຍລັດຖະບານສະຫະລັດເພື່ອປະເມີນອັດຕາການຫວ່າງງານ. ໃນແຕ່ລະເດືອນປະມານ 100,000 ປະຊາຊົນໄດ້ຖືກສໍາພາດ, ບໍ່ວ່າຈະໃບຫນ້າເພື່ອໃບຫນ້າຫຼືທາງໂທລະສັບ, ແລະຜົນໄດ້ຮັບຖືກນໍາໃຊ້ເພື່ອຜະລິດຕະພັນອັດຕາການຫວ່າງງານການຄາດຄະເນ. ເນື່ອງຈາກວ່າລັດຖະບານຕ້ອງການທີ່ຈະປະເມີນອັດຕາການຫວ່າງງານໃນແຕ່ລະລັດ, ມັນບໍ່ສາມາດເຮັດໄດ້ຕົວຢ່າງແບບສຸ່ມງ່າຍດາຍຂອງຜູ້ໃຫຍ່ເນື່ອງຈາກວ່າການທີ່ຈະໃຫ້ຜົນຜະລິດຕອບທີ່ນ້ອຍເກີນໄປຢູ່ໃນປະເທດທີ່ມີປະຊາກອນຂະຫນາດນ້ອຍ (ຕົວຢ່າງ:, Rhode Island) ແລະຈໍານວນຫຼາຍເກີນໄປຈາກປະເທດທີ່ມີປະຊາກອນຂະຫນາດໃຫຍ່ (ຕົວຢ່າງ: , California). ແທນທີ່ຈະ, CPS ຕົວຢ່າງປະຊາຊົນຢູ່ໃນປະເທດທີ່ແຕກຕ່າງກັນໃນອັດຕາທີ່ແຕກຕ່າງກັນ, ຂະບວນການທີ່ເອີ້ນວ່າການເກັບຕົວຢ່າງຊັ້ນມີໂອກາດກັນຂອງການຄັດເລືອກ. ສໍາລັບການຍົກຕົວຢ່າງ, ຖ້າຫາກວ່າ CPS ທີ່ຕ້ອງການຢາກ 2,000 ຕອບຕໍ່ລັດ, ຫຼັງຈາກນັ້ນຜູ້ໃຫຍ່ໃນ Rhode Island ຈະມີປະມານ 30 ເທົ່າສູງກວ່າການຄາດຄະເນຂອງການລວມກ່ວາຜູ້ໃຫຍ່ໃນແຄລິຟໍເນຍ (Rhode Island: 2,000 ຕອບຕໍ່ຜູ້ໃຫຍ່ 800,000 vs ແຄລິຟໍເນຍ: 2,000 ຕອບຕໍ່ຜູ້ໃຫຍ່ 30,000,000). ດັ່ງທີ່ພວກເຮົາຈະເບິ່ງຕໍ່ມາ, ປະເພດຂອງຕົວຢ່າງທີ່ມີການຄາດຄະເນກັນນີ້ເກີດຂຶ້ນກັບແຫຼ່ງຂໍ້ມູນອອນໄລນ໌ຂອງຂໍ້ມູນເຊັ່ນດຽວກັນ, ແຕ່ບໍ່ເຫມືອນກັບ CPS ການ, ກົນໄກການເກັບຕົວຢ່າງແມ່ນປົກກະຕິແລ້ວບໍ່ເປັນທີ່ຮູ້ຈັກຫຼືຄວບຄຸມໂດຍນັກຄົ້ນຄວ້າໄດ້.

ໄດ້ຮັບການອອກແບບການເກັບຕົວຢ່າງຂອງຕົນ, CPS ບໍ່ເປັນຕົວແທນໂດຍກົງຂອງສະຫະລັດ; ມັນປະກອບມີປະຊາຊົນຈໍານວນຫຼາຍເກີນໄປຈາກ Rhode Island ແລະບໍ່ພໍເທົ່າໃດເກີນໄປຈາກແຄລິຟໍເນຍ. ເພາະສະນັ້ນ, ມັນຈະເປັນສິ່ງທີ່ບໍ່ດີທີ່ຈະປະເມີນອັດຕາການຫວ່າງງານໃນປະເທດທີ່ມີອັດຕາການຫວ່າງງານໃນຕົວຢ່າງຂອງ. ແທນທີ່ຈະຫມາຍຄວາມວ່າຕົວຢ່າງ, ມັນເປັນການດີກວ່າທີ່ຈະໃຊ້ເວລາຫມາຍຄວາມວ່ານ້ໍາ, ບ່ອນທີ່ນ້ໍາບັນຊີສໍາລັບຄວາມຈິງທີ່ວ່າປະຊາຊົນຈາກ Rhode Island ມີແນວໂນ້ມທີ່ຈະໄດ້ຮັບການປະກອບກ່ວາຄົນທີ່ມາຈາກແຄລິຟໍເນຍ. ສໍາລັບການຍົກຕົວຢ່າງ, ແຕ່ລະຄົນທີ່ມາຈາກແຄລິຟໍເນຍຈະ upweighted- ພວກເຂົາເຈົ້າຈະຖືກນັບເພີ່ມຂຶ້ນໃນການຄາດຄະເນ, ແລະແຕ່ລະຄົນທີ່ມາຈາກ Rhode Island ຈະໄດ້ຮັບການ downweighted, ພວກເຂົາເຈົ້າຈະຖືກນັບລວມຫນ້ອຍໃນການຄາດຄະເນ. ໃນເນື້ອແທ້ແລ້ວ, ທ່ານແມ່ນໄດ້ຮັບສຽງເພີ່ມເຕີມຕໍ່ກັບປະຊາຊົນທີ່ທ່ານມີໂອກາດນ້ອຍທີ່ຈະຮຽນຮູ້ກ່ຽວກັບການ.

ຕົວຢ່າງ toy ນີ້ສະແດງໃຫ້ເຫັນທີ່ສໍາຄັນແຕ່ວ່າເຂົ້າໃຈຜິດທົ່ວໄປຈຸດ: ຕົວຢ່າງບໍ່ຈໍາເປັນຕ້ອງເປັນສະບັບພາສາ miniature ຂອງປະຊາກອນໃນການຜະລິດຄາດຄະເນທີ່ດີ. ຖ້າຫາກວ່າພຽງພໍເປັນທີ່ຮູ້ຈັກກ່ຽວກັບວິທີຂໍ້ມູນດັ່ງກ່າວໄດ້ເກັບກໍາ, ຫຼັງຈາກນັ້ນຂໍ້ມູນທີ່ສາມາດໄດ້ຮັບການນໍາໃຊ້ໃນເວລາທີ່ເຮັດໃຫ້ການຄາດຄະເນຈາກຕົວຢ່າງຂອງ. ວິທີການຂ້າພະເຈົ້າໄດ້ອະທິບາຍແລະພຽງແຕ່ວ່າຂ້າພະເຈົ້າອະທິບາຍຄະນິດສາດໃນດ້ານວິຊາເອກະສານຊ້ອນ, ຢູ່ຮຽບຮ້ອຍໃນຂອບການເກັບຕົວຢ່າງຈະເປັນຄລາສສິກ. ໃນປັດຈຸບັນ, ຂ້າພະເຈົ້າຈະສະແດງໃຫ້ເຫັນວິທີການທີ່ຄວາມຄິດດຽວກັນສາມາດໄດ້ຮັບການນໍາໃຊ້ຕົວຢ່າງທີ່ບໍ່ແມ່ນການຄາດຄະເນ.