3.4.1 සම්භාවිතා නියැදි: දත්ත රැස් කිරීම හා දත්ත විශ්ලේෂණය

කිරුම් පඩි හිතාමතාම විශේෂණය නිසා විකෘති කිරීම් ඉවත් කරන්න පුළුවන්.

සම්භාවිතා සාම්පල ජනතාව වයනය දන්නා, ශූන්ය නොවන සම්භාවිතාව ඇති වන අතර, ඉතා සරළ සම්භාවිතාව නියැදීම් නිර්මාණය එක් එක් පුද්ගලයාට ඇතුලත් සමාන සම්භාවිතාවක් ඇත එහිදී සරල අහඹු නියැදි කොහෙද අයයි. පරිපූර්ණ ක්රියාත්මක (උදා, කිසිදු ආවරණය කරන වැරදි හා කිසිදු-නොවන ප්රතිචාර) සමග සරල අහඹු නියැදි හරහා වගඋත්තරකරුවන් තෝරාගත් විට, එසේ නම් ඇස්තමේන්තු නියැදි ඇත මත ජනගහනයෙන් පුංචි අනුවාදය සාමාන්ය-විය නිසා පහසු වේ.

සරල අහඹු නියැදි කලාතුරකින් කෙසේ වෙතත්, ප්රායෝගිකව භාවිතා කරයි. ඒ වෙනුවට, පර්යේෂකයන් හිතාමතාම පිරිවැය අඩු හා නිරවද්යතාව වැඩි කර ගැනීම සඳහා ඇතුලත් අසමාන බඹලොව සමග ජනතාව තෝරන්න. පර්යේෂකයන් හිතාමතාම ඇතුළත් විවිධ බඹලොව සමග ජනතාව තෝරාගත් විට, එසේ නම් යම් වෙනස්කම් නියැදි ක්රියාවලිය විසින් ඇති කරන ලද විකෘති කිරීම් ඉවත් කිරීමට අවශ්ය වේ. වෙනත් වචන වලින් කිවහොත්, අපි කොහොමද නියැදියකින්, සාමාන්යකරණයක් නියැදි තෝරා ගන්නා ලදී ආකාරය මත රඳා පවතී.

උදාහරණයක් ලෙස, වර්තමාන ජනගහන සමීක්ෂණය (තෙල් සංස්ථාව සතුව) විරැකියා අනුපාතය ඇස්තමේන්තු කිරීම, එක්සත් ජනපද ආන්ඩුව විසින් භාවිතා කරනු ලබයි. එක් එක් මාසය 100,000 ක් පමණ ජනතාව, සම්මුඛ සාකච්ඡා කරන්නේ මුහුණට මුහුණ හෝ දුරකථනය එක්කෝ, සහ ප්රතිඵල සඳහා ඇස්තමේන්තුගත විරැකියා අනුපාතය නිෂ්පාදනය කිරීම සඳහා භාවිතා වේ. රජය සෑම රාජ්ය තුල විරැකියා අනුපාතය තක්සේරු කිරීමට රජය අපේක්ෂා කරයි, එය ඉතා කුඩා ගහනයක් (උදා, රෝඩ් අයිලන්ඩ්) සමග රාජ්යයන්, ප්රතිචාර දැක්වූවන්ගෙන් ඉතා සුළු යටත් වන නිසා වැඩිහිටියන් සරල අහඹු නියැදි කරන්න ගත නොහැකි වීම නිසා විශාල ජනගහනයක් සහිත ප්රාන්තවල සිට බොහෝ (උදා: කැලිෆෝනියාවේ). ඒ වෙනුවට, වෙනස් අනුපාත වෙනස් ප්රාන්තවල තෙල් සංස්ථාව සතුව සාම්පල මිනිසුන්, ක්රියාවලිය ස්ථරීභූත නියැදීම් තෝරා අසමාන සම්භාවිතාව සමඟ සිටියේය. උදාහරණයක් ලෙස, තෙල් සංස්ථාව සතුව එක් රාජ්ය 2,000 වගඋත්තරකරුවන් අවශ්ය නම්, රෝඩ් අයිලන්ඩ් හි වැඩිහිටියන් කැලිෆෝනියාවේ (: කැලිෆෝනියාවේ එදිරිව 800,000 වැඩිහිටියන් අනුව 2000 වගඋත්තරකරුවන්: වැඩිහිටියන් 30,000,000 ක් 2000 වගඋත්තරකරුවන් රෝඩ් අයිලන්ඩ්) වැඩිහිටියන් වඩා ඇතුළත් කාලයන්හි 30 ක් පමණ ඉහළ සම්භාවිතාව සිදු වනු ඇත. අප පසුව දකින පරිදි, අසමාන සම්භාවිතාව සමඟ නියැදීම් මේ ආකාරයේ ද දත්ත සමඟ අමුත්තන් ආරංචි මාර්ග සිදු වන නමුත්, තෙල් සංස්ථාව සතුව මෙන් නොව, නියැදීම් යාන්ත්රණයක් සාමාන්යයෙන් පර්යේෂකයෙකු විසින් දැන හෝ පාලනය නොවේ.

එහි නියැදීම් නිර්මාණය සලකන විට, තෙල් සංස්ථාව සතුව එක්සත් ජනපද නියෝජිත සෘජුවම නොවේ; එය රෝඩ් දූපතේ සිට බොහෝ ජනතාව හා කැලිෆෝනියාවේ ඉතා සුළු ඇතුළත් වේ. ඒ නිසා, එය නියැදි දී විරැකියා අනුපාතය සමග රට තුළ විරැකියා අනුපාතය ඇස්තමේන්තු කිරීම අනුවණ වනු ඇත. ඒ වෙනුවට නියැදි ලක්ෂ්ය, එය බර රෝඩ් අයිලන්ඩ් ජනතාව කැලිෆෝනියාවේ ජනතාවට වඩා ඇතුළත් කළ යුතු වැඩි බව ඇත්ත සඳහා වැයවේ එහිදී බර මධ්යන්ය, ගැනීමට වඩා හොඳ වේ. උදාහරණයක් ලෙස, ඔවුන් අතර තක්සේරු-සහ රෝඩ් අයිලන්ඩ් සිට එක් එක් පුද්ගලයාට downweighted-ඔවුන් කරන බව ඇස්තමේන්තු කර අඩු ගණන් කරන තවත් ගණන් ඇත upweighted- කැලිෆෝනියාවේ එක් එක් පුද්ගලයාට වනු ඇත. සාරය වශයෙන්, ඔබ ගැන ඉගෙනගන්න ඇති ඉඩකඩ අඩු ය බව තව තවත් ජනතාවට විශාල හඬක් ලබා දී ඇත.

මෙම සෙල්ලම් බඩු උදාහරණයක් වැදගත් නමුත් පොදුවේ, අප විසින් වරදවා වටහාගනු ලක්ෂ්යය පෙන්නුම්: නියැදි කුහරයේ නිෂ්පාදනය කිරීමට ජනගහනයෙන් පුංචි අනුවාදය විය යුතු නැත. ප්රමාණවත් තරම් දත්ත එකතු කරන ආකාරය ගැන දන්නේ නම් නියැදි වලින් ඇස්තමේන්තු කරන විට, එසේ නම් එම තොරතුරු භාවිතා කළ හැක. ප්රවේශය මම විස්තර-හා තියෙනවා මම ගණිතමය විස්තර තාක්ෂණික සම්භාව්ය සම්භාවිතාව නියැදීම් රාමුව තුළ සෘජුව උපග්රන්ථයක්-වැටෙන. දැන්, මම එම අදහස සම්භාවිතාව නොවන සාම්පල යෙදිය හැකි ආකාරය පෙන්වයි.