3.4.1 פּראָבאַביליטי מוסטערונג: דאַטן זאַמלונג און דאַטע אַנאַליסיס

ווייץ קענען ופמאַכן דיסטאָרשאַנז בעקיוון געפֿירט דורך די מוסטערונג פּראָצעס.

מאַשמאָעס סאַמפּאַלז זענען יענע ווו אַלע מענטשן האָבן אַ געקענט, ניט-נול מאַשמאָעס פון ינקלוזשאַן, און די סימפּלאַסט מאַשמאָעס מוסטערונג פּלאַן איז פּשוט ראַנדאָם מוסטערונג ווו יעדער מענטש האט גלייַך מאַשמאָעס פון ינקלוזשאַן. ווען ריספּאַנדאַנץ זענען אויסגעקליבן דורך פּשוט ראַנדאָם מוסטערונג מיט גאנץ דורכפירונג (למשל, קיין קאַווערידזש טעות און קיין ניט-ענטפער), דעמאָלט אָפּשאַצונג איז סטראַיגהטפאָרוואַרד ווייַל דער מוסטער וועט-אויף דורכשניטלעך-זיין אַ מיניטשור ווערסיע פון ​​די באַפעלקערונג.

פּראָסט ראַנדאָם מוסטערונג איז ראַרעלי געניצט אין פיר, אָבער. אלא, ריסערטשערז בעקיוון סעלעקטירן מענטשן מיט אַניקוואַל פּראַבאַבילאַטיז פון ינקלוזשאַן אין סדר צו רעדוצירן פּרייַז און פאַרגרעסערן אַקיעראַסי. ווען ריסערטשערז בעקיוון סעלעקטירן מענטשן מיט פאַרשידענע פּראַבאַבילאַטיז פון ינקלוזשאַן, דעמאָלט אַדזשאַסטמאַנץ זענען דארף צו ופמאַכן די דיסטאָרשאַנז געפֿירט דורך די מוסטערונג פּראָצעס. אין אנדערע ווערטער, ווי מיר גענעראַליזע פֿון אַ מוסטער דעפּענדס אויף ווי דער מוסטער איז אויסגעקליבן.

לעמאָשל, די קראַנט פּאָפּולאַטיאָן סורוויי (קפּס) איז געניצט דורך די יו רעגירונג צו אָפּשאַצן די אַרבעטלאָזיקייַט קורס. יעדער חודש וועגן 100.000 מענטשן זענען ינטערוויוד, אָדער פּנים-צו-פּנים אָדער איבער די טעלעפאָן, און די רעזולטאטן זענען געניצט צו פּראָדוצירן די עסטימאַטעד אַרבעטלאָזיקייַט טעמפּאָ. ווייַל די רעגירונג וויל צו אָפּשאַצן די אַרבעטלאָזיקייַט קורס אין יעדער שטאַט, עס קענען נישט טאָן אַ פּשוט ראַנדאָם מוסטער פון אַדאַלץ ווייַל אַז וואָלט טראָגן אויך ביסל ריספּאַנדאַנץ אין לענדער מיט קליין פּאַפּיאַליישאַנז (למשל, ראָוד אינזל) און אויך פילע פון ​​לענדער מיט גרויס פּאַפּיאַליישאַנז (למשל , California). אַנשטאָט, די קפּס סאַמפּאַלז מענטשן אין פאַרשידענע לענדער בייַ פאַרשידענע רייץ, אַ פּראָצעס גערופֿן סטראַטיפיעד מוסטערונג מיט אַניקוואַל מאַשמאָעס פון סעלעקציע. לעמאָשל, אויב די קפּס געוואלט 2,000 ריספּאַנדאַנץ פּער שטאַט, דעמאָלט אַדאַלץ אין ראָוד אינזל וואָלט האָבן וועגן 30 מאל העכער מאַשמאָעס פון ינקלוזשאַן ווי אַדאַלץ אין California (ראָוד אינזל: 2,000 ריספּאַנדאַנץ פּער 800,000 אַדאַלץ ווס California: 2,000 ריספּאַנדאַנץ פּער 30,000,000 אַדאַלץ). ווי מיר וועט זען שפּעטער, דעם מין פון מוסטערונג מיט אַניקוואַל מאַשמאָעס כאַפּאַנז מיט אָנליין קוואלן פון דאַטן אויך, אָבער ניט ענלעך די קפּס, די מוסטערונג מעקאַניזאַם איז יוזשאַוואַלי ניט געקענט אָדער קאַנטראָולד דורך די פאָרשער.

געגעבן זייַן מוסטערונג פּלאַן, די קפּס איז ניט גלייַך רעפּריזענאַטיוו פון די יו; עס כולל אויך פילע מענטשן פון ראָוד אינזל און אויך ווייניק פֿון California. דעריבער, עס וואָלט זיין אַנווייז צו אָפּשאַצן די אַרבעטלאָזיקייַט קורס אין דער מדינה מיט די אַרבעטלאָזיקייַט קורס אין די מוסטער. אָנשטאָט דעם מוסטער מיינען, עס איז בעסער צו נעמען אַ ווייטיד מיינען, ווו די ווייץ חשבון פֿאַר דער פאַקט אַז מענטשן פֿון ראָוד אינזל זענען מער מסתּמא צו ווערן ווי מענטשן פֿון California. לעמאָשל, יעדער מענטש פֿון California וואָלט זיין ופּוועיגהטעד- זיי וואָלט ציילן מער אין די שאַצן, און יעדער מענטש פון ראָוד אינזל וואָלט זיין דאָוונוועיגהטעד-זיי וואָלט רעכענען ווייניקער אין דער אָפּשאַצונג. אין עסאַנס, איר זענט געגעבן מער קול צו מענטשן אַז איר זענען ווייניקער מסתּמא צו לערנען וועגן.

דאס צאַצקע בייַשפּיל ילאַסטרייץ אַ וויכטיק אָבער קאַמאַנלי מיסאַנדערסטוד פונט: אַ מוסטער טוט ניט דאַרפֿן צו זייַן אַ מיניאַטורע ווערסיע פון ​​די באַפעלקערונג אין סדר צו פּראָדוצירן גוט עסטאַמאַץ. אויב גענוג איז באקאנט וועגן ווי די דאַטן איז געזאמלט, דעמאָלט אַז אינפֿאָרמאַציע קענען זיין געוויינט ווען מאכן עסטאַמאַץ פון די מוסטער. דער צוגאַנג איך ווע נאָר דיסקרייבד-און אַז איך באַשרייַבן מאַטאַמאַטיקלי אין די טעכניש אַפּפּענדיקס-Falls סקווערלי ין די קלאסישע מאַשמאָעס מוסטערונג ראַם. איצט, איך וועט ווייַזן ווי אַז זעלביקער געדאַנק קענען זיין געווענדט צו ניט-מאַשמאָעס סאַמפּאַלז.