3.6.1 د شامخو غوښتنه

څخه ډیجیټل شونې ستاسو سروې نښلول کیدای شي لکه ستاسو پوښتنو ته په هر وخت کې هر څوک غواړي.

نمونه سروې او سروې: غوښتنه په عمومي توګه په دوو سترو کتګوریو کې راځي. نمونه سروې، ځای کې چې تاسو د لږ شمیر خلکو ته لاسرسی، کیدای شي د انعطاف، په وخت او نسبتا ارزانه دي. که څه هم، د نمونې د سروې ګانو، ځکه چې هغوی د يوې نمونې په اساس دي، خلک تل په خپل پرېکړه ليک محدود؛ سره يو نمونه سروې، دا زياتره ستونزمنه ده چې د ځانګړو جغرافيايي سيمو په اړه او یا د ځانګړو وګړو د ډلو اټکل وکړي. سروې، پر نورو، هڅه کوي چې په خلکو هر سره مرکه وکړه. هغوی غوره حل، خو په عمومي توګه ګران، په تمرکز تنګ (هغوی يوازې د پوښتنو يو لږ شمېر شامل دي)، او په خپل وخت نه (دوی په یو ثابت مهال ویش پېښ شي، لکه د هر 10 کلونو پورې) (Kish 1979) . اوس تصور که څېړونکو شي د نمونه سروې او د سروې غوره ځانګړنو په ګډه؛ تصور که څېړونکو کولای شي هره پوښتنه چې له هر چا هره ورځ پوښتنه وکړئ.

ښکاره خبره ده، د دې په دوامداره توګه، په هرځای کې، تل-on سروې کې د ټولنیزو علومو خیال ډول دی. خو، داسې ښکاري چې موږ کولای شو د دې له خوا د سره څخه د زيات شمېر خلکو د ډيجيټل شونې لږ شمیر خلکو ته د سروې پوښتنې د ګډو تقريبي پيل شي. ما غږ د ترکیب په دې ډول غواړي د شامخو. که دا کار په ښه شي، نو له موږ سره مرسته کوي چې اټکل دي د زياتو ځايي (د وړو جغرافیوې سیمو کې)، زیات دانه (د ځانګړو وګړو د ډلې)، او زيات وخت.

د شامخو وپوښتي یوه بېلګه د يوشع Blumenstock، چې غوښتل يې د معلوماتو، چې په بې وزلو هېوادونو سره به د لارښود د پراختیا د راټولولو کار څخه راځي. په مشخصه توګه، Blumenstock غوښتل چې مال او هوساینې، چې د هغه د يوې سروې د انعطاف او تکرار په سر شميرنه د بشپړوالي په ګډه د اندازه کولو یو سیستم جوړ کړو (Blumenstock 2014; Blumenstock, Cadamuro, and On 2015) . په حقیقت کې، ما لا Blumenstock د کار په مختصر ډول په 1 دکوچنیانولپاره د کیسو وباله.

پيل، Blumenstock سره په رونډا لوی ګرځنده تليفون برابروونکي په ګډه. د شرکت څخه په اړه 1.5 ميليونه مشتريان سلوک د پوښښ په محرمانه ډول معاملې سوابق لکه د پيل وخت، موده، او د تليفون او ترلاسه تقريبي جغرافیایي موقعیت څخه د 2005 او 2009. د يادښتونه لري هر تليفون او متن پېغام په اړه معلومات وړاندي کړ. مخکې له موږ احصايوي موضوعاتو په اړه خبرې پيل کړي، چې دا د یادونې وړ ده اشاره کوي چې دا د لومړی ګام کيداي شي چې د سخت وي. لکه څرنګه چې په 2 فصل وباله، تر ټولو ډیجیټل مصرفه معلوماتو ده چې د څېړونکو رسي. او، ډیری شرکتونه دي توجیه لويږي چې خپل مالومات شریک کړي ځکه چې دا د خصوصي؛ چې ده د خپلو مشتريانو احتمالا نه تمه لري چې د خپلو فعاليتونو به ګډ په برخه شي-with څېړونکو. په دې صورت کې د څېړونکو په احتياط ګامونه د معلوماتو څرګندول کړ او د هغوی د کار د دريم ګوند (یعنې، د خپلو IRB) له خوا څارل. خو، د دې هڅو سره سره، د دغو معلوماتو د پيژندلو وړ دي اوس هم او نو ښايي دوی د حساسو معلوماتو لرونکی (Mayer, Mutchler, and Mitchell 2016; Landau 2016) . زه به په 6 دکوچنیانولپاره د دغو اخلاقي پوښتنې ته ستون شي.

ياد چې Blumenstock په مال او هوساینې د اندازه کولو سره مينه وه. خو، دا خاصيتونه په غوښتنې ته اسناد نه دي په مستقیم ډول. په بل عبارت، د دې غوښتنې اسناد دې څېړنې، د ډيجيټل شونې يو عام ځانګړنه چې په 2. دکوچنیانولپاره د کیسو په تفصیل سره بحث لپاره نابشپړ دي خو دا احتمال ښکاري چې د غوښتنې اسناد احتمالا په اړه مال او هوساینې څه معلومات لرم. نو د پوښتنه Blumenstock د پوښتنې کیدای شي یوه لار: آیا ممکنه ده چې وړاندوینه څنګه څوک به پر بنسټ د هغوی د ډيجيټل مصرفه د معلوماتو د يوې سروې له ځواب ته؟ که داسې وي، نو د پوښتنو په يو څو تنو موږ کولای شو د هر بل ځوابونه فکر.

د دې ازمایښتونوله ارزونه، له تیښتې ته انستیتوت د ساینس او ​​ټکنالوژۍ د Blumenstock او تحقيق د مرستيالانو په اړه د یو زره ګرځنده تليفون مشتريان يوه نمونه وبلله. څېړونکو ګډونوالو ته د پروژې د موخو څرګنده کړه، چې د هغوی د رضایت تر څو د غوښتنې اسناد د سروې له ځوابونو سره تړنې لري وغوښتل، او بيا يې د پوښتنو د یو لړ څخه وغوښتل چې په خپل مال او هوساینې د اندازه کولو، لکه د "آيا تاسو يوه شخصي راډيو؟ "او" آيا تاسو يوه بايسکل لري؟ "(د يو مختصر لست د 3.11 شکل ته وګورئ). په سروې کې د ټولو ګډونوالو شوي جبران مالي.

فیچر د انجنيرۍ ورپسې د نظارت د زده کړې: بل، Blumenstock د دوو قدمونو د طرزالعمل د معلوماتو ساينس عام کارول. لومړی، په فیچر انجنيري ګام، د هر چا لپاره چې مرکه شوې وه، Blumenstock د غوښتنې اسناد تیاتر د هر شخص په اړه ځانګړتياوو ټولګه؛ د معلوماتو پوهانو ښايي دغو ځانګړتياوو "ځانګړتياوې:" د مثال په توګه غږ او ټولنيز پوهان به هغوی ته "متحولو."، د هر کس لپاره، Blumenstock د ورځو سره د فعالیتونو شمېر محاسبه، د توپیر د خلکو د شمېر د يو کس په تماس سره شوي دي، د اندازه د پيسې په اختيار کې مصرف، او داسې نور. مهمه دا ده، ښه فیچر د انجنيرۍ د څېړنې جوړولو پوهې ته اړتيا لري. د بیلګې په توګه، که دا مهمه ده چې د کورنیو او نړیوالو اړیکو تر منځ توپير (موږ تمه خلک چې په نړيواله غږ کوم چې شتمن وي)، بیا نو دا بايد په فیچر انجنيري ګام شي. A سره د رونډا د لږ پوهاوي څېړونکی ښايي دا فیچر شامل نه دي، او وروسته د موډل predictive کړنو به رنځ وړي.

بل، په نظارت زده ګام، Blumenstock یو احصائیوي موډل جوړ وړاندوینه هر پر بنسټ د خپلو ځانګړنو کس لپاره سروې ځواب. په دې صورت کې Blumenstock سره 10 چنده متقابل اعتبار لوژستيکي regression کارول، خو هغه کولای شي د نورو د احصايوي يا ماشيني زده کړې کړنالرې نوعه ګټه اخیستی ده.

نو څنګه ښه دا کار وکړ؟ Blumenstock و وړاندوینه ځوابونه په شان پوښتنو ته د سروې: "آيا تاسو د راډيو لري؟" او "آيا تاسو يوه بايسکل لري؟" ځانګړنو څخه غوښتنې اسناد مشتق کاروي؟ لړۍ. د وړاندوينه دقت د ځينو ځانګړتياوي (3.11) لوړ شوي. خو، چې دا یو ساده د بديل په وړاندې د یوه پیچلې وړاندوينه طريقه پرتله مهم تل ده. په دې صورت کې د يو ساده بدیل دی وړاندوینه چې هر څوک به د ټولو زیات عام ځواب ورکوي ته. د مثال په توګه، 97،3٪ د راديو دې امله که Blumenstock وړاندوينه کړې، چې هر څوک به د راډيو هغه به د 97،3٪، چې د حیرانتیا ته د هغه د ډېر پېچلی طرزالعمل (97.6٪ دقت) د کړنو په ورته یوه کره کړې چې اروي او راپور اروي راپور. په بل عبارت، د ټولو ښکلې معلوماتو او ماډل څخه 97،3٪ څخه 97،6٪ د وړاندوینې د سموالي په لوړه شوې ده. دې، چې د نورو پوښتنو ته، لکه د "آیا تاسو د يو بايسکل لري؟"، د وړاندوینو څخه 54،4٪ څخه 67،6٪ ښه شوی دی. په عمومي ډول، شکل 3.12 د نندارې لپاره ځينې خاصيتونه Blumenstock نه يوازې د ساده اساسي وړاندوينه کولو وروسته ډېر ښه نه دي، خو چې د نورو خاصيتونه ځینې پرمختګونه ترسترګو کیږي.

انځور 3.11: د احصایوي موډل سره غوښتنې اسناد روزل Predictive دقت. د پایلو څخه د Blumenstock (2014) 2 جدول.

انځور 3.11: د احصایوي موډل سره غوښتنې اسناد روزل Predictive دقت. د پایلو څخه د 2 جدول Blumenstock (2014) .

3.12 شکل: د احصایوي موډل سره د ساده اساسي وړاندوينه غوښتنې اسناد روزل د predictive دقت پرتله. ټکو لږ jittered ته تداخل د مخنيوي؛ لپاره کره ارزښتونو د Blumenstock (2014) 2 جدول وګورئ.

3.12 شکل: د احصایوي موډل سره د ساده اساسي وړاندوينه غوښتنې اسناد روزل د predictive دقت پرتله. ټکو لږ jittered ته تداخل د مخنيوي؛ د 2 جدول وګورئ Blumenstock (2014) لپاره د کره ارزښتونو.

په دې وخت تاسو فکر کېدای شي چې دا پايلې دي يو څه د نهيلۍ، خو يوازې د يو کال وروسته، د Blumenstock او دوه همکاران-جبريل Cadamuro او رابرت د-خپور په علومو کې د پام وړ ښه پايله کاغذ (Blumenstock, Cadamuro, and On 2015) . لپاره د ښه والي دوه عمده تخنيکي دلايل موجود دي: 1) زيات عصري میتودونو کارول (لکه، په یوه نوي روش ته د انجنيرۍ او د یو عصري ماشيني زده کړې موډل ځانګړنې) او 2) ددې پرځای چې د انفرادي سروې پوښتنو ته ځوابونه اټکل په هڅه کې (د مثال په "آيا تاسو د راديو لري؟")، نو هڅه وکړه چې د یو مرکب شتمنی شاخص د اټکل وکړی.

Blumenstock او همکارانو سره په دوه ډوله د هغوی د چلند د کړنو ښودلې ده. لومړی، هغوی وموندل چې د هغوی په نمونه د خلکو لپاره، هغوی نه شي کولای له غوښتنې اسناد (3.14) خپل مالونه وړاند وينه کوي، یو ښایسته ښه دنده. دوهم، او بل هر وخت ډیر مهم دی، Blumenstock او همکارانو وښودله چې د خپل طرزالعمل کړي، او په رونډا د مال جغرافيايي وېش د لوړ کیفیت اټکل توليدوي. په مشخصه توګه، دوی د ټولو 1.5 میلیونه خلکو د مال وړاندوینه په غوښتنې اسناد د خپلو ماشيني زده کړې نمونه، چې د په اړه د 1،000 کسانو خپل نمونه لپاره روزل شوی و، کارول. برسيره پر دې، سره د جوړلو لپاره د معلوماتو د وصل په غوښتنې ته د معلوماتو (ياد چی دا تلیفون د معلوماتو شامل دي د هرې غوښتنې ته د حجری د نژدي برج د ځای)، د څېړونکو کولای شول چې د هر کس د استوګنی ځای تقريبي اټکل. د دغو دوو د اټکل له یو ځای کولو، د څېړنې په خورا ښه اړخيز granularity د ګډون مال جغرافيايي وېش یو اټکل توليديږي. د مثال په توګه، هغوی نشي کولای په د رونډا د 2148 حجرو (په هېواد کې د کوچنيو اداري واحد) هر اوسط مال اټکل. دا وړاندوينه مال ارزښتونو نو دانه دوی ته وګورئ ستونزمن وو. نو، د څېړونکو د هغوی د پایلو ارق چې د رواندا د 30 ولسواليو کې په اوسط ډول شتمنیو تخمین توليدوي. د دغو ولسوالیو په کچه د اټکل شوي دي په کلکه ته د سرو زرو يو معياري دوديزو سروې څخه اټکل اړوند، د رو واندا د دمو او روغتیا سروې (3.14). که څه هم له دوو سرچینو د اټکل له مخې سره ورته دي، له Blumenstock او همکارانو د اټکل له مخې په اړه 50 ځلې ارزانه او 10 ځلې ګړندۍ (کله چې لګښت کې د متحول لګښتونو سره اندازه) وو. په لګښت دغه ډراماتيک کمښت مانا لري، چې پر ځای کېږي هرو څو کلونو په توګه د د وګړو او روغتیا معياري ده سروې-د کوچنۍ سروې سره ستره ډيجيټل مصرفه معلوماتو د ګډو رګه شي په هره مياشت کې مخ ولاړ شي.

انځور 3.13: د Blumenstock، Cadamuro منوال، او د (2015). د تليفون شرکت څخه غوښتنه معلومات سره د هر کس لپاره د يو قطار او هر ځانګړنه (i.e.، متحول) لپاره د یو کالم د يو جدول بدلوی. بل، د څېړونکو يوه نظارت د زده کړې موډل جوړ څخه د شخص د سروې له ځوابونو څخه وړاندوینه چې د فیچر جدول. وروسته، د نظارت د زده کړې نمونه واخیستل شو، څو د هر چا لپاره د سروې له ځوابونو څخه impute. په اصل کې، د څېړونکو په اړه د یو زرو څخه د خلکو د ځوابونو لپاره کارول کيږي چې د يو ميليون په اړه د خلکو د مال impute. همدارنګه، د څېړونکو لپاره پر بنسټ د خپلو اړیکو د ځایونو د ټولو 1.5 میلیونه خلکو د استوګنې ځای تقريبي اټکل شوی. کله چې د دغو دوو اټکل شوي ګډو-د اټکل مال او د استوګنې د پایلو اټکل ځای ته د دیموګرافیک او روغتیا سروې، د سرو زرو يو معياري دوديزو سروې (3.14) د اټکل له مخي سره ورته وې.

انځور 3.13: د منوال Blumenstock, Cadamuro, and On (2015) . د تليفون شرکت څخه غوښتنه معلومات سره د هر کس لپاره د يو قطار او هر ځانګړنه (يعنې د متحول) لپاره د یو کالم د يو جدول بدلوی. بل، د څېړونکو يوه نظارت د زده کړې موډل جوړ څخه د شخص د سروې له ځوابونو څخه وړاندوینه چې د فیچر جدول. وروسته، د نظارت د زده کړې نمونه واخیستل شو، څو د هر چا لپاره د سروې له ځوابونو څخه impute. په اصل کې، د څېړونکو په اړه د یو زرو څخه د خلکو د ځوابونو لپاره کارول کيږي چې د يو ميليون په اړه د خلکو د مال impute. همدارنګه، د څېړونکو لپاره پر بنسټ د خپلو اړیکو د ځایونو د ټولو 1.5 میلیونه خلکو د استوګنې ځای تقريبي اټکل شوی. کله چې د دغو دوو اټکل شوي ګډو-د اټکل مال او د استوګنې د پایلو اټکل ځای ته د دیموګرافیک او روغتیا سروې، د سرو زرو يو معياري دوديزو سروې (3.14) د اټکل له مخي سره ورته وې.

انځور 3.14: د پایلو څخه Blumenstock، Cadamuro، او د (2015). په انفرادي کچه، د څېړونکو کولای څخه د هغوی غوښتنې اسناد د چا مال وړاند یو معقول دندې ته راشي. د ولسوالیو په کچه د مال، چې د شتمنۍ او د استوګنې د پایلو په ځای فرد په کچه د اټکلونو پر بنسټ شوي اټکلونه ته د دیموګرافیک او روغتیا سروې، د سرو زرو يو معياري دوديزو سروې له پايلو سره ورته وې.

انځور 3.14: د پایلو څخه Blumenstock, Cadamuro, and On (2015) . په انفرادي کچه، د څېړونکو کولای څخه د هغوی غوښتنې اسناد د چا مال وړاند یو معقول دندې ته راشي. د ولسوالیو په کچه د مال، چې د شتمنۍ او د استوګنې د پایلو په ځای فرد په کچه د اټکلونو پر بنسټ شوي اټکلونه ته د دیموګرافیک او روغتیا سروې، د سرو زرو يو معياري دوديزو سروې له پايلو سره ورته وې.

په پایله کې، Blumenstock د شامخو روش ګډې سروې سره ډيجيټل مصرفه د معلوماتو د معلوماتو غوښتنه اټکل سره د سرو زرو معياري سروې اټکل د پرتلې توليدوي. دغه ځانګړی مثال هم واضح د شامخو وپوښتي او عنعنوي سروې میتودونه تر منځ د سوداګرۍ ددوهمې ځينو. لومړی، د شامخو غوښتنه اټکل زيات وخت، د پام وړ ارزانه، او نور دانه وو. خو، له بلې خوا، په دې وخت کې، هلته نه د شامخو وپوښتي د دې ډول يو قوي نظري بنسټ دی. چې ده، د دې يو مثال نه ښيي څه وخت به د کار کوي او کله چې دا به نه. برسيره پر دې، د شامخو وپوښتي روش لا تر اوسه په شاوخوا یې اټکل ابهام اندازه د ښه لارو نه لري. که څه هم، د شامخو وپوښتي چې د دريو لويو سيمو کې د احصايې موډل پر بنسټ-طبقه وروسته ژورې اړيکې لري (Little 1993) ، د بېرحمۍ له (Rubin 2004) ، او د کوچنۍ سيمه اټکل (Rao and Molina 2015) -and نو زه تمه لري چې پرمختګ به چټک وي.

د شامخو وپوښتي اساسي بېلګه وي، چې کولی شي ستاسو د ځانګړې حالت شي په لاندې. دوه عناصر او دوه ګامونه شتون لري. د دوه اجزا دي 1) د ګڼيال مصرفه بيس چې په پراخه خو نری (چې وي، د هغې زيات شمېر خلک خو نه معلومات چې تاسې د هر کسانو په اړه ته اړتيا لري) او 2) د يوې سروې چې د نری خو نازکه (چې دی، دا لري يوازې يو څو تنو، خو دا معلومات چې تاسې د هغو کسانو په اړه ته اړتيا لري) لري. وروسته، د دوو ګامونه شته. لومړی، په دواړو معلوماتي سرچینو د خلکو لپاره، يو ماشين د زده کړې نمونه چې وړاندوینه سروې ځوابونو څخه ډیجیټل مصرفه معلومات کاروي جوړ کړي. بل، کاروي چې ماشيني زده کړې موډل په ډیجیټل مصرفه د معلوماتو د هر سروې ځوابونه impute. په دې توګه، که ځینې یې پوښتنه چې تاسو غواړئ چې ډېر خلک پوښتنه کوي، له هغو خلکو چې ښايي وړاندوینه خپل ځواب ته وکارول شي ډیجیټل مصرفه د معلوماتو په لټه کې ده.

په ستونزه Blumenstock د لومړي او دوهم هڅه پرتله هم د دويم پېر څخه دريم پېر کړنالرې د لیږد په اړه د يوه مهم سبق انځوروي د څيړنو د سروې: په پيل کې پای نه ده. چې ده، څو ځلې، د لومړي طریقه به نه ښه وي، خو که څېړونکو د کار دوام، کارونه په ښه توګه تر لاسه کړي. په عمومي ډول، کله چې په ډیجیټل عمر ټولنيزو څيړنو په نوي الرو ارزونه، دا مهمه ده چې دوه سره بېل ارزونې لپاره: 1) اوس څومره ښه دې کار کوي او 2) څومره ښه فکر کوئ، دا ښايي د معلوماتو په منظره په توګه په راتلونکي کې کار وکړي د بدلونونو او د څیړونکو د دغې ستونزې د زيات پام ځانګړې کړي. که څه هم، د څیړونکو روزل شوي چې د ارزونې لومړۍ ډول (څومره ښه دی د څيړنې دغه ځانګړی ټوټه)، د دوهم کار زياتره وخت ډېره مهمه ده.