2.5 پایله

د ډیرو معلوماتو سرچینې په هر ځای کې دي، مګر د ټولنیزو څیړنو لپاره یې کارول مشکل کېدای شي. زما په تجربه کې، د معلوماتو لپاره "د وړیا ډوډۍ ډوډۍ" اصول لکه یو څه شتون نلري: که تاسو ډیری کارونه په هغه کې نه راټول کړئ، نو تاسو شاید په ډیرو کارونو کې په پام کې ونیولو په اړه فکر وکړئ او تحلیل یې کړئ.

د نن ورځې او احتمال سبا - د سترو معلوماتو سرچینې به 10 ځانګړتیاوې ولري. د دغو دریو څخه عموما عموما (مګر تل نه د) تحقیق لپاره ګټور دي: لوی، تل پاتې او غیر غیر فعال. اوسمهال اوه (عموما تل د څیړنې لپاره ستونزمن ندي): نامناسب، د لاسرسی وړ، ناببره، راڅرګند کول، الګوریتمیکي ډول ډک شوی، خراب او حساس. ډیری دا ځانګړتیاوې په پایله کې را منځته کیږي ځکه چې د ډیټا د معلوماتو سرچینې د ټولنیزو څیړنو لپاره نه وې جوړې شوې.

پدې باب کې د نظرونو پر بنسټ، زه فکر کوم چې درې مهمې لارې دي چې د ډیټابیس سرچینې به د ټولنیزو څیړنو لپاره خورا ارزښتناکه وي. لومړی، دوی کولی شي څیړونکي د سیالي سیالیو اټکلونو تر مینځ پریکړه وکړي. د دې ډول کار بیلګې په Farber (2015) (د نیویارک ټکسي چلوونکي) او King, Pan, and Roberts (2013) (په چین کې سانسور). دوهم، د معلوماتو لوی سرچینې کولی شي د پالیسۍ لپاره ښه اندازه کول د غځولو له الرې. د دې ډول کار بیلګه د Ginsberg et al. (2009) (د گوگل فلو رجحانات). په پاى کې، د معلوماتو سترې سرچينې کولاى شي څېړونکو سره د تجربو چلولو پرته د دليل اټکل وکړي. د دې ډول ډول بیلګې مثالونه Mas and Moretti (2009) (د تولیداتو Einav et al. (2015) اغیزې) او Einav et al. (2015) (په ایب کې د نیلامونو د پیل قیمت.). په هرصورت، د دې تګالرې هر یو د څیړونکو اړتیا ته اړتیا لري ترڅو ډیټا ته ډیروالی ورکړي، لکه د مقدار مقدار تعریف چې د اټکل لپاره مهم وي یا دوه تیورۍ چې د سيالۍ وړاندیزونه کوي. په دې توګه، زه فکر کوم چې د کومې لوی ارقامو سرچینو په اړه فکر کولو غوره لاره دا ده چې دوی کوالی شي څیړونکو سره مرسته وکړي چې کولی شي په زړه پورې او مهم پوښتنو څخه پوښتنه وکړي.

د پای ته رسیدو دمخه، زما په اند دا د پام وړ ارزښت لري چې د ډیټا لوی سرچینې کیدای شي د معلوماتو او نظر تر مینځ اړیکو باندې یو مهم تاثیر ولري. تر اوسه پورې، دغه څپرکی د تیوری له پلوه تجربه لرونکی څیړنه اخیستې ده. مګر د ډیرو معلوماتو سرچینې هم څیړونکي پدې توانوي چې تجربه لرونکي تیورونه ترسره کړي . دا د تجربو حقایقو، نمونو او پیچلو احتیاطاتو راټولولو له لارې، څیړونکي کولی شي نوي نظرونه رامینځ ته کړي. دا بدیل، د لومړي ځل لپاره تیوری نظر نظر ندی، او دا په خورا زور سره د بارني ګالزر او انیللم سټراس (1967) د ګوتو تیورۍ لپاره د دوی غوښتنه وه. په هرصورت، دا ډاټا - لومړی تګلاره، د "تیورۍ پای" ته اشاره نه کوي لکه څنګه چې د ډیجیټل عمر (Anderson 2008) څیړنې (Anderson 2008) په شاوخوا کې د ژورنالیزم په اړه ادعا شوې ده. بلکې، د معلوماتو چاپیریال بدلونونو په توګه، موږ باید د معلوماتو او تیوری تر مینځ اړیکو کې د بیارغونې تمه وکړو. په هغه نړۍ کې چې د معلوماتو راغونډول خورا ګران وو، دا د احساس احساس و چې یوازې هغه ارقام راټولوي چې تیوریانې وړاندیز کوي تر ټولو ګټور وي. مګر، په داسې یو نړۍ کې چې د ډیرو ډیرو معلوماتو ډاونلوډ لپاره وړیا شتون لري، نو دا هم احساس کوي چې د معلوماتو ډاټا لومړنۍ طریقه (Goldberg 2015) .

لکه څنګه چې ما په دې فصل کې ښودل شوي، څیړونکي کولی شي د خلکو په لیدلو سره ډیر څه زده کړي. په راتلونکو دریو فصلونو کې، زه به تشریح کړم چې څنګه موږ د معلوماتو راټولولو خنډونه کولی شو څنګه زده کولی شو او د خلکو سره په مستقیم ډول د پوښتنو پوښتنو له لارې سره اړیکه ونیسو) فصل 3 (، د تجربو چلولو (څلورم څپرکی)، او حتی حتی په دې کې شامل دي د څیړنې په پروسه کې نیغه مستقیمه برخه) 5 څپرکی (.