2.3.2.3 غیر نماینده

دو منبع غیر نمایندگی جوامع مختلف و الگوهای مختلف استفاده می شود.

داده های بزرگ تمایل به صورت سیستماتیک در دو راه اصلی مغرضانه. این نیاز به یک مشکل برای همه نوع از تجزیه و تحلیل ایجاد نمی کند، اما برای برخی از تجزیه و تحلیل می توان آن را یک نقص حیاتی است.

یک منبع برای اولین بار از تعصب سیستماتیک است که مردم اسیر معمولا نه یک جهان کامل از تمام مردم و یا یک نمونه تصادفی از هر جمعیت خاص. به عنوان مثال، آمریکایی ها در توییتر هستند یک نمونه تصادفی از آمریکایی ها نمی (Hargittai 2015) . منبع دوم از تعصب سیستماتیک است که بسیاری از سیستم های داده های بزرگ گرفتن اقدامات، و برخی از مردم بسیاری از اقدامات بیش از دیگران کمک می کند. به عنوان مثال، برخی از مردم را در توییتر صدها توییت برابر بیشتر از دیگران کمک می کند. بنابراین، وقایع بر روی پلت فرم خاص می تواند تا به حال به شدت بیشتر بازتابی از زیر گروه های خاصی از پلت فرم خود را.

به طور معمول محققان می خواهند بدانند که زیادی در مورد داده هایی را که آنها داشته باشد. اما، با توجه به ماهیت غیر نماینده از داده های بزرگ، بهتر است به تفکر خود را نیز تلنگر. شما همچنین نیاز به دانستن زیادی در مورد داده هایی را که شما لازم نیست. این امر به ویژه زمانی که داده که شما لازم نیست که به طور سیستماتیک از داده هایی را که شما لازم می باشد. به عنوان مثال، اگر شما ثبت تماس از یک شرکت تلفن همراه در یک کشور در حال توسعه، شما باید فقط در مورد افرادی که در مجموعه داده های خود، بلکه در مورد افرادی که ممکن است بیش از حد فقیر برای داشتن یک تلفن همراه فکر می کنم. علاوه بر این، در فصل 3، ما در مورد چگونگی وزن می تواند محققان را قادر به برآورد بهتر از داده های غیر نماینده یاد بگیرند.