2.2 داده های بزرگ

داده های بزرگ ایجاد شده و توسط دولت برای مقاصد دیگر از تحقیقات جمع آوری شده. با استفاده از این داده ها برای تحقیق، بنابراین، نیاز به repurposing.

مشاهده آرمانی پژوهش اجتماعی تصور یک دانشمند با داشتن ایده و سپس جمع آوری داده ها برای تست این ایده است. این سبک از تحقیقات منجر به یک جا تنگ بین درخواست تحقیق و داده ها، اما محدود است زیرا یک فرد محقق اغلب منابع مورد نیاز برای جمع آوری داده های آنها نیاز دارند، مانند داده های بزرگ، غنی، و در سراسر کشور-نماینده ندارد. بررسی های اجتماعی در مقیاس بزرگ بنابراین، بسیاری از تحقیقات اجتماعی در گذشته استفاده کرده است، مانند بررسی عمومی اجتماعی (GSS)، مطالعه انتخابات ملی آمریکا (ANES) و مطالعه پنل دینامیک درآمد (PSID). این بررسی در مقیاس بزرگ به طور کلی توسط یک تیم از محققان اجرا و طراحی شده برای ایجاد داده است که می تواند توسط بسیاری از محققان استفاده می شود. از آنجا که از اهداف این بررسی در مقیاس بزرگ، مراقبت های بزرگ به طراحی جمع آوری داده ها و آماده سازی داده ها در نتیجه برای استفاده توسط محققان قرار داده است. این داده ها توسط محققان و پژوهشگران برای می باشد.

بسیاری از تحقیقات اجتماعی با استفاده از منابع عصر دیجیتال، با این حال، اساسا متفاوت است. به جای استفاده از داده های جمع آوری شده توسط محققان و برای محققان، آن را با استفاده از منابع داده که ایجاد شده و توسط شرکت های تجاری و دولت برای اهداف خود از جمله سود، ارائه خدمات و یا مدیریت یک قانون جمع آوری شد. این کسب و کار و دولت منابع داده آمده اند به آن می شود داده های بزرگ. انجام پژوهش با داده های بزرگ از انجام پژوهش با داده هایی را که در اصل برای تحقیقات ایجاد شده بود متفاوت است. مقایسه، برای مثال، یک وب سایت رسانه های اجتماعی، مانند توییتر، با یک نظرسنجی عمومی سنتی مانند پیمایش اجتماعی عمومی (GSS). اهداف اصلی توییتر هستند به ارائه خدمات به کاربران آن و به دست آوردن سود. در این روند از دستیابی به این اهداف، توییتر ایجاد داده است که ممکن است برای مطالعه جنبه های خاصی از افکار عمومی مفید است. اما، بر خلاف پیمایش اجتماعی عمومی (GSS)، توییتر است در درجه اول در پژوهش اجتماعی است.

داده های بزرگ مدت ناموفق مبهم است، و آن را گروه با هم بسیاری از چیزهای مختلف. برای اهداف پژوهش اجتماعی، من فکر می کنم آن را به تمایز بین دو نوع از منابع داده های بزرگ مفید است: سوابق اداری دولت و کسب و کار سوابق اجرایی سوابق اداری دولت داده که توسط دولت به عنوان بخشی از فعالیت های روزمره خود ایجاد شده است. این نوع از سوابق توسط پژوهشگران در گذشته مانند جمعیت شناسان مطالعه تولد، ازدواج، مرگ و سوابق اما دولت به طور فزاینده ای جمع آوری و انتشار سوابق دقیق در اشکال تحلیل استفاده شده است. به عنوان مثال، دولت شهر نیویورک متر دیجیتال در داخل هر تاکسی در شهرستان نصب شده است. این متر و ضبط از انواع داده ها در مورد هر کدام سوار تاکسی از جمله راننده، زمان شروع و محل، زمان توقف و مکان، و کرایه. در یک مطالعه که من بعدا در این فصل به، هنری فاربر (2015) تغییر کاربری این داده ها برای رسیدگی به یک بحث اساسی در اقتصاد کار در مورد رابطه بین دستمزد ساعتی و تعداد ساعت کار کرده است.

نوع اصلی دوم داده های بزرگ برای تحقیقات اجتماعی کسب و کار سوابق اجرایی است. این داده ها که کسب و کار ایجاد و جمع آوری به عنوان بخشی از فعالیت های روزمره خود هستند. این سوابق اداری کسب و کار اغلب به نام آثار دیجیتال، و شامل چیزهایی مانند موتور جستجو جستجوهای سیاهههای مربوط، پست رسانه های اجتماعی، و ثبت تماس ها از طریق تلفن همراه. انتقادی، این کسب و کار سوابق اجرایی فقط در مورد رفتار آنلاین نیست. به عنوان مثال، فروشگاه های که با استفاده از چک کردن اسکنر در حال ایجاد اقدامات در زمان واقعی بهره وری کارگر. در یک مطالعه که من شما را در مورد بعدا در این فصل بگویم، الکساندر mas بیا و انریکو مورتی (2009) تغییر کاربری این سوپر مارکت چک کردن داده ها به مطالعه و بررسی چگونگی بهره وری کارگران است بهره وری از همسالان خود نهفته است.

همانطور که هر دو از این مثالها، ایده repurposing اساسی برای یادگیری از داده های بزرگ است. در تجربه من، دانشمندان علوم اجتماعی و دانشمندان داده رویکرد به این repurposing بسیار متفاوت است. دانشمندان علوم اجتماعی، که به کار با داده های طراحی شده برای تحقیقات عادت کرده اند، سریع به اشاره به مشکلات با داده های تغییر کاربری حالی که نادیده گرفتن نقاط قوت آن است. از سوی دیگر، دانشمندان داده سریع به اشاره از مزایای داده تغییر کاربری حالی که نادیده گرفتن نقاط ضعف آن است. به طور طبیعی، بهترین روش خواهد بود ترکیبی. این است که، محققان نیاز به درک ویژگی های این منابع جدید داده خوب و بد و پس از آن شکل از چگونه به از آنها یاد بگیرند. و، که این طرح برای باقی مانده از این فصل است. بعد، من ده ویژگی های مشترک از کسب و کار و دولت داده های اداری توصیف می کنند. پس از آن، من سه رویکرد تحقیقی که می تواند با این داده ها، روش های است که به خوبی به ویژگی های این داده ها مناسب استفاده توصیف می کنند.