2.2 data Big

Data Big dijieun jeung dikumpulkeun ku pamaréntah pikeun tujuan lian ti panalungtikan. Maké data ieu panalungtikan, ku kituna, merlukeun repurposing.

Hiji pintonan idealized panalungtikan sosial imagines hiji élmuwan ngabogaan hiji ide terus ngumpulkeun data pikeun nguji pamanggih éta. gaya ieu panalungtikan ngabalukarkeun hiji fit ketat antara Patarosan panalungtikan jeung data, tapi kawates alatan hiji panalungtik individu mindeng teu boga sumber daya diperlukeun pikeun ngumpulkeun data maranéhanana kudu, saperti data badag, beunghar, jeung nasional-wakil. Ku alatan éta, loba panalungtikan sosial dina jaman baheula geus dipaké survey sosial gede skala, saperti Survey General Social (GSS), nu American Study Pemilihan Nasional (ANES), sarta Panel Study of panghasilan Dinamika (PSID). Ieu survey gede skala umumna dijalankeun ku tim panalungtik jeung nu dirancang pikeun nyieun data anu bisa dipaké ku loba panalungtik. Sabab tujuan survey badag skala ieu, ngurus gede ditunda kana ngarancang kumpulan data jeung Nyiapkeun data anu dihasilkeun dipaké ku panalungtik. data ieu ku panalungtik jeung panalungtik.

Kalolobaan panalungtikan sosial ngagunakeun sumber umur digital kitu, fundamentally béda. Gantina make data dikumpulkeun ku panalungtik jeung panalungtik, eta ngagunakeun sumber data nu dijieun jeung dikumpulkeun ku usaha jeung pamaréntah pikeun tujuan sorangan saperti nyieun untung, nyadiakeun layanan, atawa administering hukum a. Sumber data bisnis jeung pamaréntah ieu geus datang ka disebut data gedé. Ngalakonan panalungtikan jeung data gedé téh béda ti ngalakonan panalungtikan jeung data nu asalna dijieun pikeun panalungtikan. Bandingkeun, upamana, a website média sosial, saperti Twitter, jeung survey pamadegan umum tradisional saperti Survey Sosial Umum (GSS). tujuan utama Twitter urang nu nyadiakeun ladenan pikeun pamaké sarta nyieun untung. Dina prosés achieving tujuan ieu, Twitter nyieun data nu bisa jadi mangpaat pikeun nalungtik aspék tangtu pamadegan umum. Tapi, saperti Survey Sosial Umum (GSS), Twitter teu utamana difokuskeun dina panalungtikan sosial.

Data gedé istilah téh frustratingly samar, sarta grup babarengan loba hal anu béda. Pikeun tujuan panalungtikan sosial, Jigana eta mantuan keur ngabedakeun antara dua rupa sumber data gedé:. Rekaman administrasi pamaréntahan jeung rékor administrasi bisnis catetan administratif Pamaréntah aya data anu dijieun ku pamaréntah salaku bagian tina kagiatan rutin maranéhanana. rupa ieu catetan geus dipaké ku panalungtik dina jaman baheula-saperti salaku demographers nalungtik lahir, catetan-tapi nikah, jeung maot pamaréntah anu beuki ngumpulkeun jeung ngaleupaskeun catetan lengkep dina bentuk analyzable. Contona, pamaréntah New York City dipasang méter digital jero unggal taksi di kota. méter ieu ngarekam sagala jinis data ngeunaan unggal numpak taksi kaasup supir, waktu mimiti jeung lokasi, waktu eureun jeung lokasi, jeung ongkos teh. Dina hiji ulikan nu bakal nyaritakeun saterusna dina ieu bab, Henry Farber (2015) repurposed data ieu pikeun nepikeun hiji debat fundaméntal dina ékonomi tanaga gawé ngeunaan hubungan antara gajih hourly jeung jumlah jam digawé.

Tipe utama kadua data gedé pikeun panalungtikan sosial nyaeta catetan administrasi bisnis. Di handap ieu mangrupakeun data nu bisnis nyieun jeung ngumpulkeun salaku bagian tina kagiatan rutin maranéhanana. Catetan administrasi bisnis ieu mindeng disebut ngambah digital, kaasup hal kawas log query search engine, tulisan media sosial, jeung nelepon catetan ti telepon seluler. Kritis, rékaman administrasi bisnis ieu teu saukur ngeunaan paripolah online. Contona, toko anu ngagunakeun mariksa-kaluar scanner nu nyiptakeun ukuran real-time produktivitas worker. Dina hiji ulikan nu Abdi gé ngabejaan ka maneh ngeunaan saterusna dina ieu bab, Alexandre Mas jeung Enrico Moretti (2009) repurposed supermarket ieu mariksa-kaluar data pikeun diajar kumaha produktivitas hiji pagawe 'ieu impacted ku produktivitas peers maranéhanana.

Salaku boh conto ieu ngagambarkeun, pamanggih repurposing nyaéta fundamental ka pangajaran ti data gedé. Dina pangalaman mah, élmuwan sosial jeung élmuwan data kaanggo ieu repurposing pisan béda. élmuwan Sosial, anu biasa gawé bareng data dirancang pikeun panalungtikan, nu gancang nujul ka kaluar masalah jeung data repurposed bari ignoring kaunggulan anak. Di sisi séjén, élmuwan data anu gancang nujul ka kaluar mangpaat data repurposed bari ignoring kelemahan anak. Alami, pendekatan pangalusna bakal hibrid a. Hartina, panalungtik kudu ngarti ciri ieu sumber anyar data-boh alus jeung goréng-terus angka kaluar kumaha carana diajar ti maranéhna. Jeung, nu rencana pikeun sésana tina bab ieu. Next, kuring bakal ngajelaskeun sapuluh ciri umum data bisnis jeung pamaréntah administrasi. Sanggeus éta, kuring bakal ngajelaskeun tilu deukeut panalungtikan anu bisa dipaké jeung data ieu, deukeut anu well cocog ka karakteristik data ieu.