2.3 Mga karaniwang katangian ng malaking data

Big mga pinagkukunan ng data ay madalas na may sampung mga katangian; ang ilan ay mabuti para sa panlipunang pananaliksik at ang ilan ay masama.

Kung mananaliksik ay pagpunta upang malaman mula sa malaking data na hindi nila lumikha o mangolekta, pagkatapos ay dapat sila na maunawaan nito pangkalahatang katangian. Sa halip na ang pagkuha ng isang platform sa pamamagitan ng platform diskarte (eg, narito ang kung ano ang kailangan mong malaman tungkol sa Twitter, narito ang kung ano ang kailangan mong malaman tungkol sa data ng Google sa paghahanap, at iba pa), ako pagpunta upang ilarawan sampung pangkalahatang katangian ng malaking data, mga katangian na lumabas dahil dahil ang data ay hindi nilikha para sa layunin ng panlipunang pananaliksik. Sa pamamagitan ng stepping pabalik mula sa mga detalye ng bawat partikular na sistema at ang tumitingin sa mga pangkalahatang katangian, ang mga mananaliksik ay maaaring mabilis na malaman ang higit pa tungkol sa mga umiiral na mapagkukunan ng data at magkaroon ng isang firm hanay ng mga ideya na mag-aplay sa hinaharap pinagkukunan ng data.

Tingin ko ay helpful sa grupong ang mga katangian sa dalawang kategorya:

  • pangkalahatan ay mabuti para sa pananaliksik: big, laging-on, di-reaktibo
  • karaniwang masamang para sa pananaliksik: hindi kumpleto, hindi maa-access, non-kinatawan, Pag-anod, algorithmically nangapahiya, hindi maa-access, marumi, at sensitibong

Malawak pagsasalita, government records administrative ay mas non-representative, mas algorithmically nangapahiya, at mas mababa-anod. Sa kabilang dako, negosyo talaan administrative may posibilidad na maging mas malaki at mas laging-on.