2.3 Sampung karaniwang katangian ng malaking data

Ang mga pinagmumulan ng malaking data ay may posibilidad na magkaroon ng maraming mga katangian na karaniwan; ang ilan ay pangkaraniwang mabuti para sa panlipunang pananaliksik at ang ilan ay karaniwang masama.

Kahit na ang bawat malaking mapagkukunan ng data ay naiiba, makatutulong na mapansin na mayroong ilang mga katangian na madalas na nangyayari nang paulit-ulit. Samakatuwid, sa halip na kumukuha ng platform-by-platform na diskarte (hal., Kung ano ang kailangan mong malaman tungkol sa Twitter, narito ang kailangan mong malaman tungkol sa data ng paghahanap sa Google, atbp.), Ilalarawan ko ang sampung pangkalahatang katangian ng malaki mga mapagkukunan ng data. Ang pag-urong mula sa mga detalye ng bawat partikular na sistema at pagtingin sa mga pangkalahatang katangian na ito ay nagbibigay-daan sa mga mananaliksik upang mabilis na matutunan ang tungkol sa mga umiiral na pinagmumulan ng data at magkaroon ng isang matatag na hanay ng mga ideya upang ilapat sa mga mapagkukunan ng data na gagawin sa hinaharap.

Kahit na ang ninanais na mga katangian ng pinagmulan ng data ay depende sa layunin ng pananaliksik, natutuklasan ko na kapaki-pakinabang ang pag-grupo ng sampung katangian sa dalawang malawak na kategorya:

  • sa pangkalahatan ay kapaki-pakinabang para sa pananaliksik: malaki, palagi, at di-aktibo
  • sa pangkalahatan ay problemado para sa pananaliksik: hindi kumpleto, hindi naa-access, hindi kinatawan, Pag-anod, nakakalito sa algorithm, marumi, at sensitibo

Habang inilalarawan ko ang mga katangiang ito mapapansin mo na madalas silang lumabas dahil ang mga malalaking data source ay hindi nilikha para sa layunin ng pananaliksik.