2.3 том мэдээллийн нийтлэг шинж чанар

Big мэдээллийн эх сурвалж нь арван шинж чанартай байдаг; зарим нь нийгмийн судалгааны сайн байна, зарим нь муу байдаг.

Судлаачид тэдгээр нь бий болгох юм уу эсвэл цуглуулах гэж том тоо суралцах гэж байгаа бол, дараа нь ерөнхий шинж чанарыг ойлгох ёстой. Харин тавцан аргаар индэр авч дээш (жишээ нь, энд та Twitter-ий тухай мэдэх хэрэгтэй юу, энд та Google-ийн хайлтын мэдээлэл гэх мэт талаар мэдэх хэрэгтэй юу), Би том мэдээллийн арван ерөнхий шинж гарч, шинж чанар нь тайлбарлах гэж байна мэдээлэл, нийгмийн судалгаа, шинжилгээний зорилгоор бий болгосон байсан юм билээ. Тухайн систем тус бүрийн дэлгэрэнгүйг эргэж орохдоо эдгээр ерөнхий шинж хараад, судлаачид маш хурдан одоо байгаа мэдээллийн эх сурвалжийн талаар илүү ихийг мэдэх, ирээдүйн мэдээллийн эх сурвалжид хэрэглэх санаа нь компани олонлогтой болсон байх болно.

Би энэ бүлэг нь хоёр ангилалд хуваагддаг шинж чанар нь тустай олж:

  • судалгааны ерөнхийдөө сайн: том, үргэлж дээр бус реактив
  • ерөнхийдөө муу судалгаа нь: бүрэн бус, халдашгүй, төрийн бус төлөөлөгч, явган, algorithmically, будлиулсан, халдашгүй бохир болон эмзэг

Ерөнхийд нь хэлэхэд, төрийн захиргааны бүртгэл бага бус төлөөлөгч, бага algorithmically будлиулсан, бага салхиар зөөгдөж байдаг. Нөгөө талаас, бизнесийн захиргааны бүртгэл үргэлж дээр том, илүү байх хандлагатай байдаг.