2.3 დიდი მონაცემების ათი საერთო მახასიათებლები

დიდი მონაცემთა წყაროების საერთო რიცხვი საერთო რაოდენობითაა; ზოგი ზოგადად კარგია სოციალური კვლევისთვის და ზოგი ზოგადად ცუდია.

მიუხედავად იმისა, რომ თითოეული დიდი მონაცემთა წყარო განსხვავდება, სასარგებლოა შენიშვნა, რომ არსებობს გარკვეული მახასიათებლები, რომლებიც, როგორც წესი, აქედან გამომდინარე, ვიდრე პლატფორმა-პლატფორმის მიდგომის აღება (მაგ., აქ არის ის, რაც უნდა იცოდეთ Twitter- ზე, აქ არის ის, რაც საჭიროა იცოდეთ Google ძიების მონაცემებზე და ა.შ.), მე ვაპირებ აღწერს ათი საერთო მახასიათებელს მონაცემთა წყაროები. თითოეული კონკრეტული სისტემის დეტალებზე დაყრდნობით და ამ ზოგადი მახასიათებლების გადახედვა საშუალებას აძლევს მკვლევარებს სწრაფად გაეცნონ არსებულ მონაცემთა წყაროებს და ჰქონდეთ მყარი კომპლექტი იდეები იმ მონაცემების მიმართ, რომლებიც მომავალში შეიქმნება.

მიუხედავად იმისა, რომ მონაცემთა წყაროების სასურველი მახასიათებლები კვლევის მიზნებზეა დამოკიდებული, მე გამოვიყენებ სასარგებლოა ათი მახასიათებლების განზოგადებაში ორ ფართო კატეგორიად:

  • ზოგადად გამოსადეგი კვლევითი: დიდი, ყოველთვის-ზე, და nonreactive
  • ზოგადად პრობლემური კვლევა: არასრული, მიუწვდომელი, არაპროფესიონალური, დრიფტირება, ალგორითმიურად დაბნეული, ბინძური და მგრძნობიარე

როგორც მე აღწერს ამ მახასიათებლებს, თქვენ შეამჩნევთ, რომ ისინი ხშირად წარმოიქმნება, რადგან დიდი მონაცემთა წყაროები არ არის შექმნილი კვლევის მიზნით.