2.3 ลักษณะทั่วไปของข้อมูลขนาดใหญ่

แหล่งที่มาของข้อมูลขนาดใหญ่มักจะมีลักษณะที่สิบ; บางส่วนเป็นสิ่งที่ดีสำหรับการวิจัยทางสังคมและบางส่วนที่ไม่ดี

หากนักวิจัยกำลังจะไปเรียนรู้จากข้อมูลขนาดใหญ่ที่พวกเขาไม่ได้สร้างหรือเก็บแล้วพวกเขาก็จะต้องเข้าใจลักษณะโดยทั่วไปของ มากกว่าการแพลตฟอร์มโดยวิธีแพลตฟอร์ม (เช่นนี่คือสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับทวิตเตอร์นี่คือสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับข้อมูลการค้นหาของ Google, etc) ฉันจะอธิบายสิบลักษณะทั่วไปของข้อมูลขนาดใหญ่ลักษณะที่เกิดขึ้น เพราะข้อมูลไม่ถูกสร้างขึ้นเพื่อวัตถุประสงค์ของการวิจัยทางสังคม ด้วยการก้าวกลับมาจากรายละเอียดของระบบแต่ละและมองไปที่คุณสมบัติทั่วไปเหล่านี้นักวิจัยได้อย่างรวดเร็วสามารถเรียนรู้เพิ่มเติมเกี่ยวกับแหล่งที่มาของข้อมูลที่มีอยู่และมีชุดของ บริษัท ความคิดที่จะนำไปใช้กับแหล่งที่มาของข้อมูลในอนาคต

ฉันคิดว่ามันเป็นประโยชน์กับกลุ่มลักษณะเป็นสองประเภทนี้:

  • โดยทั่วไปที่ดีสำหรับการวิจัย: ใหญ่เสมอในการที่ไม่ใช่ปฏิกิริยา
  • โดยทั่วไปที่ไม่ดีสำหรับการวิจัย: ไม่สมบูรณ์ไม่สามารถเข้าถึงที่ไม่ใช่ตัวแทนลอยสับสนอัลกอริทึมไม่สามารถเข้าถึงสกปรกและมีความสำคัญ

พูดกว้างบันทึกการบริหารของรัฐบาลมีน้อยไม่ใช่ตัวแทนน้อยสับสนอัลกอริทึมและการดริฟท์น้อย บนมืออื่น ๆ บันทึกการบริหารธุรกิจมีแนวโน้มที่จะมีขนาดใหญ่และอื่น ๆ ตลอดเวลาใน