2.3 ลักษณะทั่วไป 10 ข้อของข้อมูลขนาดใหญ่

แหล่งข้อมูลขนาดใหญ่มักมีหลายลักษณะเหมือนกัน บางส่วนโดยทั่วไปดีสำหรับการวิจัยทางสังคมและบางส่วนจะไม่ดีโดยทั่วไป

แม้ว่าแหล่งข้อมูลขนาดใหญ่แต่ละแห่งจะแตกต่างกัน แต่จะสังเกตได้ว่ามีลักษณะบางอย่างที่มักจะเกิดขึ้นซ้ำแล้วซ้ำอีก ดังนั้นแทนที่จะใช้วิธีการแพลตฟอร์มโดยแพลตฟอร์ม (เช่นนี่คือสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับ Twitter นี่คือสิ่งที่คุณต้องรู้เกี่ยวกับข้อมูลการค้นหาของ Google ฯลฯ ) ฉันจะอธิบายถึงลักษณะทั่วไปสิบประการของขนาดใหญ่ แหล่งข้อมูล การก้าวกลับจากรายละเอียดของแต่ละระบบและการดูลักษณะทั่วไปเหล่านี้ช่วยให้นักวิจัยสามารถเรียนรู้เกี่ยวกับแหล่งข้อมูลที่มีอยู่ได้อย่างรวดเร็วและมีแนวคิดที่จะนำไปใช้กับแหล่งข้อมูลที่จะสร้างขึ้นในอนาคต

แม้ว่าลักษณะที่ต้องการของแหล่งข้อมูลขึ้นอยู่กับเป้าหมายการวิจัย แต่พบว่าเป็นประโยชน์ในการจัดกลุ่มลักษณะสิบอย่างละเอียดออกเป็นสองประเภทใหญ่ ๆ :

  • โดยทั่วไปมีประโยชน์สำหรับการวิจัย: ใหญ่เสมอและไม่ทำปฏิกิริยา
  • ปัญหาที่พบโดยทั่วไปสำหรับการวิจัย: ไม่สมบูรณ์ไม่สามารถเข้าถึงได้ nonrepresentative ล่องลอย algorithmically สับสนสกปรกและละเอียดอ่อน

ขณะที่ฉันกำลังอธิบายลักษณะเหล่านี้คุณจะสังเกตเห็นว่ามักเกิดขึ้นเนื่องจากไม่ได้สร้างแหล่งข้อมูลขนาดใหญ่เพื่อวัตถุประสงค์ในการวิจัย