2.3.2.7 მგრძნობიარე

ზოგიერთი ინფორმაცია, რომ კომპანიებმა და მთავრობებმა მგრძნობიარეა.

ჯანმრთელობის სადაზღვევო კომპანიების დეტალური ინფორმაცია სამედიცინო მომსახურების მიერ მიღებული მათი მომხმარებელს. ეს ინფორმაცია შეიძლება იქნას გამოყენებული მნიშვნელოვანი კვლევა ჯანმრთელობის, მაგრამ თუ საჯარო გახდა, რომ შესაძლოა გამოიწვიოს ემოციური ზიანი (მაგალითად, არეულობის) და ეკონომიკური ზიანის (მაგალითად, სამუშაოს დაკარგვა). შორს გამორჩეული, ბევრი დიდი მონაცემთა წყაროებს აქვთ ინფორმაცია, რომ მგრძნობიარეა. მგრძნობიარე ბუნებას, ეს ინფორმაცია არის ნაწილი იმ მიზეზით, რომ დიდი მონაცემთა წყაროები ხშირად მიუწვდომელი (აღწერილია ზემოთ).

ერთი გზა, რომ მკვლევარები ცდილობენ გაუმკლავდეთ ამ სიტუაციაში დე იდენტიფიცირება მონაცემების, რომ აქვს გასაცვლელად. მაგრამ, როგორც მე ნახოთ დეტალურად თავი 6 (ეთიკის) ეს მიდგომა სერიოზულად შეზღუდულია გზები, რომლებიც არ არის ფართოდ დაფასებული როგორც სოციალური მეცნიერები და მონაცემები მეცნიერები.

დასკვნის სახით, დიდი მონაცემთა წყაროებს დღეს (და ხვალ) ზოგადად ათი მახასიათებლები. ბევრი კარგი თვისებები-დიდი, ყოველთვის, და nonreactive-მოდის ის ფაქტი, ციფრული ასაკი კომპანიები და მთავრობები შეუძლია შეაგროვოს მონაცემები მასშტაბის, რომ შეუძლებელი იყო. და ბევრი ცუდი თვისებები-არასრული, მიუწვდომელი, არასამთავრობო წარმომადგენელი, დრიფტი, ალგორითმულად შეშფოთნეს, მიუწვდომელი, ბინძური, და მგრძნობიარე მოდის ის ფაქტი, რომ მონაცემები არ არის შეგროვებული მკვლევარები მკვლევარები. გააზრება ამ მახასიათებლები არის აუცილებელი პირველი ნაბიჯი სწავლის დიდი მონაცემები. და ახლა ჩვენ მივმართოთ კვლევაზე სტრატეგიები ჩვენ შეგვიძლია გამოვიყენოთ ეს მონაცემები.