2.1 შესავალი

In ანალოგური ასაკის, მონაცემების შეგროვება ქცევის ვინ რას აკეთებს, როდესაც იყო ძვირი და, შესაბამისად, შედარებით იშვიათია. ახლა კი, ციფრულ ერაში, ქცევის მილიარდობით ადამიანი ჩაწერილი, შენახვის და analyzable. მაგალითად, ყოველ დროს, თქვენ დააჭირეთ ნახვა, მიიღოს ზარი თქვენს მობილურ ტელეფონში, ან გადაიხადოს რაღაც თქვენი საკრედიტო ბარათის, ციფრული ჩანაწერი თქვენი ქცევის შექმნილია და ინახება მიერ ბიზნესი. იმის გამო, რომ ეს მონაცემები პროდუქტია ხალხის ყოველდღე ქმედებები, მათ ხშირად უწოდებენ ციფრული კვალი. გარდა ამისა, ეს კვალი გაიმართა ბიზნესის, მთავრობების, ასევე აქვს ძალიან მდიდარი მონაცემები იმის შესახებ, როგორც ადამიანი და ბიზნესის, მონაცემები, რომელიც ხშირად ციფრულ და analyzable. ერთად ამ მთავრობის და ბიზნესის ჩანაწერები ხშირად უწოდებენ დიდი მონაცემები.

მუდმივად იზრდება წყალდიდობის დიდი მონაცემები იმას ნიშნავს, რომ ჩვენ გადავედით მსოფლიოში, სადაც ქცევითი მონაცემები მწირი იყო მსოფლიოში, სადაც ქცევითი მონაცემები მეტნი არიან. მაგრამ, რადგან ამ ტიპის მონაცემების შედარებით ახალი, სამწუხარო თანხის კვლევის გამოყენებით მათ ჰგავს მეცნიერები ბრმად გატანა ხელმისაწვდომი მონაცემები. ეს თავი, ნაცვლად, სთავაზობს პრინციპული მიდგომა გაგება სხვადასხვა წყაროების მონაცემები და როგორ შეიძლება იქნას გამოყენებული. ეს მდიდარი გაგება უნდა დაგეხმაროთ უფრო შეესაბამება თქვენს კვლევის კითხვები შესაბამის მონაცემებს. ან, თუ ასეთი არსებული წყაროები აკლია, დარწმუნება იმაში, რომ შეაგროვოს საკუთარი მონაცემების გამოყენებით იდეები მომავალში თავები.

პირველი ნაბიჯი სწავლის დიდი მონაცემები უნდა გააცნობიეროს, რომ ეს არის ნაწილი უფრო ფართო კატეგორიაში მონაცემები, რომ უკვე გამოიყენება სოციალური კვლევის მრავალი წლის განმავლობაში: ზედამხედველობითი მონაცემები. უხეშად რომ ვთქვათ, ზედამხედველობითი მონაცემები ნებისმიერი მონაცემების შედეგების აკვირდებიან სოციალური სისტემის გარეშე ჩარევისა რამდენიმე გზა. ნედლი გზა ვიფიქროთ, რომ ეს არის ის, რომ ზედამხედველობითი მონაცემები არის ყველაფერი, რაც არ გულისხმობს ესაუბრება ხალხს (მაგალითად, კვლევები, თემა თავი 3) ან შეცვლის ადამიანების გარემოში (მაგალითად, ექსპერიმენტი, თემა თავი 4). ამდენად, გარდა ამისა, მთავრობის და ბიზნესის ჩანაწერები, ზედამხედველობითი მონაცემები ასევე მოიცავს რამ, როგორიცაა ტექსტის საგაზეთო და სატელიტური ფოტოები.

ეს თავი აქვს სამ ნაწილად. პირველი, ნაწილი 2.2, მე აღწერს დიდი მონაცემები უფრო დეტალურად და განმარტავს ფუნდამენტურ განსხვავებას და მონაცემები, რომ ზოგადად გამოიყენება სოციალური კვლევის წარსულში. ამის შემდეგ, ნაწილი 2.3, მე აღწერს ათი საერთო მახასიათებლები დიდი მონაცემები. გააზრება ამ მახასიათებლები საშუალებას გვაძლევს სწრაფად აღიარებს ძლიერი და სუსტი მხარეები არსებული წყაროების და დაგვეხმარება აღკაზმულობა ახალი წყაროების, რომელიც შეიქმნება მომავალში. და ბოლოს, სექცია 2.4, მე აღწერს სამი ძირითადი კვლევითი სტრატეგია, რომელიც შეგიძლიათ გამოიყენოთ, რათა ვისწავლოთ ზედამხედველობითი მონაცემები: იმედი რამ, პროგნოზირება რამ, და მიახლოებით ექსპერიმენტი.