2.1 ভূমিকা

এনালগ যুগে, সম্পর্কে তথ্য সংগ্রহ আচরণ-কে বেচে কি ব্যয়বহুল, এবং সেইজন্য, তুলনামূলকভাবে বিরল যখন-ছিল. এখন ডিজিটাল যুগে, কোটি কোটি লোকের আচরণে, রেকর্ড সংরক্ষণ, এবং analyzable হয়. উদাহরণস্বরূপ, যে সময় আপনি একটি ওয়েবসাইটে ক্লিক করুন, আপনার সেল ফোনে একটি কল করতে বা আপনার ক্রেডিট কার্ড দিয়ে কিছু কেনার, আপনার আচরণের একটি ডিজিটাল রেকর্ড সৃষ্টি এবং একটি ব্যবসা দ্বারা সংরক্ষিত হয়. কারণ এই তথ্য জনগণের প্রতিদিন কর্মের একটি উপজাত হয়, তারা প্রায়ই ডিজিটাল ট্রেস বলা হয়. ব্যবসার দ্বারা অনুষ্ঠিত এই ট্রেস ছাড়াও, সরকার উভয় মানুষ এবং ব্যবসা সম্পর্কে অবিশ্বাস্যভাবে ধনী তথ্য, ডাটা যা প্রায়ই ডিজিটাইজড এবং analyzable আছে. একসাথে এই ব্যবসা এবং সরকারের রেকর্ড প্রায়ই বড় তথ্য বলা হয়.

বড় তথ্য সদা ক্রমবর্ধমান বন্যা এর মানে হল যে আমরা এমন এক জগতে থেকে সরানো হয়েছে যেখানে আচরণগত তথ্য একটি বিশ্বের যেখানে আচরণগত তথ্য অঢেল করার দুর্লভ ছিল. কিন্তু, কারণ এই ধরনের তথ্য অপেক্ষাকৃত নতুন, তাদের ব্যবহার গবেষণার একটি দু: খজনক পরিমাণ বিজ্ঞানীদের অন্ধভাবে পাওয়া তথ্য পশ্চাদ্ধাবন মত দেখায়. এই অধ্যায়ে, পরিবর্তে, তথ্য বিভিন্ন সূত্র বোঝার একটি নীতিগত পদ্ধতির প্রস্তাব এবং তারা কিভাবে ব্যবহার করা যেতে পারে. এই গরীয়ান বুঝতে সাহায্য করা উচিত আপনি ভাল তথ্য যথাযথ সূত্র আপনার গবেষণা মিলাও. কিংবা যদি উক্ত বিদ্যমান উত্স উদাসীন হয়, আপনি ভবিষ্যতে অধ্যায়গুলির মধ্যে ধারণা ব্যবহার করে আপনার নিজস্ব তথ্য সংগ্রহের জন্য সন্তুষ্ট.

পর্যবেক্ষণকারী ডাটা: বিগ ডাটা থেকে শেখার প্রথম ধাপ বুঝতে পারি যে এটা ডেটা একটি বৃহত্তর বিভাগ যে অনেক বছর জন্য সামাজিক গবেষণার জন্য ব্যবহার করা হয়েছে এর অংশ. মোটামুটিভাবে, পর্যবেক্ষণমূলক ডেটা যে কোনো না কোনোভাবে হস্তক্ষেপ ছাড়া একটি সমাজ ব্যবস্থার নিরীক্ষক থেকে ফলাফল হল. এটা সম্পর্কে চিন্তা করার একটি অশোধিত উপায় পর্যবেক্ষণমূলক তথ্য সবকিছু যে মানুষ (যেমন, সার্ভে, অধ্যায় 3 বিষয়) বা মানুষের পরিবেশের (যেমন, পরীক্ষা-নিরীক্ষা, অধ্যায় 4 বিষয়) পরিবর্তন সঙ্গে কথা যুক্ত নয় যে. সুতরাং, ব্যবসা এবং সরকারের রেকর্ড ছাড়াও গুরুত্বপূর্ণ পর্যবেক্ষণ তথ্য পত্রিকাগুলোতে নিবন্ধ এবং উপগ্রহ ফটো টেক্সট ভালো জিনিস অন্তর্ভুক্ত.

এই অধ্যায়ে তিনটি অংশে বিভক্ত. প্রথমত, অনুচ্ছেদ 2.2, আমি বড় তথ্য আরো বিস্তারিতভাবে বর্ণনা করে এবং এটা এবং ডেটা সাধারণত অতীতে সামাজিক গবেষণার জন্য ব্যবহার করা হয়েছে এর মধ্যে একটি মৌলিক পার্থক্য নির্মল. তারপর, অনুচ্ছেদ 2.3, আমি বড় তথ্য উৎসের দশ সাধারণ বৈশিষ্ট্য বর্ণনা. এই বৈশিষ্ট্য বুঝতে আমাদের দ্রুত শক্তি এবং বিদ্যমান উত্স দুর্বলতা স্বীকার করতে এবং আমাদের নতুন উত্স যে ভবিষ্যতে তৈরি করা হবে জোতা সাহায্য করবে সম্ভব. গণনা জিনিষ, পূর্বাভাস কিছু, এবং একটি পরীক্ষা approximating: সবশেষে, অনুচ্ছেদ 2.4, আমি তিনটি প্রধান গবেষণা কৌশল যে আপনি পর্যবেক্ষণমূলক ডেটা থেকে শিখতে ব্যবহার করতে পারেন বর্ণনা.