2.3.2.2 لا يمكن الوصول إليها

من الصعب على الباحثين للوصول إلى البيانات التي تحتفظ بها الشركات والحكومات.

في مايو 2014، وافتتح جدول أعمال الأمن القومي الأمريكي مركز البيانات في ولاية يوتا الريفية التي تحتوي على اسم حرج، والأمن السيبراني المركز الوطني للبيانات الاستخبارات المجتمعية الشاملة المبادرة. ومع ذلك، ويقال هذا مركز البيانات، الذي أصبح يعرف باسم مركز بيانات يوتا، لديها قدرات مذهلة. يدعي أحد التقارير أن مركز البيانات يوتا قادرة على تخزين ومعالجة كافة أشكال الاتصالات بما في ذلك "كامل محتويات رسائل البريد الإلكتروني الخاصة ومكالمات الهاتف الخليوي، وعمليات البحث جوجل، وكذلك جميع أنواع الإيصالات مسارات وقوف البيانات الشخصية، رحلات السفر ، وشراء لبيع الكتب، وغيرها الرقمية `جيب القمامة" (Bamford 2012) . بالإضافة إلى مما يثير المخاوف حول الطبيعة الحساسة للكثير من المعلومات التي تم التقاطها في البيانات الكبيرة، والتي سيتم وصفها أكثر أدناه، ومركز البيانات يوتا هو مثالا صارخا على مصدر البيانات الغنية التي لا يمكن الوصول إليها للباحثين. أكثر عموما، العديد من مصادر البيانات الكبيرة التي من شأنها أن تكون مفيدة ليتم التحكم الباحثين ومحجوب من قبل الحكومات (على سبيل المثال، البيانات الضريبية والبيانات التعليمية) والشركات (على سبيل المثال، الاستعلامات لمحركات ومكالمة هاتفية البيانات الفوقية البحث). لذلك، لن تكون هذه البيانات متاحة على الفور للباحثين في الجامعات، وأكثر لن حتى تكون في متناول الباحثين في الحكومات أو الشركات.

في تجربتي، وكثير من الباحثين مقرها في الجامعات يسيئون فهم مصدر هذه صعوبة الوصول. هذه البيانات ليست لا يمكن الوصول إليها لأن الناس في الشركات والحكومات أغبياء، كسول، أو غير مكترثة. بدلا من ذلك، هناك جادين القانونية والفنية، والأعمال التجارية، والحواجز الأخلاقية التي تحول دون الوصول إلى البيانات. على سبيل المثال، بعض اتفاقات شروط الخدمة لمواقع لا تسمح البيانات ليتم استخدامها من قبل الموظفين أو لتحسين الخدمة. حتى بعض أشكال تقاسم البيانات قد يعرض الشركات لدعاوى قضائية مشروعة من الزبائن. هناك أيضا مخاطر الأعمال الكبيرة إلى الشركات العاملة في مجال تبادل البيانات. حاول أن تتخيل كيف الجمهور سترد إذا بيانات البحث الشخصية تسربت بطريق الخطأ من Google كجزء من مشروع بحثي الجامعي. هذا خرق البيانات، إذا تطرفا، بل قد يكون خطرا وجوديا للشركة. لذلك جوجل ومعظم الشركات الكبيرة، هي تحب المجازفة جدا حول تقاسم البيانات مع الباحثين.

في الواقع، والجميع تقريبا الذي هو في وضع يمكنها من توفير إمكانية الوصول إلى كميات كبيرة من البيانات يعرف قصة عبد تشودري. في عام 2006، عندما كان رئيس قسم الأبحاث AOL، أطلق عمدا ما كان يعتقد ومجهولة المصدر طلبات البحث من 650،000 مستخدمي AOL للمجتمع العلمي. بقدر ما أستطيع أن أقول، وكان شودري والباحثين في أمريكا أون لاين النوايا الحسنة وظنوا أنهم قد مجهولة المصدر البيانات. ولكن، أنهم كانوا مخطئين. وقد اكتشف سريعا أن البيانات لم تكن مجهولة كما يعتقد الباحثون، وكان للصحفيين من صحيفة نيويورك تايمز قادرا على تحديد الأشخاص في مجموعة البيانات بكل سهولة (Barbaro and Zeller Jr 2006) . مرة واحدة تم اكتشاف هذه المشاكل، إزالة تشودري البيانات من موقع AOL، ولكن بعد فوات الأوان. قد أعاد نشر البيانات على مواقع أخرى، وأنه من المحتمل أن يكون لا يزال متاحا عندما كنت تقرأ هذا الكتاب. بسبب محاولته لتبادل البيانات مع الأوساط البحثية، أقيل شودري، واستقال الرئيس التنفيذي للتكنولوجيا أمريكا أون لاين (Hafner 2006) . كما يوضح هذا المثال، وفوائد لأفراد معينين داخل الشركات لتسهيل الوصول إلى البيانات صغيرة جدا وأسوأ سيناريو رهيب.

يمكن البحث، ومع ذلك، الوصول إلى البيانات التي لا يمكن الوصول إليها لعامة الناس. ويتعين على الحكومات الإجراءات التي يمكن للباحثين متابعة تطبيق للوصول، وكما في الأمثلة لاحقا في هذا الفصل المعرض، يمكن للباحثين تكتسب أحيانا الحصول على بيانات الشركات. على سبيل المثال، Einav et al. (2015) في شراكة مع الباحث في موقع ئي باي لدراسة آثار الرقمية من مزادات على الانترنت. سوف نتحدث أكثر عن البحوث التي جاءت من هذا التعاون في وقت لاحق في الفصل (القسم 2.4.3.2)، ولكن أذكر ذلك الآن لأنه كان كل أربعة من العناصر التي أرى في شراكات ناجحة: اهتمام الباحث، والقدرة على الباحث، مصلحة الشركة، وقدرة الشركة. وبعبارة أخرى، كان إيناف والزملاء المهتمين في وقادرة على دراسة مزادات على الانترنت. وكان موقع ئي باي أيضا. ومع ذلك، لقد رأيت الكثير من التعاون الممكن تفشل إما لأن الباحث أو الشركة تفتقر إلى واحد من هذه المكونات.

حتى لو كنت قادرا على تطوير شراكة مع رجال الأعمال، ومع ذلك، هناك بعض الجوانب السلبية بالنسبة لك. أولا، الأسئلة التي يمكنك أن تطلب مع البيانات مع المرجح أن تكون محدودة؛ الشركات من غير المرجح أن تسمح البحوث التي يمكن جعلها تبدو سيئة. ثانيا، ربما لن تكون قادرة على تبادل البيانات الخاصة بك مع باحثين آخرين، وهو ما يعني أن الباحثين الآخرين لن تكون قادرة على التحقق منها وتوسيع نتائج بحثك. وعلاوة على ذلك، يمكن لهذه الشراكات خلق ما لا يقل عن ظهور تضارب في المصالح، حيث يظن الناس أن نتائجك تأثرت شراكات الخاص بك. كل هذه السلبيات يمكن معالجتها، ولكن من المهم أن يكون واضحا أن العمل مع البيانات التي ليس في متناول الجميع وكان كل من الإيجابيات والسلبيات.

باختصار، الكثير من البيانات كبيرة غير قابلة للوصول للباحثين. هناك خطير القانونية والفنية، والأعمال التجارية، والحواجز الأخلاقية التي تحول دون الوصول إلى البيانات، وهذه الحواجز لا تذهب بعيدا. الحكومات الوطنية قد تأسست عام الإجراءات لتمكين الوصول إلى البيانات، ولكن يمكن أن تكون العملية أكثر مخصصة على المستويات الولائية والمحلية. أيضا، في بعض الحالات، يمكن للباحثين في شراكة مع الشركات للحصول على الوصول إلى البيانات، ولكن هذا يمكن أن تخلق مجموعة متنوعة من المشاكل للباحثين.