2.3 លក្ខណៈទូទៅនៃទិន្នន័យធំ ៗ ចំនួនដប់

ប្រភពទិន្នន័យធំមានទំនោរមួយចំនួនមានលក្ខណៈដូចគ្នា។ មួយចំនួនជាទូទៅល្អសម្រាប់ការស្រាវជ្រាវសង្គមហើយមួយចំនួនជាទូទៅអាក្រក់។

ទោះបីប្រភពទិន្នន័យធំ ៗ នីមួយៗមានលក្ខណៈខុសគ្នាក៏ដោយវាជាការមានប្រយោជន៍ក្នុងការកត់សម្គាល់ថាមានចរិតលក្ខណៈមួយចំនួនដែលទំនងជាកើតឡើងម្តងហើយម្តងទៀត។ ដូច្នេះជាជាងយកវិធីសាស្ត្រតាមវេទិកា (ឧទាហរណ៍អ្វីដែលអ្នកត្រូវដឹងអំពី Twitter នេះគឺជាអ្វីដែលអ្នកត្រូវដឹងអំពីទិន្នន័យស្វែងរករបស់ Google ។ ល។ ) ខ្ញុំនឹងពណ៌នាលក្ខណៈទូទៅទាំងដប់នៃទំហំធំ ប្រភពទិន្នន័យ។ ការត្រលប់ពីព័ត៌មានលម្អិតនៃប្រព័ន្ធជាក់លាក់នីមួយៗនិងការមើលលក្ខណៈទូទៅទាំងនេះអាចឱ្យក្រុមអ្នកស្រាវជ្រាវស្វែងយល់យ៉ាងឆាប់រហ័សអំពីប្រភពទិន្នន័យដែលមានស្រាប់និងបង្កើតគំនិតយោបល់ជាច្រើនដើម្បីអនុវត្តចំពោះប្រភពទិន្នន័យដែលនឹងត្រូវបានបង្កើតនាពេលអនាគត។

ទោះបីជាលក្ខណៈដែលចង់បានរបស់ប្រភពទិន្នន័យពឹងផ្អែកលើគោលដៅស្រាវជ្រាវក៏ដោយក៏ខ្ញុំយល់ថាវាមានប្រយោជន៍ក្នុងការដាក់បញ្ចូលលក្ខណៈទាំង 10 នេះទៅជាប្រភេទធំ ៗ ពីរ:

  • ជាទូទៅមានប្រយោជន៍ចំពោះការស្រាវជ្រាវ: ធំធំធេងជានិច្ចនិងមិនធ្វើសកម្មភាព
  • ជាទូទៅមានបញ្ហាសម្រាប់ការស្រាវជ្រាវ: មិនពេញលេញ, មិនអាចទទួលបាន, មិនតំណាង, រសាត់, algorithmically ស្មុគស្មាញ, កខ្វក់និងប្រកាន់អក្សរតូចធំ

ដូចដែលខ្ញុំកំពុងពិពណ៌នាអំពីលក្ខណៈទាំងនេះអ្នកនឹងកត់សំគាល់ថាជាញឹកញាប់វាកើតឡើងដោយសារតែប្រភពទិន្នន័យធំ ៗ មិនត្រូវបានបង្កើតឡើងសម្រាប់គោលបំណងនៃការស្រាវជ្រាវ។