تمهيد

تندرج الكتب التي تتناول موضوع البيانات الضخمة ضمن أحد تصنيفَين: إمَّا أنها لا تُقدِّم أيَّ تفسيراتٍ عن آلية عمل البيانات الضخمة، وإمَّا أنها تكون كتبًا دراسية مُتخصِّصة في مجال الرياضيات لا تصلح إلا لطلاب الدراسات العليا. يهدف هذا الكتاب إلى تقديم بديل عن طريق توفير مقدمة إلى آلية عمل البيانات الضخمة وكيفية تغييرها للعالم من حولنا، وتأثيرها في حياتنا اليومية، وفي عالم الأعمال.

كانت البيانات تعني في الماضي المستندات والأوراق، وربما بعض الصور، ولكنها أصبحت تعني الآن أكثر من ذلك بكثير. تُنتج مواقع شبكات التواصل الاجتماعي كلَّ دقيقة كمياتٍ كبيرةً من البيانات على هيئة صور، ومقاطع فيديو، وأفلام. ويُنتج التسوُّق عبر الإنترنت بياناتٍ عندما نُدخل عناويننا وبيانات بطاقاتنا الائتمانية. ووصلنا حاليًّا إلى مرحلة أصبح فيها جمع البيانات وتخزينها يتطوَّر على نحو لم نكن نتخيَّله منذ بضعة عقود مضت، ولكن، كما سنرى في هذا الكتاب، فإنَّ أساليب تحليل البيانات الجديدة تُحوِّل هذه البيانات إلى معلومات مفيدة. أثناء تأليف هذا الكتاب، تبيَّن لي أنه لا يمكن مناقشة موضوع البيانات الضخمة على نحوٍ مجدٍ من دون التطرق مرارًا وتكرارًا إلى عمليات جمعها، وتخزينها، وتحليلها، واستخدامها من قِبل الشركات التجارية الكبرى. وبما أن الأقسام البحثية في شركات على غرار جوجل وأمازون هي المنوط بها مسئولية الكثير من التطورات الرئيسية في مجال البيانات الضخمة، فسوف نذكرها مرارًا وتكرارًا.

يُعرِّف الفصل الأول القارئ بتنوُّع البيانات بوجه عام، قبل أن يشرح كيف أدَّى العصر الرقمي إلى تغييرات في طريقة تعريفنا للبيانات. تُطرَح البيانات الضخمة على نحو غير رسمي عبر فكرة انفجار البيانات، والتي تتضمَّن علوم الكمبيوتر، وعلم الإحصاء، ونقاط الالتقاء بينهما. في الفصول من الثاني إلى الرابع، استخدمتُ الأشكال التخطيطية على نحو مكثَّف لمساعدتي في شرح بعض من الأساليب الجديدة التي تتطلَّبها البيانات الضخمة. ويتحدَّث الفصل الثاني عن أسباب تميُّز البيانات الضخمة، وهو ما يقودنا إلى تعريفٍ أكثر تحديدًا لها. وفي الفصل الثالث، نُناقش المشكلات المتعلِّقة بتخزين البيانات الضخمة وإدارتها. يُدرك أغلب الناس الحاجة إلى الاحتفاظ بنسخة احتياطية من البيانات على أجهزة الكمبيوتر الشخصية. ولكن، كيف نفعل ذلك مع الكميات الهائلة من البيانات التي يجري إنتاجها حاليًّا؟ للإجابة عن هذا السؤال، سنتناول تخزين قواعد البيانات وفكرة توزيع المهام على مجموعات مترابطة من أجهزة الكمبيوتر. يبرهن الفصل الرابع على أن البيانات الضخمة لا تكون مفيدةً إلا إذا تمكَّنا من استخراج معلوماتٍ مفيدة منها. ونعطي لمحةً عن كيفية تحوُّل البيانات إلى معلومات باستخدام شروح مبسَّطة للعديد من الأساليب الراسخة.

بعد ذلك ننتقل إلى مناقشةٍ أكثر تفصيلًا عن تطبيقات البيانات الضخمة؛ حيث نبدأ في الفصل الخامس بدَور البيانات الضخمة في مجال الطب. ويحلِّل الفصل السادس الممارسات التجارية باستخدام دراستَي حالة عن شركتَي أمازون ونتفليكس، تُبرز كل منهما سمات مختلفة للتسويق باستخدام البيانات الضخمة. يتناول الفصل السابع بعض مشكلات الأمان التي تحيط بالبيانات الضخمة وأهمية التشفير. أصبحت سرقة البيانات مشكلةً كبيرة، وسنتناول بعض القضايا التي تناولتها الصحف، بما فيها قضية سنودن وويكيليكس. ويُختَتم الفصل بتوضيح كيف أن جرائم الإنترنت أضحت من المشكلات التي يتوجَّب على البيانات الضخمة حَلُّها. في الفصل الثامن والأخير، سنتناول كيف تُغيِّر البيانات الضخمة المجتمع الذي نعيش فيه؛ وذلك من خلال إنشاء الروبوتات المتطوِّرة ودورها في مكان العمل. ونختتم الكتاب بتناول المنازل الذكية والمدن الذكية المستقبلية.

لا يمكن أن نستوفي في مقدمة قصيرة جدًّا كل شيءٍ في هذا الصدد، ومن ثم، آمل أن يواصل القارئ مطالعة الموضوعات التي تهمه من خلال الاستعانة بالتوصيات التي أوردناها في جزء «قراءات إضافية».

جميع الحقوق محفوظة لمؤسسة هنداوي © ٢٠٢٤