التأثير المستقبلي لعلم البيانات ومبادئ النجاح
ثمة اتجاه واضح في المجتمعات الحديثة يتمثل في انتشار النظم التي يمكنها استشعار العالم الخارجي والتفاعل معه؛ مثل الهواتف الذكية والمنازل الذكية والسيارات الذاتية القيادة والمدن الذكية. ويُشكل هذا الانتشار للأجهزة الذكية وأجهزة الاستشعار تحديًا أمام خصوصيتنا؛ إلا أنه يُحفز نمو البيانات الضخمة وتطور نماذج التكنولوجيا الحديثة، مثل «إنترنت الأشياء». في هذا السياق، سيكون لعلم البيانات تأثير مُتزايد عبر مجالات عديدة في حياتنا. ومع ذلك، ثمة مجالان سيؤدي علم البيانات فيهما إلى تطوُّرات مهمة خلال العقد القادم؛ ألا وهما: الطب الشخصي وتطوير المدن الذكية.
علم البيانات الطبية
في السنوات الأخيرة، سعى مجال الطبِّ إلى استخدام علم البيانات والتحليلات التنبؤية. كان الأطباء في الماضي يعتمدون بشكلٍ أساسي على خبراتهم وحدسهم في تشخيص الأمراض وتحديد خطة العلاج المناسبة. وتؤكد حركة الطب القائم على الأدلة والطب الدقيق فكرة أن القرارات الطبية ينبغي أن تستند إلى البيانات، وتربط، بصورةٍ مثاليةٍ، أفضل البيانات المتاحة بحالة كل مريضٍ على حدة وتفضيلاته الشخصية. على سبيل المثال، في حالة الطب الدقيق، تُتيح تقنية التحديد السريع لتسلسل الجينوم تحليل جينومات المرضى المصابين بأمراضٍ نادرة من أجل تحديد الطفرات التي تسبَّبت في المرض، وبالتالي تصميم واختيار العلاجات المناسبة لكل فردٍ على حدة. ومن العوامل الأخرى التي تُشجع على استخدام علم البيانات في مجال الطب تكلفة الرعاية الصحية. يمكن استخدام علم البيانات، لا سيما التحليل التنبؤي، لأتمتة بعض عمليات الرعاية الصحية. على سبيل المثال، استخدمت التحليلات التنبؤية لتحديد التوقيت الذي ينبغي فيه إعطاء المضادات الحيوية وغيرها من الأدوية إلى الأطفال والكبار على حدٍّ سواء، ومن المعروف على نطاقٍ واسع أن هذا النهج قد أنقذ العديد من الأرواح.
تُطوَّر أجهزة استشعار طبية يرتديها أو يبتلِعها المريض أو تُزرع داخله من أجل مراقبة العلامات الحيوية وسلوك المريض ووظائف أعضائه على مدار اليوم. وتُجمَع هذه البيانات باستمرارٍ وتُرسَل مرة أخرى إلى وحدة خدمة مراقبة مركزية. وفي وحدة الخدمة هذه، يمكن لمسئولي الرعاية الصحية الوصول إلى البيانات التي جُمعت من جميع المرضى، وتقييم حالاتهم، وفهم الآثار التي يُحدثها العلاج، ومقارنة نتائج كل مريض بنتائج المرضى الآخرين الذين يعانون من حالاتٍ مُماثلة لإعلامهم بما يجب أن يحدُث في الخطوة التالية من النظام العلاجي الخاص بكل مريض. يستعين علم الطب بالبيانات التي جُمعت من خلال هذه الأجهزة ويدمجها مع بياناتٍ إضافية من أجزاء مختلفة من مهنة الطب والصناعة الدوائية لتحديد آثار الأدوية الحالية والجديدة. وتُطوَّر برامج علاجية مُصممة خصوصًا بناءً على نوع المريض وحالته المرضية وكيفية استجابة جسمه للأدوية المختلفة. بالإضافة إلى ذلك، يوفر هذا النوع الجديد من علم البيانات الطبية المعلومات لأبحاثٍ جديدة عن الأدوية وتفاعلاتها، وتصميم أنظمة مراقبة أكثر كفاءة وتفصيلًا، واكتشاف رؤًى أعمق من التجارب السريرية.
المدن الذكية
تعتمد العديد من المدن حول العالم على تقنيات جديدة لتتمكن من جمع البيانات التي أنتجها مواطنوها واستخدامها من أجل إدارة مؤسسات المدينة ومرافقها وخدماتها على نحوٍ أفضل. وهناك ثلاثة عوامل تمكين أساسية لهذا الاتجاه: علم البيانات والبيانات الضخمة وإنترنت الأشياء. يشير مصطلح «إنترنت الأشياء» إلى ربط الأجهزة المادية وأجهزة الاستشعار المادية بالإنترنت بحيث تتمكن هذه الأجهزة من مشاركة المعلومات. ربما يبدو هذا الأمر عاديًّا؛ ولكن له فائدة تتمثل في أننا يُمكننا الآن التحكم في الأجهزة الذكية عن بُعد (مثل منازلنا إذا هُيِّئت بشكلٍ مناسب) ويفتح الباب أمام إمكانية أن يؤدي الاتصال الشبكي بين الآلات إلى تمكين البيئات الذكية من التنبؤ باحتياجاتنا والاستجابة لها بشكل مُستقلٍّ (على سبيل المثال، يوجد الآن ثلاجات ذكية متاحة تجاريًّا يمكنها أن تُحذرك عندما يوشك الطعام أن يتلف وتُتيح لك طلب الحليب الطازج عبر هاتفك الذكي).
تُعد وسائل النقل والمواصلات مجالًا آخر تستخدم فيه المدن علم البيانات. نفذت الكثير من المدن أنظمة مراقبة وإدارة حركة المرور. وتستعين هذه الأنظمة ببيانات الوقت الفعلي للتحكم في تدفق حركة المرور عبر المدينة. على سبيل المثال، يُمكنها التحكم في تسلسل إشارات المرور في الوقت الفعلي، في بعض الحالات لإعطاء أولوية لوسائل النقل العام. كما تعد بيانات شبكات النقل في المدن مفيدة لتخطيط وسائل النقل العام. تفحص المدن الطرق والجداول الزمنية وإدارة وسائل النقل لضمان دعم الخدمات لأكبر عددٍ من الأشخاص وخفض التكاليف المرتبطة بتقديم خدمات النقل. بالإضافة إلى نمذجة الشبكة العامة، يُستخدم علم البيانات أيضًا لمراقبة وسائل النقل الرسمية في المدينة لضمان الاستخدام الأمثل لها. وتجمع هذه المشروعات ظروف الحركة المرورية (التي تجمع بيانات عنها بواسطة أجهزة الاستشعار الموزعة عبر شبكة الطرق، وعند إشارات المرور وما إلى ذلك)، ونوع المهمة التي تُنفَّذ، وغيرها من الظروف لتحسين تخطيط الطرق، وتُزود وسائل النقل بإعدادات الطرق المتغيرة من خلال التحديثات المباشرة والتغيرات الطارئة على مساراتها.
بجانب توفير استهلاك الطاقة وتحسين خدمات النقل، يُستخدم علم البيانات لتحسين جودة تقديم خدمات المرافق وتنفيذ التخطيط طويل الأمد لمشروعات البنية التحتية. وتخضع عملية تقديم خدمات المرافق بكفاءة للمراقبة المستمرة بناءً على الاستهلاك الحالي والاستهلاك المتوقع، وتأخذ عملية المراقبة في الاعتبار الاستهلاك السابق في ظل ظروفٍ مماثلة أيضًا. وتستعين شركات المرافق بعلم البيانات بطرقٍ عدة. إحدى هذه الطرق هي مراقبة شبكة توصيل المرافق: الإمداد وجودة الإمداد وأية مشكلات متعلقة بالشبكة والمناطق التي تتطلب استخدامًا أعلى من المتوقع وإعادة التوجيه التلقائي للإمداد وأية عيوب في الشبكة. طريقة أخرى تستخدمها شركات المرافق هي مراقبة عملائها. فهي تبحث عن الاستخدام غير العادي الذي قد يُشير إلى بعض الأنشطة الإجرامية (على سبيل المثال، وكر لبيع المخدرات)، وعن العملاء الذين ربما يُغيرون المعدات والعدادات الخاصة بالمبنى الذي يُقيمون فيه، والعملاء الذين من المرجَّح أن يتخلفوا عن سداد الأقساط الخاصة بهم. ويُستعان بعلم البيانات أيضًا لدراسة أفضل طريقةٍ لتخصيص الوحدات السكنية والخدمات المرتبطة بها في تخطيط المدن. تُصمم نماذج النمو السكاني للتنبؤ بالمستقبل، واستنادًا إلى عمليات محاكاة متنوعة، يستطيع القائمون على تخطيط المدن تقدير متى وأين تكون هناك حاجة لخدمات دعم معينة، مثل المدارس الثانوية.
مبادئ مشروعات علم البيانات: لماذا تنجح المشروعات أو تفشل؟
التركيز
يبدأ كل مشروع ناجح من مشروعات علم البيانات بتحديد المشكلة التي سيُساعد المشروع في حلِّها، بكل وضوح. وهذه الخطوة بديهية من عدة نواحٍ: فمن الصعب أن ينجح مشروعٌ ما لم يكن له هدف واضح من البداية. إن وجود هدفٍ محدد جيدًا يرشد عملية اتخاذ القرار بشأن البيانات التي يجب استخدامها، وخوارزميات تعلُّم الآلة التي يجب الاستعانة بها، وكيفية تقييم النتائج، وكيف سيُستخدم التحليل والنماذج ونشرها على نطاقٍ واسع، ومتى يحين الوقت الأمثل لتنفيذ العملية مرةً أخرى من أجل تحديث التحليل والنماذج.
البيانات
ينبغي تحديد أي البيانات التي سيحتاج إليها المشروع. يساعد وجود فهم واضح للبيانات المطلوبة في توجيه المشروع إلى مكان وجودِ هذه البيانات. كما أنه يساعد في تحديد البيانات غير المتوفِّرة حاليًّا، وبالتالي يحدد بعض المشروعات الإضافية التي يمكن أن تسعى إلى جمع وتوفير هذه البيانات. ومع ذلك، من المهم ضمان أن تكون البيانات المستخدَمة عالية الجودة. فقد يكون لدى المؤسسات تطبيقات سيئة التصميم، ونموذج بيانات سيئ للغاية، وطاقم موظفين غير مُدرَّبين على نحوٍ مناسب لضمان إدخال بيانات جيدة. في الواقع، قد تؤدي عوامل لا تُعد ولا تُحصى إلى ظهور بياناتٍ ذات جودة سيئة في النظم. وبالطبع، الحاجة إلى بيانات عالية الجودة هو أمر مُهم للغاية لدرجة أن بعض المؤسسات قامت بتعيين أشخاصٍ يتفقدون البيانات باستمرار، ويُقيِّمون جودتها، ثم يكوِّنون أفكارًا عن كيفية تحسين جودة البيانات المدخَلة من خلال التطبيقات والأشخاص الذين يُدخلون البيانات. وبدون بيانات عالية الجودة، من الصعب جدًّا أن يُكتب النجاح لمشروع علم البيانات.
عند الحصول على البيانات المطلوبة، من المهم دومًا التحقُّق من البيانات التي تُجمع واستخدامها عبر المؤسسة. ولسوء الحظ، فإن النهج الذي يتَّبعه بعض مشروعات علم البيانات للحصول على البيانات هو النظر إلى البيانات المتاحة في قواعد بيانات المعاملات التجارية (أو أي مصادر أخرى للبيانات) ثم دمج هذه البيانات وتنقيتها قبل الانتقال إلى استكشاف البيانات وتحليلها. ويتجاهل هذا النهج تمامًا فريق ذكاء الأعمال وأي مستودع بيانات ربما يكون موجودًا. وفي الكثير من المؤسسات، يجمع فريق ذكاء الأعمال ومستودع البيانات بالفعل بيانات المؤسسة ويقوم بتنظيفها ونقلها ودمجها في مستودعٍ مركزي واحد. فإذا كان يُوجَد مستودع بيانات بالفعل، فهو يحتوي على الأرجح على جميع أو أغلب البيانات المطلوبة للمشروع. وبالتالي، يمكن لمستودع البيانات أن يُوفر قدرًا كبيرًا من الوقت المستغرَق في دمج البيانات وتنظيفها. كما أنه سيحتوي على بياناتٍ أكثر بكثير مما تحتويه قواعد بيانات المعاملات التجارية الحالية. وإذا تمَّت الاستعانة بمستودع البيانات، فمن الممكن العودة لعدة سنوات، وإنشاء نماذج تنبؤية باستخدام البيانات القديمة، وتطبيق هذه النماذج عبر فترات زمنية متعددة، ثم قياس مستوى الدقة التنبؤية لكل نموذج. وتُتيح هذه العملية مراقبة التغير في البيانات وكيف تؤثر على النماذج. بالإضافة إلى هذا، من الممكن مراقبة الفروق في النماذج التي تُنتجها خوارزميات تعلُّم الآلة وكيف تتطوَّر النماذج بمرور الوقت. إن اتباع هذا النهج يُسهِّل توضيح طريقة عمل النماذج وسلوكها على مدى عدة سنوات ويساعد في بناء ثقة العملاء فيما يُنجَز وما يمكن تحقيقه. على سبيل المثال، في أحد المشروعات حيث أُتيحت في مستودع البيانات بياناتٌ قديمة خاصة بخمس سنوات سابقة، أمكن إثبات أن الشركة كان بإمكانها توفير ٤٠ مليون دولار أميركي أو أكثر خلال تلك الفترة الزمنية. ولو لم يكن مستودع البيانات متاحًا أو مستخدمًا، ما كان من الممكن التوصُّل إلى هذا الاستنتاج. أخيرًا، عندما يستعين المشروع بالبيانات الشخصية من الضروري التأكد من أن استخدام هذه البيانات يتوافق مع اللوائح المعنية بمكافحة التمييز والحفاظ على الخصوصية.
الأشخاص المناسبين
يضم مشروع علم البيانات الناجح عادة فريقًا من الأشخاص الذين يتمتَّعون بمزيج من الكفاءات والمهارات الخاصة بعلم البيانات. وفي معظم المؤسسات، يمكن لمجموعةٍ متنوعة من الأشخاص المشاركة في مشروعات علم البيانات، بل يجب عليهم أن يشاركوا فيها، ومن بين هؤلاء الأشخاص: الأشخاص الذين يعملون مع قواعد البيانات، والذين يتعاملون مع عمليات «الاستخراج والتحويل والتحميل»، والذين يتعاملون مع دمج البيانات، ومديرو المشروعات، وخبراء تحليل الأعمال، وخبراء المجال، وغيرهم. غير أن المؤسسات غالبًا ما تحتاج إلى توظيف مُتخصِّصين في علم البيانات؛ أي أشخاص يتمتعون بمهارات التعامل مع البيانات الضخمة، وتطبيق نماذج تعلُّم الآلة، وصياغة مشكلات العالم الفعلي بحيث يكون لها حلول مَبنية على البيانات. وعلماء البيانات الناجحون مُستعدون وقادرون على العمل والتواصل مع فريق الإدارة والمستخدِمين النهائيين وجميع الأشخاص المعنيين لتوضيح وشرح كيف يمكن لعلم البيانات أن يدعم عملهم. فمن الصعب أن تجد في المؤسسة أشخاصًا يتمتعون بالمهارة التقنية المطلوبة والقدرة على التواصل والعمل مع مختلف الأشخاص. ومع ذلك، فإن هذا المزيج ضروري لنجاح مشروعات علم البيانات في أغلب المؤسسات.
يضم مشروع علم البيانات الناجح عادة فريقًا من الأشخاص الذين يتمتعون بمزيجٍ من الكفاءات والمهارات الخاصة بعلم البيانات.
النماذج
من المهم تجربة مجموعة متنوعة من خوارزميات تعلُّم الآلة لاكتشاف أيها تعمل بشكل أفضل مع مجموعات البيانات. وفي مواضع كثيرة جدًّا من الأدبيات، تُضرب أمثلة لحالات استُخدِمت فيها خوارزمية تعلُّم آلة واحدة فقط. فقد يناقش المؤلفون الخوارزمية التي نجحت معهم أو التي فضلوها. وحاليًّا هناك اهتمام كبير باستخدام الشبكات العصبية والتعلُّم العميق. ومع ذلك، يمكن استخدام الكثير من الخوارزميات الأخرى ويجب النظر في هذه البدائل واختبارها. علاوة على ذلك، بالنسبة إلى مشروعات علم البيانات القائمة في الاتحاد الأوروبي، ربما تُصبح اللائحة العامة لحماية البيانات، التي دخلت حيِّز التنفيذ في مايو ٢٠١٨، عنصرًا مهمًّا في تحديد اختيار الخوارزميات والنموذج. ومن الآثار الجانبية المحتملة لهذه اللائحة أن «حق الفرد في التفسير» فيما يخصُّ عمليات اتخاذ القرارات الآلية التي تؤثر عليه ربما يحدُّ من استخدام النماذج المعقدة التي يصعب تفسيرها وشرحها (مثل نماذج الشبكات العصبية العميقة) في بعض المجالات.
الاندماج في هياكل وعمليات تكنولوجيا المعلومات الخاصة بالشركة
عندما يُحدَّد الهدف من مشروع علم البيانات، من المهم أيضًا تحديد كيف ستُطبَّق مخرجات المشروع ونتائجه على هيكل تكنولوجيا المعلومات الخاص بالشركة وعلى عمليات العمل. ويتضمن ذلك تحديد مكان وكيفية دمج النموذج في النظم الحالية وكيفية استخدام النتائج المتولِّدة من قبل المستخدِمين النهائيين للنظام أو ما إذا كانت النتائج سيُستفاد منها في عمليةٍ أخرى. وكلما زادت أتمتة هذه العملية، تستطيع الشركة الاستجابة على نحوٍ أسرع مع الملف التعريفي المتغير الخاص بعملائها، وبالتالي خفض التكاليف وزيادة الأرباح المحتملة. على سبيل المثال، إذا أُنشئ نموذج تقييم مخاطر العملاء لعملية الإقراض في بنكٍ ما، ينبغي تضمين هذا النموذج في نظام الاستقبال الذي يتلقَّى طلب القرض الذي يُقدمه العميل. بهذه الطريقة، عندما يُدخل موظف البنك طلب القرض، يستطيع أن يحصل على تقريرٍ مباشر من جانب النموذج. يستطيع الموظف استخدام هذا التقرير المباشر للتعامل مع أية مشكلات تُثار مع العميل. مثال آخر هو كشف الاحتيال. قد يستغرق تحديد حالة الاحتيال المحتمل، التي تستلزم التحقيق، من أربعة إلى ستة أسابيع. ومن خلال الاستعانة بعلم البيانات وتضمينه في نظم مراقبة المعاملات، تستطيع المؤسسات حاليًّا اكتشاف حالات الاحتيال المحتمَلة على الفور تقريبًا. ومن خلال أتمتة النماذج المبنية على البيانات ودمجها، يتحقَّق وقت استجابة أسرع، ويمكن اتخاذ الإجراءات في الوقت المناسب. وإذا لم تُدمج النواتج والنماذج التي أنشأها مشروع ما في عمليات العمل، فإن هذه النواتج لن تُستخدَم، وفي النهاية سيفشل المشروع.
دعم الإدارة العليا
بالنسبة إلى معظم المشروعات في معظم المؤسسات، يعتبر الدعم الذي تُقدمه الإدارة العليا أمرًا مهمًّا لنجاح الكثير من مشروعات علم البيانات. ومع ذلك، يُركز أغلب مديري تكنولوجيا المعلومات على الأولويات الملحَّة: التأكد من سيرورة العمل، والحفاظ على تشغيل الأنظمة وضمان تشغيل التطبيقات اليومية، والتأكد من وجود عمليات النسخ الاحتياطي والاسترداد (واختبارها)، وما إلى ذلك. تتم رعاية مشروعات علم البيانات الناجحة من قِبل كبار مديري الشركة (وليس مدير تكنولوجيا المعلومات) نظرًا إلى أن كبار مديري الشركة لا يُركزون على التكنولوجيا وإنما يُركزون على العمليات التي ينطوي عليها مشروع علم البيانات وكيف يمكن استخدام نواتج مشروع علم البيانات لصالح الشركة. وكلما ركز راعي المشروع على هذه العوامل، حقق المشروع نجاحًا أكبر. وعندئذٍ سيتصرف بوصفه المسئول عن إعلام باقي الشركة بالمشروع وإقناعهم به. ولكن حتى عندما يكون لمشروع علم البيانات مديرٌ كبير يدعمه، فقد تفشل استراتيجية علم البيانات على المدى الطويل إذا تم التعامل مع المشروع المبدئي لعلم البيانات باعتباره تمرينًا روتينيًّا وتأديةَ واجبٍ فحسب. ينبغي ألا تنظر الشركة إلى مشروع علم البيانات باعتباره مشروعًا لمرة واحدة ولن يتكرَّر. لكي تتمكن الشركة من جني فوائد طويلة الأجل، فإنها بحاجة إلى مضاعفة قُدرتها على تنفيذ مشروعات علم البيانات على نحوٍ مُتكرر واستخدام نواتج هذه المشروعات. يتطلب الأمر التزامًا طويل الأجل من الإدارة العُليا لاعتبار علم البيانات استراتيجية.
لكي تتمكَّن الشركة من جني فوائد طويلة الأجل، فإنها بحاجةٍ إلى مضاعفة قُدرتها على تنفيذ مشروعات علم البيانات على نحوٍ متكرر واستخدام نواتج هذه المشروعات.
التكرار
أفكار ختامية
دائمًا يضع البشر فرضيات عن العالم الخارجي ويحاولون فهمه من خلال تحديد أنماط في تجاربهم فيه. ويُعَدُّ علم البيانات هو أحدث تجسيد لهذا السلوك الباحث عن الأنماط. ومع ذلك، على الرغم من أن لعلم البيانات تاريخًا طويلًا، فإن مدى تأثيره على الحياة الحديثة غير مسبوق. ففي المجتمعات الحديثة، عادةً تُستخدم كلمات مثل «دقيق»، «ذكي»، «موجَّه»، «مُخصَّص» للإشارة إلى مشروعات علم البيانات مثل: «الطب الدقيق»، و«الشرطة الدقيقة»، و«الزراعة الدقيقة»، و«المدن الذكية»، و«النقل الذكي»، و«الإعلانات الموجهة»، و«وسائل الترفيه المخصصة». والعامل المشترك بين كل هذه المجالات في حياة الإنسان هو أن ثمة قرارات يجب اتخاذها: ما العلاج الذي ينبغي لنا استخدامه مع هذا المريض؟ أين ينبغي لنا أن نوزع موارد الشرطة المتوفرة لدينا؟ ما كمية الأسمدة التي ينبغي لنا أن نوزعها؟ كم عدد المدارس الثانوية التي ينبغي لنا أن نبنيها في السنوات الأربع المقبلة؟ لمن يجب أن نُرسِل هذا الإعلان؟ ما الفيلم أو الكتاب الذي ينبغي أن نوصي به لهذا الشخص؟ وقدرة علم البيانات على مساعدتنا في اتخاذ القرار هي التي تُشجعنا على اعتماد استخدامه. وإذا نُفِّذ علم البيانات بشكلٍ جيد، يمكنه تقديم «رؤى عملية» تؤدي إلى قرارات أفضل ونتائج أفضل في النهاية.
يعتمد علم البيانات، في شكله الحديث، على البيانات الضخمة، والقدرة الحاسوبية، والبراعة البشرية في عدد من مجالات المساعي العلمية (بداية من التنقيب في البيانات والبحث في قواعد البيانات وصولًا إلى تعلم الآلة). لقد حاول هذا الكتاب تقديم نظرة عامة على الأفكار والمفاهيم الأساسية اللازمة لفهم علم البيانات. تجعل مراحل العملية القياسية المتعددة المجالات للتنقيب في البيانات عملية علم البيانات واضحة وتقدم هيكلًا لمسار علم البيانات بداية من البيانات وصولًا إلى المعرفة: فهم المشكلة، وإعداد البيانات، والاستعانة بتعلم الآلة لاستخراج الأنماط وإنشاء النماذج، واستخدام النماذج للحصول على رؤًى عملية. يتطرق هذا الكتاب أيضًا إلى بعض المخاوف الأخلاقية المتعلقة بخصوصية الأفراد في عالَم علم البيانات. إن لدى الناس مخاوف حقيقية ومبررة من أن الحكومات وأصحاب المصالح ربما يستغلُّون علم البيانات في التلاعُب بسلوكنا ومراقبة أفعالنا. ونحن — كأفراد — نحتاج إلى تطوير آراء مُستنيرة حول نوع عالم البيانات الذي نرغب أن نعيش فيه، والتفكير في القوانين التي نريد أن تضعها مجتمعاتنا لتوجيه استخدام علم البيانات في الاتجاهات المناسبة. وعلى الرغم من المخاوف الأخلاقية التي قد تُساورنا بشأن علم البيانات، فإن الجنِّيَّ قد خرج من القمقم بالفعل وصار لعلم البيانات تأثيرات مُهمة على حياتنا اليومية وستستمر هذه التأثيرات في المستقبل. وعند استخدامه على نحوٍ مناسب، سوف يكون له القدرة على تحسين جودة حياتنا. ولكن إذا أردنا أن تُحقق الشركات التي نعمل بها والمجتمعات التي نعيش فيها والأسر التي نتشارك حياتنا معها الاستفادة من علم البيانات، فنحتاج إلى فهم واستكشاف ماهية علم البيانات وطريقة عملِه وما يمكنه القيام به (وما لا يمكنه القيام به). ونأمل أن يكون هذا الكتاب قد زوَّدك بالأساسيات الضرورية التي تحتاجها للانطلاق في هذه الرحلة.