الإحصاءات الرديئة
أما وقد صرتَ الآن تقدِّر قيمة الإحصاءات — فوائد ومخاطر المشاعر الحدسية — يمكننا أن نبحث كيف يُساء استخدام وفهم هذه الأرقام والعمليات الحسابية مرارًا. وسوف تأتي أمثلتنا الأولى من عالَم الصحافة، لكن مصدر الرعب الحقيقي يتمثَّل في أن الصحفيين ليسوا وحدهم مَن يرتكبون أخطاءً جوهرية في التفكير.
فالأرقام، مثلما سنرى، يمكنها أن تدمِّر حيوات.
(١) الإحصائية الكبرى
تحب الصحف الأرقام الكبيرة والعناوين الخاطفة للأبصار؛ لذا تحتاج إلى علاجات إعجازية ومصادر ذعر خفية، ولا تعتبر التحولات الصغيرة في نسب الخطورة كافيةً لها على الإطلاق لترويج عدد القراء لدى المعلنين (لأن هذا هو النموذج التجاري السائد). ولتحقيق هذه الغاية، تنتقي الصحفُ أكثرَ الطرق ميلودرامية وتضليلًا للإشارة إلى أي زيادة إحصائية في عوامل الخطر، وهو ما يُسمَّى «الزيادة النسبية للخطورة».
لِنَقُلْ إن نسبة خطر الإصابة بنوبة قلبية في الخمسينيات من العمر ترتفع بنسبة ٥٠ في المائة إذا كان مستوى الكولسترول مرتفعًا. يبدو هذا سيئًا للغاية. لكن إذا قلنا إن نسبة الخطورة الزائدة في الإصابة بنوبة قلبية إذا كان مستوى الكولسترول مرتفعًا لا تزيد على ٢ في المائة، يبدو هذا أمرًا لا بأس به بالنسبة إليَّ. لكن تظل تلك هي الأرقام (الافتراضية) نفسها. لنجرب هذا. من بين مائة رجل في الخمسينيات من عمرهم لديهم مستوًى عاديٌّ من الكولسترول، سيكون من المتوقع أن يُصاب أربعة منهم بنوبة قلبية، بينما من بين مائة رجل لديهم مستوًى مرتفع من الكولسترول، سيكون من المتوقع أن يصاب ستة منهم بنوبة قلبية. تمثِّل هذه النسبة نوبتَيْن قلبيَّتين إضافيتين لكل مائة شخص. ويُطلق على هذه النسب «المعدلات الطبيعية».
المعدلات الطبيعية مفهومة دون مزيد من التفسير؛ لأنه بدلًا من الاستعانة بالاحتمالات، أو النسب المئوية، أو أي شيء آخر أكثر فنيةً أو صعوبةً قليلًا، تستعين المعدلات الطبيعية بأرقام ملموسة، تمامًا مثل الأرقام العادية التي تستخدمها يوميًّا للتأكد مما إذا كنتَ قد فقدتَ طفلًا في رحلة تُشرف عليها، أو للحصول على باقي نقودك بشكل صحيح في أحد المتاجر. وقد دفع الكثيرون بأننا قد تطوَّرنا بحيث صرنا نعقل ونجري العمليات الحسابية باستخدام الأرقام الملموسة مثل هذه، وليس الاحتمالات؛ لذا نجدها أكثر بديهيةً؛ فالأرقام البسيطة بسيطة.
تحمل الأساليب الأخرى لوصف الزيادة في نسبة الخطورة أسماءً أيضًا. فمن مثالنا السابق، في ظل مستوًى مرتفع من الكولسترول، يمكن أن تبلغ الزيادة في نسبة الخطر ٥٠ في المائة (الزيادة النسبية للخطر)، أو نسبة زيادة تبلغ ٢ في المائة في معدلات الخطر (الزيادة المطلقة للخطر)، أو — لأكون في منتهى الوضوح — النسبة السهلة، الأكثر إفادةً، نوبتان قلبيتان زائدتان لكل مائة رجل؛ أي المعدل الطبيعي.
فضلًا عن كونها أكثر الخيارات قابليةً للفهم، تتضمَّن المعدلات الطبيعية أيضًا معلومات أكثر من «الزيادة النسبية للخطر» المستخدمة من قِبَل الصحفيين. مؤخرًا، على سبيل المثال، قيل لنا إن اللحم الأحمر يتسبَّب في سرطان المعدة، ويزيد الأيبوبروفين من مخاطر الإصابة بالنوبات القلبية، لكن إذا تابعتَ التقارير الإخبارية، لن تزداد معرفةً. استمع لهذا الحوار، حول سرطان المعدة، من برنامج «توداي» على محطة «راديو ٤»: «ماذا يعني خطر أكبر يا بروفيسورة بنجام؟» «خطرًا ثالثًا أعلى.» «يبدو هذا مريعًا، خطر ثالث أعلى، كيف يُترجَم هذا إلى الأرقام هنا؟» «فرق … يصل إلى حوالي عشرين شخصًا سنويًّا.» «إذن لا يزال رقمًا صغيرًا؟» «حسنًا … لكل ١٠ آلاف شخص …»
يصعب التعبير عن هذه الأمور إذا خرج المرء عن إطار الصيغة الأبسط. البروفيسورة شيلا بنجام هي مديرة مركز «إم آر سي» للتغذية بقسم الوقاية والتعايش مع وباء السرطان في جامعة كامبريدج، وتتعامل مع هذه الأرقام كجزء من طبيعة عملها، لكنها ليست وحدها في هذا التلعثم (الذي يُلتمس له العذر تمامًا) في برنامج إذاعي على الهواء؛ فثمة دراسات على الأطباء، واللجان المكلَّفة التابعة للسلطات الصحية المحلية، وأعضاء مهنة المحاماة، تشير إلى أن الأشخاص الذين يفسرون ويديرون المخاطر كجزء من طبيعة عملهم غالبًا ما يجدون صعوبات بالغة في التعبير عما يقصدون في الحال. يميل هؤلاء أيضًا على الأرجح إلى اتخاذ القرار السليم عندما يجري تقديم المعلومات حول مصادر الخطر في صورة معدلات طبيعية، وليس في صورة احتمالات أو نسب مئوية.
بالنسبة إلى مسكِّنات الألم والنوبات القلبية — وهو موضوع آخر من الموضوعات التي تتصدر الصفحات الأولى — أفضتِ الحاجة الملِحَّة لاختيار أكبر رقم ممكن إلى أن تصبح أرقام الإحصاءات غير دقيقة على الإطلاق، في الكثير من الصحف. فقد اعتمدتِ التقارير الإخبارية على دراسة جرى خلالها ملاحظة المشاركين فيها لمدة تزيد على أربع سنوات، وأشارت النتائج، باستخدام المعدلات الطبيعية، إلى توقُّع نوبة قلبية زائدة لكل ١٠٠٥ أشخاص يتناولون الأيبوبروفين. أو مثلما أشارت «ديلي ميل» في مقالة بعنوان «كيف يمكن لأقراص الصداع أن تقتلك»: «كشفتِ البحوث البريطانية عن أن المرضى الذين يتناولون الأيبوبروفين لعلاج التهاب المفاصل يواجهون زيادة في خطر الإصابة بنوبة قلبية تصل إلى ٢٤ في المائة.» أشعر بالخوف.
يكاد يكون الجميع قد أشار إلى الزيادات النسبية للخطر؛ فعقَّار «ديكلوفيناك» من مخاطر الإصابة بالنوبة القلبية بنسبة ٥٥ في المائة، و«الأيبوبروفين» بنسبة ٢٤ في المائة. لم يُشِر من بين جميع الصحف إلى المعدلات الطبيعية سوى صحيفتَيْ «ذا ديلي تليجراف» و«إيفنينج ستاندرد»: نوبة قلبية إضافية لدى ١٠٠٥ أشخاص يتناولون الأيبوبروفين. في غضون ذلك، حاولتْ صحيفة «ديلي ميرور» — وفشلت — الإشارة إلى أن واحدًا ضمن ١٠٠٥ أشخاص يتناولون الأيبوبروفين «سيعاني من قصور القلب على مدى العام التالي.» لا، هذه نوبة قلبية وليست قصورًا في القلب، وصارتِ النسبة الآن شخصًا واحدًا «إضافيًّا» من ١٠٠٥، بالإضافة إلى النوبات القلبية التي يصاب بها المرء على أي حال. وقد كرَّرت أوراقٌ بحثية أخرى عديدةٌ الخطأَ نفسه.
غالبًا ما يكمن الخطأ في البيانات الصحفية، وربما يكون الأكاديميون أنفسهم مخطئين قدْر خطأ الآخرين عندما يتعلَّق الأمر بالمبالغة الدرامية في نتائج بحوثهم (ثمة إرشادات ممتازة لأفضل سبل الممارسة من الجمعية الملكية حول نقل الأبحاث والتعبير عنها، إذا كنتَ مهتمًّا). لكن إذا كان ثمة أي شخص في موقع سلطة يقرأ هذا، فها هي المعلومات التي أودُّ أن أحصل عليها من أي صحيفة، لمساعدتي في اتخاذ قرارات حيال صحتي، عند تقديم بحث عن أحد المخاطر؛ أريد أن أعرف عمَّن تتحدث (مثلًا، رجال في الخمسينيات من عمرهم)، أريد أن أعرف ما الحد الأدنى للخطر (مثلًا، أربعة رجال من بين مائة سيصابون بنوبة قلبية على مدى عشر سنوات)، وأريد أن أعرف قدْر الزيادة في نسبة الخطورة، في صورة معدل طبيعي (رجلان إضافيان من بين مائة سيصابان بنوبة قلبية خلال عشر سنوات). أريد أن أعرف أيضًا السبب في زيادة معدلات الخطر، قرص صداع عَرَضي أو إناء يومي مليء بعلاجات مسكنة لآلام المفاصل. بعدها سأفكر مرة أخرى في قراءة الصحف، بدلًا من المدونات التي يكتبها أشخاص يفهمون طبيعة البحوث، والذين يشيرون إلى الأوراق البحثية الأكاديمية الأصلية للرجوع إليها، بحيث أستطيع أن أتحقَّق من ملخص البحوث عندما أرغب في ذلك.
قبل أكثر من مائة عام، قال إتش جي ويلز إن التفكير الإحصائي سيصير ذات يوم مهمًّا بقدْر أهمية القدرة على القراءة والكتابة في المجتمع التكنولوجي الحديث. لا أتفق مع ذلك؛ فالتفكير الاحتمالي صعب بالنسبة إلى الجميع، لكن يفهم الجميع الأرقام العادية. لهذا السبب تُعتبر «المعدلات الطبيعية» الطريقة المنطقية الوحيدة للتعبير عن الخطر.
(٢) اختيار الأرقام
في بعض الأحيان، يتجاوز سوء تقديم الأرقام الواقعَ بكثير، حتى إنك لا تملك إلا افتراض كذب هذه الأرقام. غالبًا ما تبدو هذه المواقف كما لو كانت تتضمَّن جانبًا أخلاقيًّا؛ أدوية، إجهاض، وما إلى ذلك. ومع الاختيار الدقيق للغاية للأرقام، فيما قد يعتبره البعض تلاعبًا غير أخلاقي بالحقائق لتحقيق مآرب شخصية، يمكن أحيانًا ليُّ عنق الأرقام لتعبِّر عن أي شيء تريده.
في عام ١٩٩٧، أطلقتْ هذه الصحيفة حملةً لوقف تجريم تعاطي القُنَّب. فقط لو كنا قد علمنا آنذاك لما استطعنا أن نكشف عنه اليوم … يلزم أعدادًا قياسية من المراهقين تلقِّي علاج جرَّاء تدخين السكانك، وهو أحد أنواع نبات القُنَّب العالي الفاعلية الأقوى بمقدار خمس وعشرين مرة من الراتنج الذي كان يُباع منذ عَقْد مضى.
يُقال لنا مرتين في هذه القصة إن القُنَّب أقوى في مفعوله بمقدار خمس وعشرين مرة مما كان قبل عقد مضى. أما بالنسبة إلى محررة الصحيفة السابقة روزي بويكوت، في استدراكها الميلودرامي، كان السكانك «أقوى بمقدار ثلاثين مرة». في إحدى المقالات الداخلية جرى التقليل من أهمية موضوع الفاعلية باقتضاب إلى «يمكن»، بل أحالتِ الصحيفة إلى مَراجع في معرض ذكر أرقامها. «تقول هيئة خدمات الطب الشرعي إن في بداية التسعينيات ستحتوي نباتات القُنَّب على حوالي ١ في المائة من تتراهايدروكانابيدينول (تي إتش سي)، المركَّب الكيميائي المغيِّر للنشاط العقلي، لكن قد تحتوي نباتات القُنَّب الآن على نسبة تصل إلى ٢٥ في المائة منه.»
ليس هذا إلا محض خيال.
فبيانات هيئة خدمات الطب الشرعي متاحة أمامي الآن، والبيانات السابقة من وكالة المختبر الكيميائي الحكومي، وبرنامج الأمم المتحدة لمكافحة المخدرات، ومركز رصد المخدرات وإدمان المخدرات التابع للاتحاد الأوروبي. سأطلعك على هذه البيانات؛ لأنني أعتقد أن الناس قادرون تمامًا على اتخاذ قراراتهم فيما يتعلَّق بالمسائل الاجتماعية والأخلاقية المهمة عندما تقدَّم لهم الحقائق.
تعود البيانات المستقاة من وكالة المختبر الكيميائي الحكومي لما بين عامي ١٩٧٥ و١٩٨٩. يشتمل راتنج القنب على نسبة تتراوح بين ٦ و١٠ في المائة من مركب تتراهايدروكانابيدينول، ومكونات عشبية بين ٤ و٦ في المائة. لا يوجد اتجاه واضح.
بعد ذلك تتولى هيئة خدمات الطب الشرعي زمام عملية تقديم البيانات، مُصدِرة أرقامًا أكثر حداثةً، لا تُظهِر تغييرًا كبيرًا في فاعلية الراتنج، فيما تتضاعف فاعلية الإنتاج المحلي للقنب العشبي المزروع داخل المنازل من ٦ في المائة إلى ١٢ أو ١٤ في المائة (بيانات الأعوام ٢٠٠٣–٢٠٠٥ في جدول أسفل المراجع).
الاتجاه الصعودي لفاعلية القنب تدريجي، وهو أمرٌ غير مدهش على الإطلاق، وتحرِّكه بصورة كبيرة الإتاحة المتزايدة لمنتجات القنب العشبية المحلية التي يجري زراعتها داخل المنازل بصورة مكثفة.
«أقوى خمسًا وعشرين مرة»، تذكَّر. مرارًا وتكرارًا، وفي الصفحة الأولى.
العام | السنسميلا (٪) | الراتنج (٪) | الأعشاب «التقليدية» المستوردة (٪) |
---|---|---|---|
١٩٩٥ | ٥٫٨ | لا توجد بيانات | ٣٫٩ |
١٩٩٦ | ٨ | لا توجد بيانات | ٥ |
١٩٩٧ | ٩٫٤ | لا توجد بيانات | ٤ |
١٩٩٨ | ١٠٫٥ | ٦٫١ | ٣٫٩ |
١٩٩٩ | ١٠٫٦ | ٤٫٤ | ٥ |
٢٠٠٠ | ١٢٫٢ | ٤٫٢ | ٨٫٥ |
٢٠٠١ | ١٢٫٣ | ٦٫٧ | لا توجد بيانات |
٢٠٠٢ | ١٢٫٣ | ٣٫٢ | لا توجد بيانات |
٢٠٠٣ | ١٢ | ٤٫٦ | لا توجد بيانات |
٢٠٠٤ | ١٢٫٧ | ١٫٦ | لا توجد بيانات |
٢٠٠٥ | ١٤٫٢ | ٦٫٦ | لا توجد بيانات |
إذا كنت في مزاج لانتقاد أسلوب تفكير صحيفة «ذي إندبندنت» الأخلاقي والسياسي، فضلًا عن تلاعبها الواضح والمَشين، يمكن الدفع بأن الزراعة الكثيفة داخل المنازل لأحد النباتات التي تنمو بصورة رائعة خارج المنازل إنما يمثل ردَّة فعل صناعة القنب على عدم مشروعية زراعة المنتج نفسها. فمن الخطر استيراد القنب بكميات كبيرة. ومن الخطر إلقاء القبض على أحد الأشخاص متلبسًا بزراعة حقل كامل منه؛ لذا يصبح أكثرَ منطقيةً زراعةُ القنب بكثافة داخل المنازل، باستخدام مناطق عقارية باهظة، وإن كان لإنتاج مخدرٍ أكثر تركيزًا. فالمخدرات الأكثر تركيزًا، على أي حال، تعتبر نتيجة طبيعية لعدم مشروعية إنتاجها. فلا يمكن شراء أوراق الكاكاو في بيكام على الرغم من إمكانية شراء كوكايين.
بالطبع توجد منتجات قُنَّب ذات فاعلية استثنائية في بعض أجزاء السوق البريطانية اليوم، لكن هكذا كان الأمر دومًا. وللحصول على رقمها المثير للذعر، لم يكن بوسع صحيفة «ذي إندبندنت» إلا مقارنة «أسوأ» أنواع القُنَّب التي كانت تُنتج في الماضي مع «أفضل» الأنواع التي تُنتج اليوم. من العبث القيام بشيء كهذا، وبالإضافة إلى ذلك كان يمكن فبركة الكتب بالطريقة نفسها قبل ثلاثين عامًا إذا كنتَ ترغب في ذلك؛ فأرقام العينات الفردية متاحة، وفي عام ١٩٧٥ كان أقل نوع من أنواع القنب العشبي الذي جرى تحليله يحتوي على ما يزيد على ٠٫٢ في المائة من «تي إتش سي»، بينما في عام ١٩٧٨ كانت نسبة «تي إتش سي» في أكثر أنواع القنب العشبي فاعليةً تبلغ ١٢ في المائة. وبموجب هذه الأرقام، يكون القنب العشبي في غضون ثلاث سنوات فقط قد صار «أكثر فاعليةً بمقدار ستين مرة».
وهذا الذعر ليس جديدًا؛ ففي منتصف الثمانينيات من القرن العشرين، خلال «حرب» رونالد ريجان «على المخدرات» وحملة زامو «فقط قل لا» في سلسلة حلقات «جرانج هيل»، كان الناشطون الأمريكيون في مجال الحملات يزعمون أن القنب أكثر فاعليةً بمقدار أربع عشرة مرة مما كان عليه في عام ١٩٧٠. وهذا يدفعنا للتفكير في أنه إذا كان أقوى بأربع عشرة مرة في عام ١٩٨٦ ممَّا كان عليه في عام ١٩٧٠، وأنه أقوى خمسًا وعشرين مرة اليوم ممَّا كان عليه في بداية تسعينيات القرن العشرين، فهل يعني ذلك أنه أقوى الآن بمقدار ٣٥٠ مرة مما كان عليه في عام١٩٧٠؟
لا يمثِّل هذا حتى قطعة كريستال في أَصِيص نبات. هذا مستحيل؛ فمثل هذا القدر من الفاعلية كان يتطلَّب وجود كمية أكبر من «تي إتش سي» في النبات من الحجم الإجمالي للحيز الذي يشغله النبات نفسه. كما كان يتطلَّب تكثيف المادة في صورة بلازما جلوونات كواركات شديدة الكثافة من القنب. بالله عليكم لا يخبر أحدٌ صحيفة «ذي إندبندنت» أن شيئًا كهذا ممكن.
(٣) الكوكايين يغمر الملاعب المدرسية
نحن الآن جاهزون للانتقال إلى بعض الموضوعات الإحصائية الأكثر تشويقًا، من خلال قصة من مجال يتسم بالمشاعر الفياضة، وهو عبارة عن مقال في صحيفة «ذا تايمز» نُشر في مارس ٢٠٠٦ بعنوان: «الكوكايين يغمر الملاعب المدرسية». وكان العنوان الفرعي للمقال يقول: «استخدام الأطفال علاجات الإدمان يتضاعف خلال عام.» هل كان ذلك صحيحًا؟
إذا قرأتَ البيان الصحفي للاستطلاع الحكومي الذي تعتمد عليه القصة، تجد أنه يشير إلى «عدم وجود أي تغيير تقريبًا في أنماط استخدام الأدوية، أو شرب الكحوليات، أو التدخين منذ عام ٢٠٠٠.» لكن لم يكن ذلك إلا بيانًا صحفيًّا حكوميًّا، ويتلقَّى الصحفيون المال مقابل تقصي الأمور؛ فربما كان البيان الصحفي يخفي شيئًا، للتغطية على إخفاقات الحكومة في مجالات أخرى. نشرتْ صحيفة «ذا تليجراف» أيضًا قصةَ «تضاعف تعاطي الكوكايين»، وهكذا فعلتْ صحيفة «ميرور». هل وجد الصحفيون الخبر نفسه مخفيًّا داخل التقرير؟
يمكنك تحميل الوثيقة كاملة من الإنترنت، وهي عبارة عن استطلاع يشمل ٩ آلاف طفل، بين أحد عشر وخمسة عشر عامًا، في ٣٠٥ مدارس. أشار الملخص الذي يأتي في ثلاث صفحات، مرة أخرى، إلى عدم وجود أي تغيير في انتشار استخدام المواد المخدرة. وإذا قرأتَ التقرير بالكامل، فستجد جداول بيانات أولية. عند سؤال الأطفال عما إذا كانوا قد تعاطَوا الكوكايين في العام الماضي، أجابت نسبةٌ بلغت ١ في المائة منهم بنعم في ٢٠٠٤، ونسبة بلغت ٢ في المائة بنعم في ٢٠٠٥.
إذن كانت الصحف على حق: تضاعف معدل التعاطي! لا. لقد كانت جميع الأرقام التي قُدِّمتْ تقريبًا إما ١ في المائة أو ٢ في المائة، وجرى تقريبها جميعًا إلى قيم كاملة. يقدِّم الموظفون الحكوميون مساعدة هائلة عند مُهاتفتهم. كانت الأرقام الفعلية ١٫٤ في المائة في عام ٢٠٠٤، و١٫٩ في المائة في عام ٢٠٠٥، وليس ١ أو ٢ في المائة. إذن، لم يتضاعف تعاطي الكوكايين على الإطلاق. لكن كان الناس لا يزالون متحمسين للدفاع عن هذه القصة: لقد زاد تعاطي الكوكايين على الرغم من كل شيء، أليس كذلك؟
لا. ما لدينا الآن هو زيادة نسبية للخطر تبلغ ٣٥٫٧ في المائة، أو زيادة مطلقة للخطر تبلغ ٠٫٥ في المائة. وباستخدام الأرقام الفعلية، من بين ٩ آلاف طفل، يوجد لدينا زيادة قدرها حوالي خمسة وأربعين طفلًا في عدد الأطفال الذين يجيبون بنعم على سؤال «هل تعاطيتَ الكوكايين العام الماضي؟»
في ظل زيادة صغيرة كهذه، يجب أن يتساءل المرء: هل هذه الزيادة ذاتُ دلالة إحصائيًّا؟ لقد أُجريت العمليات الحسابية، وأتتِ الإجابة بنعم، هي كذلك، من حيث إنك تحصل على قيمة احتمالية أقل من ٠٫٠٥. ماذا يعني تعبير «ذو دلالة إحصائيًّا»؟ لا يشير هذا التعبير إلا إلى إحدى طرق التعبير عن احتمالية أن تكون النتيجة التي حصلتَ عليها ترجع إلى المصادفة المحضة. ففي بعض الأحيان، ربما تحصل على «صورة» عند إلقاء عُملة خمس مرات متتالية، باستخدام عُملة عادية تمامًا، خاصة إذا ظل إلقاء العُملة يجري وقتًا طويلًا بما يكفي. تصوَّر دورقًا به ٩٨٠ بلية زرقاء، وعشرين بلية حمراء، مختلطة جميعًا بعضها ببعض. بين الحين والآخر — وإن كان ذلك يحدث نادرًا — عند التقاط بلية مع تعصيب العينين، ربما تسحب ثلاث بليات حمراء متتالية، فقط بمحض المصادفة. تبلغ القيمة الفاصلة المعيارية للدلالة الإحصائية قيمة احتمالية تساوي ٠٫٠٥، وهو ما يُعد مجرد طريقة أخرى لقول: «إذا أجريتَ هذه التجربة مائة مرة، فسأتوقع أن أحصل على خمس نتائج إيجابية غير حقيقية في خمس حالات، فقط بمحض المصادفة.»
بالعودة مرة أخرى إلى مثالنا الواقعي للأطفال في الملعب، دعنا نتخيل عدم وجود أي فرق في تعاطي الكوكايين، لكن مع إجراء الاستطلاع نفسه مائة مرة، ربما تتحصَّل على فرق مثل الفرق الذي رأيناه هنا، فقط بمحض المصادفة، فقط لأنه تصادف عشوائيًّا أنك انتقيتَ أطفالًا أكثر كانوا قد تناولوا كميةً أكبر من الكوكايين في ذلك الوقت. لكن تتوقع أن يحدث هذا أقل من خمس مرات من بين المائة مرة التي أجريت فيها الاستطلاع.
وهكذا تكون لدينا زيادة في نسبة الخطورة تبلغ ٣٥٫٧ في المائة، وهي قيمة تبدو في ظاهرها ذات دلالة إحصائيًّا، لكنها لا تزال قيمة منعزلة. ولإجراء عملية «تنقيب عن البيانات»، يُعتبر استخلاص البيانات من سياقها في العالم الواقعي، والقول بأنها ذات دلالة إحصائية، أمرًا مضللًا. فالاختبار الإحصائي للأهمية يفترض أن جميع البيانات المرجعية مستقلة، لكن هنا «تتجمَّع» البيانات، مثلما يقول الإحصائيون. هذه ليست بيانات مرجعية، لكنها تمثِّل أطفالًا حقيقيين، في ٣٠٥ مدارس. يخرجون معًا، ويقلِّد بعضهم بعضًا، ويشترون المخدرات أحدهم من الآخر، وهناك نوبات جنون، وأمراض، وتفاعلات اجتماعية.
كان من الممكن أن تمثِّل الزيادة المتمثلة في تناول خمسة وأربعين طفلًا للكوكايين وباءً جماعيًّا لتعاطي الكوكايين في مدرسة واحدة، أو بضع مجموعات مؤلَّفة من عشرات الأطفال في بضع مدارس مختلفة، أو أوبئة على نطاق مصغَّر، في حفنة من المدارس. أو خمسة وأربعون طفلًا يجلبون ويستهلكون الكوكايين بمعزل عن أصدقائهم، وهو ما يبدو أمرًا غير محتمل إلى حدٍّ ما بالنسبة إليَّ.
إن هذا من شأنه أن يجعل زيادتنا أقل دلالةً إحصائيًّا كثيرًا. فقد كانت الزيادة الصغيرة البالغة ٠٫٥ في المائة ذات دلالة إحصائية؛ لأنها جاءت من عينة كبيرة بلغت ٩ آلاف وحدة بيانات — مثل إلقاء عُملة معدنية ٩ آلاف مرة — ولعل الشيء الذي يعرفه الجميع تقريبًا بشأن مثل هذه الدراسات، أن العيِّنات الأكبر حجمًا تعني أن النتائج ربما تكون أكثر دلالةً إحصائيًّا. لكن إذا لم تكن وحدات البيانات المرجعية مستقلة، إذن يجب التعامل معها، من بعض الجوانب، كعينة أصغر، بحيث تصير النتائج أقل دلالة إحصائيًّا. ومثلما يقول الإحصائيون، يجب «ضبط قيمة البيانات لتأخذ في الاعتبار تكتُّل البيانات.» ويجري هذا من خلال إجراء عمليات حسابية في غاية المهارة تؤلم رءوس الجميع. كل ما تحتاج إلى معرفته هو أن أسباب «ضبط قيمة البيانات لتأخذ في الاعتبار تكتُّل البيانات» جلية، وواضحة، وسهلة، مثلما رأينا توًّا (في حقيقة الأمر، مثلما هو الحال مع كثير من الأدوات، تُعتبر معرفة متى يجب استخدام أداة إحصائية ما مهارةً مختلفة وعلى نفس القدْر من الأهمية لفهم كيفية بناء مثل هذه المهارة). عندما يجري «ضبط قيمة البيانات لتأخذ في الاعتبار تكتُّل البيانات»، إنما تُقلص بصورة هائلة من الدلالة الإحصائية للنتائج. هل ستستمر الزيادة في تعاطي الكوكايين، التي انخفضتْ بالفعل من «الضِّعْف» إلى «٣٥٫٧» في المائة؟
لا؛ لأن ثمة مشكلة نهائية مع هذه البيانات؛ هناك الكثير جدًّا منها للانتقاء من بينها. فهناك العشرات من وحدات البيانات في التقرير، حول المذيبات، والسجائر، والكيتامين، والقنب، إلخ. ومن الممارسات المتعارف عليها في مجال البحوث أننا لا نعترف بأن النتائج ذات دلالة إحصائية إلا إذا كانت لها قيمة احتمالية تبلغ ٠٫٠٥ أو أقل. لكن مثلما ذكرنا، فإن قيمة احتمالية تبلغ ٠٫٠٥ تعني أنه لكل مائة عمليةِ مقارنةٍ تُجريها، ستسفر خمسٌ منها عن نتائج إيجابية بالمصادفة البحتة فقط. من خلال هذا التقرير، كان يمكن عقد عشرات المقارنات، وكان سيُظهر بعضُها زيادات في التعاطي، لكن من خلال المصادفة البحتة فقط، وربما كانت إحصائية تعاطي الكوكايين إحداها. إذا جرى إلقاء زوج من النرد عدد مرات كافٍ، فسيظهر لك رقم ستة في كلا النردين ثلاث مرات متتالية في كثير من المرات. لهذا السبب يُجري الإحصائيون عملية «ضبط قيمة البيانات لتأخذ في الاعتبار مقارنات متعددة»؛ أي عملية ضبط قيمة «إلقاء قطع النرد» مرات كثيرة. تعتبر هذه العملية، مثل ضبط قيمة البيانات لتأخذ في الاعتبار تكتل البيانات، شديدةَ القسوة على البيانات، وغالبًا ما تقلِّص على نحو بالغ من أهمية النتائج.
تُعتبر عملية انتقاء البيانات عملية خطيرة … كان بالإمكان القول — في ظل معرفة القيمة الاسمية، دون معرفة أي شيء عن طريقة عمل الإحصاءات — إن هذا التقرير الحكومي أظهر زيادةً كبيرة تصل إلى ٣٥٫٧ في المائة في تعاطي الكوكايين. لكن خبراء الإحصاء الذين قاموا بتجميع هذا التقرير كانوا على دراية بتكتل البيانات، وطريقة ضبط بونفيروني لأخذ عمليات المقارنة المتعددة في الاعتبار. إنهم ليسوا أغبياء، وهم يقومون بإجراء الإحصاءات كجزء من عملهم.
لذلك السبب، افتراضًا، ذكروا بشكل غاية في الوضوح في ملخصهم، وفي بيانهم الصحفي، وفي التقرير الكامل، أنهم لم يجدوا أي تغيير في الإحصاءات من عام ٢٠٠٤ إلى عام ٢٠٠٥. لكن الصحفيين لم يرغبوا في تصديق ذلك، وحاولوا إعادة تفسير البيانات بأنفسهم، وراحوا ينقِّبون عن البيانات تنقيبًا، وكانوا يظنون أنهم وجدوا أخبارًا قيِّمة. فتحوَّلت الزيادة من ٠٫٥ في المائة — وهو رقم ربما كان يمثل اتجاهًا تدريجيًّا، لكنه ربما كان لا يمثل إلا محض مصادفة — إلى قصة في صدر الصفحة الأولى في صحيفة «ذا تايمز» حول تضاعُف معدل تعاطي الكوكايين. ربما لا تثق بالبيان الصحفي، لكنك إذا لم تكن تعرف كثيرًا عن الأرقام، فإنك تخاطر مخاطرة كبيرة عندما تنقِّب تنقيبًا عن البيانات في إحدى الدراسات لكتابة قصة صحفية.
(٤) حسنًا، لنعد إلى قصة سهلة
هناك أيضًا بعض الطرق البسيطة للغاية لتقديم إحصاءات مثيرة للسخرية، وهناك مثالان مفضَّلان شائعان؛ ألَا وهما اختيار مجموعة غير عادية كعينة، وتوجيه سؤال سخيف إليهم. لِنَقُلْ إن سبعين في المائة من النساء يُرِدْنَ أن يُخبِر أحدُهم الأميرَ تشارلز أن يتوقَّف عن التدخل في الحياة العامة. آه، انتظر، ٧٠ في المائة من جميع النساء «اللائي يزرن موقعي» يُرِدْن أن يُخبِر أحدهم الأمير تشارلز أن يتوقَّف عن التدخل في الحياة العامة. بإمكانك أن تَرى إلى أين نحن ماضون. وبالطبع، في استطلاعات الرأي، إذا كانت هذه الاستطلاعات طوعية، فثمة ما يسمَّى «تحيز الاختيار»؛ إذ لن يجري تسجيل آراء أحد إلَّا الأشخاص الذين أخذوا على عاتقهم عناء تعبئة نموذج الاستطلاع فقط.
ثمة مثال رائع على هذا في صحيفة «ذا تليجراف» في الأيام الأخيرة من عام ٢٠٠٧؛ كان عنوان المقال: «الأطباء يرفضون إجراء عمليات إجهاض في عياداتهم. أطباء العائلات يهددون بثورة ضد خطط الحكومة للسماح لهم بإجراء عمليات إجهاض في عياداتهم، كشفتْ عن ذلك صحيفة «ذا تليجراف»». ثورة؟ «لا يرغب أربعة من بين خمسة أطباء ممارسين عامِّين في إجراء عمليات إجهاض، على الرغم من اختبار الفكرة في إطار خطط هيئة الخدمات الصحية الوطنية التجريبية، مثلما كشف أحد استطلاعات الرأي.»
يجب على أطباء الممارسة العامة إجراء جراحات إجهاض في عياداتهم.
أوافق بشدة، أوافق، لا أعرف، لا أوافق، أعارض بشدة.
يجب أن نكون في غاية الوضوح: لا أفهم شخصيًّا هذا السؤال بشكل تام؛ هل «يجب» تلك تعني «يجب» التي اعتدناها؟ مثلما في «ينبغي»؟ وفي أي ظروف؟ من خلال توفير المزيد من التدريب والوقت والمال؟ من خلال وضع نظم إضافية لمواجهة النتائج السلبية؟ وتذكَّرْ، هذا موقع يذهب إليه الأطباء — باركهم الله — للتباكي. هل يقولون لا؛ فقط لأنهم يتذمرون من أعباء العمل الزائد وانخفاض الروح المعنوية؟
هذه فكرة عبثية؛ كيف يمكن لأطباء الممارسة العامة إجراء عمليات إجهاض في عياداتهم الخاصة؟ ماذا لو حدث أحد المضاعفات الكبرى مثل ثقب جدار الرحم والمعدة؟
•••
عيادات أطباء الممارسة العامة هي الأماكن المثالية التي توجد فيها الاضطرابات المُعدية. وفكرة إجراء أي نوع من عمليات التعقيم بها يتضمَّن أي عضو من أعضاء الجهاز الهضمي تعتبر فكرة بغيضة.
•••
الطريقة الوحيدة التي تُجرى بها أو يجب أن تُجرى بها مثل هذه العمليات في حال ما إذا كانت عيادات أطباء الممارسة العامة بها وحدة عناية جراحية نهارية يعمل بها طاقم من العاملين مدرَّب بشكل جيد، بعبارة أخرى: طاقم غرفة العمليات، طبيب تخدير، وطبيب أمراض نساء … لا توجد عملية جراحية دون مخاطر، ومن المفترض أننا سنخضع لتدريب جراحي لأطباء أمراض النساء من أجل أداء المهام.
•••
عمَّ نتحدث جميعًا؟ دعونا جميعًا نُجْرِ عمليات إجهاض في عياداتنا، وغرف معيشتنا، ومطابخنا، ومرائبنا، ومتاجرنا الصغيرة، مثلما تعرفون، تمامًا مثل الأيام الخوالي.
أعتقد أن السؤال قد جرت صياغته بطريقة سيئة، وآمُل ألَّا ينشر موقع الأطباء نتائج هذا الاستطلاع في صحيفة «ذا ديلي تليجراف».
(٥) هزيمتك
سيكون من الخطأ افتراض أن أشكال السهو التي تناولناها حتى الآن تقتصر على الطبقات الدنيا من المجتمع، مثل الأطباء والصحفيين. فبعض أكثر الأمثلة واقعيةً يأتي من الطبقات العليا في المجتمع.
في عام ٢٠٠٦، بعد إصدار تقرير حكومي كبير، أشارت وسائل الإعلام إلى أن شخصًا لديه مشكلات نفسية يرتكب جريمة قَتْل أسبوعيًّا. يجب أن يقوم المعالجون النفسيون بدَوْر أكبر، مثلما تخبرنا الصحف، ويمنعوا ارتكاب المزيد من هذه الجرائم. سيتفق جميعنا — أنا متأكد من ذلك — على ضرورة اتخاذ أي إجراء معقول لتحسين عملية إدارة المخاطر والعنف، ودائمًا ما يكون الوقت مناسبًا تمامًا أن يَجْرِي نقاش عام حول أخلاقيات احتجاز المرضى النفسيين (على الرغم من أنني أود، باسم الإنصاف، أن أرى مناقشةً لعمليات الاحتجاز الوقائي لكل مجموعات المرضى التي قد تشكِّل خطرًا أيضًا؛ مثل مدمني المشروبات الكحولية، والأشخاص الذين يمارسون العنف المتكرر، والذين أساءوا معاملة الموظفين في مركز العمل، إلخ).
لكن إذا نظرتَ إلى الاختبار من منظور الشخص الذي يُجرَى عليه، تصير العمليات الحسابية مناقِضة للبديهيات بعض الشيء؛ نظرًا لأن المعنى، أو القيمة التنبُّئِية، لنتيجة الاختبار الإيجابية أو السلبية لأحد الأفراد، تتغيَّر في المواقف المختلفة، الأمر الذي يثير الاستغراب، وهو ما يعتمد على مدى نُدْرة حدوث الحالة التي يحاول الاختبار أن يكتشفها. فكلما كانت الحالة أكثر ندرةً في العينة، صارت نتيجة الاختبار أسوأ، على الرغم من أن الاختبار هو هو.
يسهل فهم هذا أكثر مع الأرقام المحددة. لِنَقُلْ إن معدل الإصابة بفيروس «إتش آي في» بين الرجال المعرضين لخطر الإصابة به بدرجة مرتفعة في منطقة معينة يبلغ ١٫٥ في المائة. نطبِّق اختبارنا الرائع للدم على ١٠ آلاف شخص من هؤلاء الرجال، ويمكننا توقُّع نتائج إيجابية عددها ١٥١ إجمالًا؛ حيث ستمثِّل ١٥٠ نتيجة إيجابية النتائج الحقيقية الإيجابية للرجال المصابين بفيروس «إتش آي في»، الذين يحصلون على نتائج إيجابية حقيقية في اختبار الدم، بينما ستمثِّل النتيجة المتبقية النتيجة السلبية الوحيدة غير الصحيحة التي استطعنا أن نتوقَّع الحصول عليها من عينة تضم ١٠ آلاف رجل، جاءت نتيجة اختبار فيروس «إتش آي في» لديهم سلبية، والذين جرى إخضاعهم لاختبار خاطئ ضمن ١٠ آلاف حالة؛ لذا، إذا حصلتَ على نتيجة اختبار دم إيجابية لفيروس «إتش آي في»، فتحتَ هذه الظروف تبلغ احتمالات الحصول على نتيجة إيجابية بحق في اختبار «إتش آي في» ١٥٠ من بين ١٥١. إنه اختبار تنبُّئِي إلى حدٍّ كبير.
لنستخدم الآن الاختبار نفسه حيث تبلغ معدلات الإصابة بفيروس «إتش آي في» في العينة واحدًا من بين ١٠ آلاف. إذا أجرينا اختبارات على ١٠ آلاف شخص، نستطيع أن نتوقع الحصول على نتيجتين إيجابيتين في اختبار الدم إجمالًا؛ إحداهما من الشخص الذي أسفر اختبار الدم عن نتيجة إيجابية لفيروس «إتش آي في» لديه، والأخرى هي النتيجة الإيجابية غير الحقيقية التي استطعنا أن نتوقعها، مرة أخرى، من إخضاع ١٠ آلاف شخص غير مصابين بفيروس «إتش آي في»، لاختبار يخطئ مرةً كل ١٠ آلاف حالة.
فجأةً، عندما يكون معدل حدوث حالة ما في غاية الندرة، يصير حتى اختبار الدم الرائع في الحالات السابقة غير مفيد على الدوام. بالنسبة إلى الرجلين اللذين أسفرت نتائج اختبار الدم لفيروس «إتش آي في» لديهما عن نتيجة إيجابية، في هذه العينة التي لا يوجد بها إلا حالة واحدة مصابة بفيروس «إتش آي في» من بين ١٠ آلاف حالة، يبلغ احتمال إصابة أحدهما بفيروس «إتش آي في» حقًّا ٥٠ : ٥٠.
لننتقل الآن إلى العنف. تبلغ «حساسيةُ» أفضلِ أداة تنبُّئِية لحالات العنف النفسي ٠٫٧٥، و«درجة الخصوصية» تبلغ ٠٫٧٥. يصبح الأمر أكثر صعوبةً أن تسفر الاختبارات عن نتائج دقيقة عند التنبؤ بحدوث حالات معينة عند البشر، مع العقول البشرية والحياة البشرية المتغيرة. لِنَقُلْ إن ٥ في المائة من المرضى الذين يُعرَضون على فريق الصحة العقلية المجتمعية سيشاركون في حدث ينطوي على عنف في أحد الأعوام. بتطبيق العمليات الحسابية نفسها مثلما فعلنا في اختبارات فيروس «إتش آي في»، ستسفر الأداة التنبُّئِية التي تبلغ حساسيتها «٠٫٧٥» عن نتائج خاطئة في ست وثمانين مرة من بين مائة مرة. أما بالنسبة إلى حالات العنف الشديد، التي تقع بنسبة ١ في المائة سنويًّا، فسيسفر استخدام أفضل أدواتنا التنبُّئِية التي تبلغ حساسيتها «٠٫٧٥»، عن تحديد غير دقيق للمتسبِّب المحتمل لارتكاب العنف سبعًا وتسعين مرة من بين مائة مرة. هل ستحتجز سبعة وتسعين شخصًا وقائيًّا للحيلولة دون وقوع ثلاث حالات عنف؟ وهل ستطبق تلك القاعدة على مدمني الكحوليات والأنماط المتنوعة السيئة المعادية للمجتمع أيضًا؟
بالنسبة إلى القتل، تلك الجريمة الشديدة الندْرة محل البحث في هذا التقرير، التي كانت تتطلَّب اتخاذ إجراءات أكثر، والتي تقع بمعدل حالة ضمن ١٠ آلاف حالة سنويًّا بين المرضى المصابين بالأمراض الذهانية، تبلغ معدلات النتائج الإيجابية غير الصحيحة حدًّا مرتفعًا، لدرجة أن أفضل اختبار تنبُّئي لها لا يعتبر ذا فائدة على الإطلاق.
هذه ليست دعوةً للقنوط. هناك أشياء يمكن فعلُها، ويمكنك دومًا محاولة الحد من العدد الفعلي للنتائج الخاطئة على نحو صارخ، على الرغم من صعوبة معرفة ما إذا كانت «جريمة واحدة أسبوعيًّا» تمثِّل فشلًا واضحًا لأي نظام؛ إذ إن بالعودة إلى التاريخ، من خلال تحليل الماضي، كل ما يحدث سيبدو كما لو كان يؤدِّي حتميًّا إلى الحالة السيئة الوحيدة التي تنبَّأتَ بها. لا أقدِّم لك هنا إلا العمليات الحسابية التي تُجرَى على الحالات النادرة. أما ما تفعله بنتائج هذه العمليات الحسابية، فهو أمر يرجع إليك.
(٦) تقييد حركتك
في عام ١٩٩٩ حوكمت المحامية سالي كلارك لقتلها طفلَيْها. كان معظم الناس على دراية بأن ثمة خطأً إحصائيًّا في حجة الادِّعاء، لكن كان ثمة قليلون يعرفون القصة الحقيقية، أو المدى المدهش للجهل الإحصائي الذي لازم القضية.
أثناء محاكمتها، استُدعي البروفيسور السير روي ميدو — وهو خبير في مجال حالات عنف الآباء ضد أطفالهم — للإدلاء بشهادة خبير. أشار ميدو في عبارة شهيرة إلى نسبة «واحد من بين ثلاثة وسبعين مليونًا» باعتبارها نسبة احتمال وفاة طفلين من العائلة نفسها جراء متلازمة الموت المفاجئ للرُّضَّع.
كان هذا الدليل يمثل إشكالية كبرى لسببين مختلفين تمامًا؛ أحدهما سهل الفهم، والآخر شديد الصعوبة في استيعابه. ولأن لديك من القدرة على التركيز ما يكفي لمتابعة ما في الصفحتين التاليتين، سينتهي بك المطاف عند الفراغ من قراءتهما بأن تصبح أكثر ذكاءً من البروفيسور سير روي، وقاضي محاكمة سالي كلارك، وفريق دفاعها، وقضاة محكمة الاستئناف، وتقريبًا جميع الصحفيين والمعلِّقين القانونيين الذي تناولوا القضية. سنعرض السبب السهل أولًا.
(٦-١) المغالطة البيئية
يعد رقم «واحد من بين ثلاثة وسبعين مليونًا» مريبًا وغير محدَّد في ذاته، مثلما يقتنع الجميع الآن. جرى حساب هذه الاحتمالية في صورة معادلة نَصُّها: ٨٥٤٣ × ٨٥٤٣، كما لو كانت احتمالات وقوع حالتَيْ إصابة بمتلازمة الموت المفاجئ للرُّضع في هذه العائلة الواحدة مستقلة كلٌّ عن الأخرى. يبدو هذا خطأً من البداية، ولا يخفى هذا على أحد. ربما كانت ثمة عوامل بيئية أو جينية تلعب دورًا، وهي عوامل ربما كان الطفلان كلاهما يشتركان فيها. لكن انسَ تمامًا السرور الذي تشعر به بسبب استيعابك هذه الحقيقة. فحتى إذا قَبِلْنا أن احتمال وقوع حالتَيْ متلازمة الموت المفاجئ للرُّضع في عائلة واحدة أكثر من واحد من بين ثلاثة وسبعين مليون حالة — قُلْ، واحد من بين ١٠ آلاف حالة — يظل أي رقم على هذه الشاكلة مثيرًا للشك، مثلما سنرى الآن.
(٦-٢) مغالطة الادِّعاء
السؤال الحقيقي في هذه القضية هو: ماذا نفعل بهذا الرقم غير الواقعي؟ أشارت الكثير من التقارير الصحفية آنذاك إلى أن واحدًا من بين ثلاثة وسبعين مليونًا يمثل احتمالية أن حالتَيْ وفاة طفلَيْ سالي كلارك كانتا مصادفةً؛ بعبارة أخرى: احتمالية أنها كانت غير مذنبة. بدا كثير ممن كانوا جزءًا من عملية التقاضي مقتنعين بهذه الرؤية، ولا شك في أن المغالطات التي يجري تكرارها باستمرار تعْلَق في الذهن. لكن تعتبر هذه القضية مثالًا لعملية تفكير قاصرة معروفة وموثَّقة جيدًا تُعرف باسم «مغالطة الادِّعاء».
لقد مات رضيعان في عائلة واحدة، وهو ما يُعتبر في حد ذاته أمرًا شديد الندرة. وبمجرد وقوع هذا الحدث، تحتاج هيئة المحلفين إلى الموازنة بين تفسيرين متنافسين لموت الرضيعين؛ حالتا إصابة بمتلازمة موت الرُّضع المفاجئ أم جريمتا قتل. في الظروف العادية — قبل أن يموت أي رُضَّع — لا يعتبر وقوع إصابتين بمتلازمة الموت المفاجئ للرضع أمرًا محتملًا على الإطلاق، وهكذا الأمر بالنسبة إلى احتمالية وقوع جريمتَيْ قتل. لكن بما أن الحالة النادرة لموت رضيعين في عائلة واحدة قد حدثت، يصبح التفسيران — جريمتا قتل أو إصابتان بمتلازمة الموت المفاجئ للرضع — محتمَلَيْن للغاية. إذا أردْنا حقًّا أن نستخدم الإحصاءات، فسنحتاج إلى معرفة أيهما «أكثر» ندرةً نسبيًّا، حالتا متلازمة الموت المفاجئ للرضع أم جريمتا القتل. حاول الناس حساب المخاطر النسبية لهاتين الحالتين، وتقول إحدى الأوراق البحثية إن النسبة تصل إلى حوالي ٢ : ١ لصالح حالتَيْ متلازمة الموت المفاجئ للرضع.
لم يكن هذا فارقًا «جوهريًّا» في مغالطة الادِّعاء لم ينتبه إليه أحدٌ آنذاك — من قِبَل كلِّ مَن كان في المحكمة — فحسب، بل لم ينتبه إليه أحدٌ أيضًا أثناء الاستئناف، وهي المرحلة التي اقترح فيها القضاة أن بدلًا من «واحد من بين ثلاثة وسبعين مليونًا»، كان على ميدو قول «نادر جدًّا». أدرك القضاة أوجه القصور في العملية الحسابية التي أجراها للتوصل لهذا الرقم؛ أي المغالطة البيئية، المشكلة السهلة التي أشرنا إليها سابقًا، لكنهم كانوا لا يزالون يتقبَّلون هذا الرقم باعتباره يرسِّخ «لنقطة شاملة جدًّا؛ ألا وهي ندرة حدوث إصابتين بمتلازمة الموت المفاجئ للرُّضع.»
لم يكن ذلك — مثلما تدرك الآن — صحيحًا تمامًا؛ فلم تكن ندرة حدوث إصابتين بمتلازمة الموت المفاجئ للرُّضع ذات صلة بالأمر؛ لأن حدوث حالتَي قَتْل نادر أيضًا. لقد فشلتْ عمليةٌ قضائية كاملة في تعيين الفرق في الكيفية التي يجب استخدام الرقم الإحصائي بها. فشلت مرتين.
كان ميدو أحمقَ، وجرى التشهير به (ربما يقول البعض إن هذه العملية قد تفاقمت بفعل حملات اضطهاد أطباء الأطفال العاملين في مجال انتهاكات حقوق الطفل)، لكن إذا كان صحيحًا أن ميدو كان عليه تحديد وتوقُّع المشكلات في تفسيره لرقمه الإحصائي الذي تقدم به، فإذن كان على الأطراف الأخرى في القضية القيام بذلك أيضًا؛ فما من طبيب أطفال يتحمَّل مسئولية فريدة من نوعها بأن يكون ماهرًا حسابيًّا أكثر من محامٍ، أو قاضٍ، أو صحفي، أو عضو في هيئة محلفين، أو موظف في محكمة. وتعتبر مغالطة الادِّعاء مسألةً في غاية الأهمية في حال تقديم أدلة تحليل الحمض النووي، على سبيل المثال؛ حيث يعتمد التفسير كثيرًا على موضوعات رياضية وسياقية معقَّدة. وكل مَن سيتعامل في الأرقام، ويستخدمها، ويفكر من خلالها، ويقنع الآخرين بها، فضلًا عن تقييد الآخرين من خلالها، يتحمل مسئولية أيضًا في فهمها. إن كل ما فعلتُه هو قراءة كتاب علمي مشهور عن الأرقام، ويمكنك أن ترى أن الأمر لا يكاد يكون على هذه الدرجة من الصعوبة.
(٧) خسران اليانصيب
من الممكن أن يكون المرء تعيس الحظ للغاية؛ فقد ظلَّت ممرضةٌ تُدعى لوسيا دي برك في السجن مدة ست سنوات في هولندا، بتهمة ارتكاب سبع جرائم قتل وثلاث محاولات قتل أخرى. كان جوهر توجيه الاتهام إليها في القضية هو وفاة عدد كبير من الأشخاص أثناء نوبتها، وكان ذلك، بصورة جوهرية، في ظل أدلة عَرَضية ضعيفة جدًّا ضدها. لم تعترف قط بارتكابها أي جُرْم، واستمرتْ في الإصرار على براءتها، وأفضتْ محاكمتها إلى نشر مجموعة صغيرة من الأبحاث النظرية في أدبيات الإحصاء.
كان الحُكم يعتمد بصورة كبيرة على رقم «واحد من بين ٣٤٢ مليونًا». حتى إذا وجدنا أخطاءً في هذا الرقم — وصدِّقني سنجد — مثلما في قصتنا السابقة، فسيظل هذا الرقم الإحصائي غير ذي صلة إلى درجة كبيرة؛ وذلك لأن الأمر الشائق — مثلما رأينا مرارًا وتكرارًا — فيما يتعلق بالإحصائيات ليس العمليات الحسابية المعقدة، بل ما تعنيه هذه الأرقام.
إليك هذا القياس التمثيلي.
تخيَّل أنني أقف قرب إسطبل خشبي كبير أحمل بندقية آلية ضخمة، أضع عِصابةً على عيني، ووسط ضحكات مجنونة أُطلِقُ الآلاف والآلاف من الرصاصات في جانب الإسطبل، ثم أُسقِط البندقية، وأسير إلى الحائط، وأتفحَّصه عن كثب لبعض الوقت، ذارعًا المكان جيئة وذهابًا. أجد موضعًا به ثقوب رصاصات ثلاث قريبة بعضها من بعض، فأرسم علامة تصويب حولها، معلنًا في فخر أنني رامٍ بارع.
أعتقد أنك لا تتفق مع كلٍّ من أساليبي واستنتاجاتي بالنسبة إلى هذا الاستدلال. على أن هذا هو بالضبط ما حدث في قضية لوسيا؛ فقد وجد المدَّعون العموميون سبعة قتلى، قضَوْا أثناء نوبة إحدى الممرضات، في مستشفًى واحد، في مدينة واحدة، في دولة واحدة، في العالَم، ثم رسموا علامة تصويب حولهم.
يكسر هذا المثال قاعدةً أساسية في أي بحث يتضمَّن إجراء إحصاءات؛ ألَا وهي عدم إمكانية إيجاد الفرضية في النتائج. فقبل أن تبدأ العمل على البيانات من خلال الأداة الإحصائية المستخدَمة، يجب أن تكون ثمة فرضية محددة لاختبارها. أما إذا جاءت الفرضية من خلال تحليل البيانات، فلن يكون ثمة معنًى في تحليل البيانات نفسها مرة أخرى لتأكيدها.
تُعتبر هذه المسألة صورة من صور المنطق الدائري الفلسفي الرياضي المعقَّد، لكنَّ هناك أيضًا صورًا أخرى مادية جدًّا للمنطق الدائري في هذه الحالة. ففي سبيل جمع المزيد من البيانات، قصد المحقِّقون العنابر ليَرَوْا ما إذا كانوا سيعثرون على المزيد من حالات الوفاة المريبة. لكن كان جميع مَن طلب منهم أن يتذكَّروا وقوع أي «حوادث مريبة» يعلمون أن هذا السؤال موجَّه إليهم؛ لأن لوسيا قد تكون سفَّاحة. كان ثمة خطر كبير في أن تصير عبارةُ «حادثة مريبة» مترادفةً مع عبارة «كانت لوسيا موجودة»، ولم تدخل بعض حالات الوفاة المفاجئة التي وقعت عندما لم تكن لوسيا موجودة في الحسابات بطبيعة الحال؛ فهي ليست بأي حالٍ مريبة؛ لأن لوسيا لم تكن موجودة.
تصير الأمور أكثر سوءًا؛ فقد قال أحد موظفي المستشفى: «طُلِب منا أن نضع قائمةً بالأحداث التي وقعت خلال نوبات عمل لوسيا أو بعد وقت قصير منها.» على هذا النحو، جرى الكشف عن مزيد من الأنماط؛ لذا بدا مرجَّحًا أكثر أن المحققين سيجدون المزيد من حالات الوفاة المريبة في فترات نوبات لوسيا. في غضون ذلك، كانت لوسيا قابعةً في السجن انتظارًا لمحاكمتها.
هذه أشياء تحدث في الكوابيس فقط.
في الوقت نفسه، جرى تجاهل قَدْر ضخم من المعلومات الإحصائية المترابطة. ففي السنوات الثلاث قبل أن تعمل لوسيا في العنبر محل التحقيق، كان ثمة سبع حالات وفاة. وفي السنوات الثلاث التي عملتْ خلالها في العنبر، كانت هناك ست حالات وفاة. إليك فكرةً تجول بخاطري: يبدو غريبًا أن معدل حالات الوفاة «ينخفض» في عنبر في اللحظة التي تصل فيها سفَّاحة في نوبة انغماس في القتل. إذا كانت لوسيا قد قتلتهم جميعًا، فلا بد إذن أنه لم توجد أي حالة وفاة طبيعية في العنبر على الإطلاق خلال السنوات الثلاث التي عملتْ فيها هناك.
آه، لكن على الجانب الآخر، مثلما كشف الادِّعاء في محاكمتها، فعلتْ لوسيا مثلما يحدث في لعبة التاروت. بالفعل تبدو لوسيا غريبة الأطوار قليلًا في خواطرها التي كانت تدوِّنها في مفكرتها اليومية، والتي قُرئت منها مقتطفات بصوت عالٍ؛ لذا ربما قامت بما قامت به فعلًا.
لكن أغرب الأشياء بكل تأكيد هو ما يلي: في إصدارِهِ رقمَهُ الإحصائي الإلزامي، السطحي، على غرار أرقام ميدو — الذي كان في هذه المرة «واحدًا من بين ٣٤٢ مليونًا» — ارتكب الإحصائي المكلَّف من قِبَل الادِّعاء خطأً رياضيًّا، بدائيًّا، بسيطًا. لقد مزج الإحصائي بين نتائج الاختبارات الإحصائية الفردية من خلال مضاعفة القِيَم الاحتمالية، أو التعبير الرياضي للاحتمال، أو الدلالة الإحصائية. يُجري هذه الجزئية الخبراء العِلميون المتهوسون، وهي الجزئية التي سيحذفها الناشر، لكنني أنوي أن أكتبها على أي حال؛ فلا يجرِي ضرب القيم الاحتمالية معًا فقط، بل يجري صياغتها معًا من خلال أداة بارعة، ربما مثل «أسلوب فيشر لدمج القيم الاحتمالية المستقلة».