المعلومات الرياضية
بعض خواص المعلومات قابلة للحساب كميًّا بصورة بديهية، فأي شبكة اتصالات فائقة السرعة تستطيع نقل حد أقصى من المعلومات في الثانية، وأي جهاز كمبيوتر يحتوي على قرص صلب لا يتضمن إلا قدرًا محدودًا من المعلومات. عمومًا، اعتدنا على «ترميز»، و«نقل»، و«تخزين» المعلومات بكميات محددة، مثل الإشارت المادية. نتوقع أيضًا أن تكون المعلومات «مُضافة» مثل البسكويت والعملات المعدنية. إذا أعطيتُك معلومة أ + معلومة ب؛ فإن ذلك يعني أنني أعطيتُك المعلومة أ + ب. بالإضافة إلى ذلك، نفهم المعلومات بصفتها غير «سلبية» أبدًا، كما في الاحتمالات ومعدلات الفائدة، لا يمكن أن تنخفض قيمة المعلومات إلى ما دون الصفر، على عكس حسابي المصرفي أو درجة الحرارة في أكسفورد. خذ مثالنا: عندما يسأل جون جاره سؤالًا، فإن السيناريو الأسوأ هو عدم الحصول على إجابة أو الحصول على إجابة خاطئة، وهو ما سيجعل لديه صفرًا من المعلومات الجديدة.
يجري اختبار هذه الخواص الكَمِّيَّة وغيرها من خواص المعلومات من خلال عدة أساليب رياضية ناجحة. تعتبر «النظرية الرياضية للاتصال» أكثر الأساليب الرياضية أهمية وتأثيرًا وانتشارًا حتى الآن. جاء اسم هذا الفرع من نظرية الاحتمالات من خلال مجهودات كلود شانون الكبرى؛ حيث كان شانون رائدًا في مجال الدراسات الرياضية للمعلومات وتَوصَّل إلى الكثير من نتائجها الأساسية، على الرغم من إقراره بأهمية الجهد السابق للباحثين والزملاء الآخرين في معامل بل. وبعد شانون صارت النظرية الرياضية للاتصال تُعرف باسم «نظرية المعلومات». وحاليًّا يعتبر شانون «أبو نظرية المعلومات»، كما يُنظر إلى المعلومات التي تتناولها النظرية الرياضية للاتصال باعتبارها معلومات شانون. بينما يعتبر مصطلح «نظرية المعلومات» مصطلحًا جذابًا إلا أنه مصطلح غير موفَّق، وهو مصطلح لا يزال يسبِّب حالات سوء فهم لا نهاية لها. أسِفَ شانون على شعبية المصطلح الواسعة، وهو ما يجعلني أتفادى استخدامه في هذا السياق.
تكمن النظرية الرياضية للاتصال وراء أي ظاهرة تتضمن تشفير البيانات ونقلها. على هذا النحو، كان للنظرية أثر عميق على تحليلات الأنواع المختلفة للمعلومات، وهي التحليلات التي وفرت لها النظرية المفردات الفنية والإطار المفهومي المبدئي. ولعله من المستحيل فهم طبيعة المعلومات دون فهم جوهرها الرئيسي، وهو ما يناقشه هذا الفصل.
(١) النظرية الرياضية للاتصال
تتعامل النظرية الرياضية للاتصال مع المعلومات بصفتها اتصال بيانات، في ظل هدف رئيس يتمثل في إيجاد طرق فعالة لترميز البيانات ونقلها.
ترجع أصول النظرية الرياضية للاتصال إلى مجال الهندسة الكهربائية، باعتبارها دراسة حدود الاتصال، وتعمل النظرية على تطوير أسلوب كمي لتناول المعلومات.
[سقراط]: تمتلك الكتابة يا فيدريس هذه الخاصية الغريبة، وهي تشبه الرسم كثيرًا؛ إذ تقف الكائنات في الرسومات مثل الكائنات الحية، لكن إذا سألها المرء سؤالًا، لا تنبس ببنت شفة. وهكذا الأمر مع الكلمات المكتوبة. ربما تعتقد أن هذه الكائنات تحدثت كما لو أنها تمتلك ذكاءً، لكنك إذا وجهت إليها سؤالًا، راغبًا في معرفة آرائها، ستقول الشيء نفسه دومًا [أجهزة أحادية، وفق اصطلاحاتنا]. وكل كلمة، بمجرد [٢٧٥ إي] كتابتها، يجري تراشقها بالطريقة نفسها بين أولئك الذين يفهمونها ومن لا اهتمام لهم بها، ولا تعرف الكلمة إلى من تتحدث أو لا تتحدث. عندما يجري معاملة الكلمة معاملة سيئة أو تُنتقد جورًا فإنها تحتاج إلى والدها دومًا لمساعدتها؛ إذ لا تملك قوة لحماية أو مساعدة نفسها.
مثلما يدرك أفلاطون جيدًا، يجيب المصدر الأحادي على جميع الأسئلة طوال الوقت بإجابة واحدة، إجابة لا تحتوي على صمت أو رسالة؛ نظرًا لأن الصمت يعتبر رسالة، مثلما رأينا في الفصل الثاني. يترتب على ذلك اعتبار المصدر الصامت تمامًا مصدرًا أحاديًّا. وإذا كانت عملية إسكات مصدر ما (الرقابة) تعتبر طريقة سيئة لإسكات هذا المصدر عن الإخبار بالمعلومات، فمن المعروف جيدًا أن حالة العواء المستمر (وهي تكرار الرسالة نفسها دومًا، مهما كانت الظروف) تعتبر حالة كلاسيكية ينحدر فيها المصدر المفيد إلى دور جهاز أحادي غير مفيد.
الجهاز | الأبجدية | وحدات المعلومات لكل رمز |
---|---|---|
غراب بو (أحادي) | رمز واحد | لوغاريتم (١) = ٠ |
عملة واحدة (ثنائية) | رمزان متساويان في احتمال الوقوع | لوغاريتم (٢) = ١ |
عملتان | أربعة رموز متساوية في احتمال الوقوع | لوغاريتم (٤) = ٢ |
قطعة نرد واحدة | ستة رموز متساوية في احتمال الوقوع | لوغاريتم (٦) = ٢٫٥٨ |
ثلاث عملات | ثمانية رموز متساوية في احتمال الوقوع | لوغاريتم (٨) = ٣ |
تتمثل الفكرة الأساسية في أن المعلومات يمكن حسابها كميًّا في إطار انخفاض عجز البيانات (مفهوم «عدم اليقين» لشانون). تصدر عملة واحدة وحدة معلومات واحدة، وتصدر عملتان وحدتَي معلومات، وتصدر ثلاث عملات ثلاث وحدات، وهكذا دواليك. لسوء الحظ، دائمًا ما تكون العملات الحقيقية متحيزة. ولحساب كمية المعلومات التي تصدر عنها في حقيقية الأمر، يجب الاعتماد على معدل تكرار مرات حدوث الرموز في ظل عدد محدد من الرميات، أو على احتماليات حدوثها، في حال كان عدد الرميات لانهائيًّا. مقارنةً بالعملة العادلة، يجب أن يصدر عن العملة المتحيزة ما هو أقل قليلًا من وحدة معلومات واحدة، ولكنها يجب أن تكون أعلى من صفر. لم يصدر الغراب أي معلومات على الإطلاق نظرًا لأن حدوث سلسلة من «لا مزيد» لم تكن «مفيدة معلوماتيًّا» (لم تكن «مدهشة»، باستخدام مصطلح شانون الأكثر بديهية وسيكولوجية)؛ وذلك لأن «احتمال» حدوث «لا مزيد» قد وصل إلى حده الأقصى، ومن ثَمَّ يمكن توقعها. بالمثل، تعتمد كمية المعلومات التي تصدر عن العملة المتحيزة على متوسط «الإفادة المعلوماتية» لحدوث ص أو ك. كلما كانت إحدى النتائج أكثر احتمالية، كلما كُنَّا أقل دهشة عندما نعرف النتيجة، ومن ثَمَّ كانت النتيجة أقل فائدة معلوماتيًّا. وعندما تكون العملة متحيزة للغاية بحيث يصدر عنها دومًا الرمز نفسه، لا تصير العملة مفيدة معلوماتيًّا على الإطلاق، ويصبح تصرُّفها مثل الغراب أو الصبي الذي يصطنع صوت عواء الذئب.
يلعب الأسلوب الكمي الذي جرى عرضه توًّا دورًا أساسيًّا في نظرية الترميز؛ ومن ثَمَّ في علم التشفير، وفي تخزين البيانات وأساليب نقل البيانات. تدور النظرية الرياضية للاتصال بصورة أساسية حول دراسة خصائص قناة اتصال وحول الرموز التي تشفِّر البيانات بكفاءة إلى إشارات قابلة للتسجيل والنقل. هناك مفهومان يلعبان دورًا محوريًّا في تحليل الاتصالات وفي إدارة الذاكرة ما يستأهل بيانهما أكثر؛ ألا وهما: «التكرار» و«الضجيج».
(٢) التكرار والضجيج
في الحياة الواقعية، عملية التشفير الناجحة هي تلك التي لا يحدُث فيها التكرار إلا على نحو بسيط. يشير «التكرار» إلى الفرق بين التمثيل المادي لرسالةٍ ما والتمثيل الرياضي للرسالة نفسها الذي لا يستخدم وحدات بيانات غير ضرورية. تعمل إجراءات «الضغط» — مثل تلك الإجراءات المستخدمة في تقليص الحجم الرقمي للصور الفوتوغرافية — من خلال تقليص تكرار البيانات، إلا أن التكرار ليس بمسألة سيئة على الدوام؛ إذ قد يساعد التكرار على معادلة تأثير «الالتباس» (أي البيانات التي جرى إرسالها ولم يتم تلقِّيها قط)، و«الضجيج». بينما تحتوى رسالة + ضجيج على بيانات أكثر من الرسالة الأصلية، إلا أن الهدف من عملية الاتصال هو «الدقة» — وهي عملية النقل الدقيق للرسالة الأصلية من المرسِل إلى المستقبِل — لا زيادة البيانات. يزداد احتمال إعادة بناء رسالةٍ ما على نحو صحيح في نهاية عملية النقل إذا كان ثَمَّةَ درجةٌ ما من التكرار تحقِّق التوازن مع الضجيج والالتباس الحتميين والمتولِّدين عن عملية الاتصال المادية وبيئة الاتصال. يزيد الضجيج من حرية الطرف المتلقي للبيانات في اختيار رسالة ما، لكنها حرية غير مرغوب فيها وربما يسهم بعض التكرار في الحد منها؛ لهذا السبب يشمل كتيب إرشادات تشغيل سيارة جون تفسيرات لفظية وصورًا (على نحو متكرر قليلًا) لإيصال المعلومات نفسها.
(٣) بعض التداعيات المفهومية للنظرية الرياضية للاتصال
بالنسبة إلى النظرية الرياضية للاتصال، تعتبر المعلومات مجرد اختيار لرمز واحد ضمن مجموعة من الرموز الممكنة؛ ومن ثَمَّ لعلَّ أحد السبل السهلة في فهم كيفية حساب النظرية الرياضية للاتصال للمعلومات كميًّا يتمثل في أخذ عدد من الأسئلة التي يتم الإجابة عنها بنعم أو لا لتحديد ماهية ما يصدر عن مصدر الاتصال. يعتبر سؤال واحدٌ كافيًا لتحديد نتيجة عملية قذف عملة عادلة، وهي التي يصدر عنها من ثَمَّ وحدة معلومات واحدة. رأينا كيف يصدر عن نظام يتألف من عملتين عادلتين أربع نتائج مرتبة: <ص، ص>، <ص، ك>، <ك، ص>، <ك، ك> وهو ما يتطلب من ثَمَّ سؤالين على الأقل، فيما تشتمل كل نتيجة على وحدتَي معلومات، وهكذا. يكشف هذا التحليل عن نقطتين مهمتين:
أولًا: لا تعتبر النظرية الرياضية للاتصال نظريةَ معلومات بالمعنى العادي للكلمة؛ ففي النظرية الرياضية للاتصال تشتمل المعلومات على معنى فني بالكامل. بدايةً، وفق النظرية الرياضية للاتصال، تشتمل إجابتا «نعم» المتساويتان في احتمال الحدوث كمية المعلومات نفسها، بغَضِّ النظر عمَّا إذا كان السؤالان المقابلان للإجابتين هما: «هل البطارية فارغة؟» أو «هل تتزوجينني؟» إذا كُنَّا نعلم أن جهازًا ما يستطيع إرسال هذا الكتاب أو «الموسوعة البريطانية» بأكملها، مع تساوي احتمالات الحدوث؛ فإن تلقي هذا الكتاب أو الموسوعة البريطانية، سينتج عنه أننا سنستقبل في هذه الحالة أو تلك كمياتٍ مختلفة تمامًا من وحدات بايت البيانات، إلا أنه وفق النظرية الرياضية للاتصال لا يعدو ما نستقبله وحدة معلومات واحدة. في الأول من يونيو ١٩٤٤، أذاعت هيئة الإذاعة البريطانية جملةً واحدة من أغنية فيرلين «أغنية الخريف»: «التنهدات الطويلة لكمانات الخريف.» كانت هذه رسالة مشفَّرة تشتمل على أقل من وحدة بيانات واحدة، وهي إجابة «بنعم» عالية الاحتمال على سؤال ما إذا كان يوم الإنزال وشيكًا. ثم أذاعت هيئة الإذاعة البريطانية الجملة الثانية: «أجرح قلبي بطول الملل.» وعلى الرغم من كون هذه الجملة سلسلة أخرى من الحروف التي لا معنى لها تقريبًا، لكنها في المقابل وحدة معلومات أخرى؛ إذ كانت تمثل الإجابة «بنعم» التي طال انتظارها لسؤال ما إذا كان الغزو سيقع في الحال. علمت المخابرات الألمانية بأمر عملية التشفير هذه، فاعترضت هذه الرسائل، بل وأخطرت برلين، غير أن القيادة العليا فشلت في تحذير فيلق الجيش السابع الذي كان متمركزًا في نورماندي. بينما كان لدى هتلر جميع المعلومات وفق معنى شانون في النظرية الرياضية للاتصال، فشل هتلر في فهم (أو الاعتقاد في صحة) الأهمية القصوى لوحدتَي البيانات الصغيرتين هاتين. بالنسبة لنا، لا يجب أن تصيبنا الدهشة عندما نخلص إلى أن الحد الأقصى من المعلومات — وفق المعنى المقصود في النظرية الرياضية للاتصال — يصدر من خلال نص يتوزع فيه كل رمز بالتساوي، بعبارة أخرى: من خلال متتالية عشوائية خالصة. وفق النظرية الرياضية للاتصال، إذا حدث وقام القرد بالضغط على أزرار الآلة الكاتبة بصورة عشوائية فإن ذلك سينجم عنه كمٌّ هائل من المعلومات.
لا تتعلق كلمة معلومات كثيرًا بما تقوله قدر ما تتعلق بما يمكن أن تقوله. تتعامل النظرية الرياضية للاتصال مع نواقل المعلومات، والرموز، والإشارات، لا مع المعلومات نفسها. بمعنى أن المعلومات هي مقياس حريتك في الاختيار عندما تختار رسالة ما.
تتعامل النظرية الرياضية للاتصال مع رسائل تتضمن رموزًا غير مفسَّرة جرى تشفيرها في صورة سلاسل من الإشارات المشكَّلة جيدًا. ولا تزيد هذه عن كونها بيانات تؤلف، لكنها لم تصبح بعدُ معلومات دلالية. من هنا، توصف النظرية الرياضية للاتصال بصورة شائعة باعتبارها دراسة للمعلومات على المستوى «الصرفي». وبما أن أجهزة الكمبيوتر تعتبر أجهزة صرفية، يمكن استخدام النظرية الرياضية للاتصال بنجاح في تكنولوجيات المعلومات والاتصال.
(٤) الإنتروبي والعشوائية
يجب أن تطلق عليها اسم إنتروبي لسببين؛ أولًا: تُستخدَم الوظيفة فعليًّا في مجال الديناميكا الحرارية بالاسم نفسه. ثانيًا: وهو الأكثر أهمية، لا يعرف كثير من الناس ما هو الإنتروبي تحديدًا، وإذا استخدمت كلمة «إنتروبي» في أي مناقشة فستكسب هذا النقاش في كل مرة.
- (أ)
متوسط كمية المعلومات لكل رمز يصدر عن الطرف المُبلِّغ.
- (ب)
أو متوسط الكمية المساوية لعجز البيانات (مفهوم عدم اليقين عند شانون) لدى الطرف المتلقي للبيانات قبل فحص مخرجات الطرف المبلِّغ.
- (جـ)
أو الاحتمالية المعلوماتية المقابلة للمصدر نفسه، بعبارة أخرى: «الإنتروبي المعلوماتي» لها.
قد يشير الإنتروبي إلى (أ) أو (ب) بالتساوي؛ نظرًا لأن الطرف المُبلِّغ — باختياره أبجدية معينة — يخلق تلقائيًّا عجزًا في البيانات (عدم يقين) لدى الطرف المتلقي، وهو العجز الذي يمكن التغلب عليه (حله) بدرجات متعددة عن طريق «الطرف المبلِّغ». تذكر لعبة الأسئلة والأجوبة، إذا استخدمت عملة عادلة واحدة، سأجد نفسي في حالة عجز تتكون من وحدة بيانات واحدة. لا أعلم ما إذا كانت النتيجة صورة أم كتابة، وسأحتاج إلى سؤال واحد لمعرفة ذلك. أما إذا استخدمت عملتين عادلتين فسيتضاعف عجزي؛ إذ سأحتاج إلى سؤالين على الأقل، ولكنك إذا ما استخدمت الغراب، فسيبلغ العجز صفرًا. تعتبر الزجاجة الفارغة (النقطة (ب) عاليه) مقياسًا دقيقًا لقدرتك على ملئها (النقطة (أ) عاليه). بطبيعة الحال، من المنطقي الحديث عن المعلومات باعتبار إمكانية حسابها عن طريق الإنتروبي فقط في حال إذا أمكن تحديد توزيع الاحتمالات.
فيما يتعلق بالنقطة (ﺟ)، تتعامل النظرية الرياضية للاتصال مع المعلومات باعتبارها كمية مادية، مثل الكتلة أو الطاقة، وقد ناقش شانون بالفعل التقارب بين تحليل النظرية للمعلومات وصياغة مفهوم الإنتروبي في الميكانيكا الإحصائية. يرتبط المفهوم المعلوماتي والديناميكا الحرارية للإنتروبي من خلال مفاهيم الاحتمالات و«العشوائية». والعشوائية أفضل من «اللانظام»؛ نظرًا لأن المفهوم الأول مفهوم صرفي، بينما يتضمن المفهوم الثاني قيمة دلالية قوية. بعبارة أخرى: من السهولة بمكان الربط بينه وبين التفسيرات، مثلما كنت أحاول أن أوضح لوالديَّ عندما كنت مراهقًا. يعتبر الإنتروبي مقياسًا لكمية «الاختلاط» في العمليات والنُّظم التي تتضمن طاقة أو معلومات. يمكن أيضًا النظر إلى الإنتروبي باعتباره مؤشرًا على الانعكاسية. إذا لم يكن ثَمَّة تغيير في الإنتروبي، سيعني ذلك أن العملية قابلة لإجرائها عكسيًّا. فمثلًا تحتوي أي رسالة مقسمة تقسيمًا شديدًا ومنظمة تنظيمًا كاملًا على درجة أقل من الإنتروبي أو العشوائية، وهو ما يعني معلومات أقل وفق معنى شانون في النظرية، ومن ثَمَّ تتسبب في عجز بيانات أقل، وهو ما قد يقترب من الصفر (تذكر الغراب). في المقابل، كلما زادت احتمالية عشوائية الرموز في الأبجدية، زادت وحدات المعلومات التي تصدر عن الجهاز. يبلغ الإنتروبي قيمته القصوى في الحالة المتطرفة للتوزيع المنتظم، وهو ما يعني أن كوبًا من الماء فيه مكعب ثلج يحتوي على إنتروبي أقل من كوب الماء بعد ذوبان المكعب، كما يكون الإنتروبي أقل لعملة متحيزة من عملة عادلة. في الديناميكا الحرارية، كلما زاد الإنتروبي، كانت الطاقة المتوافرة أقل (انظر الفصل الخامس)، وهو ما يعني أن الإنتروبي المرتفع يقابله عجز طاقة مرتفع، وهو الأمر نفسه في النظرية الرياضية للاتصال. تقابل القيم الأعلى للإنتروبي الكميات الأعلى من عجز البيانات. ربما كان فون نيومان محقًّا على أي حال.
اكتمل استكشافنا للمفاهيم الكمية للمعلومات. تضع النظرية الرياضية للاتصال الأساس لمنهج رياضي يتناول اتصال ومعالجة بيانات مصوغة جيدًا. وعندما تصبح هذه البيانات ذات معنى، فإنها تشكِّل «محتوًى» دلاليًّا (انظر الفصل الثاني). عندما يكون المحتوى الدلالي صحيحًا أيضًا، يمكن اعتباره معلومات دلالية، وهو المفهوم الأهم بين جميع المفاهيم في هذا الكتاب، وهو ما خصصت له الفصل التالي لمناقشته.