التعلُّم
(١) إلى أي مدًى تستطيع الحيوانات أن تتعلم؟
ما الذاكرة؟ ما التعلم؟ يعتمد النهج الأكثر شيوعًا على مقارنة الكائنات الحية «بأنظمة تسجيل»، إذا لجأنا إلى استعارة تقنية كما هو الحال في أغلب الأحيان. وسيكون «التعلم» إذن هو القدرة التي تمتلكها بعض الكائنات الحية على تسجيل معلومات قد تُغيِّر سلوكها المستقبلي. أما «الذاكرة» فستكون مجموعة المعلومات التي يخزنها الجهاز العصبي.
من أجل المقارنة بين قدرات التذكر لدى مختلف الأجناس الحيوانية، يتعين امتلاك جداول لفئات التعلم التي يمكن أن تخضع إليها مختلف الفصائل. وقد تخيل العلماء مثل هذه الجداول وكانت تضم طرق تعلم بسيطة للغاية مثل التعود أو الميل إلى تبديل الاختيارات، وطرق تعلم معقدة إلى حد ما مثل الاشتراط، وطرق تعلم فائقة التعقيد مثل تعلم الدوران حول الهدف أو تعلم القواعد الإدراكية.
(١-١) الأنواع المختلفة للذاكرة
يكمن «التعود» في تعلم عدم الاستجابة من جديد إلى موقف يتكرر بصورة مستمرة، مثل صوت المنبِّه في الصباح، الذي لم يَعُدْ يجعلنا نستيقظ. ولكن ذلك يفترض أن نتذكر خصائص «ما تعودنا عليه». يمكن أن تنطبق هذه الفئة ليس فقط على الإنسان بل أيضًا على غالبية الحيوانات: فهكذا يمكننا تعويد نحلة على البرق أو تعويد دودة أرض على هزات أرضية متكررة. أما «الميل إلى تبديل الاختيارات» فهو أننا عندما نكون في موقف اختيار بين أمرين، إذا اخترنا الأمر الأول ذات مرة فسنميل في المرة التالية إلى اختيار الأمر الثاني (وهو ما يفترض أننا نتذكر الأمر الأول)؛ فإذا دارت الحشرة أو الفأر إلى اليمين في متاهة على شكل حرف تي، فستميل بالأحرى في المرة التالية إلى الدوران إلى اليسار. وإذا وجد الإنسان نفسه أمام مائدة طعام عليها قطع حلوى بالتفاح وبالفراولة وإذا كان قد تناول عدة قطع من الحلوى بالتفاح، فهو سيميل بالأحرى إلى اختيار قطعة حلوى بالفراولة بعد ذلك. أما «الاشتراط» فهو طريقة تعلم منتشرة بصورة كبيرة ونمطية للغاية (مَن لم يسمع عن كلب بافلوف؟) وهي عبارة عن تعلم الجمع بين العامل المثير ورد الفعل؛ على سبيل المثال في حالة كلب بافلوف، فإن الحيوان الذي يعتقد أن تقديم قطعة اللحم مرتبط بصورة منتظمة بعامل مثير جديد مثل صوت آلة الكمان يتعلم أن يفرز لعابًا عندما يسمع صوت الكمان. ويسمح «الاشتراط الإجرائي» بالجمع بطريقة آلية بحتة بين سلوكٍ ما والحصول على مكافأة (مثل قطعة صغيرة من الطعام) أو تفادي عقوبة ما (مثل الصدمة الكهربية). أما «تعلم الدوران حول الهدف» فيكمن في تعلم الابتعاد عن الهدف للعودة إليه لاحقًا، على سبيل المثال، إذا وقف حيوان أمام زجاج شفاف ذي ارتفاع معين يوجد خلفه مكافأة غذائية شهية، فيستطيع أن يتعلم الدوران حول الزجاج. وفيما يتعلق «بتعلم القواعد الإدراكية»، وخلافًا لما يحدث في عملية الاشتراط، فهو يقوم على التعلم بفضل قاعدة عامة بدلًا من التعلم الآلي أو المنهجي عبر محاولات متتالية وعديدة. وعلى سبيل المثال فإن الحمامة التي تنقب عن مفتاح يجعلها تصل إلى غذاء يمكنها أن تقوم بذلك عندما نوفر لها صورة شفافة تعكس مساحة مائية ممتدة أيًّا كان نوعها.
(١-٢) ذاكرة الحيوانات
وتخبرنا هذه النتيجة أيضًا عن تنظيم الذاكرة لدى الجنس البشري. فنحن نعتقد أن ذاكرتنا هي كلٌّ موحَّد ومتناسق، ولكن ذلك غير صحيح على الإطلاق؛ فذاكرتنا «كالفسيفساء» عبارة عن مجموعة من القدرات المتباينة تبدأ من التعود وحتى التعلم الإدراكي الأكثر تعقيدًا. وخلال التطور اكتسب أسلافنا من الحيوانات القدرات المختلفة لذاكرتنا والتي تشبه أوجه الفسيفساء. ونحن نستدعي هذه القدرات وفقًا للمواقف؛ ففي موقف تكرار صوت المنبه في الصباح، نستدعي قدرات التعود. ومن أجل تعلم السباحة نستدعي القدرة على الاشتراط. ومن أجل حلِّ مسألة رياضية نستدعي قدراتنا الإدراكية، وذلك دون أن ندرك أننا نستدعي آليات مختلفة لذاكرتنا الفسيفسائية حسب الموقف. وأخيرًا تُعَدُّ الذاكرة أحدَ مكونات الذكاء الأساسية (انظر الفصل الرابع).
(٢) كيف يمكن للآلات أن تتعلم؟
من الغريب أن نلاحظ أنه حتى يومنا هذا يتعجب الكثير من الأشخاص من قدرة الآلة على التعلم، إلا أن الآلات «المتعلِّمة» توجد منذ خمسين عامًا على الأقل، فكأننا نرفض مسبقًا مَنْحَ الآلات قدرة لم يكن الكثيرون يريدون منحها للحيوانات حتى وقت قريب. وسوف نستكشف لاحقًا الأسباب الممكنة التي تدفعنا إلى الرغبة في إنكار قدرة الآلات على التعلم (انظر الفصل الثاني عشر). وسنحاول الآن أن نقدم بصورة علمية الطريقة التي يمكن بها للآلات أن تُغيِّر من سلوكها وفقًا لتجاربها الماضية. وربما يتطلب هذا العرض مجهودًا من جانب القارئ كي يفهمه، ولكنه سيسمح على الأرجح بإقناعه بأن الآلات تستطيع بالفعل التعلم.
(٢-١) كل تقنية هي دعامة للذاكرة
قبل أن نناقش كيف تستطيع الآلات التعلم عن طريق ما تحفظه، يتعين ذكر الروابط الوثيقة التي تجمع منذ قديم الأزل بين التقنية والذاكرة.
تهدف بعض التقنيات بوضوح إلى الاحتفاظ بالذكريات ونقلها، وتُسمى طرق الاستذكار. ويتسبب كل ظهور جديد لطريقة استذكار في التأثير على نحو عميق على المجتمع: اللغة الشفهية، والفن الجداري، والكتابة المسمارية، ثم الأبجدية والطباعة والبطاقات المثقوبة والفونوجراف والكاميرات السينمائية وذاكرات التخزين الرقمية. واليوم، يمكن تسجيل الملامح المختلفة لحياتنا وتصفحها ومشاركتها أكثر من ذي قبل. فيستطيع كل فرد أن يتذكر وأن يحتفظ بآثار لمساره في الحياة وأن يسلط الضوء على بصماته الخاصة.
(٢-٢) الاستباق والتنبؤ عبر عناصر محفوظة في الذاكرة
ويسمح أيضًا فهم هيكل مسار زمني ما بالاستباق والتنبؤ بالقيم المستقبلية لهذا المسار. وثمة أساليب عدة للتنبؤ بواسطة سلسلة مُسجَّلة مسبقًا. فلنتخيل مثلًا آلة تحاول التنبؤ بمكان هبوط كرة أطلقناها للتوِّ في الهواء. فستحاول الآلة أن تُلائم بين نقاط المكان «أ» (وهو مسار الكرة في بداية حركتها) ونقاط المكان «ب» (موقع الكرة بعد مرور ثانية). وفي الرياضيات هذه إحدى مسائل تحليل الانحدار وهي إعادة تجميع دالة في مجملها عبر بعض النقاط. وبغية حل هذه المسألة، نفترض مسبقًا بعض خصائص هذه الدالة، مثل تعدد الحدود، ونبحث في هذه المجموعة الفرعية عن تلك التي من شأنها أن تقترب بصورة أفضل من النقاط المتوفرة.
يمكن أيضًا اللجوء إلى أساليب غير معيارية وأكثر بساطة وذات فاعلية متساوية في بعض الأحيان. فيعتمد التعلم عبر النماذج الأولية على حفظ كل أمثلة الاتفاق بين مكانَيْ «أ» و«ب» واستخدام الأمثلة الأقرب من السياق ذي الصلة للقيام بتنبؤٍ جديد. وهكذا عند رؤية صورة فُطْرٍ والرغبة في التنبؤ بما إذا كان سامًّا أم لا، فقد يكتفي نظام ما بالمقارنة بين هذه الصورة وكل الصور المرئية السابقة ووصفها ﺑ «سامة» أو «قابلة للأكل» وفقًا لغالبية التصنيفات المرتبطة بالصور الأكثر تشابهًا لهذه الصورة.
ويوفر الذكاء الاصطناعي في هذه الأيام مجموعة هائلة من طرق التعلم، تتناسب كلٌّ منها مع بعض المشكلات دون غيرها، ولكلٍّ منها خصائصها، ويتعين معرفة اختيار الطرق الأكثر تناسبًا وفقًا لنوع التعلم المطلوب تحقيقه أو ترك الآلة تختار بنفسها في بعض الحالات (انظر الفصل الخامس).
بدأ استخدام هذه التقنيات في مجالات تطبيقية متزايدة، تبدأ من التنبؤ بمعناه الدقيق (التنبؤ بأحوال الطقس، والتنبؤ المالي والاقتصادي) وحتى استكشاف قواعد بيانات ضخمة (محركات البحث على شبكة الإنترنت، والتحكم في الجودة في الصناعة، والأبحاث في العلوم العصبية والطب). وقد بدأت أيضًا في الظهور في واجهات الاستخدام في شكل نظم إكمال تلقائي للنص (سواء في الرسائل القصيرة أو واجهات نظام تحديد المواقع العالمي) أو التوصية بمحتويات مرئية وسمعية. وسيزداد في القريب العاجل عدد الأنظمة الاصطناعية التي تتعلم.
(٢-٣) التنبؤ يتيح اتخاذ القرار وفقًا لأهداف يحددها نظام قِيَم
يمكننا إعطاء الآلة بصورة عشوائية إشارة بأن بعض هذه الحالات مرغوب فيها في حين أنه يجب تجنب البعض الآخر (انظر الفصل السادس)؛ أيْ نُزوِّدها بما نسميه نظامَ قِيَم. فيمكننا، على سبيل، المثال أن نشير إلى الروبوت بأنه من غير المستحسن الاصطدام بالحائط، وذلك بالاتفاق معه على أنه ينبغي تجنب المواقف التي تتلقى فيها لاقطات اللمس لديه صدمات عنيفة. وبواسطة قدرات التنبؤ يستطيع حينئذٍ محاولة التصرف بطريقة تسمح بتحقيق هذا الغرض؛ فهو سيستبق القيمة المحتملة لأيِّ حركة في سياق معين اعتمادًا على تجاربه الماضية. وحين يرصد عائقًا على مسافة ما، فسيقوم على سبيل المثال بنصف استدارة لتفادي الاصطدام، فيُظهِر بهذه الطريقة نوعًا من الاستقلالية.
تقوم أنظمة القِيَم بترميز ما تحاول الآلة تحقيقه بصورة ضمنية أو صريحة. فبدلًا من برمجة سلوك الآلة مباشرةً، يكفي ترميز نظام قِيَم. فعلى سبيل المثال، كان كمبيوتر ديب بلو الذي طورتْه شركة آي بي إم والذي هَزَمَ بطلَ العالم في لعبة الشطرنج جاري كاسباروف، يعتمد على نظام تقييم معقد لجودة ترتيب مُعيَّن للعبة، ويقوم هذا النظام على أربعة مبادئ: القيمة الحقيقية لكل قطعة من قطع الشطرنج، وموقعها، ودرجة أمان الملك، والمبادرة في الحركة. وعبر هذا النظام كان يقوم على التوازي بحركات متعددة لكي يختار الأفضل منها (انظر الفصل الرابع).
(٢-٤) الميل إلى الاستقلالية هو عملية عامة للسلالات التقنية
من الجدير بالذكر أن كل شيء في حياتنا اليومية قد يصير شيئًا استثنائيًّا ومستقلًّا؛ فالعملية التي وصفناها الآن هي في الواقع عامة بصورة كبيرة، ويمكن تطبيقُها أيًّا كان نوع التقنية، فكل شيء قادر على الإدراك والعمل في بيئته له وجوده الخاص بطريقة ما، ويمكن أن يصبح استثنائيًّا باستذكار آثار هذه التفاعلات مع الزمن. وعلى مدار تاريخه، سيتسنَّى له عبر تقنيات الذكاء الاصطناعي أن يتنبَّأ ويستبق الأحداث المستقبلية. وإذا أضفنا للشيء نظامَ قِيَم يحدد المواقف التي يجب البحث عنها والتي يجب تجنبها، فيُمكِننا أن نفكر في تزويده بشكل من أشكال الاستقلالية. وسيكون تعقد هذا السلوك المستقل مرتبطًا بصورة أساسية بأداء قدرات التنبؤ لدى الآلة وبنوع نظام القيم الذي تم اختياره.
إن هذا الميل نحو الاستقلالية هو عملية عامة للسلالات التقنية (انظر الفصل السابع عشر). فتكون الأداة في البداية جهازًا بديلًا، ثم تكتسب الكفاية الذاتية من الطاقة، ثم تُزوَّد بعمليات تحكم ذاتي أكثر تعقيدًا لتميل في النهاية إلى الاستقلال التام. فقد حلت المطرقة الآلية المستخدمة في طرق المعادن محل المطرقة اليدوية ثم جاء دور آلة ترقيق المعادن ثم الروبوت. واستُبدل بالدفة المحرك المؤازر (السيرفو) الذي يسمح بتوجيه السفن الكبرى باستخدام قُوَى البخار، وهو الجيل السابق للتوجيه الآلي في سياراتنا. وتُعَدُّ هذه العملية التي تهدف إلى جعل النظام التقني مستقلًّا نتيجة مباشرة لعمليات التجاور والتكامل التي تتسم بها الديناميكيات التقنية (انظر الفصل الأول)، وهي أيضًا بلا شك أحد الميول القوية للأنظمة البيولوجية.
(٢-٥) دراسة التعلم الاصطناعي تسمح بإعادة تفسير مختلف أنواع الذاكرة لدى الحيوانات
- (أ)
التعود والميل إلى تبديل الاختيارات، وهما عمليتان بدائيتان يمكن ملاحظتهما لدى كل الحيوانات تقريبًا، ويتفقان مع نظام قيم متأصل لدى الحيوان مما يسهل المواقف التي يمكن إدراكها على أنها جديدة نسبةً إلى قصة حديثة إلى حد ما. وهذا يرجع إلى إعطاء قيمة أقل للمواقف التي يمكن استباقها بسهولة. ويُعَدُّ بناء نظام اصطناعي يتصرف بهذه الطريقة أمرًا سهلًا نسبيًّا، وتكفي شبكة خلايا عصبية لا تحتوي إلا على بعض العناصر.
- (ب) عمليات الاشتراط الموجودة بالفعل لدى دودة الأرض التي قد تبلغ مستويات هائلة من الإتقان لدى حيوانات أخرى، فهي تتميز بوجود أنظمة قيم عَرَضية مرتبطة بعوامل مثيرة (طعام أو سمات جنسية خاصة، إلخ) وتتميز أيضًا بأنظمة استباق بعيدة المدى إلى حد ما. وقد دُرست أساليب الاشتراط الاصطناعي بصورة جيدة وبُسِطَت رياضيًّا في شكلِ ما نسمِّيه «التعلم عن طريق التعزيز».6 واقتُرحت لوغاريتمات عديدة قادَ بعضُها إلى تفسيرات جديدة حول بنية العُقَد القاعدية (مجموعة موجودة أسفل القشرة في وسط المخ البشري تقريبًا) أو بنية المخيخ (الذي يقع أسفل المخ مباشرةً) وهما جزءان من المخ نعتقد أنهما يشتركان في عمليات التعلم.7، 8
- (جـ)
من أجل القدرة على تعلم الدوران حول الهدف، التي تتسم بها الفقاريات والرخويات رأسيات الأرجل، والتي تكمن في القدرة على الابتعاد عن الهدف لبلوغه في وقت لاحق، يتعين أن تكون الآلة مزودة بنظام استباق متوسط المدى. ويكمن أحد الأساليب في تزويد الآلة بقدرات على المحاكاة الداخلية عن طريق الاستخدام المتكرر لنتائج نظام التنبؤ. ويمكن لبعض برامج لعبة الشطرنج أن تختار أي قطعة تحركها بمحاكاة نتائج هذه الحركة لاحقًا. ويكمن أسلوب آخر في التقييم الدائم لنتائج الاختيارات الماضية مقارنةً بالأهداف المنشودة وتحديث «خريطة» لأفضل الاختيارات الواجب اتباعها في موقف معين. وفي كل الأحوال، فإن هذا النوع من التعلم المتاح حاليًّا للعديد من برامج الذكاء الاصطناعي يتطلب بلا جدال عمليات أكثر تعقيدًا من التعود أو الاشتراط.
- (د)
تعلم القواعد الإدراكية والعامة المستخدمة في غير سياقها، وهو النوع الذي تُجيده فقط الفقاريات ذوات الدم الحار والأخطبوط، والذي يتطلب آليات تنبؤ أكثر تعقيدًا. وتستطيع العديد من لوغاريتمات الذكاء الاصطناعي القيام بهذا النوع من التعلم. ولكن من بين الآليات المعقولة بيولوجيًّا، يبدو أن شبكات الخلايا العصبية المتكررة بصورة كبيرة (التي تضم حلقات التغذية الراجعة بين بعض مخارجها ومداخلها) هي وحدها التي تمتلك قدرات تعميم كافية. أما الهياكل المقابلة لها في عقلنا فهي القشرة الجديدة والحُصين، وهي هياكل جديدة نسبيًّا على مستوى التطور.
رأينا كيف يمكن للأبحاث في الذكاء الاصطناعي أن تبرز قدرات التعلم لدى الحيوانات بصورة غير مسبوقة بالإضافة إلى توفير الأسس لآلات مبتكرة تميل نحو مزيد من الاستقلالية. فهي تسمح بتطوير بداهتنا بالطريقة التي تقود بها بعض الهياكل العصبية إلى بعض أنواع التعلم. وسوف نلاحظ على مدار هذا الكتاب هذه الطبيعة المزدوجة للآلات بصفتها أدوات ونماذج.