الفصل الخامس
اتخاذ القرار على أساس القيمة
في هذا الفصل، سوف ندرس معالجة القيمة في الحُصين
باعتبارها قطعة الأخيرة من الأحجية قبل بناء نموذج
لعمليات الدوائر العصبية في الحُصين التي تُشكل
الأساس للذاكرة والخيال. كيف إذن ترتبط معالجة
القيمة بأدوار الحُصين في الذاكرة والخيال؟ سوف
يتَّضح هذا في الفصل السادس عندما نتناول نموذج
المُحاكاة والاختيار للحُصين. وكإجابةٍ موجزة
مسبقًا، يقترح النموذج أن شبكة
CA3 تُولِّد
تسلسُلات نشاط متنوعة عن طريق الاستثارة الذاتية
لكل من الأحداث المَعيشة وغير المَعيشة، وأن خلايا
CA1 العصبية
تنتقي تسلسُلات نشاط عالية القيمة فيما بينها حتى
نتمكَّن من اتخاذ خيارات أفضل في المُستقبل. في
إطار هذا النموذج، يُعتبر الحُصين بمنزلة أداة
تُستخدَم للتخطيط للأحداث المُستقبلية لا لمجرد
تذكُّر ما حدث في الماضي. ويستند هذا النموذج إلى
اكتشاف أن منطقة
CA1 في الحُصين
تُعالج إشارات القيمة وتمثلها. سنتناول هذه المسألة
بالتفصيل في هذا الفصل، وبهذا، نقدم نظرةً عامة
موجزة على التعلُّم المُعَزَّز وعلم الأعصاب الخاص
باتخاذ القرار.
القيمة والمنفعة ودالة القيمة
لقد تحقق تقدُّم كبير على مدى السنوات
العشرين الماضية في فهم الأساس العصبي لعملية
اتخاذ القرارات القائمة على القيمة. والافتراض
الرئيس في دراسة هذا الموضوع هو أن البشر
والحيوانات يتَّخذون القرارات من خلال تمثيل
القِيَم للاختيارات المُحتملة. وفي مجال علم
الأعصاب الخاص باتخاذ القرار، تُشير «القيمة»
إلى عائد متوقَّع على المدى البعيد. يوجَد
مفهوم وثيق الصِّلة في الاقتصاد وهو مفهوم
«المنفعة»، الذي يُشير إلى الفائدة أو المتعة
التي يمكن للمرء أن يحصُل عليها من استهلاك
مُنتج أو خدمة. لنفترِض أنك بحاجةٍ إلى هاتف
ذكي، وتُفكر في طرازَين مُحدَّدَين بأسعار
متشابهة: هاتف آي فون من إنتاج شركة آبل وهاتف
سامسونج جالاكسي. سيختلف مقدار الرضا الذاتي
الذي يمكن للمرء الحصول عليه من كلِّ هاتف ذكي
من شخصٍ لآخر. فقد يكون هاتف آي فون أكثر
منفعةً بالنسبة لك من هاتف جالاكسي أو قد يكون
العكس. الأرجح أنك ستشتري الهاتف ذا المنفعة
الأكبر. فالاقتصاد السائد الحالي، أو الاقتصاد
التقليدي المُحدث، يستند إلى افتراضٍ مفادُه أن
الناس (الإنسان الاقتصادي) يتَّخذون خيارات
لتعظيم منفعتهم.
يُشار إلى فكرة القيمة في عِلم الأعصاب الخاص
باتخاذ القرار باسم دالة القيمة في التعلُّم
المُعزَّز، وهو فرع من فروع الذكاء الاصطناعي.
لماذا يُعرف هذا الفرع من الذكاء الاصطناعي ﺑ
«التعلُّم المُعزَّز»؟ يحاول علم الاقتصاد شرح
القضايا والمشاكل الاقتصادية والتنبؤ بها من
خلال افتراض أن المُستهلكين والشركات يحاولون
تعظيم منفعتهم بناءً على معلوماتٍ كاملة وذات
صلة بقراراتهم. في المقابل، يركز التعلم
المُعزَّز على كيف يجد صانع القرار دوالَّ
قيمةٍ دقيقةً واستراتيجيةَ اختيارٍ مثاليةً عند
التفاعُل مع بيئةٍ غير مستقرة ومتغيرة. بعبارة
أخرى، يهتم التعلم المُعزَّز بعملية «تعلُّم»
تقريب دوال القيمة الحقيقية وإيجاد استراتيجية
اختيار مثالية لتعظيم العائدات الطويلة الأجل.
وقد أرسى التعلم المُعزَّز الأساس لعلم الأعصاب
الحديث المعنِي باتخاذ القرار من خلال توفير
الإطار النظري الأساسي لبحث عملية اتخاذ القرار
من منظور علم الأعصاب.
خطأ توقع المكافأة
كيف يعالج الدماغ القيمة ويُمثلها؟ لم يُصبح
هذا الموضوع شائعًا بين علماء الأعصاب حتى
العقد الأول من القرن الحادي والعشرين. أما قبل
ذلك، فكان علماء الأعصاب عادةً ما يتعاملون مع
الدماغ كجهاز حاسوبي، بالتركيز على العمليات
الحاسوبية الكامنة وراء المعالجة الحسِّية
والتحكم في السلوك. كان عدد قليل من علماء
الأعصاب مُهتمِّين بالعملية العصبية التي تقف
وراء اتخاذ القرار بناءً على القيم الذاتية
التي تختلف وفقًا للذوق الشخصي، مثل الاختيار
بين الكابتشينو واللاتيه. بعبارة أخرى، اعتاد
علماء الأعصاب الاهتمام ﺑ «كيفية» معالجة
الدماغ للمعلومات الحسِّية والتحكم في السلوك
بدلًا من الاهتمام ﺑ «أسباب» اختيار الدماغ
سلوكًا بعينِه على سلوكيات أخرى. وقد أدَّى
بحثٌ نظري حول خلايا الدوبامين العصبية، نُشِر
في عام ١٩٩٧، إلى تغييرٍ جذري في هذا
الاتجاه.
1
للحصول على فَهمٍ أوضح لتأثير هذا البحث،
يتعيَّن علينا فهم ماهية نظرية «خطأ توقُّع
المكافأة». كما ذكرنا سابقًا، يتعامل التعلُّم
المُعزَّز مع عملية إيجاد دوال قيمة دقيقة
أثناء التفاعُل مع بيئةٍ غير مُستقرة ومتغيرة.
كيف؟ الوسيلة الأبسط لذلك هي من خلال التجربة
والخطأ؛ إذ تقوم بتحديث دوال قيمك الحالية
(المكافآت المتوقعة) وفقًا لنتائج اختياراتك
(المكافآت الفعلية). ومع تكرار هذه العملية عدة
مرات، ستتقارب دوال قِيَمك الذاتية مع دوالِّ
القيمة الحقيقية.
لنفترِض
أن هناك خمسة مطاعم لتختار من بينها لتناوُل
الغداء. ستكون دوال قيمك لهذه المطاعم (الرضا
الذاتي الذي تستطيع الحصول عليه من كلِّ مطعم)
مُتشابهة في البداية، لكنها ستختلف عما قريب
عندما تزور كل مطعمٍ عدة مراتٍ على مدار فترة
زمنية. ستزيد دالة قِيَمك الخاصة بمطعمٍ مُعين
إذا كانت الوجبة التي يقدمها أفضل مما توقعت،
وعلى العكس من ذلك، ستنخفض دالة قيمك إذا كانت
الوجبة أسوأ. بهذه الطريقة، ومع تكرار زياراتك
لهذه المطاعم، ستُصبح دوال قيمك الخاصة بها
أقرب إلى دوال القيمة الحقيقية. غير أن العالم
ليس ثابتًا. ففي مِثالنا، قد يُعِدُّ مطعم
مُعين قائمةَ طعامٍ جديدة أو يوظف طاهيًا
جديدًا، مما سيجعل دالة القيمة الحالية لديك
تنحرف عن دالة القيمة الحقيقية للمطعم. ومع
ذلك، إذا قمتَ بتحديث دالة قيمك في كل مرةٍ
تزور فيها المطعم، فستواكب دالة قيمك في
النهاية التغييرات وتقترب من دالة القيمة
الحقيقية الجديدة.
كما ترى من هذا المثال، فإن أحد العناصر
الأساسية للتعلُّم المُعزَّز هو الفرق بين
المكافآت الفعلية والمتوقَّعة (خطأ توقُّع
المكافأة). فستزيد دالة القيمة لاختيار مُعين
إذا كانت النتيجة أفضل من دالة القيمة الحالية
(عندما تكون المكافأة الفعلية أفضل من المكافأة
المُتوقعة، فهذا خطأ موجب في توقع المكافأة).
وعلى العكس من ذلك، ستقل دالة قيمك لهذا
الاختيار إذا كانت النتيجة أسوأ من دالة قيمك
الحالية (عندما تكون المكافأة الفعلية أسوأ من
المكافأة المُتوقعة، فهذا خطأ سالب في توقُّع
المكافأة). وبطبيعة الحال، لا تعدَّل دالة
القيمة إذا كانت المكافآت الفعلية والمتوقَّعة
متساوية. وهكذا يمكن للتعلم المُعزَّز تقريب
دوال القيمة الحقيقية في بيئةٍ غير مستقرة
ومتغيرة.
في ورقتهم البحثية التي صدرت عام ١٩٩٧،
بَيَّن وولفرام شولتز وبيتر دايان وريد
مونتاجيو أن الخلايا العصبية الدوبامينية في
الدماغ الأوسط تُقدم معلوماتٍ عن خطأ توقع
المكافأة.
2 تلعب هذه الخلايا العصبية، التي
تمتد إلى مناطق واسعة النطاق من الدماغ،
أدوارًا مهمة في الحركات الإرادية ومعالجة نظام
المكافأة. يرتبط الخلل في الجهاز العصبي
الدوباميني باضطراباتٍ عصبية وعقلية مُتنوعة،
مثل الفصام، ومرض باركنسون، والإدمان. وكما
يمكن أن نتوقَّع من واقع أدوارها في معالجة
نظام المكافأة والإدمان، فإن بعض الخلايا
العصبية الدوبامينية في الدماغ الأوسط ترفع
مستوى نشاطها استجابةً لتوصيل المكافأة
والمُثيرات التي تتنبَّأ بالمكافأة.
3 وقد وسَّع الباحثون نطاق هذا
الاكتشاف من خلال إظهار أن بعض الخلايا العصبية
الدوبامينية في الدماغ الأوسط لا تستجيب سوى
للمكافآت «غير المتوقعة». ويرتبط نشاطها بالفرق
بين المكافآت الفعلية والمتوقعة، وليس
بالمكافأة في حدِّ ذاتها.
يوضح
الشكل (
٥-١) نشاط إطلاق
جهد الفعل لعيِّنةٍ من خلية عصبية دوبامينية تم
تسجيلها من قرد. في المرحلة الأولية، قُدِّمَت
مكافأة (عصير) إلى القرد على نحوٍ متقطع بحيث
لا يمكن التنبُّؤ بوقت تقديم المكافأة. وفقًا
للتقارير السابقة، رفعت هذه الخلية العصبية من
نشاط إطلاق جهد الفعل الخاص بها استجابةً
لتوصيل المكافأة (الصف العلوي). في المرحلة
التالية، كان تقديم المكافأة يَسبقه دائمًا
إشارة صوتية قبل تقديمها بثانيةٍ واحدة بحيث
يمكن توقع وقت توصيل المكافأة جيدًا. في هذه
المرحلة، وعلى نحوٍ مُثير للدهشة، توقفت الخلية
العصبية الدوبامينية عن رفع مستوى نشاطها
استجابةً لتقديم العصير (الصف الأوسط). بعبارة
أخرى، لم تستجِب هذه الخلية الدوبامينية
العصبية لمكافأة مُتوقعة. علاوة على ذلك، عند
إلغاء تقديم العصير بعد الإشارة الصوتية (أيْ
حذف المكافأة المتوقعة)، قللت خلية الدوبامين
العصبية من معدل إطلاقها (الصف السُّفلي).
يمكنك أن ترى بسهولة أن حجم خطأ توقُّع
المكافأة يختلف في الحالات الثلاث. فكان خطأ
توقُّع المكافأة موجبًا عندما قُدِّم العصير
بصورة غير متوقعة (تقديم المكافأة على فتراتٍ
متقطعة بدون مُثير تنبؤي؛ الصف العلوي)، وكان
صفرًا عند تقديم نفس الكمية من العصير كما هو
متوقع (تقديم المكافأة على فترات متقطعة بعد
الإشارة الصوتية؛ الصف الأوسط)، وكان سالبًا
عندما حُذِفَ تقديم العصير بصورةٍ غير متوقعة
(حذف المكافأة بعد الإشارة الصوتية؛ الصف
السُّفلي). أظهرت هذه الدراسة والدراسات
اللاحِقة أن الخلايا العصبية الدوبامينية تزيد
من نشاطها إذا كانت المكافأة الفعلية أكبر من
المُتوقعة، وعلى العكس من ذلك، تُقلل نشاطها
إذا كانت المكافأة الفعلية أقلَّ من المتوقعة.
يبين هذا الاكتشاف بوضوح أن بعض الخلايا
العصبية الدوبامينية في الدماغ الأوسط تستجيب
لخطأ توقُّع المكافأة؛ وهو مُتغير مُهم في
التعلم المُعزَّز.
التمثيل العصبي للقيمة
إن ما تم التوصل إليه، من أن خلايا الدوبامين
العصبية في الدماغ الأوسط تنقل إشارات خطأ
التنبؤ بالمكافأة، يُشير إلى أن الدماغ قد
يُجري تمثيلًا للقيم ويُحدِّثها وفقًا لنتائج
الاختيار الفعلية. والمسألة الحرجة التالية
التي سنُناقشها هي ما إذا كان الدماغ يُمثل
القيمة، وهو عنصر رئيس آخر من عناصر التعلُّم
المُعَزَّز. والإجابة عن هذا السؤال واضحة. فقد
وجدت دراسات لاحِقة إشارات مُرتبطة بالقيمة في
عدة أجزاءٍ مُختلفة من الدماغ لدى الفئران
والقرود والبشر. تُغير الخلايا العصبية في هذه
المناطق من الدماغ نشاطها وفقًا لنوع المكافأة
وكميتها واحتماليتها.
4 ويُوضح الملحق الثاني كيف يُحدِّد
العلماء الخلايا العصبية المُشفِّرة للقيمة من
خلال مثالٍ مُحدد. كشفت هذه الدراسات أن مناطق
واسعة النطاق من الدماغ تُجري تمثيلًا لخطأ
التنبؤ بالمكافأة والقيمة، وهما عنصران
أساسيَّان للتعلُّم المُعزَّز. وأظهرت أيضًا أن
سلوكيات الاختيار لدى الحيوانات والبشر تكون
محسوبة جيدًا بواسطة خوارزميات التعلُّم
المُعزَّز في كثير من المواقف السلوكية.
إن الفكرة الأساسية للتعلم المُعزَّز بديهية
وواضحة. أنت تتخذ خيارات وفقًا لتوقعاتك
وتُحدِّث توقعاتك وفقًا للنتائج الفعلية. سوف
تقترب توقعاتك من النتائج الفعلية مع تكرارك
لهذه العملية، وسوف يتحسن أداؤك بالتبعية. وقد
دفعت نتائج خطأ التنبؤ بالمكافأة وإشارات
القيمة في الدماغ إلى مزيدٍ من الأبحاث حول
الأساس العصبي لاتخاذ القرارات القائمة على
القيمة. ويرتبط هذا المسار البحثي، أو علم
الأعصاب المُتعلق باتخاذ القرار، ارتباطًا
وثيقًا بعلم النفس والاقتصاد والذكاء
الاصطناعي. ويُطلق عليه أيضًا علم الاقتصاد
العصبي؛ لأنه يدرس العمليات العصبية التي تكمن
وراء القرارات الاقتصادية.
الحُصين والقيمة
طالما اعتُبِر الحُصين بِنيةً تمثل الإشارات
الإدراكية، لا سيما الإشارات المكانية، وليس
إشارات القيمة؛ فكان يُعتقد أن المعلومات
المتعلقة بالقيمة تمثَّل في مكانٍ آخر في
الدماغ. تذكَّر دور الحُصين في الذاكرة
التقريرية، دون الإجرائية (انظر الفصل الأول).
تذكَّر أيضًا خلايا المكان ودور الحُصين في
تمثيل التخطيط المكاني للبيئة الخارجية
(الخريطة المعرفية؛ انظر الفصل الثالث). من
المعروف بالطبع أن الخلايا العصبية في الحُصين
تستجيب للمكافأة (مثل الطعام) والعقاب (مثل
الصدمة الكهربائية). غير أن مفهومَي «المكافأة»
و«القيمة» ليسا متطابقَين، على الرغم من
ارتباطهما. فالقيمة هي المنتج النهائي لتحليل
التكلفة والفائدة مع مراعاة نوع المكافأة
ومقدارها واحتماليتها إلى جانب تكلفة الحصول
عليها. ولا تختلِف القيمة عن مفهوم «العائد
المُتوقع» في الاقتصاد والماليات، وهو الربح
الذي يتوقَّعه المستثمر من استثمار مالي. تتفق
استجابات الحُصين للمكافأة مع تمثيل الحُصين
للقيمة، ولكنها قد تُشير فقط إلى دور الحُصين
في تمثيل الأحداث المَعيشة (أي تذكُّر حدث تلقي
مكافأة معينة في بيئة معينة).
ولهذه الأسباب، لم يهتم سوى قلَّة من العلماء
بالبحث في تمثيل القيمة في الحُصين. ومع ذلك،
تُشير مجموعة متزايدة من النتائج إلى أن
الحُصين هو واحد من بين مناطق عديدة من الدماغ
تدخل في تمثيل القيمة. حتى الآن، تعرَّف
الباحثون على إشارات القيمة في الحُصين لدى
الجرذان والقرود والبشر.
5 وفيما يلي، سوف أُلخِّص سلسلةً من
النتائج التي توصَّلتُ إليها باستخدام الجرذان
في مُختبري، والتي أشارت إلى تمثيل الحُصين
للقيمة وإسهامه في عملية اتخاذ القرار القائمة
على القيمة. ركَّز مُختبري، مثل كثيرٍ من
المختبرات الأخرى، على القشرة الجبهية والعقد
القاعدية في الاستكشاف الأوَّلي لمعالجة القيمة
في الدماغ؛ لأنها أهداف لمسارات الخلايا
العصبية للدوبامين وتُساهم بقوة في السلوك
الموجَّه نحوَ المكافأة. وكان أحد الاستنتاجات
الواضحة لهذا المسعى هو أن معالجة القيمة وظيفة
مُنتشرة في أجزاء الدماغ؛ إذ وجدنا خلايا عصبية
تستجيب للقيمة في مناطق واسعة النطاق من دماغ
الجرذان.
6
أشارت الدراسات التي أُجرِيَت على القرود
والبشَر أيضًا إلى أن مناطق واسعة النطاق من
الدماغ تتدخَّل في معالجة القيمة.
7 وهذا يُشير إلى أن تمثيل القيمة
وظيفة محفوظة للدماغ على مدار عملية التطوُّر.
وغالبًا ما تؤدَّى نفس الوظيفة بواسطة كثيرٍ من
مناطق الدماغ وأحيانًا في جميع أنحاء الجسم.
على سبيل المثال، تُوجَد ساعة بيولوجية في كل
خلايا أجسامنا تقريبًا، على الرغم من أن ساعة
رئيسة واحدة قد تكون كافية للتحكُّم في
إيقاعاتنا اليومية.
8 إن التطوُّر بمنزلة عملية إصلاح
(تعديل وتحسين نظام موجود بالفعل)، وليس اختراع
نظام جديد بالكامل من الصفر. ولذلك، فمن
المُرجَّح أن تكون الوظائف المدعومة احتياطيًّا
بِبِنًى أخرى، مُتجذرة بعمق في عملية التطور.
وكقاعدة عامة، كلما كانت وظيفة مُعينة مدعومة
احتياطيًّا ببِنًى أخرى، زادت احتمالية ضرورتها
للبقاء والتكاثر. إن تمثيل قِيَم الاختيارات
المُحتملة واتخاذ الخيارات المُثلى بناءً عليها
أمر بالغ الأهمية للبقاء والتكاثر. ولذلك قد لا
يكون من المُستغرَب أن نجد إشارات القيمة في
سائر أجزاء الدماغ.
عندما وجدنا الخلايا العصبية المُستجيبة
للقيمة في مناطق مختلفة من الدماغ، تملكَنا
الفضول بشأن إمكانية تمثيل القيمة في الحُصين.
فنظرًا لكون الحُصين بنيةً قديمة من الناحية
التطورية، ولأن اتخاذ القرارات القائمة على
القيمة أمر بالغ الأهمية للبقاء، فقد اعتقدنا
أن الحُصين قد يلعب دورًا أيضًا في معالجة
القيمة. وقد بحث هيونجونج لي، الذي كان طالِبَ
دراساتٍ عليا آنذاك، في هذه المسألة عن طريق
زرع أقطاب كهربائية دقيقة في حُصين جرذ.
تمثيل القيمة في شبكة
CA1
بالأخذ في الاعتبار الرأي التقليدي القائل
بأن الحُصين مُتخصص في تمثيل الإشارات المكانية
والمعرفية، فقد اعتقدنا في البداية أن إشارات
القيمة في الحُصين، إن كانت موجودة، ستكون أقوى
في بِنى المُخرجات في الحُصين وليس في الحُصين
نفسه. ولذلك قررنا فحص النشاط العصبي في شبكة
CA1، وهي
المرحلة النهائية من الدائرة الثلاثية المشبك،
ومرفد الحصين، الذي ينقل مخرجات
CA1 إلى
مناطق قشرية أخرى (انظر الشكل
٤-١). كان توقُّعنا الحذِر هو
أن إشارات القيمة سوف تُوجَد في مِرْفَد
الحصين، وليس في شبكة
CA1؛ أو
إذا كانت كلتا المنطقتَين تنقلان إشارات
القيمة، فإن الإشارات سوف تكون أقوى في مِرْفَد
الحصين عنها في شبكة
CA1. وتبين
أن هذا التوقُّع خاطئ.
درب هيونجونج الجرذان العطشى على الاختيار
بين هدفَين يُقدِّمان الماء كمكافأة باحتمالات
مختلفة. ولم تكن احتمالات المكافأة ثابتة،
ولكنها تغيَّرت على نحوٍ غير مُتوقَّع بمرور
الوقت. ومن ثَمَّ، كان على الجرذان أن تُقرر أي
هدف تختار في بيئة متغيرة وغير مُستقرة.
ولزيادة تناول الماء في هذه الظروف لأقصى حد،
كان على الجرذان أن تحسب احتمالات المكافأة
للهدفَين (قيم الاختيارَين المُستهدفَين) على
أساس تاريخ الاختيارات السابقة ونتائجها وتوزيع
اختياراتها على هدفين مع مراعاة قيمهما النسبية
(أي احتمالات المكافأة). ويعبِّر التعلم
المُعزَّز على نحوٍ جيد عن هذه العملية.
والواقع أن سلوك الاختيار لدى الجرذان في هذه
المهمة كان متوقعًا على نحوٍ جيد من خلال نموذج
بسيط للتعلم المُعَزَّز، ممَّا يُشير إلى أن
الجرذان قدرت وحدَّثت القيم للهدفين على أساس
تاريخ الاختيارات السابقة ونتائجها. وقد قدَّر
هيونجونج القِيَم لكلٍّ من الهدفَين من خلال
تجربة تلوَ الأخرى باستخدام نموذج للتعلم
المُعزَّز واختبر ما إذا كانت هناك خلايا عصبية
ارتبط نشاطها خلال تجربة تلوَ الأخرى بالقيمة.
انظر الملحق الثاني لشرحٍ أكثر تفصيلًا للإجراء
الخاص بالعثور على الخلايا العصبية المشفِّرة
للقيمة.
كانت مفاجأة لنا أن وجدنا إشارات قيمة قوية
في منطقة شبكة
CA1، وليس
في مرفد الحصين.
9 فقد كانت نسبة كبيرة من الخلايا
العصبية في شبكة
CA1، ونسبة
صغيرة فقط من الخلايا العصبية في منطقة مِرْفَد
الحُصين، تستجيب للقيمة (موضح في الملحق الثاني
نموذج للخلايا العصبية المُشفِّرة للقيمة في
شبكة
CA1).
فوجئنا بذلك، ولكننا في الوقت نفسه كنا
متحمِّسين لهذه النتيجة غير المتوقعة. فاللحظة
المُحيرة والمثيرة في الوقت نفسه بالنسبة
للعالِم تحدُث عندما يكون أمام نتيجة غير
متوقعة. لقد بدأتُ مسيرتي المهنية في علم
الأعصاب في عام ١٩٨٦ طالبًا للدراسات العُليا
في جامعة كاليفورنيا في إيرفين. وكنتُ قد أطلتُ
التفكير في العمليات التي تحدث في الدوائر
العصبية والتي تشكل الأساس لوظائف الحُصين،
ولكنني لم أستطع التوصُّل إلى إجابة مُرضِية،
وخاصة فيما يتصل بدور شبكة
CA1 في عمل
الحُصين. ولكن هذه النتيجة غير المتوقعة — أن
شبكة
CA1 تمثل
إشاراتٍ قيمة قوية — كانت إنجازًا؛ فقد تمكنَّا
من ابتكار نموذج جديد للحُصين، أعتقد أنه
يجسِّد جوهر عمليات الدوائر الحُصينية،
استنادًا إلى هذه النتيجة. وسأشرح هذا النموذج
بالتفصيل في الفصل السادس.
تمثيل القيمة في شبكة
CA3
كانت صدمةً لنا حين اكتشفنا أن شبكة
CA1، وليس
مِرْفَد الحُصين، تمثل إشاراتٍ قيمة قوية.
لماذا يُمثِّل الحُصين إشارات القيمة، وهو
المعروف بأنه مَعنِي في المقام الأول
بالمعلومات المعرفية؟ كيف تتأثر عملية معالجة
الإشارات المعرفية في الحُصين بإشارات القيمة؟
ما دور إشارات القيمة في عمل الحُصين؟ كخطوة
لاستقصاء هذه الأمور، بحَثْنا فيما إذا كانت
شبكة
CA3، التي
تُعَد بِنية المدخلات الرئيسة في شبكة
CA1، تُمثل
أيضًا إشارات قيمة. فقارن سونج-هيون لي، الذي
كان طالب دراساتٍ عُليا آنذاك، إشارات القيمة
لشبكتي
CA3
و
CA1.
10 وكانت النتيجة واضحة. كانت إشارات
القيمة أضعفَ بكثيرٍ في
CA3 مقارنة
ﺑ
CA1. وفي هذه
النتيجة إشارة إلى أن شبكة
CA3 ليست
مصدر إشارات القيمة في شبكة
CA1. كما
أن حقيقة أن إشارات القيمة قوية في شبكة
CA1 ولكنها
ضعيفة في بِنى المدخلات
(
CA3)
والمُخرجات (مِرْفَد الحُصين) الرئيسة تُشير
إلى أن تمثيل القيمة قد يكون سمةً خاصة لشبكة
CA1 بين
المناطق الفرعية الحُصينية.
ماذا لو عُطِّلَت شبكة
CA1؟
النتائج حتى الآن هي نتائج دراسات ارتباطية
تُظهِر أن أنشطة إطلاق جهد الفعل لكثيرٍ من
خلايا CA1
العصبية ترتبط بقِيم هدفَين. وبوجهٍ عام،
تتكامل الدراسات الارتباطية والتدخُّلية فيما
بينها. نُنشِّط جزءًا معينًا من الدماغ أو
نُثبطه ونفحص عواقب ذلك على السلوك في دراسة
تدخُّلية. يُمكننا أن نستنتج ببعض الثقة أن
بِنية دماغية مُعينة تلعب دورًا أساسيًّا في
وظيفةٍ معينة عندما يسفر كل من النهجين
الارتباطي والتدخلي عن نتائج متقاربة. في
حالتنا، ستكون حقيقة أن شبكة
CA1 تُعالج
إشارات القيمة القوية (النهج الارتباطي)، وأن
تعطيل شبكة CA1
يُعطل اتخاذ القرار القائم على القيمة (النهج
التدخلي)، حجةً قوية تُثبت مساهمة شبكة
CA1 في
معالجة القيمة. بالطبع، لا يُسفر النهجان
الارتباطي والتدخلي دائمًا عن نتائج متقاربة.
فعلى الرغم من العثور على إشاراتٍ عصبية قوية
في بِنية الدماغ ترتبط بوظيفة مُعينة، فإن
تعطيلها قد لا يكون له عواقب سلوكية. وهذا
يُعزَى إلى أن وظيفة مُعينة قد تخدمها بِنى
دماغية مُتعددة.
واستنادًا إلى هذه الخلفية، بحَثْنا في
العواقب السلوكية المُترتبة على تعطيل
CA1 لدى
الجرذان. تولى هذا العمل يونجسيوك جونج، الذي
كان آنذاك طالب دراساتٍ عُليا. والواقع أنني
كنتُ مترددًا إلى حدٍّ ما في إجراء هذه
الدراسة. فكما ذكرتُ في وقتٍ سابق، توجَد
إشارات القيمة في مناطق واسعة النطاق من
الدماغ. وعلاوة على ذلك، أشارت دراسات عديدة
إلى أهمية القشرة الجبهية والعُقَد القاعدية في
اتخاذ القرارات القائمة على القيمة. وبناءً على
هذا، بدا أن الحيوانات ذات الحُصين المُعطَّل
قد تعتمِد على هذه الأنظمة العصبية في اتخاذ
القرارات القائمة على القيمة. وعلاوة على ذلك،
أشارت دراسات كثيرة إلى دور الحُصين في التشفير
السريع للذاكرة التقريرية (انظر الفصل الأول)
وليس في التعلُّم التدريجي للقيمة، الذي كان
يُعتقَد أنه يتم بواسطة العقد
القاعدية.
11 ولهذه الأسباب، توقَّعت أن تعطيل
CA1 من
شأنه أن يؤثر بصورةٍ طفيفة جدًّا على سلوك
الاختيار لدى الفئران في المهام التي تتطلَّب
تعديلاتٍ على القِيَم من تجربةٍ إلى تجربة
وفقًا لنتائج التجارب. ومع ذلك، كانت هذه
التجربة ضروريةً لمتابعة النتيجة التي مفادها
أن
CA1 تمثل
إشاراتٍ قيمة قوية. وهذا النوع من الدراسات قد
لا يكون طالب الدراسات العُليا متحمسًا له
كثيرًا. فمن الصعب عمومًا نشر نتيجةٍ سلبية (أي
أن تعطيل
CA1
لا يؤثر على السلوك). في حالتنا، إذا لم نجد أي
تأثيرٍ لتعطيل
CA1 على
سلوك الاختيار لدى الحيوان، فسيكون من الصعب
الجزم بما إذا كان غياب تأثير التعطيل يرجع إلى
إمكانية الاستغناء عن شبكة
CA1 في
اتخاذ القرارات القائمة على القيمة، أم لأن
CA1 لم
تُعطَّل بقدْرٍ كافٍ. ولحُسن الحظ، حتى مع هذا
التحفُّظ، وافق يونجسيوك على إجراء هذه الدراسة
دون كثيرٍ من التردُّد.
وتبيَّن أن توقُّعي كان خاطئًا مرة أخرى. فقد
وجد يونجسيوك أن تعطيل شبكة
CA1 يغير
من سلوك الاختيار لدى الجرذان بحيث تُصبح أقل
نجاحًا في الحصول على الماء.
12 وقد استخدم تقنيةً تُعرَف باسم
«الوراثيات الكيميائية» لتعطيل مناطق فرعية
مختلفة من الحُصين بشكلٍ انتقائي
(
CA1،
CA2،
CA3،
والتلفيف المُسنن)، وفحص سلوك الاختيار لدى
الجرذان.
13 ثم استخدم نموذج التعلُّم
المُعزَّز لدراسة: أي جانبٍ من جوانب اتخاذ
القرار القائم على القيمة قد تأثر. فوجد أن
تعطيل
CA1 يضعف
تعلُّم القيمة؛ فقد تضررت عملية تحديث القيمة
بناءً على نتائج الاختيار (أي تحديث القيمة
بناءً على خطأ التنبُّؤ بالمكافأة) لدى الجرذان
التي عطلت لديها شبكة
CA1. في
المقابل، لم يكن لتعطيل
CA2، أو
CA3، أو
التلفيف المُسنن أي تأثيرٍ يُذكر على سلوك
الاختيار لدى الجرذان. وفوجئتُ مرةً أخرى بهذا
الاكتشاف. في تقديري، كانت فرصة الحصول على
نتيجةٍ إيجابية أقل بكثير من ٥٠ في المائة. وقد
واجهنا بعض المتاعِب في نشْر هذا الاكتشاف في
دورية أكاديمية. ربما كان هذا بسبب الرأي
السائد في هذا المجال منذ فترةٍ طويلة بأن
الحُصين مُهم للتشفير السريع للحقائق والأحداث،
ولكن ليس لتعلُّم القيمة التدريجي.
شبكة CA1:
المُتخصصة في القيمة
دعونا نلخص النتائج التي تم التوصل إليها في
الفئران والجرذان. أولًا: تُمثل شبكة
CA1 إشارات
قيمة قوية، لكن بِنى المدخلات والمخرجات
الرئيسة الخاصة بها، وهي
CA3،
ومِرْفَد الحُصَين، على الترتيب، تُمثل القيم
بشكلٍ ضعيف فقط. ثانيًا: يُضعف تعطيل
CA1 عملية
اتخاذ القرار القائمة على القيمة، لكن تعطيل
التلفيف المُسنن، أو
CA2، أو
CA3 لم يكن
له تأثير كبير على سلوك الاختيار لدى الحيوان.
الرسالة المُستقاة من هذه النتائج واضحة. من
المُرجَّح أن يلعب تمثيل القيمة، باعتباره سمةً
فريدة من نوعِها لشبكة
CA1 بين
المناطق الفرعية للحُصين، دورًا حاسمًا في عمل
شبكة
CA1.
كان الاعتقاد السائد أن الحُصين يُعالج
المعلومات المعرفية، وخاصة المعلومات المكانية.
ومن هذا المنظور، كانت وظيفة
CA1 محيرة؛
لأن أنماط إطلاق الإشارات المكانية مُتشابهة
بين خلايا CA3
وCA1
العصبية. بالطبع، تُوجَد اختلافات دقيقة بين
خصائص خلايا
CA3
وCA1
المكانية، ولكنها بوجهٍ عام متشابهة جدًّا. أما
فيما يتعلق بالتمييز الوظيفي بين
CA3
وCA1، فهل
تُمثل كل من
CA3
وCA1
معلومات مكانية (خرائط معرفية)؟ إذا كان الأمر
كذلك، فلماذا نحتاج إلى كلٍّ من
CA3
وCA1؟ ألا
تكفي CA3
وحدَها لتمثيل المعلومات المكانية الخارجية؟
توجَد نظريات عديدة حول هذه القضية، ولكن من
وجهة نظري، لا أجد أيًّا منها مقنعًا. تقدم
نتائجنا منظورًا جديدًا لهذه القضية الطويلة
الأمد. إن كون منطقة
CA1
مُتخصِّصة في القيمة بين جميع المناطق الفرعية
للحُصين يوفر خيطًا لفهم الدور الوظيفي لشبكة
CA1.
تناولنا حتى الآن قِطَع الأُحجية لفهم كيفية
دعم الشبكة العصبية الحُصينية للذاكرة والخيال.
وفي الفصل السادس، سنُحاول جمعها معًا لنرى
الأحجية كاملة.