الفصل الرابع

إبر في كومة القش

جوجل وغيرها من السماسرة في بازار البِتات

(١) لمُّ الشمل بعد سبعين عامًا

كانت روزالي بولوتسكي تبلغ من العمر عشر سنوات حين لوَّحت بيدها مودعة لابنتَيْ خالتها صوفيا وأوسي في محطة قطار موسكو عام ١٩٣٧. كانت الأختان تهربان من بطش الروس واضطهادهم لتبدآ حياة جديدة، أما أسرة روزالي فقد بقيت في أرض الوطن. كبرت روزالي في موسكو، وعملت معلمة للغة الروسية، ثم تزوجت من نارمان بيركوفيتش، وصارت لها حياة أسرية خاصة بها، وفي عام ١٩٩٠ هاجرت إلى الولايات المتحدة الأمريكية لتستقر مع ابنها ساشا في ماساتشوستس.

لطالما فكرت روزالي وزوجها وابنها في مصير صوفيا وأوسي، فالستار الحديدي قطع بالكلية التواصل بين هؤلاء الأقارب اليهود، وحين رحلت روزالي إلى الولايات المتحدة كانت صلتها بصوفيا وأوسي قد انقطعت لمدة طويلة جدًّا تضاءل معها الأمل في أن تراهما مرة أخرى، وكلما مرت الأعوام قلَّ ما يدعوها إلى التفاؤل في أن تكون ابنتا خالتها ما زالتا على قيد الحياة، ورغم أن جَدَّ ساشا كان يحلم بلقائهما، فإن بحث ساشا في سجلات المهاجرين في إيليس آيلاند وسجلات هيئة الصليب الأحمر الدولية باء بالفشل، ربما لم تتمكن الفتاتان من اجتياز أوروبا وقت الحرب العالمية الثانية كي تتمكنا من الوصول إلى الولايات المتحدة.

ثم أتى يومٌ بحث فيه ابن عم لساشا في جوجل عن الاسم «بولوتسكي»، ووجد خيطًا يبعث الأمل، لقد وجد على موقع إلكتروني يهتم بالأنساب ذِكرًا لشخص يُدعى ميناكر، وهو اسم والد صوفيا وأوسي، وسرعان ما التأم شمل روزالي مع صوفيا وأوسي في ولاية فلوريدا بعد فراق دام ٧٠ سنة. يقول ساشا وهو يتذكر رغبة جده: «كان طيلة حياته يطلب مني أن أفعل شيئًا للعثور عليهما. إن هذا ليشبه السحر.»

أسفر الانفجار الرقمي عن قدر هائل من البيانات المفيدة، ونشرت الإنترنت البياناتِ في جميع أنحاء العالم، ووضعت شبكة المعلومات العالمية تلك البيانات في متناول الملايين من عامة الناس. لكن لا يمكنك الوصول لشيء إذا كنت لا تعرف أين هو، وربما لا يكون لمعظم ذلك المخزون الكبير من المعلومات الرقمية أهمية إن تعذَّر علينا أن نجد وسيلة للعثور عليه. بالنسبة لمعظمنا، فإن وسيلة العثور على أشياء على الويب هي محركات البحث، والبحث تكنولوجيا ثورية عجيبة تحقق الأحلام وتشكل المعرفة الإنسانية، لقد أصبحت أدوات البحث التي تساعدنا على العثور على الإبر في كومة القش الرقمية بمثابة العدسات التي من خلالها ننظر إلى المشهد الرقمي، وتستخدمها الشركات والحكومات لتشويه صورة الواقع لدينا.

(٢) المكتبة والبازار

في البداية كانت الويب مكتبة، فكان مزودو المعلومات — الذين كانوا في معظمهم من الشركات والجامعات التي يمكنها أن تتحمل تكلفة إنشاء مواقع إلكترونية — هم الذين ينشرون المعلومات ليراها الآخرون، وكان متلقو المعلومات — الذين في معظمهم كانوا جهات أخرى في قطاع الأعمال والأوساط الأكاديمية — يتبينون أين يمكنهم الحصول على المعلومات ثم ينزلونها. كان باستطاعتهم أن يعرفوا أين ينظرون؛ لأن أحدهم أرسل إليهم الرابط المنشود مثل mit.edu (موقع معهد ماساتشوستس للتكنولوجيا)، أما عامة الناس فلم يكونوا يستخدمون الإنترنت، بل كانوا يستخدمون خدمات مثل كمبيو سيرف للوصول إلى قواعد بيانات منظمة تتضمن أنواعًا مختلفة من المعلومات.

مقارنة بين الويب ١٫٠ والويب ٢٫٠

بِلُغتنا المعاصرة، يُطلق على المواقع الإلكترونية الحديثة التي يمكن أن يسهم المستخدمون فيها اسم «الويب ٢٫٠»، أما المواقع الإلكترونية الأقدم التي تتسم بقدر أكبر من السلبية فيُطلق عليها الآن اسم «الويب ١٫٠». قد تشبه هذه التسمية أرقام الإصدار التي تُلحق بالبرمجيات، لكن «الويب ٢٫٠» تصف شيئًا أعمق من ذلك وأكثر تعقيدًا، فمواقع الويب ٢٫٠ — مثل فيسبوك وويكيبيديا — تستغل ما يسميه الاقتصاديون «التأثيرات الشبكية»؛ لأن المستخدمين يساهمون بما لديهم من معلومات، ويستفيدون من المعلومات التي يساهم بها غيرهم، وتزداد قيمة هذه المواقع كلما كثر عدد مستخدميها. انظر الموقع http//www.oreillynet.com/lpt/a/6228 لمزيد من التوضيح عن الويب ٢٫٠.

وبينما أخذت الويب تنحو منحاها التجاري بدأت تظهر الأدلة، بما في ذلك «الصفحات التجارية» المطبوعة، وتجد في تلك الأدلة قوائم بأماكن يمكنك زيارتها على الويب للحصول على مختلف المنتجات والخدمات، فإذا كنت تريد شراء سيارة فستنظر في مكان ما، وإذا كنت تبحث عن عمل فستنظر في مكان آخر، وتشبه هذه القوائم الفئات التي كانت تقدمها أمريكا أونلاين وكمبيو سيرف قبل أن يصير باستطاعة المستهلكين الاتصال مباشرة بالإنترنت، كان من يتولى إنشاء تلك القوائم من البشر، وكان المحررون هم من يتولى أمر التصنيف واستبعاد ما يحق استبعاده.

ومنذ منتصف تسعينيات القرن العشرين تغيرت الويب تغيرًا جذريًّا، فأولًا: لم تعد الويب موردًا سلبيًّا للمعلومات، فالمدونات وموقع ويكيبيديا وموقع فيسبوك هي ثمرةُ تعاونِ وتَشَارُكِ الكثيرين، حيث يدلي كل مشارك بما يفيد الآخرين من معلومات، وأصبح إنشاء المواقع الإلكترونية سهلًا، وتكلفته رخيصة، فأصبح بوسع أي فرد عادي، وحتى أصغر المؤسسات والشركات، امتلاك موقع إلكتروني، ونتيجة لذلك فإن مضمون ومدى ترابط الويب آخذان في التغير طوال الوقت.

ثانيًا: لقد عَظُمَ اتساع الويب وافتقارها إلى التنظيم، بحيث صار يتعذر على بشر أن يقسمها إلى فئات محددة بدقة. إن صفحات الويب لا تصلح للتنظيم في بنية متناسقة ليصير عندنا مخطط تفصيلي لها. ليست هناك خطة رئيسية للويب، فكل يوم تضاف أعداد كبيرة من صفحات الويب وبطريقة غير منظمة تمامًا، ولا يمكنك أن تعلم علم اليقين ما الذي تحتويه صفحة ويب بمجرد النظر في عنوان رابطها.

علاوة على ذلك، لن يسعفك التنظيم الهرمي في العثور على معلومات إذا لم تعلم أين موقعها تحديدًا، فنحن لا ندخل إلى الويب للبحث عن صفحة ويب بعينها، بل إن ما نسعى إليه هو المعلومات، ويسرنا أن نجدها أينما كانت. في كثير من الأحيان لا يمكنك حتى أن تخمن أين عساك أن تبحث عما تريد، وتجد أن وجود تنظيم هيكلي مرتب وأنيق للمعلومات لن يثمر شيئًا. على سبيل المثال، إن كان هناك تنظيم جيد للمعرفة الإنسانية في شكل موسوعة، فستجد بها قسمًا يتكلم عن الأبقار، وستجد قسمًا آخر يتكلم عن القمر، لكن إذا كنت لا تعرف أن هناك أنشودة للأطفال عن بقرة تقفز فوق سطح القمر، فإن ما تذكره تلك الموسوعة عن «البقرة» وما تذكره عن «القمر» لن يسعفك في فهم ماذا عساها تلك البقرة أن تكون قد فعلتْ على القمر، لكن إذا أدخلت الكلمتيْن «بقرة» و«قمر» معًا في محرك بحث، فستجد المعلومة التي تريدها في غمضة عين.

لقد صار البحث هو النموذج الجديد المتبع في العثور على المعلومات، وليس فقط على الشبكة ككل. فإذا زرت الموقع الإلكتروني لوول مارت فيمكنك تتبع التنظيم الهرمي الذي يوفره على صفحاته، في المستوى الأعلى تجد نفسك تختار بين عناوين منها «إكسسوارات»، «أطفالي»، «أولادي»، «بناتي»، وهلم جرًّا، فإن نقرت على الرابط «أطفالي» ظهرت أمامك صفحة أخرى بها اختيارات «أولاد رضع» و«دارِجات» وهلم جرًّا. كما أن هناك نافذة بحث في الجزء العلوي من الصفحة. أدخل ما تريد البحث عنه، وسرعان ما تنتقل مباشرة إلى ما كنت تبحث عنه، لكن داخل موقع وول مارت، ومحركات البحث المحدودة هذه تساعدنا في تبادل الصور وقراءة الصحف وشراء الكتب على الإنترنت من موقع أمازون أو بارنز آند نوبل، وحتى العثور على بريد إلكتروني قديم على أجهزة الكمبيوتر المحمولة.

يتيح لنا البحث العثور على ما نريد في الأرشيفات الرقمية الكبيرة؛ لكن البحث هو أكثر من مجرد عملية تنقيب في مكتبة رقمية، فالبحث هو شكل جديد من أشكال السيطرة على المعلومات.
أدوات استرجاع المعلومات مثل جوجل تنصبغ الآن بالصبغة الديمقراطية بصورة مذهلة، فروزالي وساشا بيركوفيتش لم يحتاجا إلى استئجار أحد محترفي العثور على الأشخاص لتحقيق أمنيتهما، لكن مَنْح المستخدمين هذه القوة ليس الثمرة الوحيدة للبحث، فقد مَنَحْنا محركاتِ البحث سيطرةً على الأماكن التي يمكننا الحصول منها على معلومات موثوق بها، وهو نفس التحكم الذي كنا من قبل نمنحه لمصادر موثوقة مثل الموسوعات و«صحف السجلات». وإذا وضعنا ثقة مطلقة في محرك البحث للعثور على ما نريد فنحن نمنحه القدرة على أن يجعل عثورنا على ما نريد صعبًا أو مستحيلًا. إنْ ذهبتَ إلى الصين واستخدمت جوجل للبحث عن كلمة ديمقراطية democracy فإن جوجل «سيعثر» لك على معلومات مختلفة جدًّا عن تلك التي «سيعثر» عليها إن كنت تستخدمه في الولايات المتحدة. ابحث عن خطة التقاعد 401(k) على موقع الويب الخاص بجون هانكوك وسيبدو أن هذه الخطة لا وجود لها.

فيما يلي بعض النتائج المثيرة للاهتمام من جوجل لعام ٢٠٠٧: من بين أسئلة «ما هو …؟» كان «الحب» رقم ١، و«النقرس» رقم ١٠، ومن بين أسئلة «كيف …؟» كانت أكثر الأسئلة عن «التقبيل»، وفي المركز العاشر كان «التزلج».

بالنسبة للمستخدم، يعني البحث القدرة على العثور على ما يريد، وبالنسبة لمن يتحكم في محرك البحث يعني البحث القدرة على تحديد ما تراه. البحث أيضًا مصدر قوة من نوع آخر، ونظرًا لأن شركة البحث تسجل كافة كلمات بحثنا فإننا نعطيها القوة المستمدة من معرفة ماذا نريد أن نعرف. في تقريرها السنوي التحليلي لكلمات البحث تسجل جوجل نبض مستخدميها عن طريق الكشف عن أكثر الأسئلة تكرارًا من جانب مستخدمي محرك بحثها، فكان من الطريف أن نعرف أن أكثر الأسئلة التي بدأت ﺑ «من هو …؟» في عام ٢٠٠٧ سألت عن «الله»، وفي المركز العاشر «الشيطان»، بينما احتل عازف الجيتار بَكِت هيدْ المركز السادس. كما أن محركات البحث تجمع معلومات مماثلة عن كل فرد منا على حدة. على سبيل المثال، وكما تناولنا في الفصل الثاني من هذا الكتاب، يستخدم موقع أمازون المعلومات ليقترح علينا بعض الكتب التي قد نرغب في قراءتها وذلك بمجرد استخدامنا لذلك الموقع لفترة قصيرة.

لم تعد الويب مجرد مكتبة، إنها سوق فوضوية لمليارات الأفكار والوقائع التي جمعها معًا تحت سقف واحد الانفجار الرقمي. إن من لديه المعلومة ومن يريدها يسعى كل منهما وراء الآخر، بل ويتبادلان الأدوار، وفي ظل هذا البازار الرقمي الغامض — بكل ما يعج به من حركة وجلبة — تلعب محركات البحث دور الوسيط، ووظيفتها ليست أن تزودك بالحقيقة التي لا مرية فيها، بل ولا هي حتى تحكم على دقة ما يطرحه الآخرون على الشبكة، بل هي همزة وصل بين مَنْ لديه المعلومة ومن يبحث عنها، ولا يتوقف نجاحها أو فشلها على جودة المعلومات التي تقدمها؛ لأن المحتوى الذي تجده عليها لم توجِده هي، بل عثرت عليه، فما هي إلا رابط يربط بينك وبين ما تريد، بل إن نجاحها وفشلها يتوقف على ما إذا كانت توصلنا إلى ما نريد أم لا وليس أكثر. في البازار لا يحوز قصبَ السبق مِنْ هؤلاء الوسطاء مَنْ كان أكثرهم علمًا ومعرفةً؛ بل إن سر بقاء عمل الوسيط ونجاحه يكمن في أن يوفر لمعظم زبائنه وباستمرار ما يريدون طوال الوقت.

إن البحث يفعل أكثر من أن يعثر لنا على ما نريد، فهو يساعدنا كذلك على اكتشافِ أمورٍ لم نكن نعرف أنها موجودة من الأساس، فعن طريق البحث يمكننا أن نتقصى ما نريد ونحن جالسون على أحد كراسي منزلنا، وذلك بأن نجد مفاجآت في الكتاب المجاور للكتاب الذي وقع اختيارنا عليه من رفوف الكتب الرقمية، أو نتشمَّم غبار المعلومات المثيرة التي بعثرها طوفان الانفجار الرقمي هنا وهناك.

(٢-١) السر الدفين على بُعد نقرة واحدة

الفصام مرض رهيب يصيب المخ، ويعاني منه الملايين. وإذا أردت أن تطَّلِع على أحدث العلاجات لهذا المرض فلتحاول العثور على بعض المواقع الإلكترونية وتقرأ المعلومات التي تحتويها.

البعض يعرفون بالفعل أين يمكنهم العثور على المعلومات الطبية الموثوق بها، فقد عثروا على موقع يثقون فيه وأدخلوه في قائمة مواقعهم المفضلة، وذلك على غرار موقع WebMD.com أو DrKoop.com. لكن إذا كنت مثلنا فستلجأ إلى أحد محركات البحث الشهيرة مثل Google.com أو Yahoo.com أو Ask.com، ثم تُدخل ما تريد البحث عنه في خانة البحث، ثم تبدأ في تصفح الروابط التي تظهر لك على الشاشة وقراءتها، بالطبع يجب أن لا تصدق كل ما تقرءه دون تمحيص إن أتاك من مصدر لا تعلم عنه كل شيء، ويجب أن لا تتصرف وفق معلومات طبية حصلت عليها عن طريق تصفح الإنترنت من دون أن تتشاور مع طبيب مختص في ذلك.

بريتني في بازار الإنترنت

إن تقديم ما يريده معظم الناس يوجِد طغيانًا للأغلبية وتحيزًا ضد مصالح الأقلية. عندما بحثنا عن كلمة «سبيرز spears»، على سبيل المثال، كان من بين النتائج التي حصلنا عليها ثلاث صفحات من النتائج عن بريتني سبيرز وشقيقتها، ولم تتضمن تلك الصفحات شيئًا أو شخصًا آخر سوى ثلاثة روابط: رابطٍ لشركة سبيرز للتصنيع، التي تنتج المواسير البلاستيكية، ورابطٍ للممثل الكوميدي أريز سبيرز، ورابطٍ يخص البروفسير ويليام إم سبيرز من جامعة وايومنج، ومن المفارقات أن صفحة هذا الأستاذ الجامعي كان ترتيبها أقل بكثير من موقع «دليل بريتني سبيرز لفيزياء أشباه الموصلات»، وهو موقع يخص بعض علماء الفيزياء الهزليين من جامعة إسكس في المملكة المتحدة. وموقعهم هذا يتمتع برابط مميز، britneyspears.ac، والنطاق الذي ينتهي به هذا الموقع — .ac — ليس اختصارًا لكلمة academic (أي أكاديمي)، وإنما اختصار ﻟ Ascension Island، أي جزيرة أسنسيون (والتي تحصل على مقابل بسيط مقابل استخدام هذا الرابط المنتهي ﺑ .ac أينما استضيف الموقع في أي بقعة من هذا العالم)، ويبدو أن ارتباط هذا الموقع باسم بريتني سبيرز أسهم بقدر ما في علو ترتيبه!
عندما حاولنا البحث عن schizophrenia drugs‎ (أي «أدوية انفصام الشخصية») باستخدام جوجل ظهرت أمامنا النتائج الموضحة في الشكل ٤-١. يخبرنا السطر العلوي أنه إذا لم تَرُقْ لنا هذه النتائج فإن موقع جوجل يسرُّه أن يعرض علينا أكثر من ربع مليون نتيجة غيرها، كما يُعْلِمُنا الموقع بأن بحثه هذا قد استغرق ستة أجزاء من المائة من الثانية، أما نحن فلم نشعر أن كل هذا الوقت قد مَرَّ! وعلى اليمين رأينا ثلاثة «روابط دعائية»؛ وهي روابط لمواقع دفع أصحابها لجوجل مالًا مقابل وضعها في ذلك الموضع، بعبارة أخرى هي إعلانات، وعلى اليسار ظهرت مجموعة متنوعة من الروابط العادية التي أتت بها خوارزميات جوجل لاسترجاع المعلومات، ورأت أنها من المرجح ستفيد الباحث عن معلومات حول «أدوية انفصام الشخصية»، ويطلق على تلك الروابط العادية نتائج محرك البحث «العضوية»، وهي الصورة المقابلة للنتائج الدعائية التي على اليمين.
fig26
شكل ٤-١: نتائج بحثنا في جوجل عن schizophrenia drugs‎ (أي «أدوية انفصام الشخصية»).1
مجرد النظر في الصفحة التي تظهر أمامك يثير سلسلة من التساؤلات المهمة:
  • الويب بحر شاسع، فكيف يمكن لمحرك بحث أن يعثر على تلك النتائج بهذه السرعة؟ هل يعثر على كل رابط مناسب؟

  • ما هو المعيار الذي تتبعه جوجل في ترتيب صفحات الويب فتقول هذه رقم ١ وتلك رقم ٢٨٣٠٠٠؟

  • إذا استخدمت محرك بحث آخر فستحصل على نتائج مختلفة، فأيهما صواب؟ وأيهما أفضل؟ وأيهما أكثر موثوقية؟

  • هل المقصود أن الروابط الدعائية أفضل من الروابط العضوية، أم أسوأ منها؟ وهل الإعلان ضروري حقًّا؟

  • ما مدى رقابة الحكومة على هذا؟ إذا ظلت محطة تليفزيونية تنشر الكذب والأباطيل فإن السلطات ستلاحقها، فهل ستفعل شيئًا تجاه محركات البحث؟

تلك الأسماء المضحكة

هل تعلم أن ياهو YAHOO اختصار لعبارة (منتج آخر هرمي غير رسمي من أوراكل) “Yet Another Hierarchical Officious Oracle” docs.yahoo.com/info/misc/history.html. وهل تعلم أن جوجل GOOGLE هي تحريف لكلمة googol، وتعني رقمًا يتألف من واحد متبوع بمائة صفر؟ لقد كان طموح مؤسسي جوجل عظيمًا!

سنتناول كل سؤال من هذه الأسئلة في وقته، لكن دعونا الآن نواصل مغامرتنا الطبية مع الفصام.

عندما نقرنا أول رابط عضوي ظهرت أمامنا صفحة من موقع إلكتروني يتبع إحدى الجامعات السويدية المرموقة، ووجدنا أن تلك الصفحة تتضمن بعض المعلومات عن أنواع مختلفة من عقاقير انفصام الشخصية، منها عقار يسمى «أولانزابين (زيبريكسا)»، وكان للاسم التجاري لهذا العقار وقعٌ في الأذن فبدأنا نبحث عن كلمة «زيبريكسا».

وكان أول رابط عضوي يظهر أمامنا هو www.zyprexa.com، وهو موقع يصف نفسه بأنه «الموقع الرسمي لعقار أولانزابين زيبريكسا»، وكانت هناك إشارة واضحة بأن من يقوم على الموقع هي شركة إيلي ليلي وشركاه، وهي الشركة المصنِّعة للعقار. كان الموقع يتضمن قدرًا كبيرًا من المعلومات عن العقار، إلى جانب صور لأناس تعلو البسمة وجوههم، على ما يبدو أنهم مرضى يُعْرِبون عن رضاهم عن العقار، ثم هناك شعارات مثل «هناك أمل!» و«نحن نفتح الباب أمام إمكانية العلاج»، وكانت الروابطُ القليلة التي تلت رابط ذلك الموقع في نتائج بحثنا تُشير إلى مواقع تتضمن معلومات طبية وهي drugs.com وrxlist.com وwebmd.com وaskapatient.com.
ثم تلاها رابط أخذنا في اتجاه مختلف ZyprexaKills wiki. يبدو أن هذا العقار كانت له بعض الآثار الجانبية الخطيرة، ويزعم هذا الموقع أن الشركة المصنعة أخفت ولفترة طويلة أن لعقارها آثارًا جانبية خطيرة أبقتها طي الكتمان. في أعلى صفحة نتائج البحث لم يظهر سوى رابط دعائي واحد هو: «دعوى قضائية ضد وصف هذا العقار Zyprexa-olanzapine-lawyer.com. هل تسبب العقار في الإصابة بالتهاب البنكرياس ومرض السكري؟ احصل على المساعدة القانونية اليوم.» وأخذَنا هذا الرابط إلى نموذج ويب حيث عرض علينا محامٍ من هيوستن أن يمثلنا في قضية ضد الشركة المصنعة.
وبعد نقرات يسيرة بالفأرة ظهر أمامنا مستند يحمل العنوان التالي: «أولانزابين والتغييرات في جلوكوز الدم» (انظر الشكل ٤-٢)، وكان هذا المستند مذكرة داخلية تخص الشركة المصنعة، وكان من المفترض أن لا يُنشر على الملأ، وكان يحمل علامة أنه مستند سري مستخدم في دعوى قضائية. كان أحد المرضى الذين استعملوا العقار أصيب بمرض السكري فرفع دعوى قضائية ضد الشركة المصنعة مدعيًا أن العقار هو السبب في إصابته بالسكري، وفي سياق هذه الدعوى حصل محامو المدعي على بعض المستندات السرية التي تخص الشركة ومنها هذا المستند، وذلك بموجب بروتوكول كشف معين، وعن طريق سلسلة من الأعمال غير اللائقة من قبل العديد من المحامين حصل مراسل في صحيفة نيويورك تايمز على تلك المستندات، فسارع المراسل إلى نشرِ مقالٍ يفضح فيه تباطؤ الشركة في الاعتراف بالآثار الجانبية للعقار، وقد ظهرت المستندات نفسها على صفحات عدة مواقع على شبكة الإنترنت.
fig27
شكل ٤-٢: السطران الأول والأخير في مستند في قضية تنظر فيها المحكمة. كان من المفترض أن يكون سريًّا، لكن بما أنه نُشِرَ على الويب فيمكن لأي شخص يبحث عن «مستندات زيبريكسا» أن يجده بسهولة.2

طالبت الشركة بإعادة المستندات وأن تُعدم كل نسخها وأن تلزِم المحكمة المواقع الإلكترونية التي نشرتها بحذفها، ونشبت معركة قانونية. وفي ١٣ فبراير عام ٢٠٠٧ أصدر القاضي جاك بي واينشتاين من المحكمة الجزئية الأمريكية في نيويورك حُكمًا وأمرًا قضائيًّا. نعم، ما جرى لتلك المستندات كان خطأ جسيمًا، ويتعارض مع أوامر المحكمة التي أصدرتها في وقت سابق. لقد تحايل المحامون والصحفي على النظام القانوني، وانطوت فعلتهم على تواطؤ مع محامٍ من ألاسكا ليس له علاقة بهذه القضية، من أجل الحصول على المستندات، وحين صدر الحكم اضطر هؤلاء المحامون الذين تآمروا للحصول على المستندات إلى إعادتها ولم يحتفظوا بأي نسخ منها، وفُرض عليهم أن لا يعطوا أي نسخة إلى أي شخص آخر.

لكن خَلُص القاضي واينشتاين إلى أن أمر المواقع الإلكترونية كان مسألة أخرى، فلم يأمر القاضي المواقع الإلكترونية بحذف نسخ المستندات من على صفحاتها. كان من حق الشركة المصنِّعة استعادة المستندات الورقية، لكن الصورة الإلكترونية لتلك المستندات تسربت ولا سبيل إلى استردادها، وحتى كتابة هذه السطور لا تزال تلك المستندات معروضة على بعض المواقع، وسرعان ما وجدناها عن طريق البحث عن «مستندات زيبريكسا».

لقد مضى ذلك العهد الذي كان فيه بوسع القاضي أن يأمر بإعادة «جميع» نسخ المواد المخالفة. فحتى لو كان هناك مئات من النسخ في خزائن الملفات والأدراج المكتبية كان باستطاعة القاضي أن يصر على إعادتها جميعًا تحت تهديدٍ بفرض عقوبات قاسية، لكن الويب ليست خزينة ملفات وليست دُرج مكتب، وكتب القاضي واينشتاين يقول: «مواقع الويب هي في المقام الأول منابر للتعبير.» وقد طلبت الشركة المصنِّعة من المحكمة أن تصدر أمرًا بمنع المواقع الخمسة التي كانت قد نشرت المستندات، لكن بوسع الملايين من المواقع الأخرى أن تنشر تلك المستندات في المستقبل، وخلص القاضي إلى أن «السعي إلى منع تلك المنابر من نشر المعلومات لن يكون إلا حرثًا في الماء.» وعلى الأرجح لن يجدي نفعًا إصدارُ أمر قضائي أوسع نطاقًا، وحتى لو فعلنا لكان «ينبغي ما أمكن تجنب مخاطر وضع موانع غير محدودة أمام حرية التعبير.»

لقد فهم القاضي خطورة المسألة المطروحة بين يديه. في الأساس، كان مترددًا في استخدام سلطة الحكومة في محاولة غير مجدية لمنع الناس من قول ما يريدون قوله، ومعرفة ما يريدون معرفته، حتى لو كانت مدة عرض تلك المستندات قصيرة فقد يكون عدد غير معروف من نسخها يُتداول سرًّا بين الأطراف المعنية.

وحين بحثنا عن «مستندات زيبريكسا» ظهر رابطان دعائيان، كان أحدهما لمحامٍ آخر يعرض خدماته في الدعاوى القضائية المتعلقة بزيبريكسا والتي تُرفع ضد الشركة المصنِّعة له، أما الآخر فقد ظهر بسبب كلمة «مستندات» التي تضمنها بحثنا، وكان هذا الرابط يتبع جوجل نفسها: «مستندات على الإنترنت. مجانًا وبسهولة يمكنك تبادل المستندات على الإنترنت وتحريرها. تعرَّف على المزيد اليوم من docs.google.com.» وهذا من المفارقات؛ إذ إنه يذكرك بأن البِتات موجودة، وأن الأدوات اللازمة لنشرها موجودة أيضًا، ويمكن لأي شخص استخدامها. بفضل محركات البحث يمكن لأي شخص العثور على ما يريد من معلومات، لقد خرج مارد المعلومات من القمقم الذي طالما حُبس فيه.
في الواقع لقد تغيرت بنية المعرفة الإنسانية نتيجة لظهور هذا البحث الإلكتروني، في غضون عقد واحد فقط تحررنا من القيود التي كانت مفروضة على المعلومات، والتي ظلت تقيدنا منذ فجر التاريخ، وكثير من الذين ينبغي أن يعوا الدرس لم يفعلوا، ففي فبراير عام ٢٠٠٨ حاول أحد قضاة سان فرانسيسكو إغلاق موقع ويكيليكس الشهير الذي يسرب مستندات سرية دون الكشف عن هُوِيَّة من سربها كوسيلة لمساعدة من يريد دق ناقوس الخطر دون أن يتعرض للأذى، فأمر القاضي بحذف اسم «ويكيليكس» من خدمة نظام أسماء النطاقات، ومِنْ ثَمَّ فإن عنوان Wikileaks.org لن يتوافق مع عنوان بروتوكول إنترنت صحيح. (في قلب الإنترنت، تقدم خوادم نظام أسماء النطاقات خدمة ترجمة عناوين المواقع إلى عناوين بروتوكول الإنترنت. انظر الملحق)، وقد أدت الدعاية التي نتجت عن هذه المحاولة الرقابية إلى أنه صار من السهل العثور على العديد من «النظائر»، وهي مواقع مماثلة تقع في مكان آخر على شبكة الإنترنت، وذلك عن طريق البحث عن كلمة «ويكيليكس».

(٣) سقوط نظرية التنظيم الهرمي

منذ عهد بعيد والناس يرتبون أشياءهم عن طريق تصنيفها إلى فئات، ثم يقسمون تلك الفئات إلى فئات فرعية، وقد حاول أرسطو أن يصنف كل شيء؛ فالكائنات الحية على سبيل المثال كانت تُقسَّم إلى نباتات وحيوانات، والحيوانات تُقسَّم إلى ذوات الدم الأحمر وحيوانات ليست كذلك، وذوات الدم الأحمر نوعان حيوانات تلد وحيوانات تبيض، والتي تلد نوعان إما بشر أو ثدييات أخرى، والتي تبيض إما تعوم في الماء أو تطير في الهواء، وهلم جرًّا. لكن شكلت حيوانات الإسفنج والخفافيش والحيتان معضلة في ذلك التصنيف حيرت أرسطو فلم يفصل فيها بقول جازم. ثم في فجر عصر التنوير خرج لينيوس على العالم بطريقة أكثر فائدة لتصنيف الكائنات الحية، وذلك باستخدام أسلوب اكتسب صلاحية علمية ما إن بات يعكس الخطوط التطورية لأصل الأنواع.

إن تاريخنا مع التصنيف الهرمي واضح للعيان في كل مكان، فنحن نعشق الهياكل والتصاميم، فقانون حماية حقوق التأليف والنشر ضد القرصنة (والذي سنتناوله في الفصل السادس من هذا الكتاب) هو القسم الفرعي «أ» من الجزء الأول من الفقرة «أ» في القسم رقم ١٢٠١ من المادة رقم ١٧. في نظام مكتبة الكونجرس الأمريكي تجد كل كتاب ينتمي إلى فئة من ٢٦ فئة رئيسية، تُرقَّم بحرف روماني، وتقسَّم هذه الفئات الرئيسية تقسيمًا داخليًّا بطريقة مشابهة، فمثلًا حرف اﻟ B للفلسفة وحرفا BQ للبوذية.

إذا كانت الفروق بين الفئات واضحة فيمكنك استخدام التسلسل الهرمي للتنظيم لتحديد ما تبحث عنه، وهذا يتطلب أن يكون الشخص الذي يقوم بالبحث ليس فقط على دراية بنظام التصنيف، لكن يجب أيضًا أن يتقن اتخاذ جميع القرارات اللازمة، على سبيل المثال، إذا صُنِّفَت المعرفة البشرية عن الكائنات الحية وفقًا لما جاء به أرسطو، فإن أي شخص يريد أن يعرف شيئًا عن الحيتان يجب أن يعرف مسبقًا ما إذا كان الحوت من الأسماك أم من الثدييات حتى يتسنى له اختيار الفرع المناسب من شجرة التصنيف، وبما أن المعرفة تزداد يومًا بعد يوم، فإن عدد فروع شجرة التصنيف وأغصانها وبراعمها سيزداد باستمرار، وتكبر البراعم لتصير أغصانًا؛ ومِنْ ثَمَّ تتعقد مشكلة التصنيف وتستعصي عملية الاسترجاع حتى تصبح مستحيلة من الناحية العملية.

ولقد بدأ نظام عناوين الويب كأنه شجرة تصنيف، فموقع www.physics.harvard.edu هو خادم ويب يتبع قسم الفيزياء في جامعة هارفرد، وهي مؤسسة تعليمية، لكن مع اتساع رقعة الويب فإن اتباع هذا الأسلوب في نظام أسماء النطاقات صار عديم الفائدة إن أردنا أن نعرف شيئًا لا نملك عنوانه على الويب.

في عام ١٩٩١، حين كان لا يكاد أحد خارج الدوائر الأكاديمية والحكومية يعرف شيئًا عن الإنترنت، عرض بعض الباحثين الأكاديميين برنامجًا أسموه «جوفر»، وكان هذا البرنامج يتضمن دليلًا هرميًّا يشمل الكثير من مواقع الويب عن طريق تنظيم الأدلة التي تقدمها المواقع الإلكترونية في منظومة كبيرة واحدة.

كلمة «جوفر Gopher» أتت أصلًا من التعبير go for (أي «البحث عن») فهو برنامج يعينك على البحث عن المعلومات على شبكة الإنترنت، وكان أيضًا تميمة جامعة مينيسوتا حيث ابتُكر البرنامج.

مقارنةً بمقاييس اليوم فإن العثور على ما تريد باستخدام جوفر كان عملًا مملًّا، وكان يعتمد على المهارات التنظيمية للمساهمين، وفي عام ١٩٩٤ تأسست شركة ياهو كدليل يمكن استخدامه عبر الإنترنت، وحرص القائمون عليه على تصنيف المنتجات والخدمات إلى فئات، كما حرصوا على تقديم التوصيات، وحاولوا بشكل عام جعل الإنترنت في متناول غير التقنيين، ورغم أن ياهو قد أضافت منذ مدة طويلة نافذة بحث فهي لا تزال تحتفظ بوظيفتها الأساسية كدليل إنترنت إلى يومنا هذا.

قبل ستين عامًا خرج علينا مَنْ توقع أن التنظيم الشجري الهرمي سيعاني من القيود، فخلال الحرب العالمية الثانية عيَّن الرئيسُ فرانكلين روزفلت فانيفارَ بوش من معهد ماساتشوستس للتكنولوجيا مديرًا لمكتب البحوث الاستراتيجية والتطوير، وكانت مهمة هذا المكتب تنسيق البحوث العلمية في دعم المجهود الحربي، وكانت مبادرة كبرى وجهدًا عظيمًا؛ إذ عمل به ٣٠ ألف شخص، وتضمن المئات من المشاريع التي تغطي كافة المجالات العلمية والهندسية، ولم يكن مشروع مانهاتن — الذي أنتج القنبلة الذرية — سوى جزء صغير من تلك المبادرة.

من هذا المنطلق رأى فانيفار بوش أن هناك عقبة رئيسية تعترض طريق التقدم العلمي المستمر، فقد كانت وتيرة إنتاج المعلومات أسرع من معدل تلقيها، بل ومعدل تصنيفها. قبل عقود من انتشار أجهزة الكمبيوتر واعتياد الناس عليها كتب فانيفار بوش عن هذه المشكلة في مقالة له بعنوان «وفق ما قد نظن» وكأنه ينظر إلى الغيب من سِتْر رقيق، وظهرت المقالة في مجلة أتلانتيك مَنثلي، وهي مجلة للعامة وليست للمتخصصين، وكان فانيفار بوش يرى أنه:

يبدو أن الصعوبة لا تكمن في الكم الكبير الذي نشرناه على نحو غير ملائم … بل تكمن في أن النشر قد فاق حد قدرتنا الحالية على الاستفادة الحقيقية مما سُجِّل ودُوِّن وطُبِع. إن رقعة خلاصة التجربة الإنسانية تتسع على نحو مذهل، والوسائل التي نستخدمها لتعيننا على الخروج من المتاهة الناجمة عن هذا الاتساع الهائل حتى نصل إلى الأمر المهم في لحظتنا هذه هي نفسها الوسائل التي كنا نستخدمها في الأيام الخوالي … وفشَلُنا هذا يرجع إلى حد كبير إلى التصنُّع الذي يعيب نظم الفهرسة التي نتبعها.

حين كتب فانيفار بوش ذلك كان فجر العصر الرقمي لا يزال بصيص ضوء في الأفق، لكن فانيفار بوش تخيل آلة أطلق عليها اسم «ميمكس» من شأنها أن تزيد من الذاكرة البشرية عن طريق تخزين جميع المعلومات اللازمة واسترجاعها، وأنها ستكون «إضافة كبيرة» لذاكرة الإنسانية وتمكن «الاستعانة بها بسرعة ومرونة فائقتيْن».

لقد رأى فانيفار بوش المشكلة بوضوح، لكن التقنيات التي كانت في عهده من ميكروفيلم وأنابيب مفرغة عجزت عن إيجاد حل لها. لقد أدرك أن مشكلة العثور على المعلومات ستطغى في نهاية المطاف على تقدم العلم في مجال إنشاء المعرفة وتسجيلها. كان فانيفار بوش على علم تام بأن الحضارة نفسها معرضة للخطر في زمن الحرب، لكنه كان يعتقد أن علينا المضي قدمًا ونحن يحدونا الأمل في الخروج بثمرة طيبة من تسجيل معرفتنا الواسعة وتدوينها، وكتب يقول إن الإنسان «قد يموت في الحرب قبل أن يتعلم كيف يُسَخِّر هذا السجل المعرفي ليعود عليه حقًّا بالنفع. لكن ونحن نُسَخِّر العلم لاحتياجات الإنسان ورغباته يبدو أن هناك مرحلة ستكون مؤسفة حقًّا نضطر فيها إلى الاختيار بين إنهاء الأمر برمَّته، وأن نفقد الأمل في الخروج بنتيجة مُرْضِية.»

سابقة مستقبلية

في عام ١٩٣٧ توقع إتش جي ويلز ظهور ما تنبأ به فانيفار بوش في عام ١٩٤٥ من آلة اﻟ «ميميكس»، بل إن ويلز كتب بأسلوب أكثر وضوحًا حول إمكانية فهرسة كل شيء وعن أثر ذلك على الحضارة:

لا يوجد أي عائق عملي الآن لإنشاء فهرس قوي لجميع المعارف البشرية والأفكار والإنجازات لتكون لدينا ذاكرة تشمل كوكبنا كله، وتملكها البشرية جمعاء. ليس مجرد فهرس؛ بل يمكن استدعاء الاستنساخ المباشر من الشيء نفسه إلى أي بقعة معدة جيدًا … هذا في حد ذاته هو حقيقةٌ ذات أهمية كبيرة، فهو ينبئ بتوحيد فكري حقيقي للجنس البشري. يمكن جعل ذاكرة البشرية كلها في متناول كل فرد، ولعل ذلك يتم في وقت قصير … وهذا ليس حلمًا بعيدًا، ولا نسجًا من وحي الخيال.

إن القدرات والإمكانات التي لم يكن أحد يتصورها فيما مضى صارت الآن أمرًا شائعًا، وأجهزة الكمبيوتر الرقمية والقدرة التخزينية الكبيرة والشبكات عالية السرعة كل هذا جعل البحث عن المعلومات واسترجاعها أمرًا لازمًا، وهي كذلك تيسِّر إمكانية حدوث ذلك. إن ظهور الويب تحقيقٌ لحلم فانيفار بوش حول الميمكس، والبحث هو السر الذي جعلها أداة مفيدة.

(٤) من الضروري أن نعرف كيف تعمل

كيف يمكن لمحرك بحث جوجل أو ياهو أن يتلقى سؤالًا لعله لم يُطرح عليه من قبل، ثم في جزء من الثانية يأتي بنتائج بحث من أجهزة كمبيوتر منتشرة في جميع أنحاء العالم؟ إن محرك البحث لا «يبحث» في الشبكة العالمية بأكملها على نطاق واسع ردًّا على سؤالك، وإلا لَمَا تمتع بكل هذا القدر من السرعة، فالبِتات تستغرق أكثر من عُشر ثانية لتطوف جميع أنحاء الأرض بسرعة الضوء، بدلًا من ذلك يكون لدى محرك البحث بالفعل فهرس بالمواقع الموجودة على شبكة الإنترنت، ومحرك البحث يفعل أفضل ما في وسعه للعثور على الإجابة على سؤالك، وبعد ذلك يرسل رده إليك مباشرة.

لتجنب الإيحاء بأن شيئًا ما يميز جوجل أو ياهو دعونا نسمي محرك البحث «الجِنِّي الرقمي». إن الجني الرقمي يستخدم عمليات مختلفة ليوجد وهمًا بأنك تسأله وهو يرد عليك بأجوبة مفيدة. الخطوات الثلاث الأولى لا علاقة لها بسؤالك على وجه التحديد، فهي تتكرر في كل مرة سواء أَطُرح سؤال أم لم يُطرح، وبلغة الكمبيوتر فإن هذه الخطوات تحدث «في الخلفية»:
  • (١)

    جمع المعلومات: يستكشف الجني الرقمي الويب، فيزور العديد من المواقع بانتظام لمعرفة ما تحتويه، ويزور الجني الرقمي الصفحات القديمة مرة أخرى لعل محتوياتها قد تغيرت، ولعلها تحتوي على وصلات إلى صفحات جديدة لم يسبق للجني زيارتها.

  • (٢)

    الاحتفاظ بالنسخ: يحتفظ الجني الرقمي بنسخ من العديد من صفحات الويب التي يزورها، وفي الواقع فإن لدى الجني الرقمي نسخةً مكررةً من جزء كبير من صفحات الويب مخزنة على أجهزة الكمبيوتر الخاصة به.

  • (٣)

    ‎إنشاء فهرس: ينشئ الجني الرقمي فهرسًا ضخمًا يُظهر، على الأقل، الكلماتِ التي تظهر على صفحة الويب هذه وتلك.

وحين تطرح سؤالًا على الجني الرقمي يقوم بتلك الخطوات الثلاث بالإضافة إلى أربع خطوات أخرى، وهذه الأخيرة تجري «في الواجهة»:
  • (٤)
    ‎استيعاب السؤال المطروح: يعيب الإنجليزية أن بها كثيرًا من الغموض، فإن استعلمت عن red sox pitchers (بمعنى رماة فريق ريد سوكس للبيسبول) فالمعنى المراد يصعب فهمه إلا على من نشأ وترعرع في أحضان لعبة البيسبول.
  • (٥)

    ‎تحديد علاقة كل إجابة محتملة بالسؤال المطروح: هل صفحة الويب تحتوي على المعلومات التي يتناولها السؤال المطروح؟

  • (٦)

    ‎تحديد ترتيب النتائج ذات الصلة: مِنْ بين الإجابات ذات الصلة، أيها «الأفضل»؟

  • (٧)

    ‎عرض النتائج: لا يتعين أن تكون النتائج «جيدة» فحسب؛ بل يجب أن تظهر للمستخدم في صورة تفيده، وربما أيضًا في صورة تخدم أغراضًا أخرى للجني الرقمي، مثل بيع المزيد من الإعلانات.

وكل خطوة من هذه الخطوات السبع تنطوي على تحديات تقنية يعشق علماء الكمبيوتر حلها، ويأمل ممولو الجني الرقمي أن ينجح مهندسوهم في إيجاد حل يفوق ما يوفره مهندسو محركات البحث المنافسة من حلول لتلك التحديات.

سنتناول كل خطوة من تلك الخطوات بمزيد من التفصيل؛ لأننا لا بد أن ندرك ما يجري، ففي كل خطوة يزداد الدور الذي تلعبه التكنولوجيا، كما أن كل خطوة تمنح الجني الرقمي فرصًا لاستغلال قدراته في جمع المعلومات وتحريرها بطرق قد لا تتوقعها كمستخدم، طرق تشكل منظورك للعالم عن طريق عدسة نتائج البحث التي يوفرها لك الجني الرقمي.

إن المعالجة التي تجري في الخلفية تشبه التدريبات والبروفات التي تسبق ظهور المسرحية على خشبة المسرح، فلا غنى لأي فرقة مسرحية عن البروفات، لكن لا تتم أي منها أمام الجمهور، وليس لها جدول زمني محدد.

(٤-١) الخطوة الأولى: جمع المعلومات

محركات البحث لا تفهرس كل ما تجده، فمحركات البحث مثل جوجل وياهو وآسك التي نعاملها كمرافق عامة تعثر على المعلومات عثورًا عشوائيًّا في طيات الويب، وهناك محركات بحث تقصر نفسها على مجالات بعينها، على سبيل المثال محرك البحث ميدلاين Medline يقتصر في بحثه على الأدبيات الطبية، ومحرك البحث ArtCylopedia يضم ٢٦٠٠ موقع متخصص في الفن، ومحرك البحث FindLaw LawCrawler لا يبحث في الويب إلا عن المواقع القانونية. في حالة أي محرك بحث، هناك بعض الأمور توجد في فهرسه وأمور أخرى لا توجد فيه؛ وذلك لأن بعض المواقع خلال خطوة جمع البيانات يُزار وبعضها لا، وهناك من يقرر ما يستأهل الحفظ وما لا يستأهله، وإن أُسْقِط شيء أثناء الخطوة الأولى فلا سبيل إلى أن تجده في الخطوة السابعة.

حين ألقى إريك شميت الرئيس التنفيذي لشركة جوجل كلمته أمام الجمعية الوطنية للمُعْلِنين في أكتوبر عام ٢٠٠٥ أوضح أنه من بين ٥٠٠٠ تيرابايت من المعلومات المتاحة في العالم لم يُفهرَس سوى ١٧٠ تيرابايت (علمًا بأن التيرابايت تعادل حوالي تريليون بايت). هذا بالكاد يتجاوز نسبة ٣٪، ومِنْ ثَمَّ فإن نسبة ٩٧٪ من المعلومات المتاحة لم تُفهرَس بعد، وهناك تقديرات تقول إن مقدار ما فُهرس من المعلومات لا يتعدى نسبة ٠٫٠٢٪ من حجم قواعد البيانات والمستندات التي يمكن الوصول إليها عن طريق الويب، وحتى في سياق محدود للشبكة العالمية نجد أن الجني الرقمي يحتاج إلى اتخاذ قرار حول ما الذي ينظر فيه ووتيرة تكرار ذلك، وتحدد هذه القرارات ضمنًا ما هو مهم وما هو دون ذلك، وسوف تحدد ما يمكن لمستخدمي الجني الرقمي العثور عليه.

إن المعدل الذي يزور به الجني الرقمي صفحات الويب حتى يدرجها في فهرسه يعد أحد أسرار مهنة تصميم محركات البحث، لعله يقوم بزيارات يومية لمواقع الأخبار مثل CNN.com، بحيث إذا سأل سائل الليلة عما وقع هذا الصباح كان بوسع الجني الرقمي أن يشير إلى الخبر المنشور على موقع CNN، في الواقع هناك قائمة رئيسية من المواقع التي على الأرجح يزورها الجني الرقمي كثيرًا، مثل whitehouse.gov، وهي مواقع تتغير بانتظام وتكون موضع اهتمام كبير من جمهور المستخدمين. من ناحية أخرى، ربما يعلم الجني الرقمي من زياراته المتكررة أن بعض المواقع لا تتغير على الإطلاق، على سبيل المثال، النسخة الإلكترونية المنشورة على الويب من صحيفة نُشرت قبل عشر سنوات لا تتغير، فبعد زيارات عدة قد يقرر الجني الرقمي أن يزورها مرة واحدة في السنة لاحتمال أن يَجِدَّ جديدٌ، وهناك صفحات أخرى تُعرَض لفترة محدودة لا تكفي على الإطلاق لفهرستها، فإذا قمتَ مثلًا بنشر إعلان على موقع Craigslist.com لبيع سرير من نوع معين فإن إعلانك هذا سيصبح في غضون دقائق معدودة في متناول مَنْ قد يُقبِل على شرائه، فإذا بِيعَ السريرُ بسرعة فلن يتسنى للجني الرقمي أن يراه أبدًا، وحتى لو بقي الإعلان لفترة من الوقت فلعله تمر عدة أيام حتى تعثر عليه معظم محركات البحث.

يتصرف الجني الرقمي بذكاء فيما يتعلق بعدد مرات زيارته لصفحات الويب، لكن براعته في هذا المجال تخضع لقراراتٍ وأولوياتٍ … تخضع لنوع من التحكم، وكلما ازدادت أهمية صفحة الويب في عين الجني الرقمي قلَّ الوقت الذي يستغرقه ظهور محتواها كنتيجة بحث يظهرها الجني الرقمي لمستخدميه.

كيف يستكشف العنكبوت الإلكتروني الويب؟

تجمع محركات البحث المعلومات عن طريق التجول في الشبكة العالمية. على سبيل المثال، عندما يزور العنكبوت الإلكتروني الصفحة الرئيسية لناشر الطبعة الإنجليزية من هذا الكتاب، www.pearson.com، فإنه يحصل على نص فيما يلي جزء منه:
<div id=“subsidiary”>
<h2 class=“hide”>Subsidiary sites links</h2>
<label for=“subsidiarySites” class=“hide”>Available sites</label>
<select name=“subsidiarySites” id=“subsidiarySites” size=“1”>
<option value=“ ”>Browse sites</option>
<optgroup label=“FT Group”>
<option value=“http://www.ftchinese.com/sc/index.jsp”> Chinese.FT.com</option>
<option value=“http://ftd.de/”>FT Deutschland</option>
هذا النص هو في الواقع برنامج كمبيوتر مكتوب بلغة برمجة خاصة تسمى HTML (لغة ترميز النص الفائق). ينفذ متصفح الويب الذي تستخدمه هذا البرنامج الصغير بحيث يجعل منه صفحة ويب تظهر أمامك على الشاشة، لكن العنكبوت الإلكتروني يحصل على هذا النص لا ليجعل منه صفحة ويب بل ليستخدمه في فهرسة ما تحتويه تلك الصفحة من معلومات، أما عبارة FT Deutschland فهي نص يظهر على الشاشة عندما تحول الأكواد إلى صفحة ويب، ومثل هذا النص يفهرَس، ويتعرف العنكبوت الإلكتروني على الروابط الأخرى، مثل www.ftchinese.com أو ftd.de، على أنها روابط لصفحات عليه زيارتها، وأثناء زيارته لتلك الصفحات يُفهرسها وينظر ما إذا كان هناك مزيد من الروابط بها عليه زيارتُها، وهلم جرًّا!

العنكبوت الإلكتروني، أو ما يسمى بزاحف الشبكة، هو نوع خاص من البرامج الآلية يطلق عليه اسم «المكرِّر»؛ وهي برامج تنفِّذ إلى ما لا نهاية بعضَ المهام المتكررة، وغالبًا ما تكون مهام لجمع المعلومات.

يطوف الجني الرقمي أرجاء الويب يجمع المعلومات عن طريق اتباع روابط من صفحات يزورها، والبرنامج الذي يزحف في الويب نسميه في عالم الكمبيوتر «عنكبوتًا إلكترونيًّا»، ونظرًا لأن عملية الزحف وجمع المعلومات هذه تستغرق أيامًا أو حتى أسابيع، فإن الجني الرقمي لن يعلم بحذف صفحةٍ ما من على الويب فور حذفها، ولا يكتشف العنكبوت الإلكتروني أنه جرى حذفها إلا إذا عاد إليها مرة أخرى ولم يجدها، عندها سيحذفها من فهرسه، لكن في الوقت نفسه، قد يرد على عمليات البحث بروابط لصفحات لم تعد موجودة. فإذا نقرت على رابط من هذا النوع فستظهر لك رسالة تقول «لم يتم العثور على الصفحة» أو «لا يمكن العثور على الخادم».

ولأن شبكة الإنترنت غير منظمة فليس هناك أصلًا نظام «صحيح» لزيارة صفحات الويب، وليست هناك طريقة واضحة لمعرفة أين ينتهي ذلك. فقد تحتوي صفحة «أ» على إشارات للصفحة «ب»، وقد تحتوي الصفحة «ب» على إشارات للصفحة «أ»، ومِنْ ثَمَّ فإن العنكبوت الإلكتروني يجب أن يكون حريصًا حتى لا يدور في حلقة مفرغة، ويجب على الجني الرقمي أن ينظم زحفه خلال الشبكة بحيث يزور صفحات الويب بقدر ما يختار دون إضاعة للوقت بإعادة النظر في الأقسام التي زارها بالفعل.

ويمكن لمصمم الموقع أن يقلل من زيارة العناكب الإلكترونية لموقعه أو أن يمنعها من فهرسة أنواع معينة من المعلومات، ويضع مصمم الموقع هذه التعليمات في ملف يسمى robots.txt، وتنصاع تقريبًا جميع برامج الزحف الإلكتروني لما يأمرها به المصمم. وبالطبع فإن الصفحات التي لا يمكن الوصول إليها من دون تسجيل للدخول لا يتناولها هذا الزحف الإلكتروني على الإطلاق؛ لذلك فإن النتائج من الخطوة السابعة قد تتأثر بما تريد المواقع من الجني الرقمي أن يعرفه عنها، كما أنها تتأثر بما يعتقد الجني الرقمي بأنه أمر ذو قيمة. على سبيل المثال لقد حالف ساشا بيركوفيتش الحظ أن نُشرت شجرة عائلة بولوتسكي على جزء من موقع genealogy.com المتاح للجميع، وإلا ما كان بوسع عنكبوت جوجل فهرستها.

وأخيرًا فإن عملية الزحف الإلكتروني ليست مجانية. إن «زيارات» الجني الرقمي هي في الحقيقة طلبات معلومات موجهة للمواقع بغرض أن تعيد هذه المواقع الصفحات إليها مرة أخرى، والزحف الإلكتروني يوجِد حركة مرور على الإنترنت، ويفرض أيضًا عبئًا على خادم الويب. بعبارة أخرى فإن هذا الجزء من المعالجة الخلفية التي تقوم بها محركات البحث له آثار غير مقصودة على تجربة شبكة الإنترنت بالكامل، فالعناكب الإلكترونية تستهلك من النطاق الترددي للشبكة، وقد تعرقل الخوادم وتشل حركتها؛ إذ إنها تُشْغَل من جانبين: فمن جهة تَرُدُّ على طلبات العنكبوت الإلكتروني، ومن جهة أخرى تتعامل مع مستخدميها العاديين الذين يشاهدون صفحاتها، ومِنْ ثَمَّ فإن محركات البحث التجارية تحاول تحديد موعد زحفها على الويب بطرق لا ترهق الخوادم التي تزورها.

(٤-٢) الخطوة الثانية: الاحتفاظ بالنسخ

يقوم الجني الرقمي بتنزيل نسخة من كل صفحة من صفحات الويب يزورها عنكبوته الإلكتروني، وهذا هو ما يعنيه مصطلح «زيارة» الصفحة. فبدلًا من إظهار الصفحة على الشاشة كما يفعل متصفح الويب فإن الجني الرقمي يفهرس تلك الصفحة، وإذا شاء الجني الرقمي فإنه يحتفظ بنسخة منها بعد أن يَفرَغ من فهرستها ويخزنها على أقراصه، ويطلق على هذه النسخة «النسخة المخبأة» cached، وقد استعارتها الإنجليزية من كلمة فرنسية تعني «مخفية»، وعادة ما لا يفعل الجني الرقمي شيئًا بهذه النسخة المخبأة؛ بل سريعًا ما قد تصبح غير ذات نفع. لكن التخزين المؤقت لصفحات الويب يمكِّن الجني الرقمي من أن يكون لديه صفحة لم تعد موجودة في مصدرها الأصلي، أو نسخة من الصفحة القديمة للصفحة الحالية، وهذا هو الجانب الآخر لعدم معرفة الجني الرقمي أبدًا عن صفحة ما قد حذفها صاحبها قبل أن تسنح الفرصة للجني الرقمي أن يفهرسها، فمع وجود الصفحة المخبأة يعلم الجني الرقمي ما كان موجودًا على الصفحة حتى بعد أن يقرر صاحبها حذفها.

التخزين المؤقت هو مِعْوَل آخر يهدم نظرية تشبيه الويب بالمكتبة؛ لأن إزالة المعلومات من رف الكتب لا يعني بالضرورة التخلص منها، بل إن الجهود اللازمة لإزالة المعلومات الخطيرة تتجاوز قدرة من نشرها. على سبيل المثال، بعد أحداث الحادي عشر من سبتمبر حذف قدر كبير من المعلومات التي كانت متوافرة على الويب، ومن بين الصفحات التي اختفت بين عشية وضحاها كانت تقارير عن نقاط الضعف في الحكومة الأمريكية، ومعلومات أمنية حساسة، بل وتقرير من مركز السيطرة على الأمراض حول الإرهاب الكيميائي كان يكشف عن عيوب الصناعة، لكن بسبب أن الصفحات كانت لها نسخ مخبأة، فإن البِتات الخاصة بكل هذا كانت موجودة لدى جوجل وغيرها من شركات محركات البحث.

لم تجعل هذه الصفحات تلك المعلومات الخطيرة تبقى فحسب، بل إن أي شخص يمكن أن يجدها. ففي أي وقت تقوم بعملية بحث عن طريق أحد محركات البحث الرئيسية سيُعرض عليك الاطلاع على النسخة المخبأة، فضلًا عن وصلة الصفحة التي أتت منها بصرف النظر عما إذا كانت موجودة أو لا. انقر على رابط الصفحة «المخبأة» وسترى نسخة تشبه إلى حد كبير ما نراه إذا نقرنا على الرابط الرئيسي، ويمكننا التعرف على النسخة المخبأة على هذا النحو (انظر الشكل ٤-٣).
fig28
شكل ٤-٣: جزء من صفحة ويب مخبأة، وهي نسخة احتفظت بها جوجل لبيان رسمي أدلى به رئيس جامعة هارفرد، وبعد ذلك بيومين استُبدل بآخر بسبب رد فعل الجمهور الغاضب، وقد استُردت هذه النسخة من جوجل بعد أن اختفى البيان من على موقع الويب التابع للجامعة، ورفضت جامعة هارفرد — التي تملك حق نشر هذا البيان الذي لم يُنشر إلا مرة واحدة — السماح بطباعته في هذا الكتاب (انظر الخاتمة).

هذا مثال فعلي، فقد صدر البيان عن لورانس سمرز في ١٧ يناير عام ٢٠٠٥، بعد أن نُشر تصريح له حول النساء في مجال العلم، وكما ورد في مجلة هارفرد في عدد مارس-أبريل عام ٢٠٠٥، فقد بدأ بيانه بقوله: «لقد أُسيئ فهمُ ما صرحتُ به، وظن بعضهم أني أعني أن المرأة تفتقر إلى القدرة على تحقيق النجاح على أعلى المستويات من الرياضيات والعلوم، وأنا لم أقل ذلك، ولا أعتقده.» ونشر هذا الإنكار الذي لا يحمل نبرة الاعتذار وظل كذلك أيامًا، وحين هاجت عاصفة من الاحتجاجات على ذلك أصدر سمرز بيانًا جديدًا في ١٩ يناير عام ٢٠٠٥ يقول فيه: «أشعر بأسف عميق لأثرِ ما صدر مني من تعليقات، وأعتذر لأنني لم أزن كلامي جيدًا قبل أن أتفوه به.» أولئك الذين يبحثون عن البيان الأول كانوا يوجَّهون إلى بيان سمرز الجديد الذي اعتذر فيه صراحة عما بدَرَ منه، لكن لبعض الوقت ظل البيان الأصلي مرئيًّا لمن ينقرون على رابط نسخة جوجل المخبأة.

يمنح الانفجار الرقمي سلطة الاتصال الفوري والتراجع الفوري، لكن تقريبًا كل عمل رقمي يخلف وراءه آثارًا رقمية تدل على الفاعل. فالبِتات لا تنمحي من الوجود بسهولة، والكلمات الرقمية متى خرجت للعالم صَعُبَ التراجع عنها.

العثور على الصفحات المحذوفة

من الطرق السهلة للعثور على صفحات حُذفت أن تبحث باستخدام جوجل عن شيء بِيعَ عن طريق موقع كريج لِسْت. يمكنك استخدام آلية بحث داخل مربع البحث في جوجل تَقْصُر البحث على موقع كريج لِسْت هكذا:

على الأرجح ستظهر أمامك صفحات عن أَسِرَّة بيعت عن طريق الموقع ولم تعد متوافرة، لكن صفحاتها المخبأة لا تزال موجودة.

إذا خزَّن الجني الرقمي نسخة من صفحة ويب فقد يتسنى لك الحصول على معلومات تَراجع عنها أصحابها بعد أن تَبَيَّنَ لهم خطؤها أو أوقعتهم في الحرج، لكن هنا يبدو أنَّ ثَمَّةَ خللًا ما، فهل يحق للجني الرقمي أن يفعل بالمعلومات الموجودة على تلك الصفحات ما يحلو له؟ إذا كانت حقوق التأليف والنشر لمادة منشورة محمية — مثل صحيفة ورقية نُشرت قبل عشر سنوات — فما الذي يمنح الجني الرقمي الحق في أن يعرضها على المستخدمين عن طريق خاصية النسخة المخبأة؟ وفي هذا الشأن، ما الذي منحه الحق في الاحتفاظ بنسخة منها أصلًا؟ إذا كنت تملك مادة محمية بموجب حقوق التأليف والنشر، أفلا تملك سلطة ما على مَنْ يمكنه نسخها؟

هذا اللغز مقدمة مبكرة لحالة الارتباك التي أصابت قانون حقوق التأليف والنشر في العصر الرقمي، وهو أمر سنتناوله في الفصل السادس من هذا الكتاب. ليس بوسع الجني الرقمي أن يفهرس صفحة ويب دون الحصول على نسخة منها. بمعنى حرفي أكثر، في كل مرة «تشاهد» فيها صفحة ويب أو «تزورها» فأنت في الواقع تنسخها، ثم يتولى متصفح الويب الذي تستخدمه تحويلها إلى الصورة التي تظهر أمامك على الشاشة، وهذا دليل آخر على فشل تشبيه الويب بمكتبة، ففي عالم الويب يكون العرض تبادلًا للبِتات، وليس عملًا سلبيًّا. لو كان «نَسْخُ» المواد محمية حقوق التأليف والنشر محظورًا بالكلية لَمَا كان بوسع محركات البحث ولا على الويب نفسها أن تعمل، ومِنْ ثَمَّ فلا بد من إباحة شيء من النَّسْخِ. من ناحية أخرى، عندما يخزن الجني الرقمي نسخة مخبأة من المواد التي يفهرسها — ولعلها تكون كتابًا كاملًا في حالة مشروع كتب جوجل — فإن الخلافات القانونية حول ذلك تشتد إلى حد بعيد، في الواقع، وكما سنتناول الأمر في الفصل السادس من هذا الكتاب، هناك قضية عالقة بين رابطة الناشرين الأمريكيين وشركة جوجل حول ما يُسمح لجوجل بفعله بالصور الرقمية للكتب التي مسحتها مسحًا ضوئيًّا وما لا يُسمح لها به.

(٤-٣) الخطوة الثالثة: إنشاء فهرس

حين بحثنا في الويب عن «زيبريكسا» نظر الجني الرقمي في فهرسه الذي يشبه في بنيته الأساسية فهرس الكتاب المطبوع: قائمة توضح أين يقع باب كذا أو فصل كذا. وتمامًا كما يبين فهرس الكتاب أرقام الصفحات يبين فهرس الجني الرقمي عناوين صفحات الويب. ولمساعدة محرك البحث على الخروج بإجابات أكثر فائدة عن الاستفسارات، قد يسجل الفهرس معلومات أخرى إضافةً إلى هذا، مثل حجم خط المادة وموقع تلك المادة من الصفحة.

الفهارس والفهارس اللفظية

البنية المعلوماتية التي تستخدمها محركات البحث تُعرف تقنيًّا باسم «الفهرس المقلوب»؛ وهو فهرس بالكلمات الموجودة في مستند أو في مجموعة من المستندات وأماكن ظهور تلك الكلمات. والفهرس المقلوب ليس فكرة جديدة، فالفهارس اللفظية التوراتية التي تَعِبَ عليها رهبان العصور الوسطى كانت فهارس مقلوبة، وكان عمل الفهارس من أول تطبيقات تكنولوجيا الكمبيوتر على المشكلات غير الحسابية.

الفهارس أمر في غاية الأهمية؛ لأن وجود فهرس مرتب — مثل فهرس الكتاب، والذي يكون مرتبًا أبجديًّا — يجعل العثور على الأشياء أسرع بكثير من البحث التسلسلي، وهذا هو ما يمنح علماء الكمبيوتر الذين يعملون في شركات محركات البحث أهميتهم ويجعلهم يستحقون رواتبهم؛ إذ إنهم يبتكرون طرقًا ذكية لتخزين المعلومات المفهرسة بحيث يمكن استرجاعها بسرعة. كما لعب قانون مور دورًا كبيرًا في إيجاد فهارس الويب. فقبل أن تصير أجهزة الكمبيوتر بهذه السرعة، وبذلك الرِّخَص، وبكل هذه القدرة التخزينية لم يكن بوسع حتى أذكى علماء الكمبيوتر أن يبرمجها بحيث تردُّ ردًّا فوريًّا على أي استفسار يُطرح عليها بالإنجليزية مهما كان غامضًا.

عندما يريد الجني الرقمي أن يعثر على مصطلح ما فهو لا ينظر في فهرسه من بدايته ويبحث فيه مصطلحًا مصطلحًا إلى أن يعثر على بُغيته في نهاية الأمر، فليست هذه هي الطريقة التي نتبعها في البحث عن شيء ما في فهرس الكتاب؛ بل إننا نستغل حقيقة أن الفهرس مرتب ترتيبًا أبجديًّا. هناك طريقة بسيطة جدًّا للبحث عن شيء ما في فهرس ضخم مرتب، مثل دليل الهاتف، وهي أن نفتح الكتاب في وسطه ثم ننظر هل ما نبحث عنه يقع في النصف الأول من الفهرس أم في نصفه الثاني، ومِنْ ثَمَّ يمكنك تجاهل أحد نصفي دليل الهاتف ثم تستخدم نفس الطريقة لتقسيم النصف المتبقي. إن عدد الخطوات اللازمة للوصول إلى صفحة بعينها في دليل هاتف يبلغ عدد صفحاته «س» باستخدام هذا الأسلوب هو عدد المرات التي تضطر فيها إلى قسمة العدد «س» على ٢ وصولًا إلى القيمة ١ في نهاية المطاف، فإذا كان عدد الصفحات ١٠٠٠ صفحة فسيتطلب الأمر تكرار الخطوات ١٠ مرات، وهذه الطريقة تعرف ﺑ «البحث الثنائي».

بصورة عامة، لا يتناسب البحث الثنائي مع العدد «س» بل مع عدد الأرقام التي يتألف منها العدد «س»، وهذا يعني أن البحث الثنائي أسرع بكثير من البحث الخطي، فالبحث في مؤلَّف يضم مليون عنصر لن يحتاج إلا إلى ٢٠ خطوة، والبحث في مؤلَّف يضم مليار عنصر لن يحتاج إلا إلى ٣٠ خطوة، ويعد البحث الثنائي دون المستوى إلى حد ما بالمقارنة مع ما يفعله الناس على أرض الواقع، فإذا أراد أحدهم أن يبحث في دليل الهاتف عن Ledeen فسيفتح الدليل في وسطه، لكن إذا بحث عن Abelson فسيفتحه قرب أوله، وهذه الطريقة يمكن أن تصاغ في خوارزمية حاسوبية أفضل وأسرع كثيرًا من البحث الثنائي.

كم يبلغ حجم فهرس الجني الرقمي؟ بادئ ذي بدء، كم مصطلحًا يضم فهرسُ الجني الرقمي؟ لا ندري؛ لأن هذا سر آخر من أسرار تلك المهنة. قد يكون فهرس الجني الرقمي مفيدًا إن كنا نتحدث عن بضع عشرات من ملايين العناصر. إن مفردات اللغة الإنجليزية أقل من نصف مليون كلمة، لكن لعل الجني الرقمي يريد على الأرجح أن يفهرس بعض الأرقام أيضًا (حاول البحث عن رقم مثل ٣٢٧ باستخدام محرك البحث الذي تستخدمه). كما أننا بحاجة إلى إدراج أسماء الأعلام، وعلى الأقل بعض الكلمات في اللغات الأخرى. إن قائمة صفحات الويب المرتبطة بمصطلح ما تكون موجودة على القرص في معظم الحالات، أما البيانات الخاصة بمكان المعلومات على القرص المتعلقة بهذا المصطلح نفسه فتخزن في الذاكرة الرئيسية، وحتى لو شغل تخزين المصطلح والموقع على القرص الذي يخص قائمة عناوين المواقع المرتبطة ١٠٠ بايت لكل مصطلح، في ظل وجود ٢٥ مليون مفردة، فهذا يعني أن الفهرس سيشغل مساحة قدرها ٢٫٥ جيجابايت (أي نحو ٢٫٥ مليار بايت) من الذاكرة الرئيسية. قبل بضع سنوات كان مقدار الذاكرة ذاك لا يمكن تصوره، أما اليوم فيمكنك أن تضع كل هذا الكم على جهاز كمبيوتر محمول من وول مارت. يمكن البحث في الفهرس بسرعة، باستخدام البحث الثنائي مثلًا، رغم أن استرداد قائمة عناوين المواقع قد يتطلب الاستعانة بالقرص. إذا كان الجني الرقمي يتمتع بما لدى جوجل من موارد فإنه يمكنه أن يزيد من سرعة رده على استفسارات مستخدميه عن طريق الحفاظ على عناوين المواقع في ذاكرته الرئيسية أيضًا، ويمكنه تقسيم عملية البحث على أكثر من جهاز كمبيوتر ليزيد السرعة أكثر.

أما وقد فرغنا من التحضيرات المطلوبة، يمكننا أن نتناول الأداء نفسه لنرى ما يحدث عندما تسأل الجني الرقمي سؤالًا.

(٤-٤) الخطوة الرابعة: استيعاب السؤال المطروح

حين طرحنا على جوجل عبارة Yankees beat Red Sox وجدنا أن إجابة واحدة فقط من أعلى خمس نتائج تتحدث عن فوز فريق اليانكيز على فريق ريد سوكس (انظر الشكل ٤-٤). أما النتائج الأخرى فقد عكست الأمر، وتحدثت عن فوز فريق ريد سوكس على فريق اليانكيز. فنظرًا للصعوبة التي تجدها أجهزة الكمبيوتر في فهم اللغة الإنجليزية، وكونها في الغالب غامضة بالنسبة لها، فإننا نجد أن أبسط شكل من أشكال تحليل السؤال المطروح يتجاهل بناء الجملة، ويعامل السؤال على أنه مجرد كلمات لا رابط بينها، إن مجرد البحث عن سلسلة من الكلمات في فهرس سهل حسابيًّا، حتى لو أخطأ البحثُ المَعْنَى المقصودَ من السؤال.
لمساعدة المستخدمين على الحد من غموض أسئلتهم فإن محركات البحث تدعم «البحث المتقدم» والذي يتمتع بمزيد من الميزات القوية، لكن أبسط الوسائل المتمثلة في وضع كلمات البحث بين علامات تنصيص لا يستخدمها سوى أقل من ١٠٪ من مستخدمي محركات البحث، فإن وضعنا طلب البحث السابق بين علامتي تنصيص هكذا “Red Sox beat Yankees” فسنحصل على نتائج أكثر ملاءمة. ويمكن استخدام “~” لإخبار جوجل أن يبحث عن المرادفات، أو ”-“ لاستبعاد بعض المصطلحات، أو نعطيه أوامر مثل “allinurl”: أو “inanchor” ليبحث في جزء من الويب. يمكن القول إننا لم نوجه الطلب بطريقة صحيحة، لكن معظمنا لا يهتم، وبشكل عام يكتفي الناس بإدخال الكلمات التي يريدونها ويأخذون الإجابات التي يحصلون عليها.

وغالبًا ما يحصلون على نتائج كثيرة، فإن سألت ياهو عن كلمتي «علاج» و«الحساسية» فستجد أكثر من عشرين مليون نتيجة بحث، أما إذا سألت عن «علاج الحساسية»، أي وضعت الكلمتين معًا بين علامتَيْ تنصيص، فستجد أن نتائج البحث ٦٢٨ ألف فقط، وستجد أيضًا أن أعلى النتائج في هذه الحالة تكون مختلفة تمامًا، وإذا سألت عن «علاج أنواع الحساسية» فستجد أن عدد النتائج سيتقلص إلى ٩٥ ألفًا. لعل الفرق بين هذه الأسئلة ليس مقصودًا، لكن محرك البحث ظن أنها مختلفة اختلافًا جذريًّا. رائع أن يكون التواصل بين الإنسان والكمبيوتر عن طريق عدسات محرك البحث مفيدًا إلى هذه الدرجة، في ظل العيوب الواضحة الموجودة!

fig29
شكل ٤-٤: البحث بالكلمات الدليلية لا يدرك معنى السؤال المطروح باللغة الإنجليزية. معظم نتائج البحث عن Yankees beat Red Sox تدور حول فوز ريد سوكس على يانكيز وليس العكس.1

الأسئلة المطروحة بلغة البشر الطبيعية

تكنولوجيا فهم كلمات البحث آخذة في التحسن. على سبيل المثال إن سألت الموقع التجريبي www.digger.com سؤالًا، وكان سؤالًا غامضًا، تجده يخبرك بذلك، ويساعدك على توضيح ما تبحث عنه، فإذا سألته مثلًا عن «جافا»، فإنه يدرك أنك لعلك تقصد السؤال عن مشروب الجافا أو عن جزيرة جاوة أو عن لغة البرمجة المعروفة، ويساعدك في الحصول على التفسير الصحيح إذا كان تخمينه خاطئًا في المرة الأولى.
أما موقع باورسيت www.powerset.com فيستخدم برمجيات لغة البشر الطبيعية لإزالة اللبس من عمليات البحث وذلك على أساس بناء الجملة في اللغة الإنجليزية، ويجيب بناء على ما تقوله صفحات الويب بالفعل، ومن شأن ذلك أن يحل مشكلة سوء الفهم في عبارة Yankees beat Red Sox.

تَعِدُ البحوثُ الجارية بنقل عبء إزالة اللبس والغموض من عمليات البحث إلى البرمجيات، وهو حق، وذلك بدلًا من إلزام المستخدم أن يلوي طريقة تفكيره لتتواءم مع طريقة تفكير الكمبيوتر. إن قافلة فهم اللغة الطبيعية تسير، لكن ليس من المتوقع أن تصل إلى هدفها المنشود في المستقبل القريب. قد نحتاج إلى زيادة القدرة الحاسوبية مائة ضعف لجعل التحليل الدلالي لصفحات الويب من الدقة بحيث تكف محركات البحث عن الخروج علينا بأجوبة هزيلة حين نطرح عليها أسئلة بسيطة.

واليوم، يميل المستخدمون إلى التسامح مع محركات البحث إن أساءت فهم المعنى المراد، فتجدهم يلومون أنفسهم وينقِّحون أسئلتهم لتحقيق نتائج أفضل، وقد يرجع هذا إلى أن الدهشة لا تزال تتملكهم من نجاح محركات البحث، وجزء من هذا التسامح يعود إلى أن البحث لا يكاد يكلف المستخدم شيئًا، ومع تحسن التقنية سيتوقع المستخدمون أكثر من ذلك، وسيصبحون أقل تسامحًا مع إضاعة أوقاتهم في فرز النتائج التي يحصلون عليها حتى يَمِيزوا الغث من السمين.

(٤-٥) الخطوة الخامسة: تحديد الصلة

عمل محرك البحث هو تقديم النتائج التي تتطابق مع مقصد السؤال الذي يُطرح عليه، وهذا يسمى «الصلة». والصلة لها مكوِّن موضوعي؛ ففوز ريد سوكس على يانكيز ما هو إلا أمر هامشي بالنسبة لمن يسأل عن العكس؛ أي فوز يانكيز على ريد سوكس. لكن الصلة بها مكون غير موضوعي بالمثل، ووحده من طرح السؤال هو الذي له الكلمة الفصل في أمر ملاءمة ما حصل عليه من إجابات لسؤاله، فقد قصدتُ بسؤالي هذا تغلب فريق نيويورك يانكيز على فريق بوسطن ريد سوكس في دوري البيسبول للكبار، لكني لم أقل ذلك، وربما قصدت تغلب فريق فلاج ستاف يانكيز على فريق كونتيننتال رد سوكس من ولاية أريزونا في دوري البيسبول للناشئين.

والعثور على جميع المستندات ذات الصلة يُطلق عليه اسم «الاستحضار»، فنظرًا لأن الشبكة العالمية واسعة جدًّا لا توجد وسيلة معقولة لتحديد ما إذا كان محرك البحث يعثر على كل ما هو ذو صلة، والاستحضار الكامل أمر بعيد المنال، لكنه أيضًا غير مهم، فقد يعطينا الجني الرقمي الآلاف بل والملايين من الإجابات التي يرى أنها ذات صلة، لكن من المستبعد أن نتجاوز في نظرنا صفحة النتائج الأولى أو الثانية، ودرجة الصلة دائمًا ما تتفوق على الاستحضار، فالمستخدمون يريدون العثور على عدد قليل من النتائج الجيدة، وليس كل النتائج الممكنة.

علم قياس الصلة أقدم بكثير من الويب، ويعود إلى أيام جيرالد سالتون في ستينيات القرن العشرين، الذي عمل في بداية الأمر في هارفرد، ثم في كورنيل. ومربط الفرس هنا هو أتمتة المهمة عندما يكون المكون الذاتي طاغيًا عليها، فنحن نريد من جهاز الكمبيوتر أن يمر على محتويات المستند مرورًا سريعًا ثم ينظر في السؤال الذي نطرحه عليه ثم يقوم بحسابات قليلة ليعطينا رقمًا يشير إلى مدى صلة هذا المستند بما سألنا عنه.

محركات البحث واسترجاع المعلومات

هناك ثلاثة مقالات تقدم أفكارًا مثيرة للاهتمام حول كيفية عمل محركات البحث وكيفية استرجاع المعلومات:
  • أولها: مقال بعنوان «تشريح لمحرك بحث واسع النطاق يتعامل مع الويب التي تعتمد على ترميز النص الفائق» كتبه سيرجي برين ولاري بيدج في عام ٢٠٠٠، وهو يتضمن وصفًا واضحًا لطريقة عمل النسخة الأصلية من جوجل، وما الهدف منه، وكيف تميَّز جوجل عما سبقه من محركات البحث.
  • وثانيها: مقال بعنوان «الاسترجاع الحديث للمعلومات: لمحة موجزة» كتبه أميت سينغال في عام ٢٠٠١، وهو يستطلع مجال استرجاع المعلومات، وكان كاتب هذا المقال حينها طالبًا عند جيري سالتون، وهو يعمل الآن في شركة جوجل.
  • وثالثها: مقال بعنوان «أكثر بحث مؤثر لم يكتبه جيرالد سالتون» كتبه ديفيد دوبين، وهو يقدم نظرة مثيرة للاهتمام في بعض أصول هذا العلم.
كمثال بسيط جدًّا للطريقة التي يمكن أن نتبعها لحساب مدى صلة مستند ما بعملية بحث بعينها سنفترض أن مفردات اللغة الإنجليزية تبلغ نصف مليون كلمة. الآن أَنشئ قائمتيْن تتألف الواحدة منهما من نصف مليون رقم، بحيث يكون هناك رقم للمستند ورقم للسؤال، كل موضع في هاتيْن القائمتيْن يتوافق مع كلمة من تلك الكلمات التي يبلغ عددها نصف مليون كلمة، على سبيل المثال الموضع رقم ٣٦٨٢ يقابل كلمة «عقاقير» drugs. بالنسبة للمستند كل موضع يحتوي على عدد يبين عدد مرات تكرار الكلمة المقابلة في المستند، والآن نفعل الشيء نفسه في السؤال، وإذا لم يتضمن كلمات مكررة، سيكون كل موضع إما صفرًا أو واحدًا، والآن اضربْ قائمة المستند وقائمة الأسئلة موضعًا موضعًا ثم اجمع النصف مليون نتيجة. إذا لم تظهر الكلمة في السؤال فستحصل على النتيجة صفر، وإلا سوف تحصل على نتيجة أكبر من الصفر، وكلما ازداد عدد مرات ظهور الكلمات من السؤال في المستند ازداد عدد النتائج.
الشكل ٤-٥ يوضح كيفية احتساب الصلة بالنسبة لعبارة طلب البحث Yankees beat Red Sox، والجزء المرئي من المستند الثالث من الشكل ٤-٤، الذي يبدأ بعبارة Red Sox rout Yankees (ولعل ما سوى ذلك يحتوي على عدد أكبر من الكلمات الرئيسية في بقية المستند الكامل). المواضع في القائمتيْن تتقابل مع الكلمات الموجودة في القاموس مرتبة أبجديًّا من ant إلى zebra، وكلمتا red وsox تظهر كل منهما مرتيْن في هذا المقتطف من القصة، أما كلمة Yankees فتظهر ثلاث مرات.
fig30
شكل ٤-٥: قوائم حساب الصلة بين المستند والأسئلة.
هذا حساب صلة يفتقر بشدة إلى التنقيح، ويسهل التعرف على ما يعتريه من عيوب. تميل المستندات الطويلة إلى أن تُقاس على أنها أكثر صلة من المستندات القصيرة؛ لأن تكرار الكلمات بها يزداد. من حيث الصلة، نجد أن الكلمات غير المهمة مثل «مِن» from يكون لها نفس الثقل الذي تتمتع به الكلمات الأساسية مثل Yankees. محركات البحث مثل جوجل وياهو وإم إس إن وآسك تضع اعتبارًا لعوامل أخرى كثيرة من هذا القبيل بالإضافة إلى الكلمات التي تجدها ومعدل تكرارها. ففي القائمة التي تخص المستند، لعل العناصر الموجودة لا تخص عدد الكلمات بل تخص رقمًا آخر، وأنها معدلة بحيث يصبح للكلمات في عنوان الصفحة ثقل أكبر، ولعل الكلمات التي كُتبت بخط كبير تحظى بثقل أكبر من مثيلاتها. عند إدخال سؤال ما يميل المستخدم إلى البدء بأهم الكلمات التي يبحث عنها، ومِنْ ثَمَّ فلعل مقدار الأهمية هنا يعتمد على مكان الكلمة في عبارة البحث نفسها.

(٤-٦) الخطوة السادسة: تحديد الترتيب

بعد اختيار الجني الرقمي للمستندات ذات الصلة — ولعله اختار جميع المستندات التي تبلغ صلتها حدًّا بعينه — فإنه «يرتب» نتائج البحث حسب أهميتها، وهذا الترتيب أمر بالغ الأهمية في الحكم على محرك البحث بأنه مفيد، فلعل نتائج البحث ذات الصلة تكون بالآلاف، والمستخدم لا يريد منها إلا عددًا قليلًا. أبسط ترتيب هو الترتيب من حيث الصلة؛ فتوضع صفحة الويب التي تتمتع بأعلى درجة من الصلة بكلمات البحث في المرتبة الأولى. لكن هذا ليس حلًّا ناجعًا؛ لأنه إذا كان سؤال البحث قصيرًا فإننا إنْ نظرْنا إلى شيء واحد فسنجد أن العديد من النتائج تكاد تكون على نفس القدر من الصلة به.

الأهم من ذلك أنه ينبغي النظر إلى المستندات التي يظهرها لنا الجني الرقمي على أنها «نتائج جيدة»، ليس فقط لأنها تتمتع بمقدار كبير من الصلة بما بحثنا عنه، لكن أيضًا لأن المستندات نفسها ذات جودة عالية، لكن للأسف من الصعب تحديد معنى «الجودة» هنا في مجال البحث حيث يكون المحك النهائي للنجاح هو أن نعطي للمستخدم ما يريد. في المثال الذي مر بنا منذ قليل، من الذي يقرر ما إذا كان العديد من الروابط إلى المواد المتعلقة ببريتني سبيرز هي حقًّا إجابة «أفضل» للسؤال عن «سبيرز» مقارنة برابط البروفسير سبيرز؟ ومهما كان تعريف «الجودة» فإن عملية الترتيب في محركات البحث الرئيسية تحدث تلقائيًّا دون تدخل بشري، ولا توجد طريقة تتضمن بروتوكولات تنظر في التراخيص المهنية والإدانات الجنائية السابقة بالتزوير، على الأقل بالنسبة للوضع الحالي للويب.

رغم أن الجودة لا يمكن أن تُقاس تلقائيًّا فإنه يمكن استنباط مقدار «الأهمية» أو «السمعة الحسنة» من هيكل روابط الويب. كمثال بعيد، إن نظرنا إلى صفحات الويب وكأنها منشورات علمية، فالسمعة الطيبة للعلماء عادة ما تكون أفضل كلما كثر الاستشهاد بقولهم على نطاق واسع في أعمال غيرهم من العلماء. هذا بعيد عن أن يكون نظامًا مثاليًّا للحكم على أهمية عمل علمي، فهناك بالفعل مجلات علمية لا تساوي شيئًا، وفي بعض الأحيان تكون هناك مجموعات صغيرة من العلماء الذين ليس لهم ثقل يكوِّنون شبكات من الإعجاب المتبادل، وهذا أمر يغرُّ ويخدع، لكن بالنسبة للويب فالنظر في بنية الربط هو نقطة انطلاق في قياس أهمية الصفحات.

ما الذي يجعل محركات البحث تُقبِل على صفحة ويب؟

لا تكشف شركة تعمل في مجال البحث على الويب عن التفاصيل الكاملة للخوارزمية التي تتبعها في تحديد مدى صلة صفحات الويب وترتيبها في نتائج البحث. تظل هذه الأمور سرًّا؛ لأنها توفر مزايا تنافسية، ولأن معرفة ما يُعلِي ترتيب الصفحة يسهِّل أمر الاحتيال والخداع، لكن فيما يلي سنذكر بعض العوامل التي قد تؤخذ بعين الاعتبار:
  • هل الكلمة المفتاحية موجودة في عنوان صفحة الويب، أم في أحد عناوينها الرئيسية، أم في أحد عناوينها الفرعية؟

  • هل الكلمة المفتاحية لا توجد إلا في النص الأساسي للصفحة؟ وإذا كان الأمر كذلك فما مقدار «بروزها» فيه؟

  • هل الموقع من النوع «الجدير بالثقة»؟

  • هل الصفحات التي لها روابط داخل تلك الصفحة هي في حد ذاتها ذات صلة بكلمات البحث؟

  • هل الصفحات التي تحمل روابط لتلك الصفحة هي في حد ذاتها ذات صلة بكلمات البحث؟

  • هل الصفحة قديمة أم حديثة؟

  • هل الصفحات التي لها روابط داخل تلك الصفحة قديمة أو حديثة؟

  • هل تتوفر في الصفحة معايير جودة معينة؟ على غرار أن لا تتضمن أخطاءً إملائية؟

ما إن تتجشم عناء الزحف الإلكتروني على الويب فستجد مادة غزيرة للتحليل، وكل ما تحتاجه هو أن تتمتع بالقدرة الحاسوبية للقيام بذلك.

كان من ابتكارات جوجل تحسين معايير الصلة عن طريق قيمة عددية أخرى تسمى «تصنيف بيدج»؛ وهو معيار يقيس مدى «أهمية» كل صفحة مع الوضع في الاعتبار الروابط الخارجية التي تشير إليها، وهو ما يعني وجود سباق انتشار على مستوى شبكة المعلومات. فالمنطق يقول إنه كلما كثر عدد صفحات الويب التي بها رابط إلى صفحة ويب بعينها ازدادت أهمية تلك الصفحة، في الواقع، ينبغي أن يكون الحكم بأهمية صفحة ويب قائمًا على أساس أن عددًا كبيرًا من الصفحات المهمة بها رابط لتلك الصفحة لا بكثرة الصفحات أيما اتفق، ويبدو أن هذا يدخلنا في دائرة مفرغة من حيث تعريف مصطلح الأهمية، لكنْ هناك مخرجٌ من هذا المأزق، وهو يتطلب الاستعانة بشيء من الرياضيات والكثير من القدرة الحاسوبية.

ويبدو أن هذه الطريقة في ترتيب نتائج البحث تُعلِي من شأن السمعة الطيبة، وتخلو من الحكم على الصفحة، فهي وسيلة آلية لتجميع الآراء المتبادلة. على سبيل المثال، عندما بحثنا باستخدام جوجل عن «أدوية انفصام الشخصية» جاءت أعلى نتيجة جزءًا من موقع يتبع إحدى الجامعات السويدية، وكان أمر الصلة بالتأكيد جزءًا من السبب الذي جعلها النتيجة الأولى لأن الصفحة تتناول على وجه التحديد العقاقير المستخدمة لعلاج مرض انفصام الشخصية، وكانت كلمات «عقاقير» drugs و«انفصام الشخصية» schizophrenia جزءًا من عنوان الصفحة، فاختيارنا للكلمات أثَّرَ على مدى صلة الصفحة، وإذا استبدلنا كلمة عقاقير drugs بكلمة أدوية medicines لما جاءت تلك الصفحة في المرتبة الأولى في نتائج البحث، كما أن ترتيب الكلمات في عبارة البحث له تأثيره على نتائج البحث؛ فالنتائج التي نحصل عليها من جوجل إن بحثنا عن drugs schizophrenia تختلف عن تلك التي نحصل عليها إن بحثنا عن schizophrenia drugs.
كان سيرجي برين ولاري بيدج، مؤسسا جوجل، من طلاب الدراسات العليا في جامعة ستانفورد عندما وضعا أول تقنيات لشركتهما شركة جوجل، وكلمة Page في مصطلح «تصنيف بيدج» PageRank لا تشير إلى صفحات الويب، وإنما إلى لاري بيدج نفسه.

قد يكون ترتيب هذه الصفحة قد أتى في هذه المرتبة العالية لأن العديد من صفحات الويب الأخرى تضمنت روابط إليها، لا سيما إذا كان كثير من هذه الصفحات هي نفسها حُكم عليها أنها مهمة. لعل هناك صفحات أخرى عن عقاقير الفصام كُتبت بأسلوب لغوي أفضل، أو كتبها أناس أكثر خبرةً ومكانةً في المجال العلمي، أو تحتوي على معلومات أحدث وعلى أخطاء أقل، لكن خوارزمية الترتيب لا سبيل أمامها لتحكم على أيٍّ من تلك الأمور، ولا يوجد في جوجل أحد يقرأ كل صفحة ليصدِر أحكامًا من هذا القبيل.

إن جوجل وغيره من محركات البحث الأخرى التي ترتب صفحات الويب تلقائيًّا يستخدم وصفة سرية للخروج بهذا الترتيب، وهي توليفة معينة هم أدرى بها. وكما هو الحال في وصفة كوكا كولا، لا يعلم سر تكوين مقاديرها إلا حَفْنَة من الناس، وخوارزمية جوجل مسجلة كبراءة اختراع، ومِنْ ثَمَّ يمكن لأي شخص أن يقرأ وصفًا عنها. الشكل ٤-٦ هو رسم توضيحي من براءة الاختراع تلك، وهو يبين عدة صفحات هناك روابط تربط فيما بينها، وهذا الرسم التوضيحي يشير إلى أن كُلًّا من المستندات نفسها والروابط فيما بينها يمكن أن تعطى أرقامًا متفاوتة كمقاييس لأهميتها، لكن الوصف يغفل الكثير من التفاصيل، كما أنه خضع للتعديل عددًا لا يحصى من المرات لتحسين الأداء، والشيء الوحيد الحقيقي الذي تستند إليه الشركة لتبرهن على صحة النظام الذي تتبعه أن مستخدميها تروق لهم النتائج التي تمدهم بها؛ لأنه لو لم تَرُقْ لهم تلك النتائج لتحولوا إلى محرك بحث آخر منافس.
fig31
شكل ٤-٦: شكل من براءة اختراع تصنيف بيدج (براءة اختراع أمريكية رقم ٦٢٨٥٩٩٩)، وهو يبين كيف أن الروابط بين المستندات قد تتلقى أحكامًا متفاوتة من حيث أهميتها.

قد يكون من بين الأمور التي يحبها المستخدمون في محرك البحث المفضل لديهم هو حصولهم دومًا على ما يعتقدون أنه معلومات غير منحازة ومفيدة، بل وصادقة، لكن «قول الحقيقة» في نتائج البحث هو في نهاية المطاف مجرد وسيلة لتحقيق غاية، والغاية هنا هي تحقيق مزيد من الأرباح للشركة صاحبة محرك البحث.

الترتيب مسألة رأي، لكن الكثير معلق على تلك الآراء. بالنسبة للمستخدم، فإنه عادة لا يهتم كثيرًا جدًّا بأن الرابط الفلاني جاء ترتيبه الأول أو ما إذا كانت النتيجة التي حصل عليها تلائم ما بحث عنه، لكن بالنسبة لشركةٍ تقدم منتجًا، فإن أمر ترتيب نتائج البحث قد يكون مسألة حياة أو موت.

شركة كِندر ستارت تدير موقعًا إلكترونيًّا هو www.kinderstart.com يتضمن دليلًا ومحركَ بحثٍ يُركز على المنتجات والخدمات التي تُقدَّم للأطفال الصغار. في ١٩ مارس عام ٢٠٠٥ انخفض عدد زيارات ذلك الموقع بنسبة ٧٠٪ عندما انخفض تصنيفه على مؤشر تصنيف بيدج إلى صفر (وفق مقياس من ٠ إلى ١٠). لعل جوجل رأت أن صفحة كندر ستارت ذات جودة منخفضة بسبب أن خوارزمية الترتيب التي تتَّبِعها جوجل وجدت أن تلك الصفحة تتكون في معظمها من روابط إلى مواقع أخرى، وقد حذرت جوجل في معاييرها من الصفحات التي «لا تتضمن محتوى أصليًّا أو محتواها الأصلي ضئيل». لكن كانت نظرة كندر ستارت للأمور مختلفة، فرفعت دعوى قضائية ضد جوجل، مدعية أن جوجل، من بين أمور أخرى، انتهكت حقوقها في حرية التعبير بموجب التعديل الأول للدستور الأمريكي بأن جعلت موقع كندر ستارت وكأنه غير موجود، فردت جوجل أن انخفاض مستوى صفحة كندر ستارت على مقياس تصنيف بيدج كان مجرد رأي من جوجل، وأن الآراء ليست من الأمور التي تتعين تسويتها في ساحات المحاكم:

إن جوجل — مثل كل شركات محركات البحث الأخرى — فعلت ذلك مع مستخدميها، فهي تحكم وتعبر عن رأيها في الأهمية النسبية لمواقع الويب بطريقة جعلت منها محرك البحث المفضل للملايين، وتدعي كندر ستارت أن السلطة القضائية يجب أن يكون لها القول الفصل في عملية التحرير تلك.

ردَّت كندر ستارت أن من الظلم اعتبار فعل جوجل مجرد تعبير عن رأي، وقالت كندر ستارت: «ليس تصنيف بيدج مجرد بيان للرأي في القيمة ذاتها، أو كون موقع الويب وصفحاته يروق لمرء معين، وإنما هو منتج حسابي يقيس ويقيِّم كم وعمق كافة الارتباطات التشعبية على شبكة الإنترنت التي ترتبط بموقع الويب الذي يخضع للترتيب عن طريق تصنيف بيدج، وهذا يخضع لقرارٍ بَرْمَجي تتخذه جوجل.»

الاطلاع على ترتيب صفحة ما

لدى جوجل شريط أدوات يمكنك إضافته إلى بعض المتصفحات حتى تتمكن من رؤية ترتيب كل صفحة ويب تظهر أمامك بحسب تصنيف بيدج، ويمكن تنزيله عن طريق الرابط التالي: toolbar.google.com، ويمكنك أيضًا استخدام موقع www.iwebtool.com/pagerank_checker لتُدخل فيه عنوان صفحة الويب لتعلم ترتيبها بحسب تصنيف بيدج.

رفض القاضي كل ما ادعته كندر ستارت، وليس مجرد ادعاء كندر ستارت أن لها حقًّا قائم على حرية التعبير بأن تكون أكثر بروزًا في عمليات البحث التي تتم على جوجل، بل رفض القاضي أيضًا المزاعم القائلة بأن جوجل وقعت في مخالفاتِ احتكارٍ، وأن وضع كندر ستارت في أدنى مرتبة وفق تصنيف بيدج أمر يصل إلى حد التشهير بالشركة.

وسواء أكان ذلك مسألة رأي أم تلاعب فإن العثور على كندر ستارت بالتأكيد باستخدام ياهو أسهل بكثير منه باستخدام جوجل، فحين بحثنا عن kinderstart باستخدام ياهو ظهر موقع kinderstart.com على قمة نتائج البحث، أما حين بحثنا عنها باستخدام جوجل فلم يظهر موقع kinderstart.com إلا في الصفحة الثانية عشرة من صفحات نتائج البحث.
حلت نفس الفاجعة بموقع bmw.de، وهو النسخة الألمانية لموقع شركة تصنيع السيارات المعروفة بي إم دبليو، فالصفحة التي فهرستها جوجل كانت نصًّا يتضمن الكلمات gebrauchtwagen وneuwagen (أي «سيارة مستعملة» و«سيارة جديدة») مكررة عشرات المرات، لكن كانت هناك خدعة ترميز جعلت الزائرين يرون صفحة أكثر تقليدية بها بعض الكلمات والعديد من الصور. كان الهدف من ذلك رفع ترتيب موقع شركة BMW في عمليات البحث عن «سيارة جديدة» و«سيارة مستعملة»، لكن هذه الوسيلة كانت مخالفة للتعليمات الواضحة التي وضعتها جوجل لمصممي مواقع الإنترنت: «عليك أن تصمم الصفحة للمستخدم لا لمحركات البحث. لا تخدع مستخدميك ولا تقدم لمحركات البحث محتوى يختلف عما تعرضه للمستخدمين، وهو ما يسمى بالتمويه.» وردَّت جوجل على تلك المخالفة ﺑ «عقوبة الإعدام» على الموقع بأن حذفته من فهرسها، ولبعض الوقت لم تعُد الصفحة تظهر في جوجل، وقد أظهر هذا الإجراء العقابي أن جوجل على استعداد للرد وبقوة على محاولة بعض المواقع أن تُعْلِيَ ترتيبها بطرق ترى جوجل أنها ليست في صالح المستخدم، وفي الوقت نفسه أوضح ذلك أن جوجل على استعداد لاتخاذ إجراءات مخصصة ضد مواقع بعينها.

(٤-٧) الخطوة السابعة: عرض النتائج

بعد كل هذا العمل الشاق والرائع في الخطوات الست الأولى عادة ما تقدم محركات البحث النتائج في شكل عرفته البشرية قبل أن يولد أرسطو؛ ألا وهو قائمة بسيطة مرتبة من أعلى إلى أسفل، وهناك طرق أقل بدائية من ذلك لعرض المعلومات.

fig32
شكل ٤-٧: صفحة نتائج البحث عن كلمة washers على موقع هوم ديبوت.3
إذا بحثت عن شيء يسهل فيه اللبس مثل كلمة washer — التي تحمل معاني شتى — باستخدام أحد محركات البحث الرئيسية فستجد أن نتائج البحث تصل إلى مليون رابط، بدءًا من غسالات الملابس إلى حزم البرامج التي تعمل على إزالة الفيروسات. وإذا بحثت في موقع هوم ديبوت عن نفس الكلمة فسوف تحصل على مجموعة من الخيارات المولدة تلقائيًّا تعينك على تضييق البحث: مجموعة من الفئات، وشرائح الأسعار، وأسماء تجارية، وغيرها، وكلها تتضمن صورًا لمنتجات (انظر الشكل ٤-٧).

تعتمد بدائل القوائم البسيطة المرتبة التي تستخدم لتقديم النتائج على النظام البصري بشكل أكبر، وظهور هذه الأشكال الجديدة للتنقل على الويب قد يغير ميزان القوى في معادلة البحث، فلعل احتلال المراتب الأولى في القوائم لم يعد له نفس القيمة الاقتصادية، لكن شيئًا آخر قد يحل محل الترتيب في القائمة الذي يمثل اليوم الهم الأكبر والهدف الأسمى، وقد يكون هذا البديل جودة الرسومات مثلًا.

بغض النظر عن كيفية عرض النتائج، فسيصحبها شيء آخر، ولعل هذا سيحدث على الدوام. والآن حان وقت الحديث عن الروابط الدعائية.

(٥) مَنْ الذي يدفع؟ ومقابل ماذا؟

البحث في الويب هو أحد أكثر الأمور التي تُستخدم فيها أجهزة الكمبيوتر استخدامًا واسعًا، فأكثر من ٩٠٪ من البالغين من مستخدمي الإنترنت يستخدمون محركات البحث، وأكثر من ٤٠٪ يستخدمونها كل يوم، وشعبية محركات البحث أمر لا يصعب تفسيره؛ فمحركات البحث هي في المعتاد مجانية، وبوسع أي شخص أن يستخدمها، فلا يتطلب استخدامها تسجيل دخول، وهي لا تتضمن حاشيةَ عقدٍ تنطوي على شروط يجب على المستخدم أن يوافق عليها قبل أن يشرع في استخدامها، كما أنها لا تتطلب سرعة اتصال بعينها، ولا يضطر المستخدم إلى الإدلاء بأي معلومات شخصية بعينها ليتمكن من استخدامها. إذا كان لديك اتصال بالإنترنت فمن شبه المؤكد أن لديك متصفحَ ويب، ولعل أول صفحة ويب يفتحها لك في كل مرة تشغله هي صفحة محرك بحث. لا توجد توجيهات عليك قراءتها، على الأقل للبدء في استخدامه، وكل ما عليك هو أن تُدخِل بعض الكلمات، وسرعان ما يأتيك الجواب، ولن يضر أحدًا أن تسأل عما تريد بتلقائية وعفوية ثم تنظر ماذا يحدث، بل إن في الأمر متعة.

وربما لأن البحث مفيد وسهل جدًّا فإننا ننظر إلى محرك البحث على أنه شيء يشبه المرفق العام؛ فهو مزيج من موسوعةٍ وعمودِ إنارة تقرأ تلك الموسوعة في ضوئه، إنه مصدر واحد يمد الجميع بقدر غير محدود من المعلومات. من الناحية الاقتصادية هذا التشبيه معيب، فمستخدم المرافق يدفع مالًا مقابل أي استخدام منه لتلك المرافق سواء أكانت مياهًا أو غازًا أو كهرباء، لكن شركات البحث على الويب لا تتقاضى منك شيئًا، وعنصر المنافسة لا يوجد عادةً في المرافق، في حين أنه موجود وبقوة بين شركات البحث، ومع ذلك فنحن نضع ثقتنا في محركات البحث كما لو كانت مرافق عامة؛ لأن نتائجها تتدفق إلينا، ولأن النتائج تبدو متسقة مع توقعاتنا، فإذا سألنا عن شركة الخطوط الجوية الأمريكية أتت إلينا محركات البحث بموقعها الإلكتروني، وإذا سألنا عن «سعر الشاي في الصين» أتت إلينا محركات البحث بالسعر الفعلي (١٫٨٤ دولار لكل ٢٥ كيس شاي) مع توضيح للعبارة. ربما نثق بها لأننا نفترض أن الآلات محايدة ولا تُصدر أحكامًا على القيمة كما نفعل نحن، ومع ذلك فإن كون محركات البحث نادرًا ما تخيب توقعاتنا لا يعني أن حدسنا صحيح.

من الذي يدفع مقابل كل هذا؟ هناك أربعة احتمالات:
  • قسم من المستخدمين يدفعون بصفتهم مشتركين في خدمة.

  • أصحاب المواقع الإلكترونية يدفعون مالًا في مقابل أن تظهر مواقعهم للمتصفحين.

  • الحكومات أو بعض الكيانات غير الربحية قد تدفع المال.

  • المعلنون قد يدفعون المال.

وكل هذه النماذج الأربعة مجربة.

(٥-١) بحثٌ خالٍ من الإعلانات

في البداية الأولى للإنترنت كانت الجامعات والحكومة تدفع مقابلًا؛ لأن الكثير من البحوث المتعلقة باسترجاع المعلومات كانت تُجرَى في الجامعات بموجب منح وعقود فيدرالية، وكان محرك ويب كرولر WebCrawler من أولى المبادرات للزحف الإلكتروني على الويب بهدف عمل فهرس للكلمات الموجودة على صفحات الويب، وكان مشروعًا بحثيًّا لبرايان بنكرتون في جامعة واشنطن، وقد نشر بحثًا حول هذا الموضوع في عام ١٩٩٤، وذلك في مؤتمر حول شبكة الويب العالمية. في عام ١٩٩٧ قدم مؤسِّسَا جوجل بحثًا أكاديميًّا شَرَحا فيه تقنية تصنيف بيدج، وقد شكَرَا ما تلقياه من دعم من مؤسسة العلوم الوطنية، ووكالة المشاريع البحثية المتقدمة التابعة لوزارة الدفاع والإدارة الوطنية للملاحة الجوية والفضاء (ناسا)، فضلًا عن العديد من الشركات الصناعية الداعمة لبرامج بحوث علم الكمبيوتر في ستانفورد، وحتى يومنا هذا لا تزال جامعة ستانفورد تملك براءة اختراع لخوارزمية تصنيف بيدج، وما جوجل إلا المرخَّص له الحصري.

كانت الأوساط الأكاديمية والحكومة منابع تكنولوجيا البحث، لكن كان هذا قبل أن تصبح الويب عملًا تِجاريًّا ضخمًا. كان البحث بحاجة إلى المال لينمو، فكانت بعض المواقع الإلكترونية التي تعمل عن طريق خدمة الاشتراك، مثل أمريكا أونلاين، تعرض خدمة محركات البحث، بل إن اللافتات الإعلانية ظهرت على مواقع الإنترنت حتى قبل أن تصير محركات البحث هي الطريقة التي يتبعها المستخدمون للعثور على ما يريدون؛ ولذا كان من الطبيعي تقديم خدمة الدعاية لدفع ثمن مواقع محركات البحث. اللافتات الإعلانية هي النظير الإلكتروني للوحات الإعلانات التي نجدها في الشوارع أو للإعلانات المعروضة في الصحف والمجلات، فيشتري المُعلِن بعض المساحة على صفحة ويب يرى أنها صفحة واعدة، ويستخدم تلك المساحة لترويج سلعته أو خدمته عن طريق وضع إعلان يجذب العين.

مع ظهور البحث على الويب أمكن للمواقع أن تبيع مساحات إعلانية اعتمادًا على ما يبحث عنه الزائر، وهو ما يسمى ﺑ «الدعاية الموجهة» التي لا تظهر إلا لمن يُظَن أن المنتج المعروض سيثير اهتمامه، فمثلًا لا تظهر إعلانات الهواتف المحمولة إلا على صفحات نتائج عمليات البحث التي تشمل كلمة «هاتف». ومثلها مثل اللوحات الإعلانية التي نجدها في شوارعنا، فإن اللافتات الإعلانية تجلب إيرادات، كما أنها تشبهها في أنها إن أُكثر منها إلى حد الإفراط فإنها تشوش على الرائي وقد تزعجه.

وبغض النظر عن النموذج المتبع في عالم التجارة والمال كانت هناك قاعدة أخلاقية متفق عليها بشكل عام تقضي بأن المحاباة أمر مرفوض؛ فإذا كنت تقدم خدمة محرك البحث فمن المفترض ألا تقبل أن يدفع لك أحد شيئًا لتغير عرض النتائج التي تظهرها للمستخدمين. إذا طلبت الحصول على معلومات فإنك تتوقع أن تحصل على نتائج محايدة، حتى ولو كانت ذاتية، فالمحاباة كانت أمرًا مرفوضًا. لكن كان هناك خط رفيع جدًّا بين التحيز والموضوعية، وقد رسم هذا الخط الفاصل في مساحة في معظمها مجهولة لم تستكشف بعد، وكانت تلك المساحة تتوسع توسعًا سريعًا وذلك حين خرجت الويب من إطار الأوساط الأكاديمية والبحوث لتدخل عالم متاجر البيع بالتجزئة، وسماسرة العقارات، والأدوية التي تعالج العجز الجنسي.
شكَّل وضع خط فاصل يمنع طغيان الصبغة التجارية معضلة، وهذا ما سماه برين وبيدج في بحثهما الأصلي «الدوافع المختلطة» لمحركات البحث التي تقوم على الدعاية. ما عسى المعلنون أن يفعلوا إذا قدم محرك البحث صفحات عالية الترتيب في نتائج البحث لا تتفق مع منتجاتهم؟ لاحظ برين وبيدج أن البحث عن «الهواتف المحمولة» على النموذج الأولي لمحرك البحث جوجل يأتي برابط لمقال عن مخاطر استخدام الهواتف المحمولة أثناء القيادة، فهل ستدفع شركات الهاتف المحمول المال لجوجل لتظهر على نفس الصفحة التي تتضمن معلومات قد تثني الجمهور عن شراء الهواتف المحمولة؟ بسبب هذا التناقض والتعارض في المصالح توقع مؤسِّسَا جوجل أن «محركات البحث القائمة على التمويل من قبل المعلِنين ستنحاز بطبيعتها إلى المعلنين على حساب احتياجات المستهلكين.» وذكرا أن أحد محركات البحث، وهو أوبن تكست Open Text، قد خرج بالفعل من مضمار محركات البحث بعد أن ثبت أنه يبيع ترتيب نتائج البحث مقابل المال.

(٥-٢) الترتيب والنقرات والمزادات

لم يمضِ على ذلك سوى عام واحد حتى تغير العالم، فقد حدث في عام ١٩٩٨ أنْ أقْدَمَ موقع أوفرتشر Overture (والذي كان في الأصل يُسمى GoTo.com) على تخطي ذلك الخط الأخلاقي الأحمر، فحقق أرباحًا كبيرة، وصار يُنظر إلى ذلك الخط الأخلاقي الأحمر على أنه أمر غير واقعي لا يوجد إلا في عقول الأكاديميين. فكان هذا الموقع يتقاضى من المعلِنين مالًا مقابل أن تظهر منتجاتهم وخدماتهم في نتائج البحث، وكان يتقاضى مبلغًا إضافيًّا مقابل ظهور هذه المنتجات وتلك الخدمات بترتيب أعلى في نتائج البحث، وكان المنطق الذي يقوم عليه هذا المنحى التجاري أنه إذا كنتَ ممن يمكنهم تحمل نفقة أن تظهر؛ فإن هذا يعكس أنك تستطيع الإنفاق على الدعاية لما تقوم به، ومِنْ ثَمَّ فإن هذا يعني أن موقعك مفيد للآخرين. لا يهم ما إذا كان هذا منطقيًّا أم لا، ولا ما إذا كان ذلك يثير حفيظة الملتزمين بالصورة المثالية لعملية البحث. لقد بدا أنه يسعد الناس، وقد أوضح الرئيس التنفيذي لشركة أوفرتشر المنطق الذي تستند إليه شركته بعبارات بسيطة، وكان كلامه يشبه كلام السماسرة وهم يتجادلون مع السلطات؛ إذ قال جيفري بروير: «بصراحة تامة، لا أحد يدرك الطريقة التي تقدِّم بها أيُّ جهةٍ خدمية النتائجَ. إذا كان المستهلكون راضين فإنهم لا يبالون بالآلية التي نوفر لهم عن طريقها ما يريدون.»

وبالفعل كان الزبائن راضين، فإبَّان فقاعة الإنترنت في أواخر تسعينيات القرن العشرين كانت المواقع التجارية حريصة على إبراز نفسها، وكان المستخدمون حريصين على العثور على المنتجات والخدمات التي يريدونها. قدمت شركة أوفرتشر ابتكارًا آخر وسَّع رقعة سوقها إلى ما وراء المواقع التي كان بوسعها دفع الكثير من الرسوم مقدمًا لأمريكا أونلاين وياهو مقابل اللافتات الإعلانية، فكانت الشركة لا تتقاضى من المعلنين مالًا مقابل نشرها لروابطهم، بل كانت لا تطالبهم بمقابل إلا عندما تظهر صفحات نتائج البحث ويقوم المستخدم بالنقر على أي من تلك الروابط، وكانت تتقاضى عن كل نقرة على رابط سنتًا واحدًا، ما أتاح حتى للشركات الصغيرة أن تنشر إعلاناتها على الويب نظرًا لانخفاض التكلفة، وكان المعلنون حريصين على الاشتراك في هذه الخدمة التي تقوم على أساس «الدفع مقابل النقر». قد لا يُقبِل المستخدم على السلعة فيشتريها بعد أن نقر على رابطها وظهرت أمامه، لكن كان المعلنون يدفعون مقابل أن يرى الجمهور مزيدًا من التفصيل عن المنتجات التي يُعلنون عنها.

وحين شاع هذا النوع من المعاملات ارتفع سعر تلك النقرات التجارية، أما أسلوب تحديد الأسعار فكان ابتكارًا ثالثًا من شركة أوفرتشر، فإذا وجدت الشركة أن هناك أكثر من معلِن يتنافسون على صفحة نتائج بحث عن المساحة المحدودة فإنها كانت تعقد مزادًا بينهم، وكانت ترفع السعر حتى أوصلته في بعض الأحيان إلى دولار للنقرة الواحدة، وكان سعر تلك النقرات التجارية يتأرجح صعودًا وهبوطًا، وذلك بحسب عدد العملاء الآخرين الذين كانوا يتنافسون لاستخدام نفس الكلمة الدليلية، فإذا أراد الكثير من المعلنين أن تكون لمواقعهم الإلكترونية روابط تظهر عند البحث عن كلمة «كاميرا» كان سعر النقرة يرتفع. كانت مساحة الشاشة محدودة، وكانت السوق تحدد الأسعار، وكان عقد المزاد العلني على الكلمات الدليلية أمرًا بسيطًا ومعقولًا ومربحًا للغاية.

ومن المفارقات أن انفجار فقاعة الإنترنت عام ٢٠٠٠ زاد من جاذبية ما تقوم به شركة أوفرتشر من تقاضي المال مقابل الترتيب ونظام النقرات التجارية وعقد المزادات على الكلمات الدليلية، فعندما تضاءلت الأرباح وقلت رءوس الأموال لم تعد شركات الإنترنت قادرة على الدفع مقدمًا لشراء مساحات إعلانية بدا أن بعضها لا يحقق إلا نتائج هزيلة، ونتيجة لذلك تحولت العديد من تلك الشركات إلى التعامل في دعايتها مع شركة أوفرتشر وغيرها من الجهات التي اعتمدت بعض ابتكارات أوفرتشر، كما أن هذا الانتشار الهائل أثر على مئات من شركات البحث على الويب، وحين اشتدت المنافسة بدأت ياهو وأمريكا أونلاين تَقبَلان أن تتقاضيا مقابلًا نظير ظهور المنتجات والخدمات على قوائم بحثهما.

(٥-٣) العم سام يتدخل

كانت محركات البحث المختلفة تقدم مستويات مختلفة من الكشف عن أمر تقاضي مقابل لقاء الترتيب، فكانت ياهو تعنون النتائج التي دُفع لها مقابل بكلمة «دعائية»، واليوم صار ذلك هو المصطلح المقبول عمومًا باعتباره تخفيفًا للكلمة الصريحة «إعلان مدفوع الأجر». أما محركات البحث الأخرى فاستخدمت مصطلحات غامضة مثل «نتائج تَتْبَع شركاءنا» أو «قوائم مميزة»، وكان محرك بحث مايكروسوفت المعروف إم إس إن يعرض مبررًا مبتكرًا لاستخدامه لكلمة «مميزة» دون أي تفسير لهذه الكلمة: إذ أظهرت استطلاعات الرأي التي قام بها إم إس إن أنَّ المستهلكين يفترضون مسبقًا أن نتائج البحث سلعة تُباع، ومِنْ ثَمَّ فلم تكن هناك حاجة إلى إخبارهم بذلك! وحين كثر الصراع على الويب أصبحت التجارة والأعمال أقل متعة، وأصبحت التكتيكات التجارية أقل اعتمادًا على روح المثالية التي وُلدت بها الإنترنت. قال إيفان ثورنلي الرئيس التنفيذي لشركة ناشئة: «لم نعد نتحمل وجود مناقشات أيديولوجية، فنحن شركة مساهمة.»

في البداية كانت الحكومة خارج هذه المنظومة، لكن في عام ٢٠٠١ تدخلت منظمة رالف نادر الرقابية «كونسيومر أليرت»، فقدمت شكوى لدى لجنة التجارة الفيدرالية تدَّعي فيها أن ثماني شركاتِ محركاتِ بحثٍ كانت تخدع المستهلكين عن طريق الخلط بين نتائج «الإدراج المدفوع» و«الترتيب مدفوع الأجر» جنبًا إلى جنب مع النتائج التي تظهر عن طريق خوارزمية محرك البحث، وكان المدير التنفيذي لكونسيومر أليرت، جاري راسكين، مباشرًا في اتهامه؛ إذ قال: «إن محركات البحث تلك فضلت الصبغة التجارية القميئة على النزاهة التحريرية. إننا نطالب لجنة التجارة الفيدرالية بضمان أن لا يتم خداع أحد بسبب سقوط محركات البحث في حمأة الخداع التجاري. فإذا كانت محركات البحث ستقحم تلك الإعلانات في نتائج البحث يتعين عليها أن تميز للمستهلك بين الإعلانات وما سواها.»

fig33
شكل ٤-٨: تقرير كونسيومر أليرت الذي أصدرته لجنة التجارة الفيدرالية عن ترتيب نتائج البحث المدفوع الأجر.4
وقد أجابته لجنة التجارة الفيدرالية إلى ذلك، وطلبت من محركات البحث توضيح الفرق بين النتائج العضوية والنتائج الدعائية. في الوقت نفسه أصدرت لجنة التجارة الفيدرالية تنبيهًا لإعلام المستهلكين بصدور هذا القرار (انظر الشكل ٤-٨). تظهر جوجل «روابطها الدعائية» إلى اليمين، كما في الشكل ٤-١، أو تكون مُزاحة ببادئة يسيرة. أما ياهو فتظهرها بخلفية ملونة.

(٥-٤) جوجل تتوصل إلى توازن غير مخلٍّ

حين كانت صناعة محركات البحث تعاني بسبب مشكلاتها الأخلاقية والمالية في عام ٢٠٠٠ عثرت جوجل على مَنْجَمٍ من الذهب.

حينها كان لدى جوجل خوارزمية تصنيف بيدج، والتي أسفرت عن نتائج أفضل بكثير من نتائج محركات البحث الأخرى، وكانت جوجل تتسم بالسرعة، ومن أسباب ذلك أن مهندسيها عرفوا كيف يَفْصِلون المعالجة التي تجري في الخلفية عن تلك التي تجري في الواجهة عبر العديد من الأجهزة التي تعمل على التوازي. كان التكرار في تخزين جوجل الواسع للبيانات شديدًا لدرجة أنه يمكن سحب أحد الأقراص الصلبة من أي مكان دون أن يُفقِد ذلك جوجلَ شيئًا، ولم يُشتبه في أن جوجل تتقاضى أجرًا مقابل علو مرتبة البحث. كانت واجهة جوجل تخلو من الأمور التي تزعج المستخدم؛ فلا إعلانات مبهرجة (بل لا يوجد بها أي إعلانات على الإطلاق) لا في الصفحة الرئيسية ولا في صفحة نتائج البحث. كانت صفحة جوجل الرئيسية نموذجًا للاقتضاب، فلم يكن بها سوى كلمة «جوجل» وخانة البحث، وخيار الحصول على صفحة نتائج البحث، أو خيار «أشعر أني محظوظ»، والانتقال مباشرة إلى الرابط الأول في الترتيب (وهو الخيار الذي بلغ ذروة قيمته عندما كان كثير من المستخدمين لديهم اتصال بطيء بالإنترنت عن طريق الهاتف الأرضي).

كانت هناك حقيقتان أخريان بشأن جوجل في أوائل عام ٢٠٠٠: فقد كانت جوجل تتوسع، ولم تكن تُدِرُّ على أصحابها الكثير من الأرباح. كانت تقنيتها ناجحة، وكان الكثيرون يستخدمون محرك بحثها، ولم يكن لدى شركة جوجل نموذج تجاري، إلى أن جاء برنامج آد ووردز AdWords.

يتيح آد ووردز للمعلنين الدخول في مزاد علني على الكلمات الدليلية، وهو يشبه مزادَ شركةِ أوفرتشر على الترتيب في نتائج البحث. لكن عند فوزك في هذا المزاد من جوجل تحصل على امتياز نشر إعلان نصي صغير على صفحات نتائج البحث على جوجل تحت ظروف معينة، لكنك لا تحصل على حق في ظهور موقعك الإلكتروني كنتيجة بحث عضوية. كان جمال النظام يكمن في عدم تدخله في نتائج البحث، وأنه غير مزعج نسبيًّا، ومرتبط بما بحث عنه المستخدم، ولم يُفسِد مظهرَ الشاشة بلافتات إعلانية مزعجة.

في البداية كانت جوجل تتقاضى مالًا من المعلِن كلما ظهر إعلانه للمستخدم بغض النظر عما إذا نقر المستخدم عليه أم لا، ثم في عام ٢٠٠٢ انتقل آد ووردز إلى نظام أوفرتشر الدفع لكل نقرة، في البداية كانت الإعلانات تُباع فُرادى عن طريق وكيل بشري، ولقد جاءت انطلاقة آد ووردز عندما أتمتت جوجل عملية نشر الإعلانات، فلكي تضع إعلانًا اليوم فما عليك إلا أن تملأ استمارة إلكترونية على الويب بها معلومات حول كلمات البحث التي تريد استهدافها، وتذكر نص إعلانك القصير، ورقم بطاقة الائتمان التي ستتقاضى جوجل عن طريقها مقابل خدمتها تلك.

كانت تقنية جوجل عبقرية، لكن لم يكن أي من عناصر نموذج عملها أصليًّا. وعن طريق المزج بين هذا وذاك انطلقت جوجل لتصبح عملاقًا في عالم الويب. لم تكن للدعاية أي تأثير على نتائج البحث، ومِنْ ثَمَّ لم تقلَّ ثقة المستخدم في جودة نتائج بحث جوجل، وقد مكن آد ووردز جوجل من تحقيق التوازن الذي تنبأ برين وبيدج من قبل أنه من المستحيلات: دعاية دون تشويه لنتائج البحث، وكانت النتيجة أن خرجت جوجل — من هذه المعضلة على الأقل — وجيوبها تفيض بالمال ومبادئها لم تُمس بسوء.

(٥-٥) الإعلانات الممنوعة

الإعلانات المستهدفة، مثل آد ووردز، تعمل الآن على تغيير وجه صناعة الإعلان. والإعلانات عبر الإنترنت أكثر فعالية من حيث التكلفة؛ وذلك لأن المعلِن يمكنه التحكم في أمر تحديد الجمهور الذي يرى إعلانه. لقد مكَّنت الإنترنت المُعلِن من توجيه إعلاناته ليس فقط عن طريق كلمات البحث، لكن جغرافيًّا كذلك؛ فمثلًا الإعلانات التي تظهر للمستخدمين في ولاية كاليفورنيا تختلف عن تلك التي تظهر للمستخدمين في ولاية ماساتشوستس، وقد أدى نجاح الدعاية والإعلان على شبكة الإنترنت إلى تحطيم مصدر رئيسي من مصادر عائدات الصحف والتليفزيون، فصناعة الإعلام والاتصالات لم تستطع إلى الآن مواكبة التغير الحادث في موازين المال والسلطة.

وبما أن شركات محركات البحث تحصد حصصًا كبيرة في مجال الدعاية فهي تسيطر على نوعية المنتجات التي يُعلَن عنها وتحدد المشروع منها من غير المشروع. إن قوائم النتائج التي تخرجها تلك الشركات هي مزيج من المتطلبات القانونية ومتطلبات السوق وفلسفة الشركات، والتأثير المشترك لهذه القرارات يمثل نوعًا من الرقابة الناعمة — التي ظلت لفترة طويلة مألوفة لدى الصحف — لكنها تكتسب أهمية جديدة حال تحوُّل موقع البحث إلى محرك دعاية مهيمن. من بين البنود والخدمات التي لا تقبل جوجل نشر إعلانات عنها السلع المقلدة والمواد الإباحية المتعلقة بالأطفال (في الولايات المتحدة يُسمح ببعض المواد الإباحية، شريطة أن لا يكون القائمون بالأدوار فيها دون السن القانونية)، وخدمات كتابة الأبحاث الدراسية، والعقاقير غير المشروعة وبعض مواد الأعشاب المشروعة، وأدوات تصنيع المخدرات، والألعاب النارية، ولعب القمار على الإنترنت، وأدوية الشفاء المعجِز، والإعلانات التي تتضمن هجومًا سياسيًّا (رغم أنه يُسمح بشكل عام بالدعاية السياسية)، والدعارة، والتشويش على رادارات حركة المرور، والأسلحة النارية، والقبضات الحديدية. ترسم القائمة صورة لما يريد أن يراه الشخص العادي، أو ينبغي أن يراه، أو لا يرى بأسًا برؤيته، ولعلها تصور أيضًا كيف تُقيِّد جوجل بحرص استخدام منتجها التحرري في ممارسة الأنشطة غير القانونية والترويج لها.

(٦) البحث قوة

في كل خطوة من عملية البحث يسعى الأفراد والمؤسسات جاهدين للسيطرة على ما نراه وما نجده، ليس بهدف إيذائنا، وإنما بهدف مساعدتنا. نعم، إن محركات البحث تعيننا، لكن ليس لديها لجان من الخبراء المحايدين تميز الصواب من الخطأ، أو تميز المهم من غير المهم، لكن هناك دوافع اقتصادية واجتماعية قوية لتقديم معلومات تروق لنا. ولأننا لا نرى ما يحدث في كواليس محركات البحث فإن مَنْ يتحكمون فيما نراه هم في حد ذاتهم يخضعون لبعض الضوابط.

(٦-١) استعمال الخوارزميات لا يعني البراءة من التحيز

تحسب محركات البحث مقدار أهمية صفحات الويب وترتبها؛ لأنها تقِيم خياراتها على أساس «خوارزمي»، وهذا ما يجعلنا في كثير من الأحيان نفترض أنها — على عكس الباحثين من البشر — ليست عرضة للوقوع في التحيز. لكن يمكن إدخال التحيز إلى البرنامج المستخدم فتظهر النتائج مع حدوث تغييرات طفيفة في عوامل مختلفة تدخل في نظام التصنيف أو خوارزمية اختيار الزحف الإلكتروني، بل إن تحديد ما يمكن اعتباره انحيازًا هو مسألة تخضع لحكم البشر.

امتلاكك لكثير من المال لن يأتي لك بترتيب عالٍ في نتائج جوجل إن دفعت لها أموالًا طائلة، لكن خوارزمية جوجل المتبعة في تصنيف بيدج تتضمن شيئًا من التحيز لصالح الأغنياء والأقوياء، فإذا أصبحت شركتك ناجحة فإنه على الأرجح ستشير الكثير من صفحات الويب إلى صفحة شركتك، وهذا من شأنه أن يرفع تصنيف موقعك الإلكتروني. هذا الأمر يبدو معقولًا، ويميل إلى إظهار نتائج يرى معظم الناس أنها صحيحة، لكن إلى أي مدى ينبغي أن يوَلِّد النفوذ مزيدًا من النفوذ؟ إجابة ذلك اختلفت حولها وجهات نظر الشركات القوية والشركات الصغيرة. هل النتائج «تبدو على ما يرام» أم أن مؤشرات خوارزمية البحث بحاجة إلى تعديل؟ وإجابة ذلك أمر لا يستطيعه إلا البشر.

لبعض الوقت كان عملاء أمازون الذين يبحثون عن الكتب التي تتحدث عن الإجهاض abortion يتلقون نتائج تتضمن سؤالًا «هل تقصد adoption (التبني)؟» وعندما اشتكت مجموعة من مؤيدي حق الاختيار من هذا الأمر ردت أمازون بأن الاقتراح المذكور يولَّد تلقائيًّا نظرًا للتشابه بين الكلمتين في اللغة الإنجليزية. كان محرك البحث قد لاحظ مع مرور الوقت أن الكثير ممن يبحثون عن «الإجهاض» يبحثون كذلك عن «التبني»، لكن أمازون وافقت على إجراء التغيير المخصص لخوارزمية بحثها لتدارك أمر كلمة «الإجهاض» باعتبارها حالة خاصة، وبقيامها بذلك أكدت الشركة عن غير قصد أن خوارزمياتها قد تتضمن في بعض الأحيان عناصر من التحيز البشري.

من المرجح أن تدفع قوى السوق محركات البحث المجدية تجاريًّا نحو الانحياز للأغلبية، وكذلك للاستجابة لمصالح الأقلية في حدود نصيب تلك الأقلية من السلطة السياسية، وعلى الأرجح تفضل محركات البحث المصادر الجديدة على المصادر القديمة، بل وربما على المصادر الأكثر شمولًا، وسبب ذلك أن مستخدميها يلجئون إلى الإنترنت للحصول على أحدث المعلومات، فإذا كنت تعتمد على محرك بحث ما لاكتشاف المعلومات التي تريدها فتذكر أن الآخرين يحكمون نيابة عنك حول ما يظهر أمامك على الشاشة.

(٦-٢) ليست محركات البحث سواءً

عندما نستخدم محرك بحث لعلنا نظن أن ما نحصل عليه هو عينة تمثيلية لما هو متاح. إذا كان الأمر كذلك فينبغي أن يكون ما نحصل عليه من أحد محركات البحث مشابهًا جدًّا لما نحصل عليه من محرك آخر، وهذا أمر منافٍ تمامًا للواقع العملي.

أظهرت دراسة مقارنة بين الأسئلة التي وُجهت لمحركات البحث جوجل وياهو وآسك وإم إس إن أنَّ النتائج التي ظهرت في الصفحة الأولى تباينت بنسبة ٨٨٪. كانت نسبة التشابه في الصفحة الأولى للنتائج ١٢٪، بل وكان هذا التشابه مقصورًا بين محركيْ بحث فقط من تلك الأربعة؛ لذا إذا اكتفيت باستخدام محرك بحث واحدًا فقد يفوتك ما تبحث عنه. هناك أداة هي ranking.thumbshots.com توفر رسمًا بيانيًّا متميزًا يوضح مقدار التداخل بين نتائج محركات البحث المختلفة، أو عمليات البحث المختلفة باستخدام محرك البحث نفسه. على سبيل المثال الشكل ٤-٩ يبين مقدار ضآلة التداخل بين نتائج البحث في جوجل وياهو عن عبارة boston florist.

كل نقطة من النقاط المائة في الصف العلوي تمثل نتيجة بحث باستخدام جوجل، والنتيجة التي حصلت على أعلى مرتبة موجودة في الجهة اليسرى، أما الصف السفلي فيمثل نتيجة البحث باستخدام ياهو، وهناك خط يصل بين كل نتيجتيْن متماثلتيْن، وفي حالتنا هذه كانت نسبة العناصر المشتركة بين محركيْ البحث لا تتجاوز ١١٪ من النتائج. الرابط الذي حصل على المرتبة الأولى في ياهو لم يظهر في نتيجة بحث جوجل مطلقًا، فلم يظهر من بين أول مائة رابط، ولا حتى في أول ثلاثين صفحة من صفحات نتائج بحث جوجل.

fig34
شكل ٤-٩: مقارنة بين نتائج البحث في جوجل وياهو عن (بائعي الزهور في بوسطن) Boston Florists.5

يحدد الترتيب مقدار البروز على الويب، وقد وجدت دراسة بحثية في مجال البحث على الويب أن ٦٢٪ من المستخدمين ينقرون على رابط من الصفحة الأولى، و٩٠٪ ينقرون على رابط من الصفحات الثلاث الأولى، وبالنسبة للمستخدمين الذي لم يعثروا على ما يريدون من أول مرة، فقد وُجِدَ أن أكثر من ٨٠٪ منهم يعيدون الكَرَّة من جديد مستخدمين محرك البحث نفسه بعد أن يعدلوا من كلمات بحثهم، ثقةً منهم أن محرك البحث «يعرف» الإجابة الصحيحة وأن العيب فيهم هم؛ إذ لم يُحسنوا اختيار ألفاظ بحثهم. وقد وجدت دراسة لعمليات البحث في محرك بحث إكسايت أن أكثر من ٩٠٪ من عمليات البحث عثر أصحابها على بغيتهم في الصفحات الثلاث الأولى، لكن باستخدام جوجل فإن المستخدمين الذين يجدون بغيتهم في الصفحة الأولى أكثر من غيرهم.

يضع مستخدمو محرك البحث ثقة كبيرة في أنه سيمنحهم نتائج ليست فقط مفيدة بل وموثوقة، ويعتقد ٣٦٪ من المستخدمين أن ظهور شركة في أعلى قائمة نتائج البحث يعني أنها من كبرى الشركات في مجالها، ومن لا يظنون ذلك لم تتجاوز نسبتهم ٢٥٪. وبوجه عام لا يوجد سبب يدعونا إلى الثقة أن ترتيب البحث يتماشى مع مكانة الشركات وجودة منتجاتها أو خدماتها.

لعبة القط والفأر مع مرسلي البريد المزعج إلى المدونات

قد ترى تعليقات على مدونة لا تتضمن سوى بعض الكلمات العشوائية ورابطًا. هناك مكرِّر خبيث ينشر هذه الرسائل على أمل أن يقوم عنكبوت جوجل الإلكتروني بفهرسة صفحة المدونة، بما في ذلك الرابط غير المرغوب فيه، ومع ازدياد عدد الصفحات التي تشير إلى ذلك الرابط لعل ترتيبه على مقياس تصنيف بيدج يرتفع، ومِنْ ثَمَّ يظهر في نتائج البحث. وقد جابهت المدونات ذلك بأن أصبحت تجبر المستخدم على إدخال حروف موجودة بصورة مشوهة فيما يسمى بنص كلمة التحقق (اختبار مؤتمت تمامًا للتفرقة بين البشر وأجهزة الكمبيوتر) وهو اختبار لتحديد ما إذا كان الطرف الآخر الذي يرسل التعليق بشرًا أو مكرِّرًا، ورد مرسلو البريد المزعج بأن جعلوا مكرِّرهم يأخذ نسخة من الصورة ثم يعرضها على متطوعين من البشر يعملون معهم؛ ثم يأخذ المكرِّر ما أدخله المتطوع، ويستخدمه في الدخول إلى موقع المدونة، ويُجنَّد هؤلاء المتطوعون مقابل منحهم دخولًا مجانيًّا إلى مواقع إباحية إذا أصابوا في كتابة نص كلمة التحقق! وهذه عينة من نص كلمة التحقق:

نشرت هذه الصورة في النطاق العام بواسطة مؤلفها كروجلوف في مشروع ويكيبيديا، وهذا ينطبق على مستوى جميع أنحاء العالم.

(٦-٣) نتائج البحث يمكن التلاعب بها

البحث نشاط تجاري رائع. يضع مستخدمو الإنترنت الكثير من الثقة في النتائج التي يحصلون عليها من محركات البحث التجارية، ويميل المشترون إلى الضغط على أول رابط يظهر أمامهم أو على الأقل على رابط من الروابط التي تظهر في الصفحة الأولى، رغم أن تلك الروابط قد تعتمد اعتمادًا كبيرًا على محرك البحث الذي يستخدمونه، وذلك استنادًا إلى تفاصيل تقنية معقدة لا يكاد أي شخص يفهمها. بالنسبة لكثير من الطلاب، على سبيل المثال، فإن المكتبة هي الملاذ الأخير للبحث عن المعلومات، هذا إن استعانوا بها أصلًا، فهم يقومون بأبحاثهم وكأن أي شيء يأتي به محرك البحث الذي يستخدمونه يجب أن يكون رابطًا يوصلهم إلى الحقيقة، وإذا لم يعثر المستخدم على إجابات مفيدة فإنه يميل إلى لوم نفسه وتعديل سؤاله بدلًا من محاولة البحث باستخدام محرك بحث آخر، حتى لو أن الإجابات التي حصل عليها كانت متقلبة ولا يمكن تفسيرها، كما يحدث لأي شخص يبحث في جوجل عن kinderstart للعثور على موقع kinderstart.com.

في ظل هذه الظروف فإن أي شخص يُنشئ موقعًا له على شبكة الإنترنت ليُبلِغ به العالم رسالة ما سيصل إلى استنتاج واضح. إن ظهور الموقع في مرتبة عالية في قائمة البحث أمر بالغ الأهمية بحيث لا يمكن تركه للصدفة، ونظرًا لأن الترتيب أمر متعلق بالخوارزميات يتضمن مجموعة من القواعد التي تُتَّبع بعناية ودقة، فلا مناص من أنه يمكن التلاعب في النتائج. والطلب في هذا الشأن هو ما تستند إليه صناعة «تحسين ترتيب المواقع في نتائج محركات البحث».

تحسين ترتيب المواقع في نتائج محركات البحث هو نشاط يسعى إلى تحسين ترتيب صفحات ويب بعينها ضمن محركات البحث الرئيسية بهدف زيادة الإقبال عليها على شبكة الإنترنت. تسعى شركات مشروعة إلى تحسين مواقعها الإلكترونية لتنال مرتبة في نتائج البحث أعلى من مراتب منافسيها، كما يسعى المخادعون وناشرو المواد الإباحية إلى تحسين مواقعهم الإلكترونية عن طريق خداع خوارزميات محركات البحث كي تدرجها على أنها مشروعة، رغم أن مساعيهم للحصول على الشرعية ليست إلا تنكرًا. تعدل شركات محرك البحث خوارزمياتها لكشف ذلك التنكر، لكن قد يكون لذلك التعديل في بعض الأحيان آثار غير مقصودة على الشركات المشروعة، وهذا التعديل يجري في معظمه سرًّا لتجنب إعطاء المتلاعبين أي أفكار تعينهم على إجراء تدابير مضادة، والنتيجة معركة فوضوية تنال نارها مارَّةً أبرياء أصبحوا يعتمدون على ارتفاع ترتيب مواقعهم في محركات البحث، وقد يتضررون في بعض الأحيان مع تغير القواعد.

تقول جوجل عن خوارزمية تصنيف بيدج: «الديمقراطية على شبكة الإنترنت ناجحة.» وهي في ذلك تشبه طريقة الترتيب بحسب كثرة الروابط التي تشير إلى صفحة الويب بالانتخاب العام. لكن هذا التشبيه قاصر؛ فهناك العديد من الطرق للتلاعب في هذا «الانتخاب»، كما أن قواعد التصويت لا يُكشف عنها بصورة كاملة.

مفتاح النجاح في مجال تحسين ترتيب المواقع في نتائج محركات البحث يكمن في الطريقة الخاصة التي تتبعها محركات البحث في ترتيب صفحات الويب — العوامل والمعايير التي تؤثر في ذلك — ومِنْ ثَمَّ تعديل موقع الويب بحسب ذلك لتحسين مرتبته في صفحات نتائج البحث. على سبيل المثال، إذا كان محركُ بحثٍ ما يُعلي من شأن الكلمات المفتاحية التي تظهر في عنوان الصفحة، وأنت تريد أن تُعْلِيَ ترتيب موقعك في نتائج البحث عن كلمة «كاميرات»، فيجب عليك أن تضع كلمة «كاميرات» في العنوان. قد تكون العوامل المرجحة معقدة وتعتمد على أمور خارجة عن صفحة الويب، على سبيل المثال الروابط الخارجية التي تشير إلى صفحة الويب تلك أو عمر الرابط أو مكانة الموقع الذي يرتبط بها، وحتى تحصل على أثر ملموس في نتائج البحث يتعين عليك أن تبذل الكثير من الوقت والجهد والمال.

ثم هناك أساليب هي في أحسن الأحوال خداعة، وفي أسوأ الأحوال تُعتبر «حيلًا قذرة». لنفترض، على سبيل المثال، أنك مصمم الموقع الإلكتروني لأبلسون، وهو متجر جديد يريد أن يتنافس مع موقع بلومينجديلز. كيف يمكنك جذب الناس لزيارة موقع أبلسون في حين أنهم اعتادوا على التوجه إلى بلومينجديلز؟ فإذا وضعت عبارة «نحن أفضل من بلومينجديلز!» على الموقع فسيظهر موقع أبلسون في نتائج البحث عن «بلومينجديلز»، لكن قد لا تكون على استعداد لأن يكون الثمن هو الإشارة إلى الجهة المنافسة على موقع أبلسون. من ناحية أخرى، إذا وضعت كلمة «بلومنجديلز» بخط أبيض على خلفية بيضاء على صفحة أبلسون فإن الزائر لن يراها، لكن قد يراها برنامج الفهرسة على أي حال. يتعامل برنامج الفهرسة مع كود لغة ترميز النص الفائق HTML الذي يولِّد صفحة الويب، وليس مع ما يظهر على الصفحة نفسها، وقد لا يبلغ البرنامج من الذكاء ما يجعله يدرك أن لفظة «بلومنجديلز» في كود لغة ترميز النص الفائق لصفحة أبلسون لن تظهر فعلًا على الشاشة.
وقد أدى تحسين ترتيب المواقع في نتائج محركات البحث إلى ظهور صناعة ضخمة فيما يشبه الصناعة التي ظهرت بسبب حركة التنسيق لالتحاق الحاصلين على الشهادة الثانوية بالجامعات. حين بحثنا في جوجل عن هذا المصطلح بالإنجليزية search engine optimization بمعنى تحسين الموقع في نتائج محركات البحث، ظهر ضمن نتائج البحث أحد عشر رابطًا دعائيًّا، وكان من بينها إعلانات نصها «نضمن لك أن تكون الصفحة الأولى في الترتيب» و«اجعل صفحتك الصفحة الأولى اليوم.»

هل عالم البحث يتمتع بقدر أكبر من الأخلاقيات لأن صفقات تحسين ترتيب الصفحات تتم بصورة غير مباشرة، وبطريقة غير معلنة، وأن هذه المهمة توكل إلى شركات تحسين الترتيب وليس شركات البحث؟ على أي حال من المنطقي أنه إذا كان لديك رسالة مهمة تريد إبلاغها فإنك ستسعى إلى تحسين ترتيب موقعك في نتائج البحث، وعلى الأرجح لن يكون لديك موقع إلكتروني على الإطلاق إذا لم يكن لديك رسالة مهمة تريد إيصالها. وتميل شركات محركات البحث إلى نصح مصممي المواقع أن يطوروا مواقع أفضل وأكثر موضوعية، بالطريقة نفسها التي يحث بها المسئولون عن القبول طلاب المدارس الثانوية أن يتعلموا المزيد في المدرسة. لكن لن تؤدي هذه النصيحة المبدئية إلى اختفاء أيٍّ من صناعات «تحسين الترتيب» التي تقوم بها جهات أخرى.

كما أن تحديد ما هو «أفضل» — بالنسبة للمجتمع بشكل عام، وليس فقط بالنسبة لأرباح شركات البحث أو الشركات التي تعتمد عليها — قد يكون صعبًا جدًّا. يصف بيتر مورفيل في كتابه «إمكانية العثور على المعلومات» تأثير تحسين ترتيب المواقع في نتائج محركات البحث على موقع المعهد الوطني للسرطان www.cancer.gov. الهدف من إنشاء المعهد الوطني للسرطان هو توفير معلومات أكثر موثوقية وعالية الجودة لمن هم في أمَسِّ الحاجة إليها، وغالبًا ما يكونون ممن يعانون من السرطان، أو لهم أقارب يعانون منه، فإن بحثت عن كلمة سرطان بالإنجليزية cancer فسيمكنك العثور على موقع المعهد بالقرب من موضوع صفحة نتائج البحث، لكن هذا لن يحدث إذا بحثت عن أنواع من السرطان بعينها، وهذا هو بالضبط ما يفعله غالبية المستخدمين المستهدفين، فاستدعى المعهد خبراء في تحسين ترتيب المواقع في نتائج محركات البحث فتغيَّر الحال، فإذا بحثنا اليوم عن سرطان القولون colon cancer فسنجد أن صفحة ويب من موقع المعهد تتناول هذا النوع من السرطان تحديدًا تظهر بين أعلى نتائج البحث.

قنابل جوجل

«قنبلة جوجل» هي مزحة تجعل بحثًا بعينه يظهر لك نتائج مخادعة، وهي في كثير من الأحيان ذات مضمون سياسي. على سبيل المثال إذا بحثت عن «الفشل الذريع» بالإنجليزية miserable failure بعد انتخابات الرئاسة الأمريكية عام ٢٠٠٠ لعثرت على سيرة جورج بوش في البيت الأبيض. وقد شنت «الدائرة المستديرة للحرية الليبرتارية» حملة ضد جهات منها مركز علوم المصلحة العامة، وفي أوائل عام ٢٠٠٨، ظهر على موقع الدائرة www.libertyroundtable.org النص التالي «هل انضممت إلى متعة قنابل جوجل؟ هيا شن هجماتك على نازيي الغذاء وعلى الجريمة المنظمة. بمشاركتك قد تلعب دورًا مؤثرًا، اقرأ المزيد وشارك في هذه المتعة! الهدف الحالي: شركة فريزون للاتصالات، بسبب انتهاكاتها للحقوق المدنية.» يحدد الموقع كود HTML الذي يُدرج في صفحة الويب، ومن المفترض أن يخدع هذا الكود خوارزميات جوجل.

شن ماريك دبليو، وهو مبرمج يبلغ من العمر ٢٣ عامًا، من سيزين ببولندا، قصفًا جوجليًّا على رئيس بلاده ليخ كازينسكي، فكانت عمليات البحث باستخدام جوجل عن كلمة العضو الذكري بالبولندية تسفر عن نتائج بحث يتصدرها موقع الرئيس البولندي، وبالطبع لم يَرُقْ هذا للرئيس البولندي، وإهانة الرئيس تعد جريمة في القانون البولندي. لذلك يواجه ماريك الآن عقوبة السجن لمدة ثلاث سنوات.

هل هذا جيد؟ ربما، فإذا كنت لا تستطيع أن تثق في المعهد الوطني للسرطان فبمن تثق إذن؟ لكن لعل المواقع التجارية مثل WebMD التي تتقاتل على تَصَدُّر نتائج البحث لا توافق على هذا، وائتلاف مشروع مثل «المائدة المستديرة الوطنية لسرطان القولون والمستقيم» لا يظهر في نتائج البحث إلا في الصفحة السابعة، ما يعني أنه من المستبعد أن يلاحظه المستخدم.
تحسين الترتيب لعبةُ قطٍّ وفأرٍ لا تنتهي، فمن يعملون على تحسين ترتيب صفحاتهم يبحثون عن أفضل الطرق لعمل ذلك، والقائمون على أمر محركات البحث يبحثون عن سبل لتحقيق نتائج أكثر موثوقية، ويكون في هذه اللعبة ضحايا من الجانبين. نيل مونتكريف يبيع أحذية ذات مقاسات كبيرة عن طريق الإنترنت، وقد ازدهرت بضاعته لفترة من الوقت لأن نتائج عمليات البحث عن big feet (أقدام كبيرة) كانت تدل المستخدمين على متجره الإلكتروني 2bigfeet.com؛ إذ كان يحتل قمة القائمة، وذات يوم عدَّلت جوجل خوارزميتها لمكافحة التلاعب، فأطاح ذلك بموقع الرجل الذي لم يقترف ذنب التلاعب إلى الصفحة الخامسة والعشرين، الأمر الذي كانت له عواقب وخيمة على عمله التجاري الصغير الذي يعتمد كليةً على الويب.

التلاعب في ترتيب نتائج البحث ساحة من ساحات المعارك حول السلطة، ولأن البحث هو المدخل إلى المعلومات على شبكة الإنترنت فإن السيطرة على نتائج بحث ربما تسمح لك بالسيطرة على فكر الآخرين؛ لذلك ترى حتى الحكومات تدلي بدلوها في هذه المعارك.

(٦-٤) محركات البحث لا ترى كل شيء

تعجز محركات البحث القياسية عن فهرسة كثير من المعلومات التي يمكن الوصول إليها عبر الويب، فالعناكب الإلكترونية لا تتمكن من الوصول إلى قواعد البيانات وقراءة محتويات ملفات بي دي إف وأنواع أخرى من الملفات، أو البحث في مواقع مفيدة تتطلب تسجيلًا يسيرًا ومجانيًّا. لكن بقليل من المجهود الذي يتجاوز مجرد الكتابة في خانة البحث في جوجل أو ياهو ستعثر على ما تبغي بالتحديد، وخطأ جسيم أن يفترض المرء أن أمرًا ما غيرُ مهم أو غيرُ موجود لمجرد أن محرك البحث لم يعثر عليه. في موقع روبرت لاكي www.robertlackie.com تجد نظرة عامة جيدة حول الموارد التي يمكن عن طريقها العثور على ما تريده في «أعماق الويب».

(٦-٥) التحكم في البحث والتحكم في العقول

لتخفي كتابًا من مكتبة لا يتعين عليك أن تزيله من رف الكتب، كل ما عليك القيام به هو إزالة قيده من كتالوج المكتبة، فإذا لم يكن هناك قيد للكتاب يبين أين يمكن العثور عليه فلا يهم إذا كان الكتاب في الواقع لا يزال موجودًا على الرفوف أم لا.

عندما نبحث عن شيء فإننا نكون شِبْه متأكدين أن ما يظهره لنا محرك البحث هو الموجود، فأداة البحث هي العدسة التي عن طريقها نستعرض المعلومات، ونحن نعوِّل على العدسة أن لا تشوه المشهد أمامنا، رغم أننا نعرف أنه لا يمكن أن تُظهِر لنا المشهدَ كله دفعة واحدة، ومثلها مثل الكتاب الذي حُذف قيده من الكتالوج، فإن المعلومات التي لا يمكن العثور عليها قد لا يكون لها وجود؛ إذن فحذف المعلومات في العالم الرقمي لا يتطلب حذف الوثائق نفسها، فيمكنك أن تجعل الأشياء تختفي بأن تحذفها من الفهرس.
عن طريق التحكم في «إمكانية العثور» على الشيء يمكن استخدام أدوات البحث للإخفاء وكذلك للكشف والإبراز، وقد أصبحت الحكومات التي تسعى للسيطرة على ما تعرف شعوبها عن هذا العالم تستخدم تلك الأدوات، وهو موضوع نتناوله في الفصل السابع من هذا الكتاب. عندما دخلت الإنترنت إلى الصين بدأت المعلومات التي لم تكن متاحة سابقًا في التدفق على شعبها، وجابهت الحكومة الصينية ذلك عن طريق البدء في إقامة «جدار الصين الناري العظيم» الذي يغربل المعلومات فيستبعد ما لا تريد الحكومة أن يطَّلِعَ عليه الشعب. لكن سرعة تدفق المعلومات فاقت سرعة إغلاق الحكومة الصينية للمواقع الإلكترونية المخالفة لأوامرها، ومن التدابير التي اتخذتها الحكومة الصينية في هذا الشأن — قبل عقد مؤتمر الحزب الشيوعي في عام ٢٠٠٢ — كان إغلاق بعض محركات البحث، وأوضح متحدث باسم الحكومة الصينية قائلًا: «من الواضح أن هناك بعض المعلومات الضارة على شبكة الإنترنت، ولا ينبغي أن يُسمح لكل من هبَّ ودبَّ الاطلاع على هذه المعلومات الضارة.» وقد حُجب موقع جوجل على وجه الخصوص، ولعل هذا يرجع إلى أنه يوفر نسخًا مخبأة لصفحات حُذفت أو غُيرت أو لمواقع حَجبت عنها الحكومة الوصول المباشر.

كان البحث على الويب حينها يمثل أمرًا جوهريًّا للاقتصاد الصيني، بحيث لم يكن بوسع الحكومة حجب مواقع البحث لفترة طويلة. تطورت مهارات القائمين على الجدار الناري، وازدادت صعوبةُ وصولِ المستخدمين إلى المواقع المحظورة، لكن قد يظهر موقع من تلك المواقع في نتائج بحث جوجل، ولم يكن بوسع المستخدم الصيني حينها الوصول إليه لو نقر على رابطه، لكنه كان بذلك يعرف ما هو محجوب عنه.

في عام ٢٠٠٤، وتحت تهديد آخر بحجب موقعها في الصين، وافقت جوجل على فرض رقابة على خدمتها الإخبارية التي توفر الوصول إلى الصحف المنشورة على الإنترنت، وقررت شركة جوجل على مَضَض أن لا تدلي بأي معلومات على الإطلاق عن هذه الأمور بحجة أن «مجرد إظهار هذه العناوين من شأنه أن يؤدي على الأرجح إلى حجب خدمة «أخبار جوجل» حجبًا تامًّا في الصين.» لكن الحكومة الصينية لم تكتفِ بذلك.

وجاء الاختيار الصعب حقًّا بعد مضي عام على ذلك، فقد كان محرك بحث جوجل متاحًا داخل الصين، لكن خوادم جوجل كانت موجودة خارج الصين ما جعل ردود جوجل تتأخر. ولأن العديد من الروابط التي ظهرت أمام المستخدم الصيني لم تعمل، فقد أصبح محرك بحث جوجل غير قادر على المنافسة، إن لم نقل عديم الجدوى، وكان معظم الإقبال هناك على محرك البحث الصيني بايدو.

هذا جعل شركة جوجل أمام قرار مصيري: فإما أن تقبل أن تتعاون مع الحكومة الصينية وتخضع لرقابتها على الويب أو تضحي بالسوق الصينية. كيف لها أن توازن بين مسئولياتها تجاه مساهميها في النمو على الصعيد الدولي وفي الوقت ذاته تلتزم بهدفها كشركة ألا وهو «تنظيم المعلومات على مستوى العالم وجعلها متوافرة ومفيدة»؟ ترى هل لشركة كان أحد مؤسسيْها مهاجرًا من الاتحاد السوفييتي أن تهادن الرقابة الصينية؟

مقارنة بين جوجل في الولايات المتحدة وجوجل في الصين

يمكنك أن تجرب بنفسك بعض عمليات البحث:

  • www.Google.com هو النسخة المتاحة من جوجل في الولايات المتحدة.
  • www.Google.cn هو النسخة المتاحة من جوجل في الصين.
إن الإمكانية العالمية للوصول الشامل كانت بالفعل أكثر مما يمكن لجوجل أن تنجزه بصورة قانونية، حتى في الولايات المتحدة، فإذا اشتكى صاحب حقوق تأليف ونشر أن جوجل توفر للمستخدمين الوصول بشكل غير صحيح إلى مواد محفوظة الحقوق، فإن جوجل تستجيب لشكواه عن طريق إزالة رابط البحث ذي الصلة من نتائج البحث التي تظهرها، وسوى ذلك كانت هناك قوانين أمريكية أخرى حول محتوى الويب، مثل قانون آداب الاتصالات، الذي نتناوله في الفصل السابع من هذا الكتاب.

وكان رد فعل جوجل تجاه السلطات الصينية، من منظور معين، لا يعدو كونه إحدى الممارسات العادية لأي شركة: فعليك أن تمتثل للقوانين المحلية في أي مكان تتاجر فيه. وقد احتجَّت الصين بالقوانين الأمريكية على منتقديها من الأمريكان، فقد صرح السيد ليو تشنج رونج، نائب رئيس مكتب شئون الإنترنت التابع لمكتب استعلامات مجلس الدولة الصيني، قائلًا: «بعد دراسة لتشريعات الإنترنت في الغرب وجدت أن لدينا أهدافًا ومبادئ تشريعية متطابقة مع مثيلاتها الغربية. من الظلم ومن ازدواجية المعايير أن ينتقد «الأجانب» الصين لحذفها الرسائل غير المشروعة والضارة، في حين أن القانون الأمريكي نفسه ينص على ذلك داخل الولايات المتحدة.»

وهكذا، عندما وافقت جوجل في أوائل عام ٢٠٠٦ على فرض رقابة على نتائج بحثها في نسختها الصينية، أيقظ ذلك البعض من أحلامهم بمدينة عالمية فاضلة للمعلومات، ففي بيان لها صرحت جوجل أنه: «رغم أن حذف نتائج البحث لا يتفق مع هدف جوجل، فإن عدم توفير المعلومات (أو إفساد تجربة المستخدم بشدة بحيث يرقى الأمر إلى حرمانه من أي معلومات) أمر يتعارض بصورة أكبر مع هدفنا.» وقد بدا هذا العذر للبعض عذرًا واهيًا، وقد رد أحد المعلقين الليبرتاريين معربًا عن خيبة أمله بقوله: «إن ما تفعلونه يمهد الطريق أمام قوى الشر في هذا العالم.» (على ما يبدو هذه إشارة إلى مبدأ آخر من مبادئ جوجل؛ ألا وهو «لا تكن شريرًا!» وقد نُقِّح الآن فصار: «يمكنك كسب المال دون أن تقع في الشر».) وقد عاب الكونجرسُ الأمريكي ذلك على شركة جوجل وشركات بحث أخرى، فقد قال ممثل كاليفورنيا توم لانتوس: «إن أعمالكم البغيضة في الصين وصمة عار، لا أستطيع أن أفهم كيف يَسَعُ مديريكم التنفيذيين أن يناموا ليلًا.»

نتائج تسوية جوجل المذلة لافتة للنظر، وهذا لا يخفى على أحد. يظهر الشكل ٤-١٠ أعلى نتائج بحث أظهرتها النسخة الأمريكية من جوجل ردًّا على البحث عن المذهب الروحي «فالون جونج».
fig36
شكل ٤-١٠: نتائج البحث عن «فالون جونج» باستخدام النسخة الأمريكية من جوجل.1
على النقيض من ذلك، يُظهر الشكل ٤-١١ النتائج القليلة الأولى للبحث عن نفس الكلمات لكن باستخدام النسخة الصينية من جوجل. جميع النتائج هي معلومات سلبية عن هذه الممارسة، أو تقارير عن إجراءات اتخذت ضد من يمارسونها.

في معظم الأحيان سواء أكنتَ تستخدم النسخة الأمريكية أم النسخة الصينية من جوجل ستحصل على نتائج مماثلة. على وجه الخصوص، إذا بحثت عن كلمة «حذاء»، فستظهر لك روابط دعائية لمتاجر أحذية على الإنترنت كي يتسنى لشركة جوجل أن تدفع فواتيرها.

لكن هناك استثناءات كثيرة، فقد عقد أحد الباحثين مقارنة بين نتائج بحث النسختين الأمريكية والصينية من جوجل عن طريق البحث عن ١٠ آلاف مفردة إنجليزية، ووجد أن ما يقرب من ٩٪ منها أظهرت ردودًا تخضع للرقابة، وهناك إصدارات مختلفة من قائمة الكلمات المحظورة، والمعايير الخاصة قابلة للتغيير دون إشعار بالتأكيد. تضمنت الإصدارات الأخيرة مفردات مثل «جريمة ضد الإنسانية» و«القمع» و«الإبادة الجماعية»، فضلًا عن قوائم بأسماء المعارضين والسياسيين.

fig37
شكل ٤-١١: نتائج البحث عن «فالون جونج» باستخدام النسخة الصينية من جوجل.1

إن عدسة محرك البحث ليست حيادية، وفي هذا النطاق يمكن أن يكون البحث أداة فعالة للسيطرة على الفكر. قال مسئول تنفيذي من جوجل أمام الكونجرس: «في عالم يفتقر إلى الكمال تعيَّن علينا أن نختار خيارًا بعيدًا عن المثالية.» هذا حقيقي بالتأكيد، لكن التجارة هي التجارة، وكما قال إريك شميت المدير التنفيذي لجوجل عن ممارسات الشركة: «هناك العديد والعديد من الطرق التي يمكنك عن طريقها إدارة العالم وإدارة شركتك … فإذا لم يعجبك هذا فلا تشارك، لقد جئتَ إلى هنا طواعية، ولم نجبرك على المجيء.»

الصفحة الرئيسية لمبادرة أوبن نت في مركز بيركمان للإنترنت والمجتمع opennet.net لديها أداة تمكنك من معرفة أي الدول تمنع وصولك إلى الموقع الذي تفضله (أو لا تفضله). ظهر موجز للنتائج في كتاب بعنوان «ممنوع الدخول» (مطبعة معهد ماساتشوستس للتكنولوجيا، ٢٠٠٨).

(٧) عمَّ بحثت؟ تتبُّع عمليات البحث

يمكن لشركات محركات البحث أن تخزن كل ما تبحث أنت عنه، وكل ما تنقر عليه. وفي ظل عالم لا تعرف سعة التخزين فيه حدودًا تستفيد شركات البحث من الاحتفاظ بهذه البيانات التي قد يكون لها استخدام يومًا ما، وهي تشكل جزءًا هامًّا من عملية البحث. لكن الاحتفاظ بسجلِّ ما بَحَثَ عنه المرء على محرك البحث أمر يثير تساؤلات قانونية وأخلاقية، فالقدرة على الاحتفاظ بسجلات عمليات البحث وتحليلها هي نقطة قوة أخرى تأتي من معرفة ما يثير اهتمامك كفرد، وما يثير اهتمام المجتمع ككل.

البحث عن الصور

هناك محركات بحث متخصصة في البحث عن الصور، والبحث عن الوجوه، وهذا يمثل نوعًا مختلفًا من التهديد للخصوصية. لقد أصبح التعرف على الوجه بواسطة الكمبيوتر مؤخرًا أمرًا سريعًا وموثوقًا به، فأجهزة الكمبيوتر صارت الآن تفوق البشر في القدرة على التعرف على صور الأشخاص، وفي ظل وجود ملايين الصور المتاحة للجمهور على شبكة الإنترنت كل ما نحتاج إليه هو صورة واحدة بها كلمات دلالية تتضمن اسمك لنجد صورًا أخرى لك. هناك أسلوب مشابه يمكننا من العثور على المنتجات عبر الإنترنت باستخدام صور لسلع مشابهة، ومن بين المواقع التي توفر خدمة المطابقة بين الصور riya.com وpolarrose.com وlike.com.
لكن لماذا تكلف شركات البحث نفسها عناء الاحتفاظ بكل ضغطة زر على لوحة المفاتيح وكل نقرة فأرة؟ هناك أسباب وجيهة لعدم القيام بذلك؛ فهذا يهدد خصوصية الفرد، وهذا ما ناقشناه في الفصل الثاني من هذا الكتاب. على سبيل المثال، بموجب القانون الأمريكي لمكافحة الإرهاب يحق للحكومة الاتحادية، في ظل ظروف معينة، أن تلزم شركة البحث التي تتعامل أنت معها بأن تكشف عما كنت تبحث عنه، دون أن تخطرك بأنها تحصل على تلك البيانات، وهناك ظروف مماثلة يسهل تصور وجودها في البلدان التي تُعرف بالقمع. حين سلَّم موقع ياهو رسائل البريد الإلكتروني التي تخص المنشقين الصينيين إلى الحكومة الصينية امتثالًا منه للقوانين المحلية قامت الحكومة بسجنهم، وتساءل النائب كريس سميث: «لو أن الشرطة السرية قبل نصف قرن سألت عن مكان اختباء آن فرانك، فهل كان من المستساغ أن تعطَى المعلومات امتثالًا للقوانين المحلية؟» ماذا لو كانت البيانات أسئلة بحث على الويب لا رسائل بريد إلكتروني؟

من وجهة نظر شركة البحث من السهل أن نفهم السبب وراء الاحتفاظ بكل نقرة بالفأرة قمتَ بها. يبين مؤسس جوجل سيرجي برين كل شيء على صفحة «فلسفة» شركة جوجل فيقول: «إن محرك البحث الأمثل هو الذي يفهم بالضبط ما يعني المستخدم ويمنحه ما يريده بالتحديد.» سجل بحثك على الويب ينبئ بالكثير، ومحرك البحث يقرأ أفكارك بطريقة أفضل بكثير إذا ما عرف كيف كنت تفكر في الماضي.

ويمكن تحسين جودة البحث إذا احتُفِظَ بسجلات البحث. قد نفضل، لأسباب تتعلق بالخصوصية، أن لا تتذكر محركات البحث أيًّا من أفعالنا، لكن سيكون لهذا الأمر ثمن؛ بالنسبة لنا سيقلل ذلك من أداء محرك البحث، وبالنسبة لشركة البحث سيقلل من قدرتها التنافسية. ما من شيء إلا وله ثمن، ومهما كانت نظريتنا عن محرك البحث وتتبعه لما نبحث عنه فإننا في الواقع لا نقلق كثيرًا بشأن ذلك، حتى لو علمنا به.

حتى وإن لم يكن هناك ربط لبيانات البحث بهُويتنا الشخصية فإن نتائج البحث المجمعة مع مرور الوقت توفر بيانات قيمة للتسويق والتحليل الاقتصادي. يظهر الشكل ٤-١٢ نمطًا من عمليات البحث باستخدام جوجل عن هاتف «آي فون» إلى جانب هُوِيَّة من بعض المقالات الإخبارية بعينها، ويبين الرسم البياني عدد المقالات الإخبارية (من بينها فهارس جوجل) التي ورد فيها ذِكْرٌ لجهاز آي فون من أبل. لقد أوجد البحث على الويب أصلًا جديدًا: مليارات من البِتات التي تتضمن معلومات حول ما يريد الناس معرفته.
يمكنك تتبع الاتجاهات بنفسك عن طريق www.google.com/trends.
fig38
شكل ٤-١٢: الخط العلوي يبين عدد عمليات البحث في جوجل عن «آي فون»، أما الخط السفلي فيدل على عدد المرات التي وردت فيها كلمة آي فون في فهارس مصادر أخبار جوجل.1

(٨) تقنين عمل السماسرة أو استبدالهم

أصبحت محركات البحث نقطة مركزية للتحكم في العالم الرقمي الذي كنا في يوم من الأيام نظن أنه عالم مثالي لا يعرف المركزية تتدفق فيه المعلومات بحُرِّية. إن ما يهم في قصة البحث ليست التكنولوجيا أو المال، رغم أن هذيْن العنصريْن موجودان بكثرة، بل ما يهم فيها هو السلطة والقدرة؛ القدرة على أن تظهر أمورًا للآخرين، وأن تجعلها موجودة أو تجعلها تختفي من الوجود، والتحكم في المعلومات وفي الوصول إليها.
توجِد محركاتُ البحث قيمة تجارية لا عن طريق خلق المعلومات، بل عن طريق مساعدة المستخدمين في العثور عليها، وذلك عن طريق فهم ما يريدون العثور عليه، وتوجيه الإعلانات على أساس هذا الفهم. يطلق بعض النقاد إجحافًا على ذلك اسم «العيش على نفقة الآخرين» كما لو أنهم هم أنفسهم كان بوسعهم أن يبدعوا شيئًا يضارع جوجل لو أنهم لم يفضلوا أن يفعلوا شيئًا أكثر إبداعًا (انظر الفصل السادس من هذا الكتاب). إنها ظاهرة رائعة: تفوق القيمة السوقية للوصول للمعلومات القيمة السوقية لإبداع المعلومات وابتكارها، فالقيمة السوقية لجوجل (١٥٧ مليار دولار) أكبر بنسبة ٥٠٪ من رأس المال المشترك لصحيفة نيويورك تايمز (٣ مليارات دولار)، ودار بيرسون للنشر (١٣ مليار دولار)، وموقع إي باي (٤٥ مليار دولار)، وميسي (١٥ مليار دولار). انظر كيف أن شركة توفر الحصول على معلومات لم تبتكرها تفوق في قيمتها السوقية الشركات التي ابتكرت تلك المعلومات، في بازار البِتات يربح الوسطاء أكثر من المحلات التجارية.

البدائل المفتوحة

هناك المئات من مشاريع البحث مفتوحة المصدر، ولأن المصدر البرمجي لهذه المحركات مفتوح فيمكن لأي شخص أن ينظر فيه ويعلم كيف يعمل محرك البحث، ومعظمها لا يفهرس كل الويب، بل يفهرس جزءًا صغيرًا منها؛ لأن البنية التحتية اللازمة لفهرسة الويب ككل واسعة جدًّا. لا يزال مشروع Nutch (lucene.apache.org/nutch, wiki.apache.org/nutch)، قيد التطوير، لكنه يستخدم بالفعل لمجموعة متنوعة من مجالات المعلومات المتخصصة. هناك أيضًا مشروع ويكيا سيرش، وهو مشروع متطور تبناه مؤسس ويكيبيديا جيمي ويلز (search.wikia.com/wiki/Search_Wikia)، ويستخدم Nutch كمحرك بحث، ويَعِد القائمون عليه بالاستفادة من مشاركة المجتمع المحلي لتحسين نوعية البحث، وعلاوة على ذلك، تُمثل الخصوصية مبدأً أساسيًّا فيه، فلا يُحتفظ ببيانات تكشف هُوِيَّة المستخدمين.
بناء السلطة وإعادة توزيعها هو أحد الآثار الجانبية غير المتوقعة لصناعة البحث. هل ينبغي أن توضع أي ضوابط؟ وهل ينبغي أن يراقب أي أحد (عدا الخدمات من قبيل searchenginewatch.com) هذه الصناعة؟ كانت هناك اقتراحات عدة للكشف عن اختيار محرك البحث وخوارزميات الترتيب، لكن طالما لا تزال المنافسة في السوق، فمن غير المتوقع أن يصدر قانون بهذا الشأن في الولايات المتحدة، رغم أن مايكروسوفت ادعت أمام لجنة التجارة الفيدرالية أن جوجل كادت أن «تسيطر على حصة تبلغ حد الاحتكار» من الإعلانات على الإنترنت، ورفضت لجنة التجارة الفيدرالية توجيه هذه التهمة إلى جوجل، وقد أثلج ذلك صدور بعض من لا يزالون يتذكرون دفاع مايكروسوفت المستميت منذ بضع سنوات خلت حين اتُّهِمَت بأنها تحتكر مجال برامج الكمبيوتر. الأمور تتغير بسرعة في العالم الرقمي.

محركات البحث المتعدد

أدوات مثل copernic.com وsurfwax.com وdogpile.com هي محركات بحث متعدد؛ فهي توجه السؤال إلى عدة محركات بحث ثم تحصل على النتائج فتوجهها إلى المستخدم كما لو كانت هي محرك البحث الذي عثر على النتائج على أساس خوارزميات ترتيبها. وفق نظرية العيش على نفقة الآخرين، فهذه المواقع الطفيلية تعيش على نفقة من يعيش على نفقة الآخرين.

نحن نعتمد على محركات البحث، لكننا لا نعرف ماذا تفعل تلك المحركات، وليس هناك أجوبة سهلة للسؤال: ماذا عسانا أن نفعل حيالها؟

لقد هالَ الرئيسَ الفرنسي جاك شيراك أن يعتمد العالم كله على محركات البحث الأمريكية كوسطاء معلومات، ولمواجهة الهيمنة الأمريكية أعلنت فرنسا وألمانيا اعتزامهما إنشاء محرك بحث ترعاه حكومات الدول الأوروبية في أوائل عام ٢٠٠٦، وقال شيراك: «علينا مواجهة التحدي الذي يشكله العملاقان الأمريكيان جوجل وياهو؛ لذلك فإننا سوف نطلق محرك البحث الأوروبي كوايرو Quaero.» وأوضح أن الحكومات الأوروبية تنوي دخول هذا المجال الخاص «وهي تحمل وسام قصة نجاح شركة إيرباص … فالثقافة ليست بضاعة، ولا يمكن أن تُترك لقوى السوق العمياء.» وبعد ذلك بعام انسحبت ألمانيا من هذا التحالف؛ لأنه، وفقًا لأحد المصادر في هذا المجال «مل الألمان من تقريع فرنسا لأمريكا، وفكرة تطوير بديل لجوجل.»

إذن في الوقت الحاضر على الأقل سوق محركات البحث لها اليد العليا، وعلى المشتري توخي الحذر، وربما هذا هو ما ينبغي أن يكون الحال عليه، ففي كثير من الأحيان يكون أثر جهود أصحاب النوايا الحسنة لتقنين التكنولوجيا أسوأ بكثير من أثر الشرور التي بذلت من أجلها تلك الجهود، وسنرى العديد من الأمثلة في الفصول القادمة من هذا الكتاب.

•••

تكنولوجيا البحث، جنبًا إلى جنب مع الشبكة العالمية، لها تأثير عجيب في الحصول على المعلومات على المستوى العالمي، والفرص التي تتيحها للحد من المعلومات لا تلقي بظلالها على قدرتها على التنوير. إننا نجد أشياء كان لا يمكن تصورها قبل عقد من الزمان غدت اليوم من الأمور البسيطة، يمكننا جميعًا أن نجد أقاربنا المفقودين، ويمكننا جميعًا أن نجد مجموعات دعم جديدة وأحدث المعلومات الطبية للأمراض التي نعاني منها مهما كانت غامضة، يمكننا أن نجد حقائق في كتب لم تقع في أيدينا قط. إن البحث على الويب يسلط مشعل الانفجار الرقمي على الأمور التي نريد إظهارها.

لكن تكنولوجيا التشفير لها هدف معاكس تمامًا: أن تجعل المعلومات سرية، حتى لو جرى تبادلها عبر شبكات مفتوحة عامة، وهذه القصة المتناقضة التي تضم في ثناياها كلًّا من السياسات والرياضيات هي موضوع الفصل التالي.

هوامش

(1) Google™ is a registered trademark of Google, Inc. Reprinted by permission.
(3) Source: Home Depot.
(4) Source: Federal Trade Commission.
(5) Reprinted with permission of SmartDevil, Inc.

جميع الحقوق محفوظة لمؤسسة هنداوي © ٢٠٢٤