إبر في كومة القش
(١) لمُّ الشمل بعد سبعين عامًا
كانت روزالي بولوتسكي تبلغ من العمر عشر سنوات حين لوَّحت بيدها مودعة لابنتَيْ خالتها صوفيا وأوسي في محطة قطار موسكو عام ١٩٣٧. كانت الأختان تهربان من بطش الروس واضطهادهم لتبدآ حياة جديدة، أما أسرة روزالي فقد بقيت في أرض الوطن. كبرت روزالي في موسكو، وعملت معلمة للغة الروسية، ثم تزوجت من نارمان بيركوفيتش، وصارت لها حياة أسرية خاصة بها، وفي عام ١٩٩٠ هاجرت إلى الولايات المتحدة الأمريكية لتستقر مع ابنها ساشا في ماساتشوستس.
لطالما فكرت روزالي وزوجها وابنها في مصير صوفيا وأوسي، فالستار الحديدي قطع بالكلية التواصل بين هؤلاء الأقارب اليهود، وحين رحلت روزالي إلى الولايات المتحدة كانت صلتها بصوفيا وأوسي قد انقطعت لمدة طويلة جدًّا تضاءل معها الأمل في أن تراهما مرة أخرى، وكلما مرت الأعوام قلَّ ما يدعوها إلى التفاؤل في أن تكون ابنتا خالتها ما زالتا على قيد الحياة، ورغم أن جَدَّ ساشا كان يحلم بلقائهما، فإن بحث ساشا في سجلات المهاجرين في إيليس آيلاند وسجلات هيئة الصليب الأحمر الدولية باء بالفشل، ربما لم تتمكن الفتاتان من اجتياز أوروبا وقت الحرب العالمية الثانية كي تتمكنا من الوصول إلى الولايات المتحدة.
ثم أتى يومٌ بحث فيه ابن عم لساشا في جوجل عن الاسم «بولوتسكي»، ووجد خيطًا يبعث الأمل، لقد وجد على موقع إلكتروني يهتم بالأنساب ذِكرًا لشخص يُدعى ميناكر، وهو اسم والد صوفيا وأوسي، وسرعان ما التأم شمل روزالي مع صوفيا وأوسي في ولاية فلوريدا بعد فراق دام ٧٠ سنة. يقول ساشا وهو يتذكر رغبة جده: «كان طيلة حياته يطلب مني أن أفعل شيئًا للعثور عليهما. إن هذا ليشبه السحر.»
أسفر الانفجار الرقمي عن قدر هائل من البيانات المفيدة، ونشرت الإنترنت البياناتِ في جميع أنحاء العالم، ووضعت شبكة المعلومات العالمية تلك البيانات في متناول الملايين من عامة الناس. لكن لا يمكنك الوصول لشيء إذا كنت لا تعرف أين هو، وربما لا يكون لمعظم ذلك المخزون الكبير من المعلومات الرقمية أهمية إن تعذَّر علينا أن نجد وسيلة للعثور عليه. بالنسبة لمعظمنا، فإن وسيلة العثور على أشياء على الويب هي محركات البحث، والبحث تكنولوجيا ثورية عجيبة تحقق الأحلام وتشكل المعرفة الإنسانية، لقد أصبحت أدوات البحث التي تساعدنا على العثور على الإبر في كومة القش الرقمية بمثابة العدسات التي من خلالها ننظر إلى المشهد الرقمي، وتستخدمها الشركات والحكومات لتشويه صورة الواقع لدينا.
(٢) المكتبة والبازار
مقارنة بين الويب ١٫٠ والويب ٢٫٠
وبينما أخذت الويب تنحو منحاها التجاري بدأت تظهر الأدلة، بما في ذلك «الصفحات التجارية» المطبوعة، وتجد في تلك الأدلة قوائم بأماكن يمكنك زيارتها على الويب للحصول على مختلف المنتجات والخدمات، فإذا كنت تريد شراء سيارة فستنظر في مكان ما، وإذا كنت تبحث عن عمل فستنظر في مكان آخر، وتشبه هذه القوائم الفئات التي كانت تقدمها أمريكا أونلاين وكمبيو سيرف قبل أن يصير باستطاعة المستهلكين الاتصال مباشرة بالإنترنت، كان من يتولى إنشاء تلك القوائم من البشر، وكان المحررون هم من يتولى أمر التصنيف واستبعاد ما يحق استبعاده.
ومنذ منتصف تسعينيات القرن العشرين تغيرت الويب تغيرًا جذريًّا، فأولًا: لم تعد الويب موردًا سلبيًّا للمعلومات، فالمدونات وموقع ويكيبيديا وموقع فيسبوك هي ثمرةُ تعاونِ وتَشَارُكِ الكثيرين، حيث يدلي كل مشارك بما يفيد الآخرين من معلومات، وأصبح إنشاء المواقع الإلكترونية سهلًا، وتكلفته رخيصة، فأصبح بوسع أي فرد عادي، وحتى أصغر المؤسسات والشركات، امتلاك موقع إلكتروني، ونتيجة لذلك فإن مضمون ومدى ترابط الويب آخذان في التغير طوال الوقت.
ثانيًا: لقد عَظُمَ اتساع الويب وافتقارها إلى التنظيم، بحيث صار يتعذر على بشر أن يقسمها إلى فئات محددة بدقة. إن صفحات الويب لا تصلح للتنظيم في بنية متناسقة ليصير عندنا مخطط تفصيلي لها. ليست هناك خطة رئيسية للويب، فكل يوم تضاف أعداد كبيرة من صفحات الويب وبطريقة غير منظمة تمامًا، ولا يمكنك أن تعلم علم اليقين ما الذي تحتويه صفحة ويب بمجرد النظر في عنوان رابطها.
علاوة على ذلك، لن يسعفك التنظيم الهرمي في العثور على معلومات إذا لم تعلم أين موقعها تحديدًا، فنحن لا ندخل إلى الويب للبحث عن صفحة ويب بعينها، بل إن ما نسعى إليه هو المعلومات، ويسرنا أن نجدها أينما كانت. في كثير من الأحيان لا يمكنك حتى أن تخمن أين عساك أن تبحث عما تريد، وتجد أن وجود تنظيم هيكلي مرتب وأنيق للمعلومات لن يثمر شيئًا. على سبيل المثال، إن كان هناك تنظيم جيد للمعرفة الإنسانية في شكل موسوعة، فستجد بها قسمًا يتكلم عن الأبقار، وستجد قسمًا آخر يتكلم عن القمر، لكن إذا كنت لا تعرف أن هناك أنشودة للأطفال عن بقرة تقفز فوق سطح القمر، فإن ما تذكره تلك الموسوعة عن «البقرة» وما تذكره عن «القمر» لن يسعفك في فهم ماذا عساها تلك البقرة أن تكون قد فعلتْ على القمر، لكن إذا أدخلت الكلمتيْن «بقرة» و«قمر» معًا في محرك بحث، فستجد المعلومة التي تريدها في غمضة عين.
لقد صار البحث هو النموذج الجديد المتبع في العثور على المعلومات، وليس فقط على الشبكة ككل. فإذا زرت الموقع الإلكتروني لوول مارت فيمكنك تتبع التنظيم الهرمي الذي يوفره على صفحاته، في المستوى الأعلى تجد نفسك تختار بين عناوين منها «إكسسوارات»، «أطفالي»، «أولادي»، «بناتي»، وهلم جرًّا، فإن نقرت على الرابط «أطفالي» ظهرت أمامك صفحة أخرى بها اختيارات «أولاد رضع» و«دارِجات» وهلم جرًّا. كما أن هناك نافذة بحث في الجزء العلوي من الصفحة. أدخل ما تريد البحث عنه، وسرعان ما تنتقل مباشرة إلى ما كنت تبحث عنه، لكن داخل موقع وول مارت، ومحركات البحث المحدودة هذه تساعدنا في تبادل الصور وقراءة الصحف وشراء الكتب على الإنترنت من موقع أمازون أو بارنز آند نوبل، وحتى العثور على بريد إلكتروني قديم على أجهزة الكمبيوتر المحمولة.
فيما يلي بعض النتائج المثيرة للاهتمام من جوجل لعام ٢٠٠٧: من بين أسئلة «ما هو …؟» كان «الحب» رقم ١، و«النقرس» رقم ١٠، ومن بين أسئلة «كيف …؟» كانت أكثر الأسئلة عن «التقبيل»، وفي المركز العاشر كان «التزلج».
لم تعد الويب مجرد مكتبة، إنها سوق فوضوية لمليارات الأفكار والوقائع التي جمعها معًا تحت سقف واحد الانفجار الرقمي. إن من لديه المعلومة ومن يريدها يسعى كل منهما وراء الآخر، بل ويتبادلان الأدوار، وفي ظل هذا البازار الرقمي الغامض — بكل ما يعج به من حركة وجلبة — تلعب محركات البحث دور الوسيط، ووظيفتها ليست أن تزودك بالحقيقة التي لا مرية فيها، بل ولا هي حتى تحكم على دقة ما يطرحه الآخرون على الشبكة، بل هي همزة وصل بين مَنْ لديه المعلومة ومن يبحث عنها، ولا يتوقف نجاحها أو فشلها على جودة المعلومات التي تقدمها؛ لأن المحتوى الذي تجده عليها لم توجِده هي، بل عثرت عليه، فما هي إلا رابط يربط بينك وبين ما تريد، بل إن نجاحها وفشلها يتوقف على ما إذا كانت توصلنا إلى ما نريد أم لا وليس أكثر. في البازار لا يحوز قصبَ السبق مِنْ هؤلاء الوسطاء مَنْ كان أكثرهم علمًا ومعرفةً؛ بل إن سر بقاء عمل الوسيط ونجاحه يكمن في أن يوفر لمعظم زبائنه وباستمرار ما يريدون طوال الوقت.
إن البحث يفعل أكثر من أن يعثر لنا على ما نريد، فهو يساعدنا كذلك على اكتشافِ أمورٍ لم نكن نعرف أنها موجودة من الأساس، فعن طريق البحث يمكننا أن نتقصى ما نريد ونحن جالسون على أحد كراسي منزلنا، وذلك بأن نجد مفاجآت في الكتاب المجاور للكتاب الذي وقع اختيارنا عليه من رفوف الكتب الرقمية، أو نتشمَّم غبار المعلومات المثيرة التي بعثرها طوفان الانفجار الرقمي هنا وهناك.
(٢-١) السر الدفين على بُعد نقرة واحدة
الفصام مرض رهيب يصيب المخ، ويعاني منه الملايين. وإذا أردت أن تطَّلِع على أحدث العلاجات لهذا المرض فلتحاول العثور على بعض المواقع الإلكترونية وتقرأ المعلومات التي تحتويها.
بريتني في بازار الإنترنت
-
الويب بحر شاسع، فكيف يمكن لمحرك بحث أن يعثر على تلك النتائج بهذه السرعة؟ هل يعثر على كل رابط مناسب؟
-
ما هو المعيار الذي تتبعه جوجل في ترتيب صفحات الويب فتقول هذه رقم ١ وتلك رقم ٢٨٣٠٠٠؟
-
إذا استخدمت محرك بحث آخر فستحصل على نتائج مختلفة، فأيهما صواب؟ وأيهما أفضل؟ وأيهما أكثر موثوقية؟
-
هل المقصود أن الروابط الدعائية أفضل من الروابط العضوية، أم أسوأ منها؟ وهل الإعلان ضروري حقًّا؟
-
ما مدى رقابة الحكومة على هذا؟ إذا ظلت محطة تليفزيونية تنشر الكذب والأباطيل فإن السلطات ستلاحقها، فهل ستفعل شيئًا تجاه محركات البحث؟
تلك الأسماء المضحكة
سنتناول كل سؤال من هذه الأسئلة في وقته، لكن دعونا الآن نواصل مغامرتنا الطبية مع الفصام.
عندما نقرنا أول رابط عضوي ظهرت أمامنا صفحة من موقع إلكتروني يتبع إحدى الجامعات السويدية المرموقة، ووجدنا أن تلك الصفحة تتضمن بعض المعلومات عن أنواع مختلفة من عقاقير انفصام الشخصية، منها عقار يسمى «أولانزابين (زيبريكسا)»، وكان للاسم التجاري لهذا العقار وقعٌ في الأذن فبدأنا نبحث عن كلمة «زيبريكسا».
طالبت الشركة بإعادة المستندات وأن تُعدم كل نسخها وأن تلزِم المحكمة المواقع الإلكترونية التي نشرتها بحذفها، ونشبت معركة قانونية. وفي ١٣ فبراير عام ٢٠٠٧ أصدر القاضي جاك بي واينشتاين من المحكمة الجزئية الأمريكية في نيويورك حُكمًا وأمرًا قضائيًّا. نعم، ما جرى لتلك المستندات كان خطأ جسيمًا، ويتعارض مع أوامر المحكمة التي أصدرتها في وقت سابق. لقد تحايل المحامون والصحفي على النظام القانوني، وانطوت فعلتهم على تواطؤ مع محامٍ من ألاسكا ليس له علاقة بهذه القضية، من أجل الحصول على المستندات، وحين صدر الحكم اضطر هؤلاء المحامون الذين تآمروا للحصول على المستندات إلى إعادتها ولم يحتفظوا بأي نسخ منها، وفُرض عليهم أن لا يعطوا أي نسخة إلى أي شخص آخر.
لكن خَلُص القاضي واينشتاين إلى أن أمر المواقع الإلكترونية كان مسألة أخرى، فلم يأمر القاضي المواقع الإلكترونية بحذف نسخ المستندات من على صفحاتها. كان من حق الشركة المصنِّعة استعادة المستندات الورقية، لكن الصورة الإلكترونية لتلك المستندات تسربت ولا سبيل إلى استردادها، وحتى كتابة هذه السطور لا تزال تلك المستندات معروضة على بعض المواقع، وسرعان ما وجدناها عن طريق البحث عن «مستندات زيبريكسا».
لقد مضى ذلك العهد الذي كان فيه بوسع القاضي أن يأمر بإعادة «جميع» نسخ المواد المخالفة. فحتى لو كان هناك مئات من النسخ في خزائن الملفات والأدراج المكتبية كان باستطاعة القاضي أن يصر على إعادتها جميعًا تحت تهديدٍ بفرض عقوبات قاسية، لكن الويب ليست خزينة ملفات وليست دُرج مكتب، وكتب القاضي واينشتاين يقول: «مواقع الويب هي في المقام الأول منابر للتعبير.» وقد طلبت الشركة المصنِّعة من المحكمة أن تصدر أمرًا بمنع المواقع الخمسة التي كانت قد نشرت المستندات، لكن بوسع الملايين من المواقع الأخرى أن تنشر تلك المستندات في المستقبل، وخلص القاضي إلى أن «السعي إلى منع تلك المنابر من نشر المعلومات لن يكون إلا حرثًا في الماء.» وعلى الأرجح لن يجدي نفعًا إصدارُ أمر قضائي أوسع نطاقًا، وحتى لو فعلنا لكان «ينبغي ما أمكن تجنب مخاطر وضع موانع غير محدودة أمام حرية التعبير.»
لقد فهم القاضي خطورة المسألة المطروحة بين يديه. في الأساس، كان مترددًا في استخدام سلطة الحكومة في محاولة غير مجدية لمنع الناس من قول ما يريدون قوله، ومعرفة ما يريدون معرفته، حتى لو كانت مدة عرض تلك المستندات قصيرة فقد يكون عدد غير معروف من نسخها يُتداول سرًّا بين الأطراف المعنية.
(٣) سقوط نظرية التنظيم الهرمي
منذ عهد بعيد والناس يرتبون أشياءهم عن طريق تصنيفها إلى فئات، ثم يقسمون تلك الفئات إلى فئات فرعية، وقد حاول أرسطو أن يصنف كل شيء؛ فالكائنات الحية على سبيل المثال كانت تُقسَّم إلى نباتات وحيوانات، والحيوانات تُقسَّم إلى ذوات الدم الأحمر وحيوانات ليست كذلك، وذوات الدم الأحمر نوعان حيوانات تلد وحيوانات تبيض، والتي تلد نوعان إما بشر أو ثدييات أخرى، والتي تبيض إما تعوم في الماء أو تطير في الهواء، وهلم جرًّا. لكن شكلت حيوانات الإسفنج والخفافيش والحيتان معضلة في ذلك التصنيف حيرت أرسطو فلم يفصل فيها بقول جازم. ثم في فجر عصر التنوير خرج لينيوس على العالم بطريقة أكثر فائدة لتصنيف الكائنات الحية، وذلك باستخدام أسلوب اكتسب صلاحية علمية ما إن بات يعكس الخطوط التطورية لأصل الأنواع.
إذا كانت الفروق بين الفئات واضحة فيمكنك استخدام التسلسل الهرمي للتنظيم لتحديد ما تبحث عنه، وهذا يتطلب أن يكون الشخص الذي يقوم بالبحث ليس فقط على دراية بنظام التصنيف، لكن يجب أيضًا أن يتقن اتخاذ جميع القرارات اللازمة، على سبيل المثال، إذا صُنِّفَت المعرفة البشرية عن الكائنات الحية وفقًا لما جاء به أرسطو، فإن أي شخص يريد أن يعرف شيئًا عن الحيتان يجب أن يعرف مسبقًا ما إذا كان الحوت من الأسماك أم من الثدييات حتى يتسنى له اختيار الفرع المناسب من شجرة التصنيف، وبما أن المعرفة تزداد يومًا بعد يوم، فإن عدد فروع شجرة التصنيف وأغصانها وبراعمها سيزداد باستمرار، وتكبر البراعم لتصير أغصانًا؛ ومِنْ ثَمَّ تتعقد مشكلة التصنيف وتستعصي عملية الاسترجاع حتى تصبح مستحيلة من الناحية العملية.
في عام ١٩٩١، حين كان لا يكاد أحد خارج الدوائر الأكاديمية والحكومية يعرف شيئًا عن الإنترنت، عرض بعض الباحثين الأكاديميين برنامجًا أسموه «جوفر»، وكان هذا البرنامج يتضمن دليلًا هرميًّا يشمل الكثير من مواقع الويب عن طريق تنظيم الأدلة التي تقدمها المواقع الإلكترونية في منظومة كبيرة واحدة.
مقارنةً بمقاييس اليوم فإن العثور على ما تريد باستخدام جوفر كان عملًا مملًّا، وكان يعتمد على المهارات التنظيمية للمساهمين، وفي عام ١٩٩٤ تأسست شركة ياهو كدليل يمكن استخدامه عبر الإنترنت، وحرص القائمون عليه على تصنيف المنتجات والخدمات إلى فئات، كما حرصوا على تقديم التوصيات، وحاولوا بشكل عام جعل الإنترنت في متناول غير التقنيين، ورغم أن ياهو قد أضافت منذ مدة طويلة نافذة بحث فهي لا تزال تحتفظ بوظيفتها الأساسية كدليل إنترنت إلى يومنا هذا.
قبل ستين عامًا خرج علينا مَنْ توقع أن التنظيم الشجري الهرمي سيعاني من القيود، فخلال الحرب العالمية الثانية عيَّن الرئيسُ فرانكلين روزفلت فانيفارَ بوش من معهد ماساتشوستس للتكنولوجيا مديرًا لمكتب البحوث الاستراتيجية والتطوير، وكانت مهمة هذا المكتب تنسيق البحوث العلمية في دعم المجهود الحربي، وكانت مبادرة كبرى وجهدًا عظيمًا؛ إذ عمل به ٣٠ ألف شخص، وتضمن المئات من المشاريع التي تغطي كافة المجالات العلمية والهندسية، ولم يكن مشروع مانهاتن — الذي أنتج القنبلة الذرية — سوى جزء صغير من تلك المبادرة.
يبدو أن الصعوبة لا تكمن في الكم الكبير الذي نشرناه على نحو غير ملائم … بل تكمن في أن النشر قد فاق حد قدرتنا الحالية على الاستفادة الحقيقية مما سُجِّل ودُوِّن وطُبِع. إن رقعة خلاصة التجربة الإنسانية تتسع على نحو مذهل، والوسائل التي نستخدمها لتعيننا على الخروج من المتاهة الناجمة عن هذا الاتساع الهائل حتى نصل إلى الأمر المهم في لحظتنا هذه هي نفسها الوسائل التي كنا نستخدمها في الأيام الخوالي … وفشَلُنا هذا يرجع إلى حد كبير إلى التصنُّع الذي يعيب نظم الفهرسة التي نتبعها.
حين كتب فانيفار بوش ذلك كان فجر العصر الرقمي لا يزال بصيص ضوء في الأفق، لكن فانيفار بوش تخيل آلة أطلق عليها اسم «ميمكس» من شأنها أن تزيد من الذاكرة البشرية عن طريق تخزين جميع المعلومات اللازمة واسترجاعها، وأنها ستكون «إضافة كبيرة» لذاكرة الإنسانية وتمكن «الاستعانة بها بسرعة ومرونة فائقتيْن».
لقد رأى فانيفار بوش المشكلة بوضوح، لكن التقنيات التي كانت في عهده من ميكروفيلم وأنابيب مفرغة عجزت عن إيجاد حل لها. لقد أدرك أن مشكلة العثور على المعلومات ستطغى في نهاية المطاف على تقدم العلم في مجال إنشاء المعرفة وتسجيلها. كان فانيفار بوش على علم تام بأن الحضارة نفسها معرضة للخطر في زمن الحرب، لكنه كان يعتقد أن علينا المضي قدمًا ونحن يحدونا الأمل في الخروج بثمرة طيبة من تسجيل معرفتنا الواسعة وتدوينها، وكتب يقول إن الإنسان «قد يموت في الحرب قبل أن يتعلم كيف يُسَخِّر هذا السجل المعرفي ليعود عليه حقًّا بالنفع. لكن ونحن نُسَخِّر العلم لاحتياجات الإنسان ورغباته يبدو أن هناك مرحلة ستكون مؤسفة حقًّا نضطر فيها إلى الاختيار بين إنهاء الأمر برمَّته، وأن نفقد الأمل في الخروج بنتيجة مُرْضِية.»
سابقة مستقبلية
لا يوجد أي عائق عملي الآن لإنشاء فهرس قوي لجميع المعارف البشرية والأفكار والإنجازات لتكون لدينا ذاكرة تشمل كوكبنا كله، وتملكها البشرية جمعاء. ليس مجرد فهرس؛ بل يمكن استدعاء الاستنساخ المباشر من الشيء نفسه إلى أي بقعة معدة جيدًا … هذا في حد ذاته هو حقيقةٌ ذات أهمية كبيرة، فهو ينبئ بتوحيد فكري حقيقي للجنس البشري. يمكن جعل ذاكرة البشرية كلها في متناول كل فرد، ولعل ذلك يتم في وقت قصير … وهذا ليس حلمًا بعيدًا، ولا نسجًا من وحي الخيال.
إن القدرات والإمكانات التي لم يكن أحد يتصورها فيما مضى صارت الآن أمرًا شائعًا، وأجهزة الكمبيوتر الرقمية والقدرة التخزينية الكبيرة والشبكات عالية السرعة كل هذا جعل البحث عن المعلومات واسترجاعها أمرًا لازمًا، وهي كذلك تيسِّر إمكانية حدوث ذلك. إن ظهور الويب تحقيقٌ لحلم فانيفار بوش حول الميمكس، والبحث هو السر الذي جعلها أداة مفيدة.
(٤) من الضروري أن نعرف كيف تعمل
كيف يمكن لمحرك بحث جوجل أو ياهو أن يتلقى سؤالًا لعله لم يُطرح عليه من قبل، ثم في جزء من الثانية يأتي بنتائج بحث من أجهزة كمبيوتر منتشرة في جميع أنحاء العالم؟ إن محرك البحث لا «يبحث» في الشبكة العالمية بأكملها على نطاق واسع ردًّا على سؤالك، وإلا لَمَا تمتع بكل هذا القدر من السرعة، فالبِتات تستغرق أكثر من عُشر ثانية لتطوف جميع أنحاء الأرض بسرعة الضوء، بدلًا من ذلك يكون لدى محرك البحث بالفعل فهرس بالمواقع الموجودة على شبكة الإنترنت، ومحرك البحث يفعل أفضل ما في وسعه للعثور على الإجابة على سؤالك، وبعد ذلك يرسل رده إليك مباشرة.
- (١)
جمع المعلومات: يستكشف الجني الرقمي الويب، فيزور العديد من المواقع بانتظام لمعرفة ما تحتويه، ويزور الجني الرقمي الصفحات القديمة مرة أخرى لعل محتوياتها قد تغيرت، ولعلها تحتوي على وصلات إلى صفحات جديدة لم يسبق للجني زيارتها.
- (٢)
الاحتفاظ بالنسخ: يحتفظ الجني الرقمي بنسخ من العديد من صفحات الويب التي يزورها، وفي الواقع فإن لدى الجني الرقمي نسخةً مكررةً من جزء كبير من صفحات الويب مخزنة على أجهزة الكمبيوتر الخاصة به.
- (٣)
إنشاء فهرس: ينشئ الجني الرقمي فهرسًا ضخمًا يُظهر، على الأقل، الكلماتِ التي تظهر على صفحة الويب هذه وتلك.
- (٤) استيعاب السؤال المطروح: يعيب الإنجليزية أن بها كثيرًا من الغموض، فإن استعلمت عن red sox pitchers (بمعنى رماة فريق ريد سوكس للبيسبول) فالمعنى المراد يصعب فهمه إلا على من نشأ وترعرع في أحضان لعبة البيسبول.
- (٥)
تحديد علاقة كل إجابة محتملة بالسؤال المطروح: هل صفحة الويب تحتوي على المعلومات التي يتناولها السؤال المطروح؟
- (٦)
تحديد ترتيب النتائج ذات الصلة: مِنْ بين الإجابات ذات الصلة، أيها «الأفضل»؟
- (٧)
عرض النتائج: لا يتعين أن تكون النتائج «جيدة» فحسب؛ بل يجب أن تظهر للمستخدم في صورة تفيده، وربما أيضًا في صورة تخدم أغراضًا أخرى للجني الرقمي، مثل بيع المزيد من الإعلانات.
وكل خطوة من هذه الخطوات السبع تنطوي على تحديات تقنية يعشق علماء الكمبيوتر حلها، ويأمل ممولو الجني الرقمي أن ينجح مهندسوهم في إيجاد حل يفوق ما يوفره مهندسو محركات البحث المنافسة من حلول لتلك التحديات.
سنتناول كل خطوة من تلك الخطوات بمزيد من التفصيل؛ لأننا لا بد أن ندرك ما يجري، ففي كل خطوة يزداد الدور الذي تلعبه التكنولوجيا، كما أن كل خطوة تمنح الجني الرقمي فرصًا لاستغلال قدراته في جمع المعلومات وتحريرها بطرق قد لا تتوقعها كمستخدم، طرق تشكل منظورك للعالم عن طريق عدسة نتائج البحث التي يوفرها لك الجني الرقمي.
إن المعالجة التي تجري في الخلفية تشبه التدريبات والبروفات التي تسبق ظهور المسرحية على خشبة المسرح، فلا غنى لأي فرقة مسرحية عن البروفات، لكن لا تتم أي منها أمام الجمهور، وليس لها جدول زمني محدد.
(٤-١) الخطوة الأولى: جمع المعلومات
حين ألقى إريك شميت الرئيس التنفيذي لشركة جوجل كلمته أمام الجمعية الوطنية للمُعْلِنين في أكتوبر عام ٢٠٠٥ أوضح أنه من بين ٥٠٠٠ تيرابايت من المعلومات المتاحة في العالم لم يُفهرَس سوى ١٧٠ تيرابايت (علمًا بأن التيرابايت تعادل حوالي تريليون بايت). هذا بالكاد يتجاوز نسبة ٣٪، ومِنْ ثَمَّ فإن نسبة ٩٧٪ من المعلومات المتاحة لم تُفهرَس بعد، وهناك تقديرات تقول إن مقدار ما فُهرس من المعلومات لا يتعدى نسبة ٠٫٠٢٪ من حجم قواعد البيانات والمستندات التي يمكن الوصول إليها عن طريق الويب، وحتى في سياق محدود للشبكة العالمية نجد أن الجني الرقمي يحتاج إلى اتخاذ قرار حول ما الذي ينظر فيه ووتيرة تكرار ذلك، وتحدد هذه القرارات ضمنًا ما هو مهم وما هو دون ذلك، وسوف تحدد ما يمكن لمستخدمي الجني الرقمي العثور عليه.
يتصرف الجني الرقمي بذكاء فيما يتعلق بعدد مرات زيارته لصفحات الويب، لكن براعته في هذا المجال تخضع لقراراتٍ وأولوياتٍ … تخضع لنوع من التحكم، وكلما ازدادت أهمية صفحة الويب في عين الجني الرقمي قلَّ الوقت الذي يستغرقه ظهور محتواها كنتيجة بحث يظهرها الجني الرقمي لمستخدميه.
كيف يستكشف العنكبوت الإلكتروني الويب؟
العنكبوت الإلكتروني، أو ما يسمى بزاحف الشبكة، هو نوع خاص من البرامج الآلية يطلق عليه اسم «المكرِّر»؛ وهي برامج تنفِّذ إلى ما لا نهاية بعضَ المهام المتكررة، وغالبًا ما تكون مهام لجمع المعلومات.
يطوف الجني الرقمي أرجاء الويب يجمع المعلومات عن طريق اتباع روابط من صفحات يزورها، والبرنامج الذي يزحف في الويب نسميه في عالم الكمبيوتر «عنكبوتًا إلكترونيًّا»، ونظرًا لأن عملية الزحف وجمع المعلومات هذه تستغرق أيامًا أو حتى أسابيع، فإن الجني الرقمي لن يعلم بحذف صفحةٍ ما من على الويب فور حذفها، ولا يكتشف العنكبوت الإلكتروني أنه جرى حذفها إلا إذا عاد إليها مرة أخرى ولم يجدها، عندها سيحذفها من فهرسه، لكن في الوقت نفسه، قد يرد على عمليات البحث بروابط لصفحات لم تعد موجودة. فإذا نقرت على رابط من هذا النوع فستظهر لك رسالة تقول «لم يتم العثور على الصفحة» أو «لا يمكن العثور على الخادم».
ولأن شبكة الإنترنت غير منظمة فليس هناك أصلًا نظام «صحيح» لزيارة صفحات الويب، وليست هناك طريقة واضحة لمعرفة أين ينتهي ذلك. فقد تحتوي صفحة «أ» على إشارات للصفحة «ب»، وقد تحتوي الصفحة «ب» على إشارات للصفحة «أ»، ومِنْ ثَمَّ فإن العنكبوت الإلكتروني يجب أن يكون حريصًا حتى لا يدور في حلقة مفرغة، ويجب على الجني الرقمي أن ينظم زحفه خلال الشبكة بحيث يزور صفحات الويب بقدر ما يختار دون إضاعة للوقت بإعادة النظر في الأقسام التي زارها بالفعل.
وأخيرًا فإن عملية الزحف الإلكتروني ليست مجانية. إن «زيارات» الجني الرقمي هي في الحقيقة طلبات معلومات موجهة للمواقع بغرض أن تعيد هذه المواقع الصفحات إليها مرة أخرى، والزحف الإلكتروني يوجِد حركة مرور على الإنترنت، ويفرض أيضًا عبئًا على خادم الويب. بعبارة أخرى فإن هذا الجزء من المعالجة الخلفية التي تقوم بها محركات البحث له آثار غير مقصودة على تجربة شبكة الإنترنت بالكامل، فالعناكب الإلكترونية تستهلك من النطاق الترددي للشبكة، وقد تعرقل الخوادم وتشل حركتها؛ إذ إنها تُشْغَل من جانبين: فمن جهة تَرُدُّ على طلبات العنكبوت الإلكتروني، ومن جهة أخرى تتعامل مع مستخدميها العاديين الذين يشاهدون صفحاتها، ومِنْ ثَمَّ فإن محركات البحث التجارية تحاول تحديد موعد زحفها على الويب بطرق لا ترهق الخوادم التي تزورها.
(٤-٢) الخطوة الثانية: الاحتفاظ بالنسخ
التخزين المؤقت هو مِعْوَل آخر يهدم نظرية تشبيه الويب بالمكتبة؛ لأن إزالة المعلومات من رف الكتب لا يعني بالضرورة التخلص منها، بل إن الجهود اللازمة لإزالة المعلومات الخطيرة تتجاوز قدرة من نشرها. على سبيل المثال، بعد أحداث الحادي عشر من سبتمبر حذف قدر كبير من المعلومات التي كانت متوافرة على الويب، ومن بين الصفحات التي اختفت بين عشية وضحاها كانت تقارير عن نقاط الضعف في الحكومة الأمريكية، ومعلومات أمنية حساسة، بل وتقرير من مركز السيطرة على الأمراض حول الإرهاب الكيميائي كان يكشف عن عيوب الصناعة، لكن بسبب أن الصفحات كانت لها نسخ مخبأة، فإن البِتات الخاصة بكل هذا كانت موجودة لدى جوجل وغيرها من شركات محركات البحث.
هذا مثال فعلي، فقد صدر البيان عن لورانس سمرز في ١٧ يناير عام ٢٠٠٥، بعد أن نُشر تصريح له حول النساء في مجال العلم، وكما ورد في مجلة هارفرد في عدد مارس-أبريل عام ٢٠٠٥، فقد بدأ بيانه بقوله: «لقد أُسيئ فهمُ ما صرحتُ به، وظن بعضهم أني أعني أن المرأة تفتقر إلى القدرة على تحقيق النجاح على أعلى المستويات من الرياضيات والعلوم، وأنا لم أقل ذلك، ولا أعتقده.» ونشر هذا الإنكار الذي لا يحمل نبرة الاعتذار وظل كذلك أيامًا، وحين هاجت عاصفة من الاحتجاجات على ذلك أصدر سمرز بيانًا جديدًا في ١٩ يناير عام ٢٠٠٥ يقول فيه: «أشعر بأسف عميق لأثرِ ما صدر مني من تعليقات، وأعتذر لأنني لم أزن كلامي جيدًا قبل أن أتفوه به.» أولئك الذين يبحثون عن البيان الأول كانوا يوجَّهون إلى بيان سمرز الجديد الذي اعتذر فيه صراحة عما بدَرَ منه، لكن لبعض الوقت ظل البيان الأصلي مرئيًّا لمن ينقرون على رابط نسخة جوجل المخبأة.
العثور على الصفحات المحذوفة
من الطرق السهلة للعثور على صفحات حُذفت أن تبحث باستخدام جوجل عن شيء بِيعَ عن طريق موقع كريج لِسْت. يمكنك استخدام آلية بحث داخل مربع البحث في جوجل تَقْصُر البحث على موقع كريج لِسْت هكذا:
على الأرجح ستظهر أمامك صفحات عن أَسِرَّة بيعت عن طريق الموقع ولم تعد متوافرة، لكن صفحاتها المخبأة لا تزال موجودة.
إذا خزَّن الجني الرقمي نسخة من صفحة ويب فقد يتسنى لك الحصول على معلومات تَراجع عنها أصحابها بعد أن تَبَيَّنَ لهم خطؤها أو أوقعتهم في الحرج، لكن هنا يبدو أنَّ ثَمَّةَ خللًا ما، فهل يحق للجني الرقمي أن يفعل بالمعلومات الموجودة على تلك الصفحات ما يحلو له؟ إذا كانت حقوق التأليف والنشر لمادة منشورة محمية — مثل صحيفة ورقية نُشرت قبل عشر سنوات — فما الذي يمنح الجني الرقمي الحق في أن يعرضها على المستخدمين عن طريق خاصية النسخة المخبأة؟ وفي هذا الشأن، ما الذي منحه الحق في الاحتفاظ بنسخة منها أصلًا؟ إذا كنت تملك مادة محمية بموجب حقوق التأليف والنشر، أفلا تملك سلطة ما على مَنْ يمكنه نسخها؟
(٤-٣) الخطوة الثالثة: إنشاء فهرس
حين بحثنا في الويب عن «زيبريكسا» نظر الجني الرقمي في فهرسه الذي يشبه في بنيته الأساسية فهرس الكتاب المطبوع: قائمة توضح أين يقع باب كذا أو فصل كذا. وتمامًا كما يبين فهرس الكتاب أرقام الصفحات يبين فهرس الجني الرقمي عناوين صفحات الويب. ولمساعدة محرك البحث على الخروج بإجابات أكثر فائدة عن الاستفسارات، قد يسجل الفهرس معلومات أخرى إضافةً إلى هذا، مثل حجم خط المادة وموقع تلك المادة من الصفحة.
الفهارس والفهارس اللفظية
البنية المعلوماتية التي تستخدمها محركات البحث تُعرف تقنيًّا باسم «الفهرس المقلوب»؛ وهو فهرس بالكلمات الموجودة في مستند أو في مجموعة من المستندات وأماكن ظهور تلك الكلمات. والفهرس المقلوب ليس فكرة جديدة، فالفهارس اللفظية التوراتية التي تَعِبَ عليها رهبان العصور الوسطى كانت فهارس مقلوبة، وكان عمل الفهارس من أول تطبيقات تكنولوجيا الكمبيوتر على المشكلات غير الحسابية.
الفهارس أمر في غاية الأهمية؛ لأن وجود فهرس مرتب — مثل فهرس الكتاب، والذي يكون مرتبًا أبجديًّا — يجعل العثور على الأشياء أسرع بكثير من البحث التسلسلي، وهذا هو ما يمنح علماء الكمبيوتر الذين يعملون في شركات محركات البحث أهميتهم ويجعلهم يستحقون رواتبهم؛ إذ إنهم يبتكرون طرقًا ذكية لتخزين المعلومات المفهرسة بحيث يمكن استرجاعها بسرعة. كما لعب قانون مور دورًا كبيرًا في إيجاد فهارس الويب. فقبل أن تصير أجهزة الكمبيوتر بهذه السرعة، وبذلك الرِّخَص، وبكل هذه القدرة التخزينية لم يكن بوسع حتى أذكى علماء الكمبيوتر أن يبرمجها بحيث تردُّ ردًّا فوريًّا على أي استفسار يُطرح عليها بالإنجليزية مهما كان غامضًا.
عندما يريد الجني الرقمي أن يعثر على مصطلح ما فهو لا ينظر في فهرسه من بدايته ويبحث فيه مصطلحًا مصطلحًا إلى أن يعثر على بُغيته في نهاية الأمر، فليست هذه هي الطريقة التي نتبعها في البحث عن شيء ما في فهرس الكتاب؛ بل إننا نستغل حقيقة أن الفهرس مرتب ترتيبًا أبجديًّا. هناك طريقة بسيطة جدًّا للبحث عن شيء ما في فهرس ضخم مرتب، مثل دليل الهاتف، وهي أن نفتح الكتاب في وسطه ثم ننظر هل ما نبحث عنه يقع في النصف الأول من الفهرس أم في نصفه الثاني، ومِنْ ثَمَّ يمكنك تجاهل أحد نصفي دليل الهاتف ثم تستخدم نفس الطريقة لتقسيم النصف المتبقي. إن عدد الخطوات اللازمة للوصول إلى صفحة بعينها في دليل هاتف يبلغ عدد صفحاته «س» باستخدام هذا الأسلوب هو عدد المرات التي تضطر فيها إلى قسمة العدد «س» على ٢ وصولًا إلى القيمة ١ في نهاية المطاف، فإذا كان عدد الصفحات ١٠٠٠ صفحة فسيتطلب الأمر تكرار الخطوات ١٠ مرات، وهذه الطريقة تعرف ﺑ «البحث الثنائي».
كم يبلغ حجم فهرس الجني الرقمي؟ بادئ ذي بدء، كم مصطلحًا يضم فهرسُ الجني الرقمي؟ لا ندري؛ لأن هذا سر آخر من أسرار تلك المهنة. قد يكون فهرس الجني الرقمي مفيدًا إن كنا نتحدث عن بضع عشرات من ملايين العناصر. إن مفردات اللغة الإنجليزية أقل من نصف مليون كلمة، لكن لعل الجني الرقمي يريد على الأرجح أن يفهرس بعض الأرقام أيضًا (حاول البحث عن رقم مثل ٣٢٧ باستخدام محرك البحث الذي تستخدمه). كما أننا بحاجة إلى إدراج أسماء الأعلام، وعلى الأقل بعض الكلمات في اللغات الأخرى. إن قائمة صفحات الويب المرتبطة بمصطلح ما تكون موجودة على القرص في معظم الحالات، أما البيانات الخاصة بمكان المعلومات على القرص المتعلقة بهذا المصطلح نفسه فتخزن في الذاكرة الرئيسية، وحتى لو شغل تخزين المصطلح والموقع على القرص الذي يخص قائمة عناوين المواقع المرتبطة ١٠٠ بايت لكل مصطلح، في ظل وجود ٢٥ مليون مفردة، فهذا يعني أن الفهرس سيشغل مساحة قدرها ٢٫٥ جيجابايت (أي نحو ٢٫٥ مليار بايت) من الذاكرة الرئيسية. قبل بضع سنوات كان مقدار الذاكرة ذاك لا يمكن تصوره، أما اليوم فيمكنك أن تضع كل هذا الكم على جهاز كمبيوتر محمول من وول مارت. يمكن البحث في الفهرس بسرعة، باستخدام البحث الثنائي مثلًا، رغم أن استرداد قائمة عناوين المواقع قد يتطلب الاستعانة بالقرص. إذا كان الجني الرقمي يتمتع بما لدى جوجل من موارد فإنه يمكنه أن يزيد من سرعة رده على استفسارات مستخدميه عن طريق الحفاظ على عناوين المواقع في ذاكرته الرئيسية أيضًا، ويمكنه تقسيم عملية البحث على أكثر من جهاز كمبيوتر ليزيد السرعة أكثر.
أما وقد فرغنا من التحضيرات المطلوبة، يمكننا أن نتناول الأداء نفسه لنرى ما يحدث عندما تسأل الجني الرقمي سؤالًا.
(٤-٤) الخطوة الرابعة: استيعاب السؤال المطروح
وغالبًا ما يحصلون على نتائج كثيرة، فإن سألت ياهو عن كلمتي «علاج» و«الحساسية» فستجد أكثر من عشرين مليون نتيجة بحث، أما إذا سألت عن «علاج الحساسية»، أي وضعت الكلمتين معًا بين علامتَيْ تنصيص، فستجد أن نتائج البحث ٦٢٨ ألف فقط، وستجد أيضًا أن أعلى النتائج في هذه الحالة تكون مختلفة تمامًا، وإذا سألت عن «علاج أنواع الحساسية» فستجد أن عدد النتائج سيتقلص إلى ٩٥ ألفًا. لعل الفرق بين هذه الأسئلة ليس مقصودًا، لكن محرك البحث ظن أنها مختلفة اختلافًا جذريًّا. رائع أن يكون التواصل بين الإنسان والكمبيوتر عن طريق عدسات محرك البحث مفيدًا إلى هذه الدرجة، في ظل العيوب الواضحة الموجودة!
الأسئلة المطروحة بلغة البشر الطبيعية
تَعِدُ البحوثُ الجارية بنقل عبء إزالة اللبس والغموض من عمليات البحث إلى البرمجيات، وهو حق، وذلك بدلًا من إلزام المستخدم أن يلوي طريقة تفكيره لتتواءم مع طريقة تفكير الكمبيوتر. إن قافلة فهم اللغة الطبيعية تسير، لكن ليس من المتوقع أن تصل إلى هدفها المنشود في المستقبل القريب. قد نحتاج إلى زيادة القدرة الحاسوبية مائة ضعف لجعل التحليل الدلالي لصفحات الويب من الدقة بحيث تكف محركات البحث عن الخروج علينا بأجوبة هزيلة حين نطرح عليها أسئلة بسيطة.
واليوم، يميل المستخدمون إلى التسامح مع محركات البحث إن أساءت فهم المعنى المراد، فتجدهم يلومون أنفسهم وينقِّحون أسئلتهم لتحقيق نتائج أفضل، وقد يرجع هذا إلى أن الدهشة لا تزال تتملكهم من نجاح محركات البحث، وجزء من هذا التسامح يعود إلى أن البحث لا يكاد يكلف المستخدم شيئًا، ومع تحسن التقنية سيتوقع المستخدمون أكثر من ذلك، وسيصبحون أقل تسامحًا مع إضاعة أوقاتهم في فرز النتائج التي يحصلون عليها حتى يَمِيزوا الغث من السمين.
(٤-٥) الخطوة الخامسة: تحديد الصلة
عمل محرك البحث هو تقديم النتائج التي تتطابق مع مقصد السؤال الذي يُطرح عليه، وهذا يسمى «الصلة». والصلة لها مكوِّن موضوعي؛ ففوز ريد سوكس على يانكيز ما هو إلا أمر هامشي بالنسبة لمن يسأل عن العكس؛ أي فوز يانكيز على ريد سوكس. لكن الصلة بها مكون غير موضوعي بالمثل، ووحده من طرح السؤال هو الذي له الكلمة الفصل في أمر ملاءمة ما حصل عليه من إجابات لسؤاله، فقد قصدتُ بسؤالي هذا تغلب فريق نيويورك يانكيز على فريق بوسطن ريد سوكس في دوري البيسبول للكبار، لكني لم أقل ذلك، وربما قصدت تغلب فريق فلاج ستاف يانكيز على فريق كونتيننتال رد سوكس من ولاية أريزونا في دوري البيسبول للناشئين.
والعثور على جميع المستندات ذات الصلة يُطلق عليه اسم «الاستحضار»، فنظرًا لأن الشبكة العالمية واسعة جدًّا لا توجد وسيلة معقولة لتحديد ما إذا كان محرك البحث يعثر على كل ما هو ذو صلة، والاستحضار الكامل أمر بعيد المنال، لكنه أيضًا غير مهم، فقد يعطينا الجني الرقمي الآلاف بل والملايين من الإجابات التي يرى أنها ذات صلة، لكن من المستبعد أن نتجاوز في نظرنا صفحة النتائج الأولى أو الثانية، ودرجة الصلة دائمًا ما تتفوق على الاستحضار، فالمستخدمون يريدون العثور على عدد قليل من النتائج الجيدة، وليس كل النتائج الممكنة.
علم قياس الصلة أقدم بكثير من الويب، ويعود إلى أيام جيرالد سالتون في ستينيات القرن العشرين، الذي عمل في بداية الأمر في هارفرد، ثم في كورنيل. ومربط الفرس هنا هو أتمتة المهمة عندما يكون المكون الذاتي طاغيًا عليها، فنحن نريد من جهاز الكمبيوتر أن يمر على محتويات المستند مرورًا سريعًا ثم ينظر في السؤال الذي نطرحه عليه ثم يقوم بحسابات قليلة ليعطينا رقمًا يشير إلى مدى صلة هذا المستند بما سألنا عنه.
محركات البحث واسترجاع المعلومات
- أولها: مقال بعنوان «تشريح لمحرك بحث واسع النطاق يتعامل مع الويب التي تعتمد على ترميز النص الفائق» كتبه سيرجي برين ولاري بيدج في عام ٢٠٠٠، وهو يتضمن وصفًا واضحًا لطريقة عمل النسخة الأصلية من جوجل، وما الهدف منه، وكيف تميَّز جوجل عما سبقه من محركات البحث.
- وثانيها: مقال بعنوان «الاسترجاع الحديث للمعلومات: لمحة موجزة» كتبه أميت سينغال في عام ٢٠٠١، وهو يستطلع مجال استرجاع المعلومات، وكان كاتب هذا المقال حينها طالبًا عند جيري سالتون، وهو يعمل الآن في شركة جوجل.
- وثالثها: مقال بعنوان «أكثر بحث مؤثر لم يكتبه جيرالد سالتون» كتبه ديفيد دوبين، وهو يقدم نظرة مثيرة للاهتمام في بعض أصول هذا العلم.
(٤-٦) الخطوة السادسة: تحديد الترتيب
بعد اختيار الجني الرقمي للمستندات ذات الصلة — ولعله اختار جميع المستندات التي تبلغ صلتها حدًّا بعينه — فإنه «يرتب» نتائج البحث حسب أهميتها، وهذا الترتيب أمر بالغ الأهمية في الحكم على محرك البحث بأنه مفيد، فلعل نتائج البحث ذات الصلة تكون بالآلاف، والمستخدم لا يريد منها إلا عددًا قليلًا. أبسط ترتيب هو الترتيب من حيث الصلة؛ فتوضع صفحة الويب التي تتمتع بأعلى درجة من الصلة بكلمات البحث في المرتبة الأولى. لكن هذا ليس حلًّا ناجعًا؛ لأنه إذا كان سؤال البحث قصيرًا فإننا إنْ نظرْنا إلى شيء واحد فسنجد أن العديد من النتائج تكاد تكون على نفس القدر من الصلة به.
الأهم من ذلك أنه ينبغي النظر إلى المستندات التي يظهرها لنا الجني الرقمي على أنها «نتائج جيدة»، ليس فقط لأنها تتمتع بمقدار كبير من الصلة بما بحثنا عنه، لكن أيضًا لأن المستندات نفسها ذات جودة عالية، لكن للأسف من الصعب تحديد معنى «الجودة» هنا في مجال البحث حيث يكون المحك النهائي للنجاح هو أن نعطي للمستخدم ما يريد. في المثال الذي مر بنا منذ قليل، من الذي يقرر ما إذا كان العديد من الروابط إلى المواد المتعلقة ببريتني سبيرز هي حقًّا إجابة «أفضل» للسؤال عن «سبيرز» مقارنة برابط البروفسير سبيرز؟ ومهما كان تعريف «الجودة» فإن عملية الترتيب في محركات البحث الرئيسية تحدث تلقائيًّا دون تدخل بشري، ولا توجد طريقة تتضمن بروتوكولات تنظر في التراخيص المهنية والإدانات الجنائية السابقة بالتزوير، على الأقل بالنسبة للوضع الحالي للويب.
رغم أن الجودة لا يمكن أن تُقاس تلقائيًّا فإنه يمكن استنباط مقدار «الأهمية» أو «السمعة الحسنة» من هيكل روابط الويب. كمثال بعيد، إن نظرنا إلى صفحات الويب وكأنها منشورات علمية، فالسمعة الطيبة للعلماء عادة ما تكون أفضل كلما كثر الاستشهاد بقولهم على نطاق واسع في أعمال غيرهم من العلماء. هذا بعيد عن أن يكون نظامًا مثاليًّا للحكم على أهمية عمل علمي، فهناك بالفعل مجلات علمية لا تساوي شيئًا، وفي بعض الأحيان تكون هناك مجموعات صغيرة من العلماء الذين ليس لهم ثقل يكوِّنون شبكات من الإعجاب المتبادل، وهذا أمر يغرُّ ويخدع، لكن بالنسبة للويب فالنظر في بنية الربط هو نقطة انطلاق في قياس أهمية الصفحات.
ما الذي يجعل محركات البحث تُقبِل على صفحة ويب؟
-
هل الكلمة المفتاحية موجودة في عنوان صفحة الويب، أم في أحد عناوينها الرئيسية، أم في أحد عناوينها الفرعية؟
-
هل الكلمة المفتاحية لا توجد إلا في النص الأساسي للصفحة؟ وإذا كان الأمر كذلك فما مقدار «بروزها» فيه؟
-
هل الموقع من النوع «الجدير بالثقة»؟
-
هل الصفحات التي لها روابط داخل تلك الصفحة هي في حد ذاتها ذات صلة بكلمات البحث؟
-
هل الصفحات التي تحمل روابط لتلك الصفحة هي في حد ذاتها ذات صلة بكلمات البحث؟
-
هل الصفحة قديمة أم حديثة؟
-
هل الصفحات التي لها روابط داخل تلك الصفحة قديمة أو حديثة؟
-
هل تتوفر في الصفحة معايير جودة معينة؟ على غرار أن لا تتضمن أخطاءً إملائية؟
ما إن تتجشم عناء الزحف الإلكتروني على الويب فستجد مادة غزيرة للتحليل، وكل ما تحتاجه هو أن تتمتع بالقدرة الحاسوبية للقيام بذلك.
كان من ابتكارات جوجل تحسين معايير الصلة عن طريق قيمة عددية أخرى تسمى «تصنيف بيدج»؛ وهو معيار يقيس مدى «أهمية» كل صفحة مع الوضع في الاعتبار الروابط الخارجية التي تشير إليها، وهو ما يعني وجود سباق انتشار على مستوى شبكة المعلومات. فالمنطق يقول إنه كلما كثر عدد صفحات الويب التي بها رابط إلى صفحة ويب بعينها ازدادت أهمية تلك الصفحة، في الواقع، ينبغي أن يكون الحكم بأهمية صفحة ويب قائمًا على أساس أن عددًا كبيرًا من الصفحات المهمة بها رابط لتلك الصفحة لا بكثرة الصفحات أيما اتفق، ويبدو أن هذا يدخلنا في دائرة مفرغة من حيث تعريف مصطلح الأهمية، لكنْ هناك مخرجٌ من هذا المأزق، وهو يتطلب الاستعانة بشيء من الرياضيات والكثير من القدرة الحاسوبية.
قد يكون ترتيب هذه الصفحة قد أتى في هذه المرتبة العالية لأن العديد من صفحات الويب الأخرى تضمنت روابط إليها، لا سيما إذا كان كثير من هذه الصفحات هي نفسها حُكم عليها أنها مهمة. لعل هناك صفحات أخرى عن عقاقير الفصام كُتبت بأسلوب لغوي أفضل، أو كتبها أناس أكثر خبرةً ومكانةً في المجال العلمي، أو تحتوي على معلومات أحدث وعلى أخطاء أقل، لكن خوارزمية الترتيب لا سبيل أمامها لتحكم على أيٍّ من تلك الأمور، ولا يوجد في جوجل أحد يقرأ كل صفحة ليصدِر أحكامًا من هذا القبيل.
قد يكون من بين الأمور التي يحبها المستخدمون في محرك البحث المفضل لديهم هو حصولهم دومًا على ما يعتقدون أنه معلومات غير منحازة ومفيدة، بل وصادقة، لكن «قول الحقيقة» في نتائج البحث هو في نهاية المطاف مجرد وسيلة لتحقيق غاية، والغاية هنا هي تحقيق مزيد من الأرباح للشركة صاحبة محرك البحث.
الترتيب مسألة رأي، لكن الكثير معلق على تلك الآراء. بالنسبة للمستخدم، فإنه عادة لا يهتم كثيرًا جدًّا بأن الرابط الفلاني جاء ترتيبه الأول أو ما إذا كانت النتيجة التي حصل عليها تلائم ما بحث عنه، لكن بالنسبة لشركةٍ تقدم منتجًا، فإن أمر ترتيب نتائج البحث قد يكون مسألة حياة أو موت.
إن جوجل — مثل كل شركات محركات البحث الأخرى — فعلت ذلك مع مستخدميها، فهي تحكم وتعبر عن رأيها في الأهمية النسبية لمواقع الويب بطريقة جعلت منها محرك البحث المفضل للملايين، وتدعي كندر ستارت أن السلطة القضائية يجب أن يكون لها القول الفصل في عملية التحرير تلك.
ردَّت كندر ستارت أن من الظلم اعتبار فعل جوجل مجرد تعبير عن رأي، وقالت كندر ستارت: «ليس تصنيف بيدج مجرد بيان للرأي في القيمة ذاتها، أو كون موقع الويب وصفحاته يروق لمرء معين، وإنما هو منتج حسابي يقيس ويقيِّم كم وعمق كافة الارتباطات التشعبية على شبكة الإنترنت التي ترتبط بموقع الويب الذي يخضع للترتيب عن طريق تصنيف بيدج، وهذا يخضع لقرارٍ بَرْمَجي تتخذه جوجل.»
الاطلاع على ترتيب صفحة ما
رفض القاضي كل ما ادعته كندر ستارت، وليس مجرد ادعاء كندر ستارت أن لها حقًّا قائم على حرية التعبير بأن تكون أكثر بروزًا في عمليات البحث التي تتم على جوجل، بل رفض القاضي أيضًا المزاعم القائلة بأن جوجل وقعت في مخالفاتِ احتكارٍ، وأن وضع كندر ستارت في أدنى مرتبة وفق تصنيف بيدج أمر يصل إلى حد التشهير بالشركة.
(٤-٧) الخطوة السابعة: عرض النتائج
بعد كل هذا العمل الشاق والرائع في الخطوات الست الأولى عادة ما تقدم محركات البحث النتائج في شكل عرفته البشرية قبل أن يولد أرسطو؛ ألا وهو قائمة بسيطة مرتبة من أعلى إلى أسفل، وهناك طرق أقل بدائية من ذلك لعرض المعلومات.
تعتمد بدائل القوائم البسيطة المرتبة التي تستخدم لتقديم النتائج على النظام البصري بشكل أكبر، وظهور هذه الأشكال الجديدة للتنقل على الويب قد يغير ميزان القوى في معادلة البحث، فلعل احتلال المراتب الأولى في القوائم لم يعد له نفس القيمة الاقتصادية، لكن شيئًا آخر قد يحل محل الترتيب في القائمة الذي يمثل اليوم الهم الأكبر والهدف الأسمى، وقد يكون هذا البديل جودة الرسومات مثلًا.
بغض النظر عن كيفية عرض النتائج، فسيصحبها شيء آخر، ولعل هذا سيحدث على الدوام. والآن حان وقت الحديث عن الروابط الدعائية.
(٥) مَنْ الذي يدفع؟ ومقابل ماذا؟
البحث في الويب هو أحد أكثر الأمور التي تُستخدم فيها أجهزة الكمبيوتر استخدامًا واسعًا، فأكثر من ٩٠٪ من البالغين من مستخدمي الإنترنت يستخدمون محركات البحث، وأكثر من ٤٠٪ يستخدمونها كل يوم، وشعبية محركات البحث أمر لا يصعب تفسيره؛ فمحركات البحث هي في المعتاد مجانية، وبوسع أي شخص أن يستخدمها، فلا يتطلب استخدامها تسجيل دخول، وهي لا تتضمن حاشيةَ عقدٍ تنطوي على شروط يجب على المستخدم أن يوافق عليها قبل أن يشرع في استخدامها، كما أنها لا تتطلب سرعة اتصال بعينها، ولا يضطر المستخدم إلى الإدلاء بأي معلومات شخصية بعينها ليتمكن من استخدامها. إذا كان لديك اتصال بالإنترنت فمن شبه المؤكد أن لديك متصفحَ ويب، ولعل أول صفحة ويب يفتحها لك في كل مرة تشغله هي صفحة محرك بحث. لا توجد توجيهات عليك قراءتها، على الأقل للبدء في استخدامه، وكل ما عليك هو أن تُدخِل بعض الكلمات، وسرعان ما يأتيك الجواب، ولن يضر أحدًا أن تسأل عما تريد بتلقائية وعفوية ثم تنظر ماذا يحدث، بل إن في الأمر متعة.
وربما لأن البحث مفيد وسهل جدًّا فإننا ننظر إلى محرك البحث على أنه شيء يشبه المرفق العام؛ فهو مزيج من موسوعةٍ وعمودِ إنارة تقرأ تلك الموسوعة في ضوئه، إنه مصدر واحد يمد الجميع بقدر غير محدود من المعلومات. من الناحية الاقتصادية هذا التشبيه معيب، فمستخدم المرافق يدفع مالًا مقابل أي استخدام منه لتلك المرافق سواء أكانت مياهًا أو غازًا أو كهرباء، لكن شركات البحث على الويب لا تتقاضى منك شيئًا، وعنصر المنافسة لا يوجد عادةً في المرافق، في حين أنه موجود وبقوة بين شركات البحث، ومع ذلك فنحن نضع ثقتنا في محركات البحث كما لو كانت مرافق عامة؛ لأن نتائجها تتدفق إلينا، ولأن النتائج تبدو متسقة مع توقعاتنا، فإذا سألنا عن شركة الخطوط الجوية الأمريكية أتت إلينا محركات البحث بموقعها الإلكتروني، وإذا سألنا عن «سعر الشاي في الصين» أتت إلينا محركات البحث بالسعر الفعلي (١٫٨٤ دولار لكل ٢٥ كيس شاي) مع توضيح للعبارة. ربما نثق بها لأننا نفترض أن الآلات محايدة ولا تُصدر أحكامًا على القيمة كما نفعل نحن، ومع ذلك فإن كون محركات البحث نادرًا ما تخيب توقعاتنا لا يعني أن حدسنا صحيح.
-
قسم من المستخدمين يدفعون بصفتهم مشتركين في خدمة.
-
أصحاب المواقع الإلكترونية يدفعون مالًا في مقابل أن تظهر مواقعهم للمتصفحين.
-
الحكومات أو بعض الكيانات غير الربحية قد تدفع المال.
-
المعلنون قد يدفعون المال.
وكل هذه النماذج الأربعة مجربة.
(٥-١) بحثٌ خالٍ من الإعلانات
كانت الأوساط الأكاديمية والحكومة منابع تكنولوجيا البحث، لكن كان هذا قبل أن تصبح الويب عملًا تِجاريًّا ضخمًا. كان البحث بحاجة إلى المال لينمو، فكانت بعض المواقع الإلكترونية التي تعمل عن طريق خدمة الاشتراك، مثل أمريكا أونلاين، تعرض خدمة محركات البحث، بل إن اللافتات الإعلانية ظهرت على مواقع الإنترنت حتى قبل أن تصير محركات البحث هي الطريقة التي يتبعها المستخدمون للعثور على ما يريدون؛ ولذا كان من الطبيعي تقديم خدمة الدعاية لدفع ثمن مواقع محركات البحث. اللافتات الإعلانية هي النظير الإلكتروني للوحات الإعلانات التي نجدها في الشوارع أو للإعلانات المعروضة في الصحف والمجلات، فيشتري المُعلِن بعض المساحة على صفحة ويب يرى أنها صفحة واعدة، ويستخدم تلك المساحة لترويج سلعته أو خدمته عن طريق وضع إعلان يجذب العين.
مع ظهور البحث على الويب أمكن للمواقع أن تبيع مساحات إعلانية اعتمادًا على ما يبحث عنه الزائر، وهو ما يسمى ﺑ «الدعاية الموجهة» التي لا تظهر إلا لمن يُظَن أن المنتج المعروض سيثير اهتمامه، فمثلًا لا تظهر إعلانات الهواتف المحمولة إلا على صفحات نتائج عمليات البحث التي تشمل كلمة «هاتف». ومثلها مثل اللوحات الإعلانية التي نجدها في شوارعنا، فإن اللافتات الإعلانية تجلب إيرادات، كما أنها تشبهها في أنها إن أُكثر منها إلى حد الإفراط فإنها تشوش على الرائي وقد تزعجه.
(٥-٢) الترتيب والنقرات والمزادات
وبالفعل كان الزبائن راضين، فإبَّان فقاعة الإنترنت في أواخر تسعينيات القرن العشرين كانت المواقع التجارية حريصة على إبراز نفسها، وكان المستخدمون حريصين على العثور على المنتجات والخدمات التي يريدونها. قدمت شركة أوفرتشر ابتكارًا آخر وسَّع رقعة سوقها إلى ما وراء المواقع التي كان بوسعها دفع الكثير من الرسوم مقدمًا لأمريكا أونلاين وياهو مقابل اللافتات الإعلانية، فكانت الشركة لا تتقاضى من المعلنين مالًا مقابل نشرها لروابطهم، بل كانت لا تطالبهم بمقابل إلا عندما تظهر صفحات نتائج البحث ويقوم المستخدم بالنقر على أي من تلك الروابط، وكانت تتقاضى عن كل نقرة على رابط سنتًا واحدًا، ما أتاح حتى للشركات الصغيرة أن تنشر إعلاناتها على الويب نظرًا لانخفاض التكلفة، وكان المعلنون حريصين على الاشتراك في هذه الخدمة التي تقوم على أساس «الدفع مقابل النقر». قد لا يُقبِل المستخدم على السلعة فيشتريها بعد أن نقر على رابطها وظهرت أمامه، لكن كان المعلنون يدفعون مقابل أن يرى الجمهور مزيدًا من التفصيل عن المنتجات التي يُعلنون عنها.
وحين شاع هذا النوع من المعاملات ارتفع سعر تلك النقرات التجارية، أما أسلوب تحديد الأسعار فكان ابتكارًا ثالثًا من شركة أوفرتشر، فإذا وجدت الشركة أن هناك أكثر من معلِن يتنافسون على صفحة نتائج بحث عن المساحة المحدودة فإنها كانت تعقد مزادًا بينهم، وكانت ترفع السعر حتى أوصلته في بعض الأحيان إلى دولار للنقرة الواحدة، وكان سعر تلك النقرات التجارية يتأرجح صعودًا وهبوطًا، وذلك بحسب عدد العملاء الآخرين الذين كانوا يتنافسون لاستخدام نفس الكلمة الدليلية، فإذا أراد الكثير من المعلنين أن تكون لمواقعهم الإلكترونية روابط تظهر عند البحث عن كلمة «كاميرا» كان سعر النقرة يرتفع. كانت مساحة الشاشة محدودة، وكانت السوق تحدد الأسعار، وكان عقد المزاد العلني على الكلمات الدليلية أمرًا بسيطًا ومعقولًا ومربحًا للغاية.
ومن المفارقات أن انفجار فقاعة الإنترنت عام ٢٠٠٠ زاد من جاذبية ما تقوم به شركة أوفرتشر من تقاضي المال مقابل الترتيب ونظام النقرات التجارية وعقد المزادات على الكلمات الدليلية، فعندما تضاءلت الأرباح وقلت رءوس الأموال لم تعد شركات الإنترنت قادرة على الدفع مقدمًا لشراء مساحات إعلانية بدا أن بعضها لا يحقق إلا نتائج هزيلة، ونتيجة لذلك تحولت العديد من تلك الشركات إلى التعامل في دعايتها مع شركة أوفرتشر وغيرها من الجهات التي اعتمدت بعض ابتكارات أوفرتشر، كما أن هذا الانتشار الهائل أثر على مئات من شركات البحث على الويب، وحين اشتدت المنافسة بدأت ياهو وأمريكا أونلاين تَقبَلان أن تتقاضيا مقابلًا نظير ظهور المنتجات والخدمات على قوائم بحثهما.
(٥-٣) العم سام يتدخل
كانت محركات البحث المختلفة تقدم مستويات مختلفة من الكشف عن أمر تقاضي مقابل لقاء الترتيب، فكانت ياهو تعنون النتائج التي دُفع لها مقابل بكلمة «دعائية»، واليوم صار ذلك هو المصطلح المقبول عمومًا باعتباره تخفيفًا للكلمة الصريحة «إعلان مدفوع الأجر». أما محركات البحث الأخرى فاستخدمت مصطلحات غامضة مثل «نتائج تَتْبَع شركاءنا» أو «قوائم مميزة»، وكان محرك بحث مايكروسوفت المعروف إم إس إن يعرض مبررًا مبتكرًا لاستخدامه لكلمة «مميزة» دون أي تفسير لهذه الكلمة: إذ أظهرت استطلاعات الرأي التي قام بها إم إس إن أنَّ المستهلكين يفترضون مسبقًا أن نتائج البحث سلعة تُباع، ومِنْ ثَمَّ فلم تكن هناك حاجة إلى إخبارهم بذلك! وحين كثر الصراع على الويب أصبحت التجارة والأعمال أقل متعة، وأصبحت التكتيكات التجارية أقل اعتمادًا على روح المثالية التي وُلدت بها الإنترنت. قال إيفان ثورنلي الرئيس التنفيذي لشركة ناشئة: «لم نعد نتحمل وجود مناقشات أيديولوجية، فنحن شركة مساهمة.»
في البداية كانت الحكومة خارج هذه المنظومة، لكن في عام ٢٠٠١ تدخلت منظمة رالف نادر الرقابية «كونسيومر أليرت»، فقدمت شكوى لدى لجنة التجارة الفيدرالية تدَّعي فيها أن ثماني شركاتِ محركاتِ بحثٍ كانت تخدع المستهلكين عن طريق الخلط بين نتائج «الإدراج المدفوع» و«الترتيب مدفوع الأجر» جنبًا إلى جنب مع النتائج التي تظهر عن طريق خوارزمية محرك البحث، وكان المدير التنفيذي لكونسيومر أليرت، جاري راسكين، مباشرًا في اتهامه؛ إذ قال: «إن محركات البحث تلك فضلت الصبغة التجارية القميئة على النزاهة التحريرية. إننا نطالب لجنة التجارة الفيدرالية بضمان أن لا يتم خداع أحد بسبب سقوط محركات البحث في حمأة الخداع التجاري. فإذا كانت محركات البحث ستقحم تلك الإعلانات في نتائج البحث يتعين عليها أن تميز للمستهلك بين الإعلانات وما سواها.»
(٥-٤) جوجل تتوصل إلى توازن غير مخلٍّ
حين كانت صناعة محركات البحث تعاني بسبب مشكلاتها الأخلاقية والمالية في عام ٢٠٠٠ عثرت جوجل على مَنْجَمٍ من الذهب.
حينها كان لدى جوجل خوارزمية تصنيف بيدج، والتي أسفرت عن نتائج أفضل بكثير من نتائج محركات البحث الأخرى، وكانت جوجل تتسم بالسرعة، ومن أسباب ذلك أن مهندسيها عرفوا كيف يَفْصِلون المعالجة التي تجري في الخلفية عن تلك التي تجري في الواجهة عبر العديد من الأجهزة التي تعمل على التوازي. كان التكرار في تخزين جوجل الواسع للبيانات شديدًا لدرجة أنه يمكن سحب أحد الأقراص الصلبة من أي مكان دون أن يُفقِد ذلك جوجلَ شيئًا، ولم يُشتبه في أن جوجل تتقاضى أجرًا مقابل علو مرتبة البحث. كانت واجهة جوجل تخلو من الأمور التي تزعج المستخدم؛ فلا إعلانات مبهرجة (بل لا يوجد بها أي إعلانات على الإطلاق) لا في الصفحة الرئيسية ولا في صفحة نتائج البحث. كانت صفحة جوجل الرئيسية نموذجًا للاقتضاب، فلم يكن بها سوى كلمة «جوجل» وخانة البحث، وخيار الحصول على صفحة نتائج البحث، أو خيار «أشعر أني محظوظ»، والانتقال مباشرة إلى الرابط الأول في الترتيب (وهو الخيار الذي بلغ ذروة قيمته عندما كان كثير من المستخدمين لديهم اتصال بطيء بالإنترنت عن طريق الهاتف الأرضي).
يتيح آد ووردز للمعلنين الدخول في مزاد علني على الكلمات الدليلية، وهو يشبه مزادَ شركةِ أوفرتشر على الترتيب في نتائج البحث. لكن عند فوزك في هذا المزاد من جوجل تحصل على امتياز نشر إعلان نصي صغير على صفحات نتائج البحث على جوجل تحت ظروف معينة، لكنك لا تحصل على حق في ظهور موقعك الإلكتروني كنتيجة بحث عضوية. كان جمال النظام يكمن في عدم تدخله في نتائج البحث، وأنه غير مزعج نسبيًّا، ومرتبط بما بحث عنه المستخدم، ولم يُفسِد مظهرَ الشاشة بلافتات إعلانية مزعجة.
في البداية كانت جوجل تتقاضى مالًا من المعلِن كلما ظهر إعلانه للمستخدم بغض النظر عما إذا نقر المستخدم عليه أم لا، ثم في عام ٢٠٠٢ انتقل آد ووردز إلى نظام أوفرتشر الدفع لكل نقرة، في البداية كانت الإعلانات تُباع فُرادى عن طريق وكيل بشري، ولقد جاءت انطلاقة آد ووردز عندما أتمتت جوجل عملية نشر الإعلانات، فلكي تضع إعلانًا اليوم فما عليك إلا أن تملأ استمارة إلكترونية على الويب بها معلومات حول كلمات البحث التي تريد استهدافها، وتذكر نص إعلانك القصير، ورقم بطاقة الائتمان التي ستتقاضى جوجل عن طريقها مقابل خدمتها تلك.
كانت تقنية جوجل عبقرية، لكن لم يكن أي من عناصر نموذج عملها أصليًّا. وعن طريق المزج بين هذا وذاك انطلقت جوجل لتصبح عملاقًا في عالم الويب. لم تكن للدعاية أي تأثير على نتائج البحث، ومِنْ ثَمَّ لم تقلَّ ثقة المستخدم في جودة نتائج بحث جوجل، وقد مكن آد ووردز جوجل من تحقيق التوازن الذي تنبأ برين وبيدج من قبل أنه من المستحيلات: دعاية دون تشويه لنتائج البحث، وكانت النتيجة أن خرجت جوجل — من هذه المعضلة على الأقل — وجيوبها تفيض بالمال ومبادئها لم تُمس بسوء.
(٥-٥) الإعلانات الممنوعة
وبما أن شركات محركات البحث تحصد حصصًا كبيرة في مجال الدعاية فهي تسيطر على نوعية المنتجات التي يُعلَن عنها وتحدد المشروع منها من غير المشروع. إن قوائم النتائج التي تخرجها تلك الشركات هي مزيج من المتطلبات القانونية ومتطلبات السوق وفلسفة الشركات، والتأثير المشترك لهذه القرارات يمثل نوعًا من الرقابة الناعمة — التي ظلت لفترة طويلة مألوفة لدى الصحف — لكنها تكتسب أهمية جديدة حال تحوُّل موقع البحث إلى محرك دعاية مهيمن. من بين البنود والخدمات التي لا تقبل جوجل نشر إعلانات عنها السلع المقلدة والمواد الإباحية المتعلقة بالأطفال (في الولايات المتحدة يُسمح ببعض المواد الإباحية، شريطة أن لا يكون القائمون بالأدوار فيها دون السن القانونية)، وخدمات كتابة الأبحاث الدراسية، والعقاقير غير المشروعة وبعض مواد الأعشاب المشروعة، وأدوات تصنيع المخدرات، والألعاب النارية، ولعب القمار على الإنترنت، وأدوية الشفاء المعجِز، والإعلانات التي تتضمن هجومًا سياسيًّا (رغم أنه يُسمح بشكل عام بالدعاية السياسية)، والدعارة، والتشويش على رادارات حركة المرور، والأسلحة النارية، والقبضات الحديدية. ترسم القائمة صورة لما يريد أن يراه الشخص العادي، أو ينبغي أن يراه، أو لا يرى بأسًا برؤيته، ولعلها تصور أيضًا كيف تُقيِّد جوجل بحرص استخدام منتجها التحرري في ممارسة الأنشطة غير القانونية والترويج لها.
(٦) البحث قوة
في كل خطوة من عملية البحث يسعى الأفراد والمؤسسات جاهدين للسيطرة على ما نراه وما نجده، ليس بهدف إيذائنا، وإنما بهدف مساعدتنا. نعم، إن محركات البحث تعيننا، لكن ليس لديها لجان من الخبراء المحايدين تميز الصواب من الخطأ، أو تميز المهم من غير المهم، لكن هناك دوافع اقتصادية واجتماعية قوية لتقديم معلومات تروق لنا. ولأننا لا نرى ما يحدث في كواليس محركات البحث فإن مَنْ يتحكمون فيما نراه هم في حد ذاتهم يخضعون لبعض الضوابط.
(٦-١) استعمال الخوارزميات لا يعني البراءة من التحيز
تحسب محركات البحث مقدار أهمية صفحات الويب وترتبها؛ لأنها تقِيم خياراتها على أساس «خوارزمي»، وهذا ما يجعلنا في كثير من الأحيان نفترض أنها — على عكس الباحثين من البشر — ليست عرضة للوقوع في التحيز. لكن يمكن إدخال التحيز إلى البرنامج المستخدم فتظهر النتائج مع حدوث تغييرات طفيفة في عوامل مختلفة تدخل في نظام التصنيف أو خوارزمية اختيار الزحف الإلكتروني، بل إن تحديد ما يمكن اعتباره انحيازًا هو مسألة تخضع لحكم البشر.
امتلاكك لكثير من المال لن يأتي لك بترتيب عالٍ في نتائج جوجل إن دفعت لها أموالًا طائلة، لكن خوارزمية جوجل المتبعة في تصنيف بيدج تتضمن شيئًا من التحيز لصالح الأغنياء والأقوياء، فإذا أصبحت شركتك ناجحة فإنه على الأرجح ستشير الكثير من صفحات الويب إلى صفحة شركتك، وهذا من شأنه أن يرفع تصنيف موقعك الإلكتروني. هذا الأمر يبدو معقولًا، ويميل إلى إظهار نتائج يرى معظم الناس أنها صحيحة، لكن إلى أي مدى ينبغي أن يوَلِّد النفوذ مزيدًا من النفوذ؟ إجابة ذلك اختلفت حولها وجهات نظر الشركات القوية والشركات الصغيرة. هل النتائج «تبدو على ما يرام» أم أن مؤشرات خوارزمية البحث بحاجة إلى تعديل؟ وإجابة ذلك أمر لا يستطيعه إلا البشر.
من المرجح أن تدفع قوى السوق محركات البحث المجدية تجاريًّا نحو الانحياز للأغلبية، وكذلك للاستجابة لمصالح الأقلية في حدود نصيب تلك الأقلية من السلطة السياسية، وعلى الأرجح تفضل محركات البحث المصادر الجديدة على المصادر القديمة، بل وربما على المصادر الأكثر شمولًا، وسبب ذلك أن مستخدميها يلجئون إلى الإنترنت للحصول على أحدث المعلومات، فإذا كنت تعتمد على محرك بحث ما لاكتشاف المعلومات التي تريدها فتذكر أن الآخرين يحكمون نيابة عنك حول ما يظهر أمامك على الشاشة.
(٦-٢) ليست محركات البحث سواءً
عندما نستخدم محرك بحث لعلنا نظن أن ما نحصل عليه هو عينة تمثيلية لما هو متاح. إذا كان الأمر كذلك فينبغي أن يكون ما نحصل عليه من أحد محركات البحث مشابهًا جدًّا لما نحصل عليه من محرك آخر، وهذا أمر منافٍ تمامًا للواقع العملي.
كل نقطة من النقاط المائة في الصف العلوي تمثل نتيجة بحث باستخدام جوجل، والنتيجة التي حصلت على أعلى مرتبة موجودة في الجهة اليسرى، أما الصف السفلي فيمثل نتيجة البحث باستخدام ياهو، وهناك خط يصل بين كل نتيجتيْن متماثلتيْن، وفي حالتنا هذه كانت نسبة العناصر المشتركة بين محركيْ البحث لا تتجاوز ١١٪ من النتائج. الرابط الذي حصل على المرتبة الأولى في ياهو لم يظهر في نتيجة بحث جوجل مطلقًا، فلم يظهر من بين أول مائة رابط، ولا حتى في أول ثلاثين صفحة من صفحات نتائج بحث جوجل.
يحدد الترتيب مقدار البروز على الويب، وقد وجدت دراسة بحثية في مجال البحث على الويب أن ٦٢٪ من المستخدمين ينقرون على رابط من الصفحة الأولى، و٩٠٪ ينقرون على رابط من الصفحات الثلاث الأولى، وبالنسبة للمستخدمين الذي لم يعثروا على ما يريدون من أول مرة، فقد وُجِدَ أن أكثر من ٨٠٪ منهم يعيدون الكَرَّة من جديد مستخدمين محرك البحث نفسه بعد أن يعدلوا من كلمات بحثهم، ثقةً منهم أن محرك البحث «يعرف» الإجابة الصحيحة وأن العيب فيهم هم؛ إذ لم يُحسنوا اختيار ألفاظ بحثهم. وقد وجدت دراسة لعمليات البحث في محرك بحث إكسايت أن أكثر من ٩٠٪ من عمليات البحث عثر أصحابها على بغيتهم في الصفحات الثلاث الأولى، لكن باستخدام جوجل فإن المستخدمين الذين يجدون بغيتهم في الصفحة الأولى أكثر من غيرهم.
يضع مستخدمو محرك البحث ثقة كبيرة في أنه سيمنحهم نتائج ليست فقط مفيدة بل وموثوقة، ويعتقد ٣٦٪ من المستخدمين أن ظهور شركة في أعلى قائمة نتائج البحث يعني أنها من كبرى الشركات في مجالها، ومن لا يظنون ذلك لم تتجاوز نسبتهم ٢٥٪. وبوجه عام لا يوجد سبب يدعونا إلى الثقة أن ترتيب البحث يتماشى مع مكانة الشركات وجودة منتجاتها أو خدماتها.
لعبة القط والفأر مع مرسلي البريد المزعج إلى المدونات
قد ترى تعليقات على مدونة لا تتضمن سوى بعض الكلمات العشوائية ورابطًا. هناك مكرِّر خبيث ينشر هذه الرسائل على أمل أن يقوم عنكبوت جوجل الإلكتروني بفهرسة صفحة المدونة، بما في ذلك الرابط غير المرغوب فيه، ومع ازدياد عدد الصفحات التي تشير إلى ذلك الرابط لعل ترتيبه على مقياس تصنيف بيدج يرتفع، ومِنْ ثَمَّ يظهر في نتائج البحث. وقد جابهت المدونات ذلك بأن أصبحت تجبر المستخدم على إدخال حروف موجودة بصورة مشوهة فيما يسمى بنص كلمة التحقق (اختبار مؤتمت تمامًا للتفرقة بين البشر وأجهزة الكمبيوتر) وهو اختبار لتحديد ما إذا كان الطرف الآخر الذي يرسل التعليق بشرًا أو مكرِّرًا، ورد مرسلو البريد المزعج بأن جعلوا مكرِّرهم يأخذ نسخة من الصورة ثم يعرضها على متطوعين من البشر يعملون معهم؛ ثم يأخذ المكرِّر ما أدخله المتطوع، ويستخدمه في الدخول إلى موقع المدونة، ويُجنَّد هؤلاء المتطوعون مقابل منحهم دخولًا مجانيًّا إلى مواقع إباحية إذا أصابوا في كتابة نص كلمة التحقق! وهذه عينة من نص كلمة التحقق:
نشرت هذه الصورة في النطاق العام بواسطة مؤلفها كروجلوف في مشروع ويكيبيديا، وهذا ينطبق على مستوى جميع أنحاء العالم.
(٦-٣) نتائج البحث يمكن التلاعب بها
في ظل هذه الظروف فإن أي شخص يُنشئ موقعًا له على شبكة الإنترنت ليُبلِغ به العالم رسالة ما سيصل إلى استنتاج واضح. إن ظهور الموقع في مرتبة عالية في قائمة البحث أمر بالغ الأهمية بحيث لا يمكن تركه للصدفة، ونظرًا لأن الترتيب أمر متعلق بالخوارزميات يتضمن مجموعة من القواعد التي تُتَّبع بعناية ودقة، فلا مناص من أنه يمكن التلاعب في النتائج. والطلب في هذا الشأن هو ما تستند إليه صناعة «تحسين ترتيب المواقع في نتائج محركات البحث».
تحسين ترتيب المواقع في نتائج محركات البحث هو نشاط يسعى إلى تحسين ترتيب صفحات ويب بعينها ضمن محركات البحث الرئيسية بهدف زيادة الإقبال عليها على شبكة الإنترنت. تسعى شركات مشروعة إلى تحسين مواقعها الإلكترونية لتنال مرتبة في نتائج البحث أعلى من مراتب منافسيها، كما يسعى المخادعون وناشرو المواد الإباحية إلى تحسين مواقعهم الإلكترونية عن طريق خداع خوارزميات محركات البحث كي تدرجها على أنها مشروعة، رغم أن مساعيهم للحصول على الشرعية ليست إلا تنكرًا. تعدل شركات محرك البحث خوارزمياتها لكشف ذلك التنكر، لكن قد يكون لذلك التعديل في بعض الأحيان آثار غير مقصودة على الشركات المشروعة، وهذا التعديل يجري في معظمه سرًّا لتجنب إعطاء المتلاعبين أي أفكار تعينهم على إجراء تدابير مضادة، والنتيجة معركة فوضوية تنال نارها مارَّةً أبرياء أصبحوا يعتمدون على ارتفاع ترتيب مواقعهم في محركات البحث، وقد يتضررون في بعض الأحيان مع تغير القواعد.
تقول جوجل عن خوارزمية تصنيف بيدج: «الديمقراطية على شبكة الإنترنت ناجحة.» وهي في ذلك تشبه طريقة الترتيب بحسب كثرة الروابط التي تشير إلى صفحة الويب بالانتخاب العام. لكن هذا التشبيه قاصر؛ فهناك العديد من الطرق للتلاعب في هذا «الانتخاب»، كما أن قواعد التصويت لا يُكشف عنها بصورة كاملة.
مفتاح النجاح في مجال تحسين ترتيب المواقع في نتائج محركات البحث يكمن في الطريقة الخاصة التي تتبعها محركات البحث في ترتيب صفحات الويب — العوامل والمعايير التي تؤثر في ذلك — ومِنْ ثَمَّ تعديل موقع الويب بحسب ذلك لتحسين مرتبته في صفحات نتائج البحث. على سبيل المثال، إذا كان محركُ بحثٍ ما يُعلي من شأن الكلمات المفتاحية التي تظهر في عنوان الصفحة، وأنت تريد أن تُعْلِيَ ترتيب موقعك في نتائج البحث عن كلمة «كاميرات»، فيجب عليك أن تضع كلمة «كاميرات» في العنوان. قد تكون العوامل المرجحة معقدة وتعتمد على أمور خارجة عن صفحة الويب، على سبيل المثال الروابط الخارجية التي تشير إلى صفحة الويب تلك أو عمر الرابط أو مكانة الموقع الذي يرتبط بها، وحتى تحصل على أثر ملموس في نتائج البحث يتعين عليك أن تبذل الكثير من الوقت والجهد والمال.
هل عالم البحث يتمتع بقدر أكبر من الأخلاقيات لأن صفقات تحسين ترتيب الصفحات تتم بصورة غير مباشرة، وبطريقة غير معلنة، وأن هذه المهمة توكل إلى شركات تحسين الترتيب وليس شركات البحث؟ على أي حال من المنطقي أنه إذا كان لديك رسالة مهمة تريد إبلاغها فإنك ستسعى إلى تحسين ترتيب موقعك في نتائج البحث، وعلى الأرجح لن يكون لديك موقع إلكتروني على الإطلاق إذا لم يكن لديك رسالة مهمة تريد إيصالها. وتميل شركات محركات البحث إلى نصح مصممي المواقع أن يطوروا مواقع أفضل وأكثر موضوعية، بالطريقة نفسها التي يحث بها المسئولون عن القبول طلاب المدارس الثانوية أن يتعلموا المزيد في المدرسة. لكن لن تؤدي هذه النصيحة المبدئية إلى اختفاء أيٍّ من صناعات «تحسين الترتيب» التي تقوم بها جهات أخرى.
قنابل جوجل
شن ماريك دبليو، وهو مبرمج يبلغ من العمر ٢٣ عامًا، من سيزين ببولندا، قصفًا جوجليًّا على رئيس بلاده ليخ كازينسكي، فكانت عمليات البحث باستخدام جوجل عن كلمة العضو الذكري بالبولندية تسفر عن نتائج بحث يتصدرها موقع الرئيس البولندي، وبالطبع لم يَرُقْ هذا للرئيس البولندي، وإهانة الرئيس تعد جريمة في القانون البولندي. لذلك يواجه ماريك الآن عقوبة السجن لمدة ثلاث سنوات.
التلاعب في ترتيب نتائج البحث ساحة من ساحات المعارك حول السلطة، ولأن البحث هو المدخل إلى المعلومات على شبكة الإنترنت فإن السيطرة على نتائج بحث ربما تسمح لك بالسيطرة على فكر الآخرين؛ لذلك ترى حتى الحكومات تدلي بدلوها في هذه المعارك.
(٦-٤) محركات البحث لا ترى كل شيء
(٦-٥) التحكم في البحث والتحكم في العقول
لتخفي كتابًا من مكتبة لا يتعين عليك أن تزيله من رف الكتب، كل ما عليك القيام به هو إزالة قيده من كتالوج المكتبة، فإذا لم يكن هناك قيد للكتاب يبين أين يمكن العثور عليه فلا يهم إذا كان الكتاب في الواقع لا يزال موجودًا على الرفوف أم لا.
كان البحث على الويب حينها يمثل أمرًا جوهريًّا للاقتصاد الصيني، بحيث لم يكن بوسع الحكومة حجب مواقع البحث لفترة طويلة. تطورت مهارات القائمين على الجدار الناري، وازدادت صعوبةُ وصولِ المستخدمين إلى المواقع المحظورة، لكن قد يظهر موقع من تلك المواقع في نتائج بحث جوجل، ولم يكن بوسع المستخدم الصيني حينها الوصول إليه لو نقر على رابطه، لكنه كان بذلك يعرف ما هو محجوب عنه.
في عام ٢٠٠٤، وتحت تهديد آخر بحجب موقعها في الصين، وافقت جوجل على فرض رقابة على خدمتها الإخبارية التي توفر الوصول إلى الصحف المنشورة على الإنترنت، وقررت شركة جوجل على مَضَض أن لا تدلي بأي معلومات على الإطلاق عن هذه الأمور بحجة أن «مجرد إظهار هذه العناوين من شأنه أن يؤدي على الأرجح إلى حجب خدمة «أخبار جوجل» حجبًا تامًّا في الصين.» لكن الحكومة الصينية لم تكتفِ بذلك.
وجاء الاختيار الصعب حقًّا بعد مضي عام على ذلك، فقد كان محرك بحث جوجل متاحًا داخل الصين، لكن خوادم جوجل كانت موجودة خارج الصين ما جعل ردود جوجل تتأخر. ولأن العديد من الروابط التي ظهرت أمام المستخدم الصيني لم تعمل، فقد أصبح محرك بحث جوجل غير قادر على المنافسة، إن لم نقل عديم الجدوى، وكان معظم الإقبال هناك على محرك البحث الصيني بايدو.
هذا جعل شركة جوجل أمام قرار مصيري: فإما أن تقبل أن تتعاون مع الحكومة الصينية وتخضع لرقابتها على الويب أو تضحي بالسوق الصينية. كيف لها أن توازن بين مسئولياتها تجاه مساهميها في النمو على الصعيد الدولي وفي الوقت ذاته تلتزم بهدفها كشركة ألا وهو «تنظيم المعلومات على مستوى العالم وجعلها متوافرة ومفيدة»؟ ترى هل لشركة كان أحد مؤسسيْها مهاجرًا من الاتحاد السوفييتي أن تهادن الرقابة الصينية؟
مقارنة بين جوجل في الولايات المتحدة وجوجل في الصين
يمكنك أن تجرب بنفسك بعض عمليات البحث:
-
www.Google.com هو النسخة المتاحة من جوجل في الولايات المتحدة.
-
www.Google.cn هو النسخة المتاحة من جوجل في الصين.
وكان رد فعل جوجل تجاه السلطات الصينية، من منظور معين، لا يعدو كونه إحدى الممارسات العادية لأي شركة: فعليك أن تمتثل للقوانين المحلية في أي مكان تتاجر فيه. وقد احتجَّت الصين بالقوانين الأمريكية على منتقديها من الأمريكان، فقد صرح السيد ليو تشنج رونج، نائب رئيس مكتب شئون الإنترنت التابع لمكتب استعلامات مجلس الدولة الصيني، قائلًا: «بعد دراسة لتشريعات الإنترنت في الغرب وجدت أن لدينا أهدافًا ومبادئ تشريعية متطابقة مع مثيلاتها الغربية. من الظلم ومن ازدواجية المعايير أن ينتقد «الأجانب» الصين لحذفها الرسائل غير المشروعة والضارة، في حين أن القانون الأمريكي نفسه ينص على ذلك داخل الولايات المتحدة.»
وهكذا، عندما وافقت جوجل في أوائل عام ٢٠٠٦ على فرض رقابة على نتائج بحثها في نسختها الصينية، أيقظ ذلك البعض من أحلامهم بمدينة عالمية فاضلة للمعلومات، ففي بيان لها صرحت جوجل أنه: «رغم أن حذف نتائج البحث لا يتفق مع هدف جوجل، فإن عدم توفير المعلومات (أو إفساد تجربة المستخدم بشدة بحيث يرقى الأمر إلى حرمانه من أي معلومات) أمر يتعارض بصورة أكبر مع هدفنا.» وقد بدا هذا العذر للبعض عذرًا واهيًا، وقد رد أحد المعلقين الليبرتاريين معربًا عن خيبة أمله بقوله: «إن ما تفعلونه يمهد الطريق أمام قوى الشر في هذا العالم.» (على ما يبدو هذه إشارة إلى مبدأ آخر من مبادئ جوجل؛ ألا وهو «لا تكن شريرًا!» وقد نُقِّح الآن فصار: «يمكنك كسب المال دون أن تقع في الشر».) وقد عاب الكونجرسُ الأمريكي ذلك على شركة جوجل وشركات بحث أخرى، فقد قال ممثل كاليفورنيا توم لانتوس: «إن أعمالكم البغيضة في الصين وصمة عار، لا أستطيع أن أفهم كيف يَسَعُ مديريكم التنفيذيين أن يناموا ليلًا.»
في معظم الأحيان سواء أكنتَ تستخدم النسخة الأمريكية أم النسخة الصينية من جوجل ستحصل على نتائج مماثلة. على وجه الخصوص، إذا بحثت عن كلمة «حذاء»، فستظهر لك روابط دعائية لمتاجر أحذية على الإنترنت كي يتسنى لشركة جوجل أن تدفع فواتيرها.
لكن هناك استثناءات كثيرة، فقد عقد أحد الباحثين مقارنة بين نتائج بحث النسختين الأمريكية والصينية من جوجل عن طريق البحث عن ١٠ آلاف مفردة إنجليزية، ووجد أن ما يقرب من ٩٪ منها أظهرت ردودًا تخضع للرقابة، وهناك إصدارات مختلفة من قائمة الكلمات المحظورة، والمعايير الخاصة قابلة للتغيير دون إشعار بالتأكيد. تضمنت الإصدارات الأخيرة مفردات مثل «جريمة ضد الإنسانية» و«القمع» و«الإبادة الجماعية»، فضلًا عن قوائم بأسماء المعارضين والسياسيين.
إن عدسة محرك البحث ليست حيادية، وفي هذا النطاق يمكن أن يكون البحث أداة فعالة للسيطرة على الفكر. قال مسئول تنفيذي من جوجل أمام الكونجرس: «في عالم يفتقر إلى الكمال تعيَّن علينا أن نختار خيارًا بعيدًا عن المثالية.» هذا حقيقي بالتأكيد، لكن التجارة هي التجارة، وكما قال إريك شميت المدير التنفيذي لجوجل عن ممارسات الشركة: «هناك العديد والعديد من الطرق التي يمكنك عن طريقها إدارة العالم وإدارة شركتك … فإذا لم يعجبك هذا فلا تشارك، لقد جئتَ إلى هنا طواعية، ولم نجبرك على المجيء.»
(٧) عمَّ بحثت؟ تتبُّع عمليات البحث
يمكن لشركات محركات البحث أن تخزن كل ما تبحث أنت عنه، وكل ما تنقر عليه. وفي ظل عالم لا تعرف سعة التخزين فيه حدودًا تستفيد شركات البحث من الاحتفاظ بهذه البيانات التي قد يكون لها استخدام يومًا ما، وهي تشكل جزءًا هامًّا من عملية البحث. لكن الاحتفاظ بسجلِّ ما بَحَثَ عنه المرء على محرك البحث أمر يثير تساؤلات قانونية وأخلاقية، فالقدرة على الاحتفاظ بسجلات عمليات البحث وتحليلها هي نقطة قوة أخرى تأتي من معرفة ما يثير اهتمامك كفرد، وما يثير اهتمام المجتمع ككل.
البحث عن الصور
من وجهة نظر شركة البحث من السهل أن نفهم السبب وراء الاحتفاظ بكل نقرة بالفأرة قمتَ بها. يبين مؤسس جوجل سيرجي برين كل شيء على صفحة «فلسفة» شركة جوجل فيقول: «إن محرك البحث الأمثل هو الذي يفهم بالضبط ما يعني المستخدم ويمنحه ما يريده بالتحديد.» سجل بحثك على الويب ينبئ بالكثير، ومحرك البحث يقرأ أفكارك بطريقة أفضل بكثير إذا ما عرف كيف كنت تفكر في الماضي.
ويمكن تحسين جودة البحث إذا احتُفِظَ بسجلات البحث. قد نفضل، لأسباب تتعلق بالخصوصية، أن لا تتذكر محركات البحث أيًّا من أفعالنا، لكن سيكون لهذا الأمر ثمن؛ بالنسبة لنا سيقلل ذلك من أداء محرك البحث، وبالنسبة لشركة البحث سيقلل من قدرتها التنافسية. ما من شيء إلا وله ثمن، ومهما كانت نظريتنا عن محرك البحث وتتبعه لما نبحث عنه فإننا في الواقع لا نقلق كثيرًا بشأن ذلك، حتى لو علمنا به.
(٨) تقنين عمل السماسرة أو استبدالهم
البدائل المفتوحة
محركات البحث المتعدد
نحن نعتمد على محركات البحث، لكننا لا نعرف ماذا تفعل تلك المحركات، وليس هناك أجوبة سهلة للسؤال: ماذا عسانا أن نفعل حيالها؟
إذن في الوقت الحاضر على الأقل سوق محركات البحث لها اليد العليا، وعلى المشتري توخي الحذر، وربما هذا هو ما ينبغي أن يكون الحال عليه، ففي كثير من الأحيان يكون أثر جهود أصحاب النوايا الحسنة لتقنين التكنولوجيا أسوأ بكثير من أثر الشرور التي بذلت من أجلها تلك الجهود، وسنرى العديد من الأمثلة في الفصول القادمة من هذا الكتاب.
•••
تكنولوجيا البحث، جنبًا إلى جنب مع الشبكة العالمية، لها تأثير عجيب في الحصول على المعلومات على المستوى العالمي، والفرص التي تتيحها للحد من المعلومات لا تلقي بظلالها على قدرتها على التنوير. إننا نجد أشياء كان لا يمكن تصورها قبل عقد من الزمان غدت اليوم من الأمور البسيطة، يمكننا جميعًا أن نجد أقاربنا المفقودين، ويمكننا جميعًا أن نجد مجموعات دعم جديدة وأحدث المعلومات الطبية للأمراض التي نعاني منها مهما كانت غامضة، يمكننا أن نجد حقائق في كتب لم تقع في أيدينا قط. إن البحث على الويب يسلط مشعل الانفجار الرقمي على الأمور التي نريد إظهارها.
لكن تكنولوجيا التشفير لها هدف معاكس تمامًا: أن تجعل المعلومات سرية، حتى لو جرى تبادلها عبر شبكات مفتوحة عامة، وهذه القصة المتناقضة التي تضم في ثناياها كلًّا من السياسات والرياضيات هي موضوع الفصل التالي.