كيفية قراءة كتاب الحياة
على الرغم من الأهمية البيولوجية التي يحملها الحمض النووي، فإنه جزيء هش. فبِنْيته الطولية التي تُشبه الخيط تُصعِّب دراسته في حالته الطبيعية. ونادرًا ما يوجد الحمض النووي في الخلايا الحية منفردًا؛ إذ عادةً ما يرتبط ارتباطًا وثيقًا بالبروتينات (ارجع للشكل ١-٢)؛ البروتينات التي تعمل على ضغطه وتنظيم عملية التعبير الجيني. ومن ثَم، فإن عملية استخلاص (أو «استخراج») الحمض النووي من العديد من البروتينات والدهون والجزيئات العيانية الأخرى داخل الخلية تستلزم استخدام مواد كيميائية قوية وتعرِّضه لتلفٍ مادي. وبينما يُمكن تقدير حجم الكروموسومات السليمة في المختبَر، عادةً ما تَجمع الأدوات الحديثة المُستخدَمة في تحديد تسلسل الحمض النووي أجزاءً من الحمض النووي لا يزيد طول كلٍّ منها على ألف زوج قاعدي من تسلسل النيوكليوتيدات. لذا فمن أجل تحديد تسلسل أحد الجينومات، لا بد أولًا أن يولِّد العلماء آلافًا إلى ملايين من «قراءات» تحديد تسلسل قصيرة مفردة (كلما زاد حجم الجينوم زادت القراءات المطلوبة)، ثم يُقارن بين القراءات بمحاكاة حاسوبية، وبعدئذٍ تُستخدم لإعادة بناء (أو «تجميع») صورة حمض نووي لكائن حي كما هو موجود في الخلية. سنتناول في هذا الفصل تقنيات تحديد التسلسل، وفي الفصل الثالث سنركِّز على الأدوات المستخدَمة في تجميع الجينوم واكتشاف الجينات. وتجدر الإشارة إلى أنَّ التطورات التكنولوجية في هاتين المسألتين كلتيهما أوصلت مجال علم الجينوم إلى وضعه الحالي.
تحديد تسلسل البروتينات والحمض النووي الريبوزي
بالرغم من الانتشار الهائل لعملية تحديد تسلسل الحمض النووي حاليًّا، فإنها تطورت بعد تحديد تسلسل الحمض النووي الريبوزي وتسلسل البروتينات بفترة طويلة. ويرجع ذلك إلى عدة عوامل، أهمها أن استخلاص جزيئات البروتينات والحمض النووي الريبوزي في البداية كان أسهل من استخلاص الحمض النووي؛ وبذلك كانت أكثر قابلية لإجراء تجارب عليها. جدير بالذكر أن أول بروتين «قُرئ» تسلسل أحماضه الأمينية حتى النهاية، كان هرمون الأنسولين الصغير الذي حدَّد تسلسُلَه عالِمُ الكيمياء الحيوية البريطاني فريدريك سانجر في منتصف خمسينيات القرن العشرين. لن نتطرق هنا إلى مناقشة الطرق التي حدَّد بها سانجر تسلسل البروتينات، لكن إسهاماته المؤثرة في الكيمياء الحيوية وعلم الأحياء الجزيئي تتخلل كل جزء من هذا الكتاب وجديرة بأن يتكرر ذكرها (فاز سانجر مرتين بجائزة نوبل في الكيمياء، في عامَي ١٩٥٨ و١٩٨٠، لإسهامه في تطوير تحديد تسلسل البروتينات وتسلسل الحمض النووي، على الترتيب).
وقد ظهرت طرق لتحديد تسلسل الحمض النووي الريبوزي بعد ذلك بحوالي عقد. انصبَّ التركيز الأولي، بحُكم الضرورة، على الجزيئات الصغيرة التي استُخلصَت بسهولةٍ مثل جزيئات الحمض النووي الريبوزي الناقلة. ففي عام ١٩٦٥، استطاع روبرت هولي، عالِمُ الكيمياء الحيوية الأمريكي والحائز على جائزة نوبل، أن يستخلص من بعض خلايا الخميرة حمضًا نوويًّا ريبوزيًّا ناقلًا طوله سبع وسبعون نيوكليوتيدة، وحدد تسلسله كاملًا. وطوال الستينيات، كان سانجر عاكفًا على إجراء تجارب بوسائل جديدة لدراسة جزيئات صغيرة من الحمض النووي الريبوزي، ثم كان عالِمُ الأحياء الدقيقة الأمريكي كارل ووز هو الذي بنى على تلك الوسائل وطوَّرها لدراسة جزيئات حمض نووي ريبوزي أكبر حجمًا بكثير. وكانت اهتمامات ووز العلمية مُنصبة على الريبوسوم، وهو مركَّب معقَّد يرتبط فيه البروتين بالحمض النووي الريبوزي، ويوجد بوفرة هائلة، ويُعَد مسئولًا عن تخليق البروتين؛ وهكذا كان ووز هو أول من جمع تسلسلات من الحمض النووي والحمض النووي الريبوزي من أجل استخدامها مقياسًا زمنيًّا لقياس المسافات التطورية بين الكائنات الحية.
للحصول على المعلومات الفعلية الخاصة بالتسلسل، قُطِعَت جزيئات الحمض النووي الريبوزي الريبوسومي المُستخلَصة والمشِعَّة إلى قِطع أصغر حجمًا باستخدام إنزيمات خاصة من الإنزيمات التي تفكك الحمض النووي الريبوزي (مثل إنزيم الريبونيوكلياز تي١، الذي يقطع من بعدٍ ريبونيوكليوتيدات الجوانين). ثم فُصلَت العينات مرة أخرى وفقًا لحجمها، وبعد عدة دورات من التفكيك والفصل، كان ما تَبقَّى أنماطًا مميزة من نقاط سوداء على لوح تصوير بالأشعة السينية. إذ تُمثل كل نقطة جزءًا من الحمض النووي الريبوزي لا يتعدى طوله خمس نيوكليوتيدات أو ستًّا. وبجهدٍ كبير، أمكن التوصل إلى التسلسل الدقيق للنيوكليوتيدات المكوِّنة لكل جزءٍ من الحمض بتدقيق النظر في انتقاله أثناء عملية الفصل الكهربائي والإنزيمات التي أدَّت إلى تحليله. وهكذا أصبح كل تسلسل من تسلسلات الحمض النووي الريبوزي، في زمان ووز، مُدخلًا مدونًا في فهرس الحمض النووي الريبوزي المُستخدَم في المختبرات، وقد أفضت نتائج تحليلات هذا الفهرس في النهاية إلى اكتشاف نطاق الحياة الثالث، وهو العتائق.
تحديد تسلسل الحمض النووي
تُعَد تقنيات تحديد التسلسل الجزيئي القائمة على الحمض النووي الريبوزي مُجهِدة إلى أقصى حد؛ لذا سرعان ما حلَّت محلها، في أواخر السبعينيات، طريقتان لتحديد تسلسل الحمض النووي ابتكرهما سانجر وعالِم علم الأحياء الجزيئي الأمريكي والتر جيلبرت، كلٌّ على حدة. وما زال نهج «التحديد الكيميائي للتسلسل» الذي ابتكره جيلبرت مفيدًا في تطبيقات بحثية معينة، لكننا سنركِّز هنا على ما أصبح معروفًا باسم «طريقة سانجر لتحديد التسلسل»؛ إذ إن هذا النهج هو الذي بات سائدًا داخل المجتمع البحثي لأسبابٍ مختلفة. وما زال يُستخدم على نطاق واسع في الوقت الحاضر، وإن كان يُطبَّق باستخدام معَدَّات وكواشف حديثة.
عادةً ما تبدأ طريقة سانجر بإدخال جزء الحمض النووي المراد تحديد تسلسله في جزيء بلازميد حلقي مربوط به «بادئ» قصير من بادئات تحديد تسلسل الحمض النووي. ثم تُخلط هذه الجزيئات من الحمض النووي مع إنزيم بوليميريز الحمض النووي، وهو الإنزيم نفسه الذي يُضاعف الحمض النووي داخل الخلية في الطبيعة. ويُضاف إلى هذا الخليط كلٌّ من وحدات بناء الحمض النووي الأساسية الأربع، وهي النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين (المعروفة اختصارًا ﺑ «دي إن تي بي») المتمثلة في الأدينوسين الثلاثي الفوسفات المنقوص الأكسجين، والسيتيدين الثلاثي الفوسفات المنقوص الأكسجين، والجوانوسين الثلاثي الفوسفات المنقوص الأكسجين، والثايميدين الثلاثي الفوسفات المنقوص الأكسجين، على أن تكون واحدة من تلك النيوكليوتيدات موسومة إشعاعيًّا. ومن العوامل الضرورية لنجاح التجربة إضافة نيوكليوتيدات ثنائية ثلاثية الفوسفات منقوصة (المعروفة اختصارًا ﺑ «دي دي إن تي بي») الأكسجين أيضًا. وتعمل هذه النيوكليوتيدات باعتبارها مُنهيات للسلسلة؛ فهي معدَّلة كيميائيًّا بطريقةٍ تُتيح دمجها في الحمض النووي عن طريق إنزيم البوليميريز، ولكن لا يمكن استخدامها لمواصلة مدِّ السلسلة. وتستخدم طريقة سانجر التقليدية أربعة أنابيب تفاعل منفصلة لكل عينة حمض نووي يُراد تحديد تسلسلها، ولا تختلف كل عينة عن الأخرى إلا في هوية جزيء النيوكليوتيدات الثنائية الثلاثية الفوسفات المنقوصة الأكسجين المضاف إليها (يحتوي كل أنبوب على جزيء مختلف من جزيئات إنهاء سلسلة الحمض النووي).
وفي عمل سانجر على تطوير طريقته، تجلَّت ألمعيَّته في تعديل الكميات النسبية من النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين والنيوكليوتيدات الثنائية الثلاثية الفوسفات المنقوصة الأكسجين الموجودة في أنابيب التفاعل، بحيث يصبح دمج الثانية نادرًا؛ وبذلك لا يحدث إنهاء السلسلة إلا نادرًا. ففي أنبوب الأدينين، عندما تُصادَف إحدى بقايا الثايمين على قالب الحمض النووي، سيضيف إنزيم البوليميريز جزيئًا عاديًّا من الأدينوسين الثلاثي الفوسفات المنقوص الأكسجين أغلب الوقت. والعلة في ذلك أن الأدينين يقترن بالثايمين، وعدد جزيئات الأدينوسين الثلاثي الفوسفات المنقوص الأكسجين في الأنبوب أكثر من جزيئات الأدينوسين الثنائي الثلاثي الفوسفات المنقوص الأكسجين. وبذلك تتواصل استطالة السلسلة. وعند الوصول إلى الثايمين التالي في القالب، يصبح إنهاء السلسلة مستبعَدًا مرة أخرى، لكنه يظل ممكنًا. وبذلك تصير النتيجة النهائية أنبوب أدينين مليئًا بقِطع مشعَّة من الحمض النووي ذات أحجام متعددة، بحيث تشير كل قطعة منها إلى موضع إحدى بقايا الثايمين في قالب الحمض النووي. تحذو التفاعلات التي تجري في الأنابيب الثلاثة الإضافية حذو الأنبوب الأول، باستثناء أن قِطع الحمض النووي المُخلَّقة حديثًا تُنهيها جزيئات سيتيدين ثنائي ثلاثي الفوسفات منقوص الأكسجين، وجوانوسين ثنائي ثلاثي الفوسفات منقوص الأكسجين، وثيميدين ثنائي ثلاثي الفوسفات منقوص الأكسجين.
الخطوة الأخيرة هي استخدام الفصل الكهربائي بالهلام لفصل قِطع الحمض النووي في كلٍّ من الأنابيب الأربعة المتراصَّة جنبًا إلى جنب. وهذا بدوره يؤدي إلى تكوين ما يُعرَف ﺑ «سُلم» تحديد تسلسل الحمض النووي، الذي يمكن إظهاره بتعريض قطعة من لوح تصوير الأشعة السينية للهلام (وذلك بسبب استخدام جزيئات مشعة من النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين). وبتحليل أنماط انتقال درجات السُّلَّم، يمكن استنتاج تسلسل جزيء الحمض النووي الأصلي.
تجدر الإشارة إلى أن نسخة سانجر الأصلية من طريقة تحديد التسلسل القائمة على إنهاء السلسلة باستخدام نيوكليوتيدات ثنائية ثلاثية الفوسفات منقوصة الأكسجين؛ كانت بمثابة قفزة نوعية فارقة تخطَّت تقنية فهرسة الحمض النووي الريبوزي. فلأنَّ هذه العملية تضمَّنت تخليق الحمض النووي في أنبوب اختبار، أتاحت الاستغناء عن ضرورة الحصول على كميات كبيرة من المادة البادئة (الأمر الذي كان يحدُّ من جزيئات الأحماض النووية التي يُمكن تحديد تسلسلها). غير أنَّ الطريقة ظلَّت تستهلك وقتًا طويلًا وبقيت عُرضة للخطأ البشري (أقول هذا من واقع الخبرة). فالمواد الهلامية اللازمة لفصل الحمض النووي صعبة التحضير، وتسلسل النيوكليوتيدات يُقرأ بالعين من ألواح التصوير بالأشعة السينية. ولا يمكن أن يُقرأ من التسلسل سوى جزء يتراوح طوله بين ١٥٠ و٢٠٠ زوج قاعدي في كل تفاعل، وهو ما يعني أن تحديد تسلسل قِطع أطول من الحمض النووي يتطلب تكرار إجراء عدة تفاعلات من تفاعلات تحديد التسلسل باستخدام بادئات مختلفة من الحمض النووي.
قفزت تقنيات تحديد تسلسل الحمض النووي عدة قفزات نوعية فارقة على مدار العقد الماضي. لكن قبل الانتقال إلى النقطة التالية، تجدر الإشارة إلى أنَّ نهج سانجر ما زال له مجال لاستخدامه. ففي ظل تطبيقه باستخدام مجموعة الأدوات الحالية، ما زال يمثل المعيار الذهبي من حيث جودة البيانات، ويُنتِج قراءات بأطوالٍ معتبَرة جدًّا (يتراوح متوسِّطها بين ٨٠٠ و١٠٠٠ زوج قاعدي). وكذلك فإنَّ طريقة سانجر المؤتمَتة تُحقِّق أعلى فاعلية بأقل تكلفة ممكنة إذا كانت الاحتياجات بسيطة (مثل الحاجة إلى تحديد تسلسل جزيئات قصيرة من الحمض النووي يقل عددها عن عدة عشرات من الجزيئات). لاحظ أيضًا أننا سنُرجئ مناقشة تجميع الجينوم إلى الفصل الثالث، بعد استكشاف «الجيل الثاني» من التقنيات المتنوعة لتحديد التسلسل. وإجمالًا، فإن التحديات المرتبطة بتجميع أجزاء الجينوم معًا من قراءات تحديد التسلسل المفردة هي نفس التحديات، بغضِّ النظر عن كيفية توليد تلك القراءات.
الجيل الثاني من تقنيات تحديد تسلسل الحمض النووي
اعتمد مشروع الجينوم البشري الممول حكوميًّا في أوجِه على أقصى الإمكانات المُسخَّرة لتحديد تسلسل الحمض النووي لدى أكثر من عشر جامعات ومراكز بحثية في الولايات المتحدة والمملكة المتحدة وفرنسا وألمانيا واليابان والصين. وكان كلٌّ منها مزوَّدًا بالعشرات من أحدث أدوات تطبيق طريقة سانجر، التي كان كلٌّ منها يُحدد تسلسل ٩٦ أو ٣٨٤ عينة من الحمض النووي بالتوازي، على مدار ٢٤ ساعة في اليوم طوال أيام الأسبوع. وقد خرجت من رحم هذه الجهود بيانات عالية الجودة، وأُنجزت مهمة تحديد تسلسل الجينوم البشري قبل موعدها المقرَّر. لكنها كانت مهمة مُكلِّفة؛ إذ تكلَّفت ٣ مليارات دولار أمريكي. ثم بدأ المشروع الممول بتمويل خاص الذي نفَّذته شركة سيليرا المملوكة للأمريكي كريج فينتر بعد ذلك بفترة طويلة، وأثمرت جهوده عن إنتاج تسلسل جينومي بالجودة نفسها تقريبًا وبالأدوات نفسها، لكن بتكلفةٍ بلغَت حوالَيْ ٣٠٠ مليون دولار أمريكي. (استفادت شركة سيليرا، عند إنجازها لتلك المهمة، من نتاج سنوات من البيانات الأولية التي أنتجها المشروع الحكومي؛ طالِعِ الفصل الثالث للاطلاع على الاستراتيجيات المختلفة المستخدَمة.) بعد إضفاء تحسينات طفيفة على طريقة سانجر وتحديثها ورفع كفاءتها باستمرار، اقتربت بحلول أواخر التسعينيات من الحد الأقصى لتوليد البيانات التي تُنتجها كل أداة في كل وحدة زمنية.
وعلى عكس طريقة سانجر التي تستخدم الفصل الكهربائي بالهلام ﻟ «قراءة» نواتج تفاعلات إنهاء السلسلة التي تُجرى سلفًا، فإن طريقة تحديد التسلسل القائم على إطلاق البيروفوسفات تُسجل تخليق الحمض النووي تسجيلًا آنيًّا أثناء حدوثه في الوقت الفعلي. وتعتمد كيمياء هذه الطريقة، التي ابتكرها عالِم الكيمياء الحيوية السويدي بال نيرين، على الكشف عن البيروفوسفات التي تُحرَّر كلما أضاف إنزيم البوليميريز إحدى النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين إلى قالب حمض نووي. ويتحقق ذلك باستخدام سلسلة من التفاعلات الكيميائية التتابعية المتعددة الإنزيمات التي تستخدم البيروفوسفات لتوليد دَفْقة من الضوء الحيوي.
تجدر الإشارة إلى أنَّ أول جهاز متاح تِجاريًّا من أجهزة تحديد التسلسل القائم على إطلاق البيروفوسفات — بل وأول جهاز لتحديد التسلسل من الجيل الثاني — قد طُرح في عام ٢٠٠٥. إذ أنتجته شركة «٤٥٤ لايف ساينسز»، التي أسَّسها العالِم ورائد الأعمال الأمريكي جوناثان روثبرج (والتي منحها نيرين وزملاؤه رخصةَ استخدام تقنيتهم). والعامل الرئيسي الذي منح هذا الجهاز القدرة على إجراءِ كمٍّ هائل من العمليات المتوازية لتحديد تسلسل الحمض النووي هو استخدام طبق «بيكوتيتر» يحتوي على عدة آلاف من التجاويف المنفصِلة لإجراء التفاعلات، حيث يصل قُطرُ كل تجويف منها إلى حوالَي ٢٥ ميكرومترًا. ويحتوي كل تجويف على كُرَيَّة واحدة، ترتبط بها آلاف النُّسخ المتطابقة من قالب حمض نووي ذي شريط واحد، ومضخَّمة من جزيء «جذري» واحد (يُعد هذا التضخيم خطوة ضرورية لإيصال إشارة الضوء الحيوي المولَّدة في كل تجويف إلى مستويات يمكن اكتشافها). يُضاف البادئ إلى الحمض النووي الموجود في كل تجويف، ويصبح جاهزًا للاستطالة عند إضافة النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين والإنزيمات المناسبة.
ولأنَّ طريقة تحديد التسلسل القائم على إطلاق البيروفوسفات تستخدم «إشارة» واحدة (أي: الضوء) للكشف عن دمج النيوكليوتيدات، يجب إدخال النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين إلى قالب الحمض النووي بطريقة منهجية. وينفَّذ ذلك باستخدام نظام من الموائع الدقيقة يدفع النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين الأربع عبر طبق بيكوتيتر واحدةً في كل مرة وبترتيبٍ محدد. تُسلَّط كاميرا قوية على طبق البيكوتيتر، وتسجِّل ما إذا انبعث ضوءٌ أم لا في كل تجويف (وهذا يكشف بالتبعية عما إذا كان اندماج النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين قد حدث هناك أم لا).
غير أنَّ تلك الطريقة تواجه عائقًا مهمًّا يُسمَّى مشكلة «البوليمر المتجانس»؛ فعندما يُصادِف الجهاز على قالب الحمض النووي أكثر من بضع نيوكليوتيدات متماثلة، يجد صعوبةً في استنتاج العدد الدقيق لعمليات اندماج النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين التي حدثت. فعلى سبيل المثال، حينما يوجد في قالب حمض نووي سلسلة مكوَّنة من ثماني قواعد أدينين متتالية، سيترتَّب على ذلك اندماج ثماني قواعد من الثايميدين الثلاثي الفوسفات المنقوص الأكسجين، ولكن سيصعُب التمييز بموثوقية بين إشارات الضوء الحيوي المنبعث من الاندماج السابع أو الثامن أو التاسع. وكلما كان مقطع البوليمر المتجانس أطول، تفاقمت المشكلة.
وبصرف النظر عن البوليمرات المتجانسة، فقد عزَّزت التحسينات التكنولوجية من كثافة عدد التجاويف في كل طبق بيكوتيتر إلى حوالَي مليون تجويف؛ ليمكن بذلك توليد قراءات يزيد متوسط أطوالها على ٥٠٠ زوج قاعدي، وهذا تحسُّن بقدرٍ كبير عن القراءات البالغ طولها حوالَي ١٠٠ زوج قاعدي التي تُنتجها أجهزة الجيل الأول. هذا وتستطيع الفئة الأكثر تقدمًا من أجهزة تحديد التسلسل القائم على إطلاق البيروفوسفات أن تولِّد بياناتِ تسلسلاتٍ يبلغ طولها حوالَي ٥٠٠ مليون زوج قاعدي أثناء مدة تشغيل تصل إلى عشر ساعات. وقد شهد عام ٢٠٠٦ إثبات الإمكانات الهائلة لطريقة تحديد التسلسل القائم على إطلاق البيروفوسفات، حين حُدِّد تسلسل طوله مليون زوج قاعدي من الحمض النووي الخاص بأحد أفراد سلالة النياندرتال (انظر الفصل الخامس)، وكذلك عام ٢٠٠٧ حين حدد التسلسل الكامل لجينوم جيمس واطسون الفائز بجائزة نوبل (انظر الفصل الرابع). تجدر الإشارة إلى أنَّ تسلسل جينوم واطسون حُدِّد في شهرين بتكلفة تصل إلى حوالَي ٢ مليون دولار أمريكي، وهي تكلفة صغيرة إذا ما قورنت بتكلفة استخدام طريقة سانجر.
تحديد تسلسل الحمض النووي بأشباه الموصِّلات
من الشواهد على التطوُّر السريع الذي تشهده طرق تحديد تسلسل الحمض النووي أنَّ تقنية تحديد التسلسل القائم على إطلاق البيروفوسفات، التي ابتكرتها شركة ٤٥٤ لايف ساينسز رغم كل إمكاناتها، قد ظهرت واندثرت في غضون عقدٍ زمني واحد، ولم تعُد تُعتبر منافسة لمجموعةٍ متنوعةٍ من أنظمةٍ ناشئةٍ أخرى. (يُذكَر أنَّ شركة ٤٥٤ لايف ساينسز، التي أسسها روثبرج، استحوذت عليها شركة روش دياجنوستيكس في عام ٢٠٠٧، التي توقَّفت في عام ٢٠١٦ عن دعم معداتها التي تستخدم تقنية تحديد التسلسل القائم على إطلاق البيروفوسفات.) وقبل الانتقال إلى النقطة التالية، دعونا نعرض نبذة موجزة عن تقنية جديدة أنتجتها شركة اسمها أيون تورنت (هي أيضًا من بنات أفكار روثبرج)؛ إذ تتشابه هذه التقنية التي تحدد التسلسل باستخدام شبه موصِّل مع طريقة تحديد التسلسل القائم على إطلاق البيروفوسفات في جوانب عديدة، لكنهما تختلفان تمامًا فيما يتعلق بالكشف عن التسلسل.
تتميز أطوال قراءات التسلسل التي تُنتجها تقنية شركة أيون تورنت بأنها مذهلة (تصل حاليًّا إلى حوالَي ٤٠٠ زوج قاعدي)، علاوةً على أن الجهاز أسرع كثيرًا من الأنظمة الأخرى المنتمية إلى الجيل الثاني (إذ لا يستغرق وقت التشغيل سوى بضع ساعات). وخير برهان على ذلك أن تقنية شركة أيون تورنت استُخدمت لتحديد تسلسل أحد الجينومات البشرية في عام ٢٠١١ (ومن المناسب أنَّ ذلك كان جينوم جوردون مور، الذي شارك في تأسيس شركة الإلكترونيات العملاقة إنتل، وصاغ «قانون مور»، الذي ينصُّ على أن أداء شرائح المعالجات الحاسوبية يتضاعَف كل ثمانية عشر شهرًا). لكن بوجهٍ عام، يُعَد حجم التسلسل الذي يُنتجه أيٌّ من هذه الأجهزة في كل مرةٍ من مرات التشغيل متواضعًا في الوقت الحالي، وما زالت هذه التقنية متأثرةً بمشكلة البوليمرات المتجانسة التي سبق توضيحها في طريقة تحديد التسلسل القائم على إطلاق البيروفوسفات. وفي الوقت الحالي، يُركز تسويق نظام أيون تورنت على الترويج لاستخدامه في عمليات تحديد التسلسل الإكلينيكية السريعة والتطبيقات ذات الصلة (مثل اكتشاف الطفرات الجينية التي تؤدي إلى الإصابة بالسرطان) بدلًا من تحديد تسلسل الجينومات من البداية.
تحديد التسلسل المعتمد على تقنية إنهاء السلسلة القابل للعكس
يُعَد نظام إلومينا واحدًا من أكثر الأنظمة استخدامًا بين أنظمة الجيل الثاني من تقنيات تحديد تسلسل الحمض النووي. وعلى غرار طريقتَي سانجر والطريقة القائمة على إطلاق البيروفوسفات، يستخدم نظام إلومينا نهج «تحديد التسلسل بالتخليق» القائم على إنزيم بوليميريز الحمض النووي. لكنَّ الفارق أنه يستخدم ما يُسمى تقنية «إنهاء السلسلة القابل للعكس». وكما يوحي الاسم، فإن هذه التقنية تستخدم جزيئات مُعدَّلة من النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين تؤدي دور إنهاء السلسلة؛ إذ يمكن دمجها لتكوِّن حمضًا نوويًّا، ولكن لا يمكن استطالتها إلى أن يُزال «عائق» كيميائي خاص.
ونظرًا إلى أن كيمياء نظام إلومينا تعتمد على تقنية إنهاء السلسلة القابل للعكس، لا يعاني النظام مشكلة البوليمرات المتجانسة؛ إذ لا يمكن دمج سوى نيوكليوتيدة واحدة من النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين في كل مرة، بغضِّ النظر عن طول جزء البوليمرات المتجانسة في امتدادٍ معين من قالب الحمض النووي. غير أن النظام له عيوبه. فطول القراءات التي يُنتجها نظام إلومينا أقصر إلى حدٍّ ما من معظم قراءات الطرق الأخرى من الجيل الثاني (إذ كان طولها ٥٠ زوجًا قاعديًّا في البداية، ووصل حاليًّا إلى أعلى من ٣٠٠ زوج قاعدي)، وهو ما يفرض تحدياتٍ حينما يُراد استخدامه في تجميع الجينوم (الفصل الثالث). لكنَّ نظام إلومنيا يعوِّض قصوره في أطوال القراءات بالجودة وحجم الإنتاجية خلال وقت محدد من زمن التشغيل. فمع أن دورة تشغيل واحدة قد تستغرق عدة أيام، يمكن لأحدث أجهزة من هذه النوعية أن تولِّد ما يصل إلى أربعة مليارات قراءة من قراءات التسلسل، وما يزيد على ٥٠٠ مليار زوج قاعدي من بيانات أولية غير مُعالَجة عن التسلسل. وهذه الكمية المذهلة من المخرَجات هي التي أتاحت تحديد تسلسل جينوم بشري في أقل من أسبوع مقابل ألف دولار أمريكي تقريبًا.
تحديد تسلسل جزيئات مفردة
في السنوات الأولى من تطوير تقنيات الجيل الثاني غابت الحلول المبتكَرة لمواجهة المشكلات الصعبة تمامًا. لهذا وظفت الشركات العاملة في مجال التكنولوجيا الحيوية فِرقًا من علماء علم الأحياء الجزيئي والكيميائيين والمهندسين ليتعاونوا معًا (وينافسوا الشركات الأخرى) من أجل اكتشاف أفضل طريقة لتحسين أساليبها؛ سعيًا إلى زيادة طول قراءات التسلسل إلى أقصى حد والارتقاء بجودة القراءات وحجم النتائج المُخرَجة (عبر إجراء العمليات بالتوازي) إلى أعلى مستوًى. وصحيح أننا لم نستكشف إلا أبرز طرق الجيل الثاني من تقنيات تحديد التسلسل التي ظهرت خلال أوائل العقد الأول من القرن الحادي والعشرين وحتى منتصف العقد، ولكنَّ ثَمة مشكلتين رئيسيتين تشترك فيهما كل هذه التقنيات، وهما: قِصَر طول القراءات والحاجة إلى تضخيم الحمض النووي. فمن أجل التغلب على مشكلات نسبة «الإشارة إلى الضجيج» المتأصِّلة في الأنظمة المختلفة، توضع آلاف الأجزاء المتماثلة من الحمض النووي في منطقة محدَّدة (كأحد تجاويف خلية التدفق مثلًا)، وتُكتشَف «إشاراتها» الإجمالية ككلٍّ (مثل انبعاث ضوء أو ضوء فلوري، أو تغيير الأس الهيدروجيني). غير أنَّ تضخيم الحمض النووي يستغرق وقتًا طويلًا، ويحمل معه احتمالية حدوث انحيازات، مثل تمثيل بعض مناطق الجينوم محل الدراسة بأكثر أو أقل من حقيقتها الفعلية بسبب التفاوتات في نِسب وفرة قواعد الأدينين، والسايتوسين، والجوانين، والثايمين. وهذا يقودنا إلى ما يُعرَف أحيانًا باسم تقنيات «الجيل الثالث»، التي تتميز بحساسيتها الشديدة، لدرجة أنها تستطيع تحديد تسلسل الحمض النووي بدقة على مستوى الجزيئات المفردة. وبهذا فإن التحديات التكنولوجية والفوائد المحتملة عظيمة على حدٍّ سواء.
وفي هذا الصدد، تجدر الإشارة إلى جهاز تحديد التسلسل «الآني للجزيئات المفردة» الذي أنتجته شركة باسيفيك بيوساينسز (المعروفة اختصارًا باسم باسبيو)، والذي يستخدم خلية تدفق مغطاة بتجاويف بالغة الصغر يصل عرضها إلى ٥٠ نانومترًا فقط. ويوجد في كل تجويف إنزيمٌ مُهندَس خصِّيصى من إنزيمات بوليميريز الحمض النووي مُثبَّت بقاعه الشفَّاف. ويُمكن تحديد تسلسل جزيئات مفردة لأنَّ إنزيم البوليميريز ثابت؛ إذ تصبح كاميرا الجهاز قادرة على التركيز على ما يحدث في قاع كل تجويف، فتُسجل بذلك التوهُّج الفلوري الذي يحدث كلما أدمج إنزيم البوليميريز إحدى النيوكليوتيدات الثلاثية الفوسفات المنقوصة الأكسجين في سلسلة الحمض النووي (علمًا بأنَّ كل نيوكليوتيدة منها تحمل علامتها الفلورية الواسمة الخاصة بها.) هذا ويتسم الجيل الأول من أجهزة باسبيو بكِبر حجمه (يصل وزن الجهاز إلى حوالَي ١٨٠٠ رطل)، لكن الطُّرز الأحدث يبلغ حجمها ثلث حجم أجهزة الجيل الأول، علاوةً على أنها حسَّنت من عملياتها الكيميائية وزادت من حجم إنتاجية التسلسلات خلال وقت محدد من زمن التشغيل. وتحتوي خلايا التدفق الحالية على حوالَي مليون تجويف في كلٍّ منها؛ وبذلك صار ممكنًا الحصول على قراءات يتراوح متوسط أطوالها بين ١٠ و٢٠ ألف زوج قاعدي، فيما يتجاوز أقصى أطوالها ٤٠ ألف زوج قاعدي.
تبدأ العملية بتوصيل تيار كهربائي إلى غشاء اصطناعي مزوَّد بمسامات كهذه يتراوح عددها بين مئات وعدة آلاف. وتعمل بروتينات محرِّكة مُخصَّصة على توصيل جزيئات الحمض النووي المزدوجة الشريط إلى المسامات النانوية، ثم تفك الحمض النووي، وتُنزِل قواعده تدريجيًّا خلال كل مسام قاعدة واحدة في كل مرة. والمُذهِل أنَّ تسلسل كل جزيء من الحمض النووي يُستنتج من تسجيل اضطرابات التيار التي تحدث في كل مسام نانوي عند مرور القواعد النيوكليوتيدية خلاله. وقد أُبلِغَ عن أنَّ ذلك الجهاز أنتج قراءات تدنو أطوالها من مليون زوج قاعدي، فضلًا عن أنَّ طبيعته التي تُسهِّل حمله ونقله أوصلت عملية تحديد تسلسل الحمض النووي إلى أماكن لم تكن قد وصلت إليها من قبل. فعلى سبيل المثال، شهد عام ٢٠١٥ استخدام بعض أجهزة مين أيون في موقع ميداني على أرض الواقع من أجل تتبُّع تفشِّي فيروس الإيبولا في غينيا. واستُخدم الجهاز كذلك في محطة الفضاء الدولية. وصحيح أنَّ إجمالي التسلسلات المُخرَجة من جهاز مين أيون كان متواضعًا في البداية، لكنه يزداد باطِّراد مع نضوج تلك التقنية، وحشرِ المزيد والمزيد من المسامات النانوية في خلية التدفق. وكذلك تُنتج شركة أكسفورد نانوبور تكنولوجيز إصدارًا من جهاز تحديد التسلسل (اسمه «بروميث أيون») يُمكن استخدامه على طاولات المختبَرات، ويمتاز بقدرته على تشغيل عدد يصل إلى ثمانٍ وأربعين خلية تدفق بالتوازي، علمًا بأنَّ كل خلية منها تحتوي على ما يقرب من ٣ آلاف مسام نانوي.
رغم الإمكانات الهائلة التي تتمتع بها الأجهزة المتاحة حاليًّا من أجهزة تحديد تسلسل الجزيئات المفردة، فإنَّ معدلات الخطأ لديها أعلى من معدلات الخطأ لدى أجهزة إلومينا وأجهزة تحديد التسلسل القائم على إطلاق البيروفوسفات، فضلًا عن أنَّ إجمالي عدد القراءات التي تنتج في كل مرة من مرات تشغيل الجهاز عادةً ما تكون أقل. وقد ثبَت حاليًّا أنَّ أنظمة تحديد تسلسل الجزيئات المفردة تكون فعالة جدًّا، بالأخص عند استخدامها مع تقنيات أخرى «تقليدية» مثل جهاز إلومينا. وتكمن فكرة ذلك في الجمع بين الجودة العالية والإنتاجية الكبيرة اللتين يتيحهما جهاز إلومينا والقراءات الأطول التي تُنتجها أنظمة تحديد تسلسل الجزيئات المفردة. وكما سيُناقَش في الفصل الثالث، فإن طول القراءات بات عاملًا حاسمًا عند محاولة تجميع جينومات كبيرة ومعقَّدة.
تتفاوت الأنظمة المختلفة المنتمية إلى الجيل الثاني من تقنيات تحديد التسلسل في نقاط قوتها وضعفها. فما يكفي لفكِّ تشفير جينوم أحد الفيروسات قد يكون مع الأسف غير كافٍ لعالِم محاصيل يحلل جينومَ نباتٍ كبير. لذا يؤثر في اختيار النظام المستخدَم في تحديد التسلسل عواملُ مثل طول قراءة التسلسل والجودة، ووقت تشغيل الجهاز، وإجمالي مخرَجات البيانات، وكذلك الفوارق في كمية قوالب الحمض النووي المطلوبة. وبِناءً على مدى السرعة التي تغيَّرت بها التكنولوجيا على مدار العقد الماضي، بات من الصعب توقُّع ما ستبدو عليه عملية تحديد تسلسل الحمض النووي في غضون أكثر من بضع سنين من الآن. ولكن يُمكن الافتراض بثقةٍ أنَّ تكلفة تخزين معلومات تسلسل الحمض النووي ستصبح عمَّا قريب مساويةً لتكلفة توليد تلك المعلومات.