پروٹین فولڈنگ – مصنوعی ذہانت کا ایک اور کارنامہ
(Protein folding: A master piece of Artificial Intelligence)
ترجمہ و تلخیص: قدیر قریشی
انسان اور باقی تمام
جانوروں کی زندگی کا ایک بنیادی جزو پروٹینز ہیں۔ ہمارے جسم کے تمام سٹرکچرز
پروٹینز سے ہی بنتے ہیں۔ پروٹینز انتہائی پیچیدہ مالیکیول ہوتے ہیں جو امائنو ایسڈ
کے مالیکیولز کی لڑیوں پر مشتمل ہوتے ہیں۔ایک
اندازے کے مطابق، انسانی جسم میں لگ بھگ چار لاکھ مختلف قسم کی پروٹینز بنتی ہیں۔ان میں سے ہر پروٹین امائنو ایسڈ کی لڑیوں پر مشتمل ہوتی ہے لیکن امائنو ایسڈز کی
ترتیب ہر پروٹین میں مختلف ہوتی ہے۔ پروٹین کے مالیکیولز خلیوں کے سائیٹوپلازم میں
بنتے ہیں (اسے پروٹین سینتھیسس کہا جاتا ہے)۔ ہر پروٹین مالیکیول بننے کے بعد ایک
مخصوص طریقے سے فولڈ ہو کر تھری ڈی سٹرکچر بناتا ہے۔ ہر پروٹین کا تھر ڈی سٹرکچر
مختلف ہوتا ہے۔ پروٹین اپنا کام صرف اپنے تھری ڈی سٹرکچر کی وجہ سے ہی کر پاتی ہے۔ اگر کسی وجہ سے کسی پروٹین کا تھری ڈی سٹرکچر خراب ہو جائے (جو ڈی این اے میں
میوٹیشن کی وجہ سے ہو سکتا ہے) تو پھر وہ پروٹین درست کام نہیں کر پاتی اور ایسے
شخص کے جسم میں کہیں نہ کہیں کوئی abnormality پیدا ہو جاتی ہے۔
کسی بھی پروٹین کا تھری
ڈی سٹرکچر امائنو ایسڈز کے مالیکیولز کی ترتیب پر منحصر ہوتا ہے۔ لیکن محض امائنو
ایدسڈز کے مالیکیولز کی درست ترتیب معلوم ہو جانے سے پروٹین کے تھری ڈی سٹرکچر کی
پیش گوئی کرنا عملاً ناممکن ہے۔ اس کی وجہ یہ ہے کہ پروٹین کے مالیکیول میں
سینکڑوں یا ہزاروں امائنو ایسڈ مالیکیولز ہوتے ہیں جن کی فولڈنگ بہت سی مختلف
قوتوں کا مجموعی نتیجہ ہوتی ہے۔ ان قوتوں میں معمولی سی کمی بیشی سے پروٹین کی
فولڈز مختلف ہو سکتی ہیں۔ سائنس دانوں کا اندازہ ہے کہ پروٹین کے ایک عام مالیکیول
کو 10^300 مختلف طریقوں سے فولڈ کیا جا سکتا ہے (یعنی 1 کے بعد تین سو صفر لگانے
سے جو عدد بنتا ہے وہ پروٹینز کی ممکنہ فولڈز کی تعداد ہے)۔ اس وجہ سے پروٹیین کے
مالیکیول میں امائنو ایسڈز کی پوزیشن دیکھ کر پروٹین کی تھری ڈی ساخت کی پیش گوئی
کرنا ابھی تک ناممکن رہا ہے۔ فطرت میں ہر پروٹین مالیکیول تشکیل پانے کے بعد چند
ملی سیکنڈ میں ہی درست طور پر فولڈ ہو جاتا ہے اور پروٹین کی مخصوص شکل سامنے آ
جاتی ہے۔ گویا فطرت میں جو کام چند ملی سیکنڈ میں ہو جاتا ہے اس فولڈنگ کی brute force طریقے سے پیش گوئی کرنے
کے لے ایک سپر کمپیوٹر کو جس قدر کمپیوٹنگ پاور کی ضرورت ہے وہ ہمارے پاس میسر نہیں
ہے۔ اس مسئلے کو سائنس دان پروٹین فولڈنگ پرابلم کا نام دیتے ہیں۔
پروٹین فولڈنگ کی پرابلم مصنوعی بیالوجی (synthetic biology) کے تیزی سے بڑھتے فیلڈ کی ایک بہت بڑی پرابلم ہے۔ پچھلے پچاس سال سے پروٹین فولڈنگ کی ریسرچ کا فوکس ایکس رے کرسٹلوگرافی کی ٹیکنالوجی رہی ہے۔ اس طریقے میں Xray کی مدد سے پروٹین کے مالیکیولز کی شبیہہ بنانے کی کوشش کی جاتی ہے۔ یہ طریقہ بہت محنت طلب اور صبر آزما ہے۔ ایک اوسط سائز کے پروٹین مالیکیول کی شبیہہ بنانے میں کئی سال درکار ہوتے ہیں۔ اس وجہ سے اس فیلڈ میں ترقی کی رفتار انتہائی سست رہی ہے۔
اس رفتار میں اضافے کے لیے 1994 میں سائنس دانوں نے ایک کانفرنس کا اعلان کیا جو ہر دوسرے سال منعقد ہو گی اور جس میں پروٹین فولڈنگ سے متعلق سائنس اور ٹیکنالوجی کو بہتر بنانے کے طریقوں پر تبادلہ خیال کیا جائے گا۔ اس کانفرنس کا نام Critical Assessment of protein Structure Prediction (CASP) رکھا گیا۔ اس کانفرنس میں شرکاء کو یہ چیلنج دیا گیا کہ وہ کمپیوٹرز کے استعمال سے کسی پروٹین کے سٹرکچر کی پیش گوئی کریں۔ پھر اس پیش گوئی کیے گئے سٹرکچر کا اسی پروٹین کے ایکس رے ٹیکنالوجی سے معلوم کیے گئے سٹرکچر سے موازنہ کیا جائے۔ اس موازنے کا نتیجہ ایک سکور کی صورت میں جاری کیا جاتا ہے جو صفر سے سو تک ہو سکتا ہے۔ 100 سکور کا مطلب یہ ہو گا کہ اس پروٹین کے تمام کے تمام امائنو ایسڈز کی پوزیشن درست طور پر بتائی گئی یعنی پروٹین کے سٹرکچر کی پیش گوئی درست تھی۔
سنہ 2016 تک کی CASP کانفرنسز میں مصنوعی ذہانت سے پروٹینز کے سٹرکچر کی پیش گوئی کا سکور کبھی 40 سے اوپر نہیں جا پایا۔ لیکن جب گوگل کے مصنوعی ذہانت پر مبنی ڈیپ مائنڈ (DeepMind) کمپنی کے سائنس دانوں نے اس کانفرنس میں حصہ لینا شروع کیا تو اس کانفرنس کی کامیابی کی شرح بڑھنے لگی۔ 2018 میں ڈیپ مائنڈ کے پروگرام AlphaFold کا سکور 58 رہا جو اس سے پہلے کبھی ممکن نہیں ہوا تھا۔ اس کامیابی پر سائنس دان بہت خوش تھے لیکن سائنس دانوں کا خیال تھا کہ مصنوعی ذہانت کبھی 90 سے بہتر سکور نہیں کر پائے گی۔ 90 کا سکور ایکس رے کرسٹلوگرافی سے معلوم کیے گئے سٹرکچر کا اوسط سکور ہوتا ہے۔ یہ ذہن میں رکھیے کہ ایکس رے کرسٹلوگرافی سے بھی سو فیصد درست سٹرکچر کا علم شاذ و نادر ہی ہوتا ہے۔
اس سال یعنی 2020 میں ڈیپ مائنڈ کے ایک نئے الگورتھم AlphaFold2 نے 92 کا سکور حاصل کر لیا ہے۔ یعنی اب مصنوعی ذہانت پروٹین کے سٹرکچر کی پیش گوئی اتنی زیادہ ایکوریسی کے ساتھ کر سکتی ہے کہ ایکس رے کرسٹلوگرافی کے نتائج کی ایکوریسی کو بھی پیچھے چھوڑ گئی ہے جو ابھی تک اسی فیلڈ میں سند تسلیم کی جاتی تھی۔ یہ اتنا بڑا معرکہ ہے کہ کئی سائنس دانوں کو ابھی تک یہ یقین نہیں ہو رہا کہ مصنوعی ذہانت اس قدر ایکوریسی سے پروٹین کی فولڈنگ کی پیش گوئی کر سکتی ہے۔ اکثر سائنس دانوں کا خیال تھا کہ سنہ 2030 سے پہلے مصنوعی ذہانت اس مسئلے کو حل نہیں کر پائے گی۔
پروٹین فولڈنگ(Protein Folding) کی درست
پیش گوئی محض ایک کاغذی کامیابی نہیں ہے بلکہ اس ٹیکنالوجی سے مستقبل قریب میں بہت
سی بیماریوں کی وجوہات سمجھنا ممکن ہو جائے گا۔ اکثر جینیاتی بیماریوں کی وجہ
پروٹین کی غلط فولڈنگ ہوتی ہے یعنی کسی جینیاتی میوٹیشن کی وجہ سے پروٹین کے
امائنوایسڈز کی ترتیب بدل جاتی ہے جس سے پروٹین درست طور پر فولڈ نہیں ہو پاتی۔ اگر ہم پروٹین کی
misfolding یعنی غلط فولڈنگ کی پیش
گوئی کر پائیں تو ہم جینیاتی انجینیئرنگ سے اس کا توڑ نکال سکتے ہیں۔ اس کے علاوہ
کئی بیماریاں اس لیے ہوتی ہیں کہ جسم میں کسی خاص پروٹین کی کمی ہوتی ہے۔ اگر ہم
ایسی پروٹینز مصنوعی طور پر تیار کر کے جسم میں داخل کر سکیں تو کئی ایسی بیماریوں
کا علاج ممکن ہو جائے گا جو ابھی تک لاعلاج ہیں۔
یہ معرکہ اتنا اہم ہے کہ کئی سائنس دان یہ پیش گوئی کر رہے ہیں کہ 2021 کا میڈیسن کا نوبیل انعام ڈیپ مائنڈ ٹیم کے ممبرز کو پروٹین فولڈنگ کا مسئلہ حل کرنے پر دیا جائے گا۔
پروٹین فولڈنگ – مصنوعی ذہانت کا ایک اور کارنامہ ترجمہ و تلخیص: قدیر قریشی Article by Qadeer Qureshi Protein folding: A master piece of Artificial Intelligence |