صورة غلاف الرسالة/الاطروحة غير متوفرة



العنوان باللغة العربية
منصة الرسائل والاطاريح: تصميم نظام للتنبؤ بمعامل استنساخ الDNA بالاعتماد على خوارزمية الCNN - جامعة بابل
العنوان باللغة الانكليزية
Design a System for Prediction Transcription Factor Binding Sites of DNA Sequence Based on CNN Algorithm
اسم الطالب باللغتين
فيصل عبد الله عزيز لفته - Faisal Abdullah Aziz Laftah
اسم المشرف باللغتين
فراس حسن عبد الأمير الحسيني--Dr. Sura Zaki AL-Rashid
الخلاصة
عوامل النسخ (TFs) هي جزيئات كبيرة ترتبط وتبدأ النسخ في مختلف مناطق الصياغة التعبيرية التي تمثل جزء من promoter الموجود بداخل الحمض النووي. في التعبير الجيني ، تلعب عوامل النسخ (TFs) دورًا رئيسيًا، حيث تقوم بالتحكم في نسبة نقل المعلومات الجينية من الحمض النووي إلى الرنا الناقل عن طريق اتصالها بسلسلة الحمض النووي بموقع معين يسمى مواقع ربط عامل النسخ (TFBS). لطالما كان اكتشاف ما يسمى بال(motif) يمثل تحديًا لأنه يحتاج إلى هياكل بيوفيزيائية دقيقة للإشارة إلى موقع TFBS بداخل سلاسل الحمض النووي. لسوء الحظ ، استطاعت الدراسات البيولوجية الوصول فقط الى بعض مواقع الربط هذه. بالإضافة إلى ذلك ، فإن هذه الاختبارات تستغرق وقتًا طويلاً ومكلفة. من أجل القيام بذلك، يجب إنشاء نظام تنبؤ يتنبأ بدقة بعلاقات الربط بين TFs و سلاسل الحمض النووي. و قد تم اقتراح طرق التعلم العميق مؤخرًا ، و التي اظهرت نتائج تنافسية لعملية التنبؤ بموقع ربط عامل النسخ. يبدأ النظام المقترح بمرحلة معالجة البيانات التي تتكون من ثلاث خطوات: تنظيف البيانات، وتكامل البيانات ، وتقليل البيانات. بعد ذلك ، ستستمر نتائج هذه المرحلة (وهي تسلسل الحمض النووي) على مسارين. يتكون المسار الأول من الخطوات التالية: تضمين k-mer ، ترميز احادي قوي ، وربط كل سلسلة DNA مع TF\s الخاص به. يتضمن المسار الثاني أيضًا ثلاث خطوات ، وهي: توليد k-mer ، و طريقة z-score لايجاد النمط المتكرر، وربط كل فكرة إجماع بمجموعة البيانات. بعد ذلك ، سيتم إدخال الإخراج من هذه المسارات في مرحلة التشفير. في هذه المرحلة، يتم ترميز الميزات في شكل رقمي. بعد ذلك ، يتم إدخال الميزات المشفرة في CNN لتصنيف مواقع ربط الحمض النووي. أخيرًا ، تم تنفيذ خطوة التقييم اعتمادًا على مقاييس مختلفة مثل الدقة ، و نسبة الخطأ ، والدقة (Precision) ، و ال(Recall) ، ودرجة F1 و AUPRC. أظهرت النتائج أن أداء النظام المقترح كفوء و فعال. حقق النموذج دقة تنبؤ بلغت 99.26٪ ، ونسبة خطأ تتراوح بين 5 و 9٪ ، ودقة (Precision) ، واسترجاع ، ودرجة f1 تبلغ 100٪. بالإضافة إلى ذلك ، حقق AUPRC نسبة 100 ٪ أيضًا.
الفئة
المجموعة الهندسية
الاختصاص باللغة العربية
الاختصاص باللغة الانكليزية
السنة الدراسية
2022
لغة الرسالة/الاطروحة
اللغة الانكليزية
الشهادة
ماجستير
رابط موقع (doi)
Open access
نعم