صورة غلاف الرسالة/الاطروحة غير متوفرة



العنوان باللغة العربية
منصة الرسائل والاطاريح: نموذج مطور بالاعتماد على تحليل النص والتغريدات الجغرافية لكشف انتشار كوفيد 1 - جامعة بابل
العنوان باللغة الانكليزية
Developed Model Based on Text Analysis and Geo-Tweets for Detecting the Spread of Covid-19
اسم الطالب باللغتين
اقبال عبد الباقي محمد مهدي - Iqbal Abdul Baki Mohammed Mahdi
اسم المشرف باللغتين
أ .د احمد سليم عباس جاسم--Ahmed Saleem Abbas Jassim
الخلاصة
تويتر، منجم الذهب الذي يوفر معلومات قيمة لا تصدق لجميع قطاعات العمل ، وخاصة قطاع الصحة. نمت سمعته بسرعة مع انتشار فيروس COVID-19 عالميًا .سابقا كانت المعلومات الجغرافية محدودة قبل ظهورهذا المرض. وقد بدأت مجموعات البيانات لـ Twitter بالظهور تزامنا مع ظهور هذا المرض حيث تم اطلاقها بصورة واسعة وكان من ضمنها البيانات المكانية المصاحبة للتغريدة. مثل هكذا بيانات يزداد الطلب عليها للتحري عن مناطق انتشار المرض. اما فيما يخص هذه الاطروحة فان حاجتها للبيانات المكانية تشكل اهمية قصوى. اذ لم يكن بالامكان الاستفادة من مجاميع البيانات التي اطلقها العديد من الباحثين كونها تفتقد للعديد من المعلومات المهمة. عند جمع البيانات الخاصة بهذه الاطروحة تم استخدام كلمات مفتاحية مسيطر عليها تسمى الجمل المنطقية. حيث تم الوصول الى التغريدات التي يتحدث اصحابها عن اصابتهم بالمرض من بين ملايين التغريدات على منصة Twitter والخاصة بهذا الموضوع حيث تمكنا من تحديد المعلومة المكانية الصحيحة من خلال عدة عمليات. ووفقا لتعدد هذا المعلومة فقد تم تجزئة البيانات الى اربع مجاميع وحسب المعلومة المكانية المتوفرة مع تلك التغريدة. وقد تم فحص هذه المعلومات لتحديد موقع كل مريض وكانت النتيجة تشكيل اربع مجاميع وحسب تواجد المعلومة المكانية التابعة لحقل معين. اما في حالة عدم تواجد المعلومة فيتم فحص نص التغريدة والبحث عن مدخلات مكانية ونسبها لمكان المريض. تم بناء معجم جغرافي للتحقق من الكلمات الخاصة بالمواقع الجغرافية لكل من المريض ومتابعيه واصدقائه ومن ثم تحديد ايهم اقرب اليه جغرافيا. يتم ذلك من خلال سحب تغريدات المتابعين واستخراج مواقعهم. عملية سحب تغريدات المتابعين تتم وفق فترة زمنية معنية خاصة بفترة اصابة المريض اول مرة. وبعدها تم استخراج المعلومات المكانية الخاصة بهم ومقارنتها مع البيانات المكانية المعروفة للمستخدم. الخطوة التي تليها تم عزل أولئك الموجودين في نفس منطقة المصاب عن طريق تطبيق طريقة التجميع خوارزمية k-mean إلى نقطة إحداثيات خطوط الطول والعرض لكل منهم. وتم عزل أولئك الذين يحصلون على نفس مجموعة التسمية للمصاب. بعد الانتهاء من عملية العزل المكاني ، يتم جمع تغريداتهم لغرض تصنيف هذه التغريدات ، ولكن قبل البدء في عملية التصنيف ، تم تحديد ثلاث فئات بحيث يمكن نسب التغريدة إلى إحدى هذه الفئات الثلاث. تم استخدام الشبكة العصبية MLP وكان ناتج هذه العملية بدقة 0.88. ومن خلال توفرالكود الشخصي للمقربين تم جلب بقية بياناتهم الوصفية ومن ضمنها البيانات المكانية حيث تم عزل المصابين وتوزيعهم على الخارطة مع بيان اعدادهم . في النهاية يتم الإعلان عن المنطقة النهائية كمنطقة مصابة بسبب كثرة الإصابات. هذا البحث قدم مجموعة بيانات للحالات المصابة بوباء كوفيد تم جمعها خلال سنة كاملة وايضا قدم مجموعة بيانات مؤشرة ومفروزة بحيث كل تغريدة تحمل تاشيرة خاصة بها وفق معايير الاصابة. تمكنت عملية التصنيف من تحديد الشخص المصاب والتعرف عليه من خلال تغريدته.
الفئة
المجموعة الطبية
الاختصاص باللغة العربية
الاختصاص باللغة الانكليزية
السنة الدراسية
2023
لغة الرسالة/الاطروحة
اللغة الانكليزية
الشهادة
دكتوراه
رابط موقع (doi)
Open access
نعم