جامعة بابل
المجلات
الكليات
المراكز
الحوكمة الالكترونية
English
جامعة بابل
الكليات
المراكز
المجلات
الحوكمة الالكترونية
English
جامعة بابل
University of Babylon
نظام الرسائل والاطاريح الجامعية/ المكتبة المركزية
الرئيسية
تصفح الاحدث
دليل الايداع
محرك البحث
أدارة الايداع
دخول طلاب الدراسات
دخول موظفي التدقيق
ملف الرسالة/الاطروحة كامل (PDF)
مشاهدة
ملف الخلاصة عربي/ انكليزي (PDF)
لايوجد ملف
ملفات اخرى (PDF)
لايوجد ملف
العنوان باللغة العربية
منصة الرسائل والاطاريح: أستخراج تضمين العبارة الرئيسية باستخدام شبكة المتوسط العميق والصلة الهامشية الاكبر لتحسين أسترجاع المعلومات - جامعة بابل
العنوان باللغة الانكليزية
Extracting Key-phrase Embedding using deep Average Network and Maximal Marginal Relevance To enhance Information Retrieval
اسم الطالب باللغتين
علياء عبد الكاظم هادي
-
Alyaa Abdual Kadhum Hadi
اسم المشرف باللغتين
أ.د وفاء محمد سعيد
--
Wafaa Mohammed Saeed
الخلاصة
نظرًا للتحسينات التقنية والنمو الهائل للبيانات النصية والمصادر الرقمية، هناك تحدٍ لاستخراج كلمات رئيسية عالية الجودة في البحث المعاصر. يعد الاستخراج التلقائي للعبارات الرئيسية أمرًا بالغ الأهمية للعديد من مهام معالجة اللغات الطبيعية واسترجاع المعلومات، بما في ذلك تلخيص المستندات، والتصنيف ، وتوصية المقالة ، وفهرسة النص الكامل. الهدف من هذا العمل هو الحصول على فهم دلالي للاستعلام والوثائق المفهرسة باستخدام تقنية التضمين لتحسين أداء أنظمة الاسترجاع. الطريقة المقترحة تتكون من عدة مراحل. تتمثل المرحلة الأولى في جمع المستندات في ملف واحد بعد فك ضغط مجلد مجموعة البيانات باستخدام نظام Linux وتحديد المستندات التي لها قرار للاستخدام داخل النظام. تتضمن المرحلة الثانية إجراء المعالجة الاولية للمستندات ثم تم تنفيذ طريقة استخراج العبارة الرئيسية غير الخاضعة للرقابة ، وتخضع العبارات الرئيسية المرشحة المستخرجة لتطبيق مشفر الجملة العالمي (USE) لإنتاج متجهات التضمين مع الاحتفاظ بالمعلومات الأكثر أهمية باستخدام الصلة الهامشية القصوى (MMR). تم تقييم خطوة استخراج العبارات الرئيسية باستخدام مجموعة البيانات (Inspec) التي تحتوي على ملف يدعى (Key ) والذي يتضمن (عبارات الهدف أضافها الخبراء لتمثيل كل مستند). تتضمن المرحلة الثالثة الفهرسة والترتيب باستخدام طريقتين، الطريقة الأولى متوسط تضمين العبارة الرئيسية للحصول على درجة المستند، والطريقة الثانية تبني فهرسًا مقلوبًا لحساب وترتيب العبارات الأكثر تشابهًا مع متجه تضمين الاستعلام. كانت المرحلة الرابعة هي تسجيل أكثر الوثائق ذات الصلة بمتجه الاستعلام. تم تطبيق نموذج الاسترجاع المقترح على مجموعة البيانات (Fire2011). كانت المرحلة الأخيرة هي نتيجة تقييم (Baseline) ونتيجة نهجي (الفهرسة والتصنيف). باستخدام متوسط الدقة (MAP) كانت نتيجة Baseline (0.61) ، بينما كانت نتيجة نهج متوسط تضمين المستند 0.5589172 . وقد لوحظ أن أفضل نتيجة تم تحقيقها مع الفهرس المقلوب التي كانت0.6277519 .
الفئة
المجموعة الطبية
الاختصاص باللغة العربية
الاختصاص باللغة الانكليزية
السنة الدراسية
2023
لغة الرسالة/الاطروحة
اللغة الانكليزية
الشهادة
ماجستير
رابط موقع (doi)
Open access
نعم