Adaptive Indexing of Documents Using Genetic Algorithms and Relevance Feedback
محتوى المقالة الرئيسي
الملخص
مقدمة:
في هذه الورقة، تم البحث في مشكلة استرجاع الوثائق الصحيحة التي تحقق رغبات المستخدم. الهدف الرئيسي في أنظمة استرجاع المعلومات هو استرداد جميع الوثائق ذات الصلة فقط.
طرق العمل:
تم استخدام الخوارزمية الجينية لتحقيق هذا الهدف. أوصاف المستندات تم تكييفها وتغييرها باستخدام الخوارزمية الجينية، اعتمادًا على الأحكام التي اطلقها المستخدم (والتي تم جمعها والاحتفاظ بها) حول اهمية المستندات بالنسبة له. الخوارزمية الجينية هي أداة قوية تعتمد على مبادئ الداروينية وتقنيات التطور للبحث في فضاءات البحث المعقدة. يسهل استخدام الخوارزمية الجينية تكييف فهارس المستندات. تم تنفيذ ثلاثة طرق في الانتخاب: نمذجة عجلة الروليت ، ونمذجة عجلة الروليت مع النخبة والنمذجة الشاملة التصادفية. يتم حساب دالة الصلاحية باستخدام معامل Jaccard الذي يقيس التقارب بين الاستعلام وفهرس المستند.
الاستنتاجات:
توجد بين الكلمات المفتاحية المستخدمة لوصف محتوى الوثائق اعتماديات إحصائية. من الصعب استيعاب هذه الاعتماديات في نظام الاسترجاع. يمكن للخوارزمية الجينية أن تأخذ في الاعتبار هذه الاعتماديات أثناء عملها. وفقًا لنظرية المخطط وفرضية حجر البناء [10] ، يتم نشر المخططات الأكثر صلاحية من جيل إلى جيل ، حيث يتم أخذ عينات منها وإعادة تجميعها وتحويلها وإعادة تشكيلها لتشكيل سلاسل ذات صلاحية أعلى. هناك جانب آخر يمكن أن تقدمه الخوارزمية الجينية ، وهو الاعتماد على التغذية الراجعة المقدمة من مستخدمي نظام الاسترجاع لتكييف أوصاف المستندات، وإنتاج مجموعة جديدة من الأوصاف الأقرب إلى حاجات المستخدمين. تم استخدام ثلاثة انواع من الانتخاب المتناسب مع الصلاحية ، وهي نمذجة عجلة الروليت ، ونمذجة عجلة الروليت ذات النخبة ، والنمذجة الشاملة التصادفية. أظهرت النتائج تفوق النوع الثالث على الأول والثاني.
تفاصيل المقالة

هذا العمل مرخص بموجب Creative Commons Attribution 4.0 International License.