TY - JOUR ID - TI - Finding the Relevance Degree between an English Text and its Title إيجاد درجة الترابط بين نص انكليزي وعنوانه AU - Abdul Monem S. Rahma AU - Suhad M. Kadhem AU - Alaa Kadhim Farhan PY - 2012 VL - 30 IS - 9 SP - 1625 EP - 1640 JO - Engineering and Technology Journal مجلة الهندسة والتكنولوجيا SN - 16816900 24120758 AB - Keywords are useful tools as they give the shorter summary of thedocument. Keywords are useful for a variety of purposes includingsummarizing, indexing, labeling, categorization, clustering, and searching, andin this paper we will use keywords in order to find the relevance degreebetween an English text and its title.The proposed system solves this problem through simple statistic (Termfrequency) and linguistic approaches by extracting the keywords of the titleand keywords of the text (with their frequency that appear in the text) andfinding the average of title's keywords frequency across the text that representthe relevance degree that required, with depending on a lexicon of a particularfield(in this work we choose computer science field). This lexicon isrepresented using two different B+ trees one for non-keywords and the otherfor candidate keywords, these keywords was stored in a manner that preventredundancy of these terms or even sub-terms to provide efficient memoryusage and to minimize the search time.The proposed system was implemented using Visual Prolog 5.1 and aftertesting, it proved to be valuable for finding the degree of relevance between atext and its title (from point of view of accuracy and search time).

إن الكلمات المفتاحيه أداة مفيدة لأنها تعطي ملخصا قصيرا عن النص. وهي مفيدةلمجالات عديدة كالتلخيص والفهرسة والعنونة والتصنيف وفي هذا البحث سوف نستخدمالكلمات المفتاحيه من اجل معرفة درجة ترابط نص انكليزي بعنوانه.لقد حل النظام المقترح هذه المشكلة من خلال طرق إحصائية (تكرار التعبير) ولغويةباستخلاص الكلمات المفتاحية للعنوان، والكلمات المفتاحية للنص الانكليزي (مع تكرارهمداخل النص) ومن ثم إيجاد معدل تكرار الكلمات المفتاحية للعنوان داخل النص والذي يمثلدرجة تعلق النص بعنوانه، وبالاعتماد على معجم للكلمات الغير مفتاحيه ومعجم للكلماتالمرشحة لان تكون كلمات مفتاحية ولمجال معين (في بحثنا هذا تم اختيار مجال علومالحاسوب). هذا المعجم ممثل بهيكل شجري للكلمات الغير مفتاحية وهيكل شجري آخرللكلمات المفتاحية المرشحة، ولقد خزنت هذه الكلمات المفتاحية بطريقة تمنع التكرار لهذهالتعابير او اجزاء منها لتوفير كفائة الخزن ولتقليل وقت البحث.ولقد Visual Prolog تم تنفيذ النظام المقترح باستخدام اللغة البرمجية المرئية 5.1اثبت النظام المقترح بعد اختباره بانه قيم في ايجاد درجة الترابط بين نص وعنوانه (منوجهة نظر الدقة ووقت البحث). ER -