Comparative Study the Effect of Similarity Measures on K-Means Algorithm in Clustering Arabic Texts based on Keywords

Abstract

يعيمجت دع )ةدقنع( صوصنلا أ ىلإ صوصنلا عيمجت فدهي ثيح ، صوصنلا بيقنت يف ةلاعفلاو ةماهلا لئاسولا دحاهنيب اميف هباشتت تانايك ىلع يوتحت )ديقانع(تاعمجت ىعدت ةريغص عيماجم ىلإ صوصنلل ةريبكلا عيماجملا ميسقتوصنلا عيمجتل ةقيرط لمعلا اذه يف انمدق .ىرخلأا تاعمجتلا يف تانايكلا نع ةفلتخم نوكتو ىدحإ مادختساب ةيبرعلا صةيمزراوخب ةلثمتملاو ةروهشملا عيمجتلا تاينقت k-means ىلإ هتئيهتل ةيلوأ ةوطخك صنلا ليلحت ةقيرطلا تنمضت .ىلع تقبط يتلا ةدقنعلا ةيمزراوخ 011 ، مئارج ، نف ، ةضاير( تلمش ةفلتخم فانصأ عبرأب يبرع صن ةيبط ، )ةدعاق دامتعاب ةقيرطلا انروط ثيح نم لادب عيمجتلا زكارم رايتخلا لاجم لكب ةصاخلا ةيحاتفملا تاملكلا نم تانايبم( امه هباشتلل نيسايقم انمدختسا مث يئاوشع لكشب اهرايتخا سايقمو ةيديلقلاا ةفاسملا سايق بييجت ةيوازلا باسحل )عيمجتلا زكرم نيب تافاسملا تلا سيياقم ريثات انميق . ديقانعلا ءانبل تادنتسملاو )ةيوازلا بييجت ،ةيديلقلاا ةفاسملا( هباشةيمزراوخ جئاتن ىلع k-means مييقتلا سايقم مادختساب F-Measure هيزاجنا نيب ةنراقم نع ةرابع جئاتنلا تناكولا هباشت سايقم مادختساب ةيمزراوخ ةيديلقلاا ةفاسملا سايقمو بييجت ةيوازلا تاعمجتلا ددع اهنم لماوعلا نم ددع ىلعوددعو فانصلأا . هيزاجنا ناب انضحلا اريخأو ةيمزراوخ k-means نم لضفا وه ةيوازلا بييجت سايقم مادختسابمادختساب اهتيزاجنا .ةيديلقلاا ةفاسملا