@Article{, title={A Proposed Framework for Analyzing Crime Data Set Using Decision Tree and Simple K-Means Mining Algorithms}, author={Kadhim B. Swadi Al-Janabi د.كاظم بريهي سوادي الجنابي}, journal={Journal of Kufa for Mathematics and Computer مجلة الكوفة للرياضيات والحاسوب}, volume={1}, number={3}, pages={8-24}, year={2011}, abstract={AbstractThis paper presents a proposed framework for the crime and criminal data analysis and detection using Decision tree Algorithms for data classification and Simple K Means algorithm for data clustering. The paper tends to help specialists in discovering patterns and trends, making forecasts, finding relationships and possible explanations, mapping criminal networks and identifying possible suspects. The classification is based mainly on grouping the crimes according to the type, location, time and other attributes; Clustering is based on finding relationships between different Crime and Criminal attributes having some previously unknown common characteristics. The results of both classifications and Clustering are used for prediction of trends and behavior of the given objects (Crimes and Criminals).Data for both crimes and criminals were collected from free police departments’ dataset available on the Internet to create and test the proposed framework, and then these data were preprocessed to get clean and accurate data using different preprocessing techniques (cleaning, missing values and removing inconsistency). The preprocessed data were used to find out different crime and criminal trends and behaviors, and crimes and criminals were grouped into clusters according to their important attributes. WEKA mining software and Microsoft Excel were used to analyze the given data.

الملخص:تقدم هذه الورقةِ البحثية إطارا ونموذجا لتحليلِ بياناتِ الجريمةَ باستخدام تقنيات وخوارزميات مفاهيم التنقيب عن البيانات (التصنيف والتجميع Classification and Clustering)بهدف تقديم افضل المعلومات الى المختصين في علم الجريمة للمساعدة في الكشف عن الجريمة. يهدف البحث إلى مساعدة الإختصاصيين في إكتِشاف الأنماطِ والإتّجاهاتِ للجرائم والمجرمين و إيجاد عِلاقاتِ وتفسيراتِ محتملةِ للجرائم ومتابعة الشبكاتَ إلاجراميةَ وتمييز مشتبه بهمَ محتملينَ. إنّ التصنيفَ بشكل رئيسي يستند اساسا على تصنيف الجرائمِ طبقاً للنوعِ، العنوان، وقت حصول الجريمة، صفات المشتبه بهم وغيرها. اضافة الى إيجاد العلاقات بين الجرائم المختلفة والخواص الإجراميةِ. ولتحقيق ذلك تم استخدام خوارزميات مختلفة لما يسمى بشجرة القرارات Decision Tree Algorithms لاجراء عملية التصنيف وتقنيات المتوسط البسيط Simple K-Mean للتجميع.تم تجميع البيانات عن الجرائم والمجرمين من البيانات الحرة على الانترنت، حيث استخدمت هذه البيانات لانشاء واختبار النموذج المقترح، وقد تم استخدام خوارزميات مختلفة لاعداد هذه البيانات لكي تتلائم مع خوارزميات التنقيب المختلفة وبعد ذلك تم تطبيق خوارزميات التصنيف والتجميع للحصول على المعلومات التي تساعد في اعطاء رؤية واضحة عن الجرائم والمجرمين. وقد استخدمت برامجياتWEKA و Excel لمعالجة وتحليل تلك البيانات} }