Fulltext

Recognition the Arabic Characters Based On the Characteristics of Arabic Language

Yasser Chasib Bucheet Mobarak

Journal of College of Education مجلة كلية التربية
ISSN: 18120380 Year: 2011 Issue: 5 Pages: 268-299
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Abstract

Characters recognition problem is a special case of image analysis, so it has received more attention than any other pattern recognition problem. The only real problem is to design a system extracted the features efficiently and describes the character perfectly. Much research has been done regarding the recognition of Latin, and Chinese characters. In contrast to Arabic language, very little investigation has been performed regarding Arabic characters recognition. This paper seeks to provide a comprehensive list of the characteristics of the Arabic characters, and to address some challenges posed by the nature of the characters.One of the important ways of summarizing a two-valued picture (i.e., binary image) is to replace all the thick lines by suitable thin lines representing the real boundaries. In this paper, thinning process is performed by using the skeleton process, which summarized the character data. Zhang-Suen algorithm is used to find the skeleton of the Arabic characters, after carrying out several developments on this algorithm for keeping the basic forms of the character from decay when using this algorithm in its known form like the group of dotting associated with the dotted letters. In this paper, a technique has been employed to recognize isolated Arabic characters. A chain coding technique based algorithm along with other significant peculiarities such as number and location of dots and secondary components features, and the number of closed loops feature existing in the isolated Arabic character has been used in this study to recognize Arabic characters. Experimental results show the relatively high accuracy of the method developed when it is tested on several standard Arabic fonts.

أن مسالة تمييز الرموز تعتبر من الحالات الخاصة في تحليل الصور لذلك تلاقي اهتماما واسعا يفوق باقي مشكلات تمييز الأنماط. المشكلة الحقيقة في تصميم نظام ذو كفاءة جيدة هي كيفية استخلاص الصفات والمحافظة على وصف دقيق للرموز. هناك عدد كبير من البحوث تم انجازها في مجال تمييز الحروف الانكليزية و الصينية. على العكس من ذلك, عدد قليل من البحوث تناولت موضوع التمييز والتعرف على الحروف العربية. يقدم البحث الخصائص العامة لكتابة الحروف العربية من وجهة نظر التعرف على الحروف ضوئيا ويعرض بعض التحديات الناتجة عن طبيعة الحروف العربية. من الطرق المهمة في تلخيص صورة ذات بعدين تتمثل باستبدال جميع الخطوط العريضة بأخرى نحيفة. في هذا البحث استخدمنا تقنية التنحيف لتمثيل بيانات الحروف. تم إيجاد هيكل الحروف العربية باستخدام خوارزمية (Zhang-Suen) بعد إجراء بعض التطوير عليها وذلك للحفاظ على الأشكال الأساسية التابعة للحرف من التلاشي عند استخدام الخوارزمية بشكلها المعروف مثل مجموعة التنقيط المرافقة للأحرف المنقطة. تم في هذا البحث, تقديم تقنية لتمييز الحروف العربية المعزولة.طريقة التمييز في هذا البحث اعتمدت على الاستعانة بخصائص تقنية التشفير التسلسلي لتحويل الحروف العربية المعزولة إلى متجهات. بالإضافة إلى ميزات مهمة استخلصت من تركيب كل حرف, مثل عدد وموقع النقاط المرافقة للحرف, خصائص المركبات الثانوية لبعض الحروف, وعدد الحلقات (الفجوات) المغلقة الموجودة بتركيبة الحرف العربي. هذه الخصائص تم تبنيها لإغراض تمييز الحروف العربية. النتائج العملية المستخلصة بهذه الطريقة, أسفرت عن نسبة تمييز عالية عندما جربت على مجموعة من الخطوط العربية القياسية.