TY - JOUR ID - TI - Document Image Classification Using Probabilistic Neural Network تصنيف صورة الوثيقه بواسطة الشبكة الاحتماليه العصبيه AU - Wdad A. Nasir وداد عبد الخضر ناصر AU - Aml A. Kadhim أمل عباس كاظم PY - 2010 VL - IS - 15-E SP - 63 EP - 77 JO - Journal of Al-Ma'moon College مجلة كلية المأمون SN - 19924453 27902544 AB - The decreasing cost of hardware will eventually enable commonplace the storage and process of documents by electronic means. However, today most documents are begin saved, processed, and presented on papers. Paper is the primary medium for books, journals and newspapers. In order to properly archive, index and process a large number of document images, several challenging processing steps must be completed. In this work, a proposed system is used to segment and classify the gray document image to regions based on data blocks. A probabilistic neural network model has been used for this purpose . First, the preprocessing is used to convert gray document image to binary document image, then the erode process used to convert the binary document into blocks. The resulting blocks are segmented to number of regions by using label procedure, the four features of each region are calculated based on the bounding box for each region. Then these features are fed to the input layer of a probabilistic neural network for classification to one of two regions (text, picture). Some gray documents images are used in order to test the proposed system. The tests have successfully classified all test documents.

إن التكلفة المتناقصة لمكونات الحاسبة المادية ستمكننا من خزن ومعالجة الوثائق بشكل الكتروني, اليوم معظم الوثائق تخزن وتعالج وتعرض على الأوراق والتي هي أساس الكتب والمعاملات والصحف والمجلات. ومن اجل خزن وفهرسة ومعالجة مجموعة كبيرة من صور الوثائق يتطلب ذلك إجراء مجموعة من خطوات المعالجة. في هذا العمل تم استخدام نظام مقترح لتجزئة و تصنيف صورة الوثيقة الرمادية اللون الى مناطق بالاعتماد على بيانات المقاطع التي تحويها. استخدم نموذج الشبكة العصبية الاحتمالية لهذا الغرض. أولاً المعالجة المسبقة استخدمت لتحويل صورة الوثيقة الرمادية اللون إلى صورة الوثيقة ثنائية اللون (الأبيض والأسود) ثم استخدام عملية التآكل لتحويل الوثيقة ثنائية اللون إلى وحدات، الوحدات الناتجة تقسم الى عدد من المناطق باستخدام البرنامج الفرعي للعنونة.تم حساب اربع صفات لكل منطقة بالاعتماد على الصندوق الذي يحوي تلك المنطقة بعدها يتم إدخال الصفات المحسوبة الى وحدة الإدخال في الشبكة العصبية الاحتمالية لغرض تصنيفها إلى واحدة من منطقتين وهي نص و صورة .تم استعمال بعض صور وثائق الرماديةِ اللون لكي تَختبرَ النظام المُقتَرَحَ. الاختبارات نجحت في تصنيف جميع وثائق الاختبار ∙ ER -