@Article{, title={التدقيق الإملائي للكلمات العربية المطبوعة باستخدام التحليل الإحصائي}, author={غيداء عبد العزيز الطالب and ماهر أحمد أنور النعمة and رافدة حميد الطائي}, journal={JOURNAL OF EDUCATION AND SCIENCE مجلة التربية والعلم}, volume={23}, number={47}, pages={130-141}, year={2010}, abstract={ABSTRACTIn this research we propose a statistical method and morpho-lexical analysis for correcting Arabic words as a post processor for Arabic words output from OCR systems. Dictionaries of words were built for the comparison to the attached word.The present research uses multiple knowledge sources and basing on the Arabic language properties, statistical method, morpho-lexical analysis and dictionary look-up for error detection and correction. Correction of errors in this research depends on the type of possible error, which can be: transposing two adjacent letters, rejection, replacing an incorrect letter, inserting a missing letter, substitution errors, which are most frequently committed by the OCR systems.

المستخلصيقترح هذا البحث طريقة إحصائية وتحليل مورفولوجي لتصحيح الكلمات العربية الخاطئة بوصفها وسيلة معالجة نهائية للكلمات العربية الناتجة من أنظمة التمييز الضوئي OCR. يلحق بالبحث قواميس بالكلمات بهدف مقارنة الكلمة تحت المعالجة مع مطابقتها في القاموس.يستخدم هذا البحث عدد من مصادر المعرفة ويعتمد خصائص اللغة العربية، طريقة إحصائية، تحليل مورفولوجي، فضلاً عن البحث في القواميس لتحديد موقع الخطأ وتصحيحه. تتوقف عملية تصحيح الأخطاء على نوع الخطأ المحتمل، والذي يشمل القلب المكاني، وإبدال الحروف، وحذفها، وإضافتها الممكنة، وذلك باستبدال الحروف المنقلبة بتلك التي تشابهها، وتعويض الحروف المحذوفة بتلك المسموح بها داخل سياق الكلمة، وهي الأخطاء الأكثر حدوثاً في أنظمة التمييز الضوئي.} }