TY - JOUR ID - TI - Solving Missing Values : A Case Study AU - Mansoor Habeeb & Kadhim Aljanabi & Nawras Riyadh Neamah PY - 2014 VL - 4 IS - 1 SP - 254 EP - 265 JO - Journal of Education for Pure Science مجلة التربية للعلوم الصرفة SN - 20736592 AB - One of the most important issues in information theory related to data in both Database and Data Warehouse is the missing values (unknown, not available and required). This represents a great challenge to the analysis process. Features or data attributes (fields or columns in relational DB) in data repositories represent the core of any analytical process in OLAP(On Line Analytical Processing)and OLTP(On Line Transaction Processing). These attributes are required to be studied and processed. Many papers were published to solve such problem in different goals and algorithms. However, the aim of this research proposal is to improve the algorithms applied to these topics to insure data consistency, correctness, completeness, and time and space complexity. Different algorithms and techniques were applied on more than 20000 records collected from different hospitals and clinics around Iraq to study the effectiveness of the proposed algorithms including Most Common Value, overall average, and classification.

تعتبر القيم المفقودة من أهم القضايا في نظرية المعلومات المتعلقة بالبيانات في كل من قاعدة بيانات ومخازن البيانات (وهي تشير الى القيم غير المعروفة، وليست متاحة ولكنها مطلوبة) وهذا الموضوع يمثل تحديا كبيرا لعملية تحليل البيانات. ميزات أو سمات البيانات (الحقول او الاعمدة في انظمة قواعد البيانات) تمثل جوهر أي عملية تحليلية في )OLAPانظمة المعالجة التحليلية المباشرة) وOLTP (انظمة معالجة الاجراءات المباشرة). وهذه الصفات تتطلب الدراسة والمعالجة. وقد تم معالجة هذه المشكلة في العديد من الاوراق البحثية باستخدام خوارزميات ومنهجيات مختلفة، وتهدف هذه الورقة البحثية الى تحسين وتطوير الخوارزميات المطبقة على هذه المواضيع لضمان اتساق البيانات وصحتها واكتمالها وتطويرها في كل من معياري الوقت والسعة المطلوبة لانجاز الخوارزمية. وتم تطبيق هذه الخوارزميات على اكثر من 20000 سجل تم جمعها من مستشفيات وعيادات مختلفة في العراق. وقد تم تطبيق الخوارزميات التالية:•القيمة الأكثر شيوعا ضمن البيانات•المعدل العام ومعدل الفئات المختلفة•التصنيف ER -