research centers


Search results: Found 10

Listing 1 - 10 of 10
Sort by

Article
CHOOSING APPROPRIATE IMPUTATION METHODS FOR MISSING DATA: A DECISION ALGORITHM ON METHODS FOR MISSING DATA

Authors: Wisam A. Mahmood --- Mohammed S. Rashid --- Teaba wala Aldeen
Journal: Journal of Al-Qadisiyah for Computer Science and Mathematics مجلة القادسية لعلوم الحاسوب والرياضيات ISSN: 20740204 / 25213504 Year: 2019 Volume: 11 Issue: 2 Pages: Comp Page 65-73
Publisher: Al-Qadisiyah University جامعة القادسية

Loading...
Loading...
Abstract

Missing values commonly happen in the realm of medical research, which is regarded creating a lot of bias in case it is neglected with poor handling. However, while dealing with such challenges, some standard statistical methods have been already developed and available, yet no credible method is available so far to infer credible estimates. The existing data size gets lowered, apart from a decrease in efficiency happens when missing values is found in a dataset. A number of imputation methods have addressed such challenges in early scholarly works for handling missing values. Some of the regular methods include complete case method, mean imputation method, Last Observation Carried Forward (LOCF) method, Expectation-Maximization (EM) algorithm, and Markov Chain Monte Carlo (MCMC), Mean Imputation (Mean), Hot Deck (HOT), Regression Imputation (Regress), K-nearest neighbor (KNN),K-Mean Clustering, Fuzzy K-Mean Clustering, Support Vector Machine, and Multiple Imputation (MI) method. In the present paper, a simulation study is attempted for carrying out an investigative exploration into the efficacy of the above mentioned archetypal imputation methods along with longitudinal data setting under missing completely at random (MCAR). We took out missingness from three cases in a block having low missingness of 5% as well as higher levels at 30% and 50%. With this simulation study, we concluded LOCF method having more bias than the other methods in most of the situations after carrying out a comparison through simulation study.


Article
Satellite Image Gap Filling Technique
تقنية ملء الفجوات في صور الاقمار الصناعية

Author: Faisel G. Mohammed فيصل غازي محمد
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2012 Volume: 53 Issue: 5 Pages: 1232-1235
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

In the current research work a useful gap filling method was presented. Images over Al Mosel city in Iraq were used as tested images. The linear algorithm for high resolution (H.R.) image interpolation were based. The difference between the proposed algorithm and conventional nearest neighbor algorithm is that the concept applied, to estimate the missing pixel value, is guided by the nearest value rather than the distance. In other words, the proposed concept selects one pixel, among four directly surrounding the empty location, whose value is almost equal to the value generated by the conventional bilinear interpolation algorithm. The experimental results show that the proposed method demonstrated higher performances in terms of H.R. and thus is applicable to gray level satellites images.

في البحث الحالي تم تحضير طريقة مفيدة لملء الفجوات. اضافة الى بعض صور الاقمار الصناعية العالمية تم اختيار صورة للموصل فوق العراق كصورة اختبارية.خوارزمية بسيطة وكفوءة لاستكمال الصورتم اعتمادها. الفرق بين الخوارزمية المقترحة وخوارزمية الجار الاقرب التقليدية بان المبدأ المطبق هو لتخمين قيمة البكسل المفقود منقاد الى القيمة الاقرب وليس الجار الاقرب. بعبارة اخرى, ان المبدأ المقترح يختار بكسل واحد من بين اربعة مواقع محيطة بالموقع الفارغ, والذي دائما تكون قيمته مساوية الى القيمة المتولدة باستخدام خوارزمية الاستكمال الثنائية. النتائج العملية توضح ان الطريقة المقترحة استعرضت اداء عالي وحتى على الصور العالية الدقة وهذا يعني انها قابلة للتطبيق لصور الاقمار الصناعية ذات التدرج الرمادي.


Article
Comparison between the empirical bayes method with moments method to estimate the affiliation parameter in the clinical trials using simulation
مقارنة بين أسلوب بيز التجريبي مع طريقة العزوم لتقدير معلمات الأنتماء في المحاولات السريرية بأستعمال المحاكاة

Authors: صباح هادي الجاسم --- محمد صباح خالد
Journal: journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية ISSN: 2227 703X / 2518 5764 Year: 2012 Volume: 18 Issue: 69 Pages: 226-236
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

In this research the Empirical Bayes method is used to Estimate the affiliation parameter in the clinical trials and then we compare this with the Moment Estimates for this parameter using Monte Carlo stimulation , we assumed that the distribution of the observation is binomial distribution while the distribution with the unknown random parameters is beta distribution ,finally we conclude that the Empirical bayes method for the random affiliation parameter is efficient using Mean Squares Error (MSE) and for different Sample size .

في هذا البحث تتم مقارنة تقديرات بيز التجريبي لمعلمات الانتماء في التجارب السريرية مع تقديرات معلمات الانتماء بطريقة العزوم, وذلك بتوظيف اسلوب المحاكاة بطريقة مونت كارلو حيث تم استعمال المقياس الاحصائي متوسط مربعات الخطأ (MSE) من اجل المقارنة بين كفاءة التقديرات ولحجوم عينات مختلفة علماً انه تم افتراض نسب فقدان مختلفة للبيانات وعلى فرض ان توزيع المشاهدات هو توزيع ثنائي الحدين في حين كان توزيع المعلمات العشوائية المجهولة هو توزيع بيتا وتم التوصل في هذا البحث الى ان تقديرات بيز التجريبي لمعلمات الانتماء العشوائية افضل من تقديرات العزوم لهذه المعلمات ولحجوم العينات المفترضة في الجانب التجريبي.


Article
Investigating the Effect of Missing Data imputation Method and its Percentage on the Detection of Differential Item Functioning for Items of Test Using Raju's Method
تقصي أثر طريقة التعويض عن البيانات المفقودة ونسبها في الكشف عن الاداء التفاضلي لفقرات اختبار باستخدام طريقة راجو

Loading...
Loading...
Abstract

The aim of this study was to investigate the effect of the method of compensation for missing data and its percentage in the detection of the differential performance of the test paragraphs using the Rajo method according to the three-parameter response model using the generated data. The design of the study included different conditions based on the study variables. The differential performance in the test is 10%, 20% and 40%. The differential performance of the paragraph is: (low level of 0.5 and high level of 1.5). Accordingly, the study was designed from (6) different groups with different performance differentials and differential performance of the paragraph, as well as a reference group that does not include any differential performance clause, which is the basis of comparison, resulting in (7) sets Study.

هدفت هذه الدراسة إلى تقصي أثر طريقة التعويض عن البيانات المفقودة و نسبها في الكشف عن الاداء التفاضلي لفقرات اختبار باستخدام طريقة راجو نسبة وفق نموذج الاستجابة للفقرة ثلاثي المعلمة باستخدام بيانات مولدة، حيث تضمن تصميم الدراسة ظروفاً مختلفة بناءً على متغيرات الدراسة، فقد كانت نسبة الفقرات ذات الأداء التفاضلي الموجودة في الاختبار هي (10%، 20%، 40%)، وكان مستويا الأداء التفاضلي للفقرة هما: (مستوى متدنٍ بمقدار 0.5 ومستوى عالٍ بمقدار 1.5). وبناءً على ذلك تم تصميم الدراسة من (6) مجموعات تختلف فيما بينها بنسبة الفقرات ذات الأداء التفاضلي ومستوى الأداء التفاضلي للفقرة، بالإضافة إلى المجموعة المرجعية التي لا تشتمل على أي فقرة ذات أداء تفاضلي، والتي تمثل القاعدة الأساسية للمقارنة، مما نتج (7) مجموعات للدراسة.


Article
Proposed method to estimate missing values in Non - Parametric multiple regression model
أسلوب مقترح في تقدير القيم المفقودة في نموذج الانحدار المتعدد اللامعلمي

Author: قتيبة نبيل نايف القزاز
Journal: journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية ISSN: 2227 703X / 2518 5764 Year: 2016 Volume: 22 Issue: 89 Pages: 396-406
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

In this paper, we will provide a proposed method to estimate missing values for the Explanatory variables for Non-Parametric Multiple Regression Model and compare it with the Imputation Arithmetic mean Method, The basis of the idea of this method was based on how to employ the causal relationship between the variables in finding an efficient estimate of the missing value, we rely on the use of the Kernel estimate by Nadaraya – Watson Estimator , and on Least Squared Cross Validation (LSCV) to estimate the Bandwidth, and we use the simulation study to compare between the two methods

في هذا البحث سوف نقدم أسلوب مقترح في تقدير القيم المفقودة لمشاهدات المتغيرات التوضحية لنموذج الانحدار المتعدد اللامعلمي ومقارنتها مع طريقة التعويض بالوسط الحسابي، أن أساس فكرة هذا الأسلوب أستندت الى كيفية توظيف العلاقة السببية بين المتغيرات في ايجاد تقدير كفوء للقيمة المفقودة، معتمدين في ذالك على استعمال تقدير Kernel والمتمثل بمقدر Nadary - Watson وعلى طريقة المربعات الصغرى للعبور الشرعي LSCV في تقدير المعلمة التمهيدية، ومستخدمين اسلوب المحاكاة في المقارنة بين الطريقتين.


Article
ESTIMATION OF MISSING LEFT TURNING MOVEMENT FOR INTERSECTIONS TRAFFIC VOLUME COUNT
تقدير القيمة المفقودة للحركة المنعطفة يسارا" في حساب الحجم المروري للتقاطعات

Author: Mohammad Ahmad Hummody
Journal: Tikrit Journal of Engineering Sciences مجلة تكريت للعلوم الهندسية ISSN: 1813162X 23127589 Year: 2006 Volume: 13 Issue: 2 Pages: 39-66
Publisher: Tikrit University جامعة تكريت

Loading...
Loading...
Abstract

Intersection traffic volume count must be in of the accurate data, because it is a crucial in the calibration and validation of traffic demand models. It is process in a continuous manner done by the analyst, planner or designer.Many procedures were recently produced to estimate the intersection turning movement matrix. Sometimes, these procedures of traffic volume count may have unusual, unavailable or missing values especially for the left turn movement, which is more effective in capacity analysis.Typical four mathematical and statistical methods of estimating the missing left turn movement volume were developed for about twenty signalized intersections. The most significant one is the typical curve estimation method. It is a power curve and in a simple formula compared with several other imputation techniques. This method can be superior to substitute the other methods in estimating the intersection traffic volume matrices.

تعتبر عملية حساب الحجم المروري في التقاطعات من العمليات المستمرة والتي يجب أن تكون دقيقة بغية تقييم الوضع الحالي أو للتنبؤ المستقبلي أو أحيانا" لغرض أجراء التصاميم أو أجراء التحويرات. تتم العملية بعدة طرق ولكن يحدث أحيانا" أن تفقد قيمة الحجم المروري لحركة ما في أي مقترب من التقاطع، فمثلا" عدم استطاعة متابعة حساب الحجم المروري المتجه يسارا" ، أو قد يتم أحيانا" الحصول على قيم غير منطقية (شاذة ). لذا تم تطبيق ومقارنة أربع طرق رياضية وإحصائية لإيجاد هذه القيمة المفقودة على حوالي عشرين نموذج من التقاطعات المسيطر عليها بالإشارات الضوئية. وجد أن أفضل طريقة لإيجاد القيم المفقودة للحجم المروري للتقاطعات هي طريقة استخدام منحني أسي مبسط, ويمكن اعتبارها من أهم الطرق المستخدمة في أيجاد مصفوفة الحجم المروري.


Article
Comparison some of methods wavelet estimation for non parametric regression function with missing response variable at random
مقارنة بعض طرائق التقدير المويجي لدالة الانحدار اللامعلمي عند فقدان متغير الاستجابة عشوائياً

Authors: ظافر حسين رشيد --- سعد كاظم حمزة
Journal: journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية ISSN: 2227 703X / 2518 5764 Year: 2016 Volume: 22 Issue: 90 Pages: 382-406
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

The problem of missing data represents a major obstacle before researchers in the process of data analysis in different fields since , this problem is a recurrent one in all fields of study including social , medical , astronomical and clinical experiments .The presence of such a problem within the data to be studied may influence negatively on the analysis and it may lead to misleading conclusions , together with the fact that these conclusions that result from a great bias caused by that problem in spite of the efficiency of wavelet methods but they are also affected by the missing of data , in addition to the impact of the problem of miss of accuracy estimation it is not possible to apply these methods because of the miss of one of its conditions which is dyadic sample size .According to the great impact resulted from the problem , many researchers who devoted their studies to process this problem , by using traditional methods in processing missing data , whereas the current research used imputation methods more efficient and effective to process missing data as a primary stage so that these data will be ready and available to wavelet application , as a result simulation experiment proved that the suggested methods (Nearset Nighbor Polynomial Wavelet) are more efficient and superior to other methods , this paper also includes the auto correction of boundaries problem by using local polynomial models , and using different threshold values in wavelet estimations .

تعد مشكلة البيانات المفقودة عقبة كبيرة أمام الباحثين في عملية تحليل البيانات في مختلف المجالات ، وان هذه المشكلة متكررة الظهور في جميع مجالات الدراسات الاجتماعية والطبية والفلكية والتجارب السريرية وغيرها.وان وجودها ضمن البيانات المراد دراستها سيؤثر بشكل سلبي على تحليلها ومن ثم يؤدي الى استنتاجات مظللة ، وان هذه الاستنتاجات ناتجة من التحيز الكبير التي تحدثه . وعلى الرغم من كفاءة الطرائق المويجية الا انها هي الاخرى تتأثر بمشكلة فقدان البيانات ، فهي فضلا عن تأثير مشكلة الفقدان على دقة التقدير فليس بالامكان تطبيق هذه الطرائق لفقدان احد شروطها وهي حجم العينة الدايديكي(Dyadic) .ونظراً للتأثير الكبيرة الناجم عنها فان الكثير من الباحثين ممن كرسوا بحوثهم لمعالجتها باستخدام طرائق تقليدية في معالجة البيانات المفقودة ، بينما قام الباحث باستخدام طرائق تعويض اكثر كفاءة لمعالجة البيانات المفقودة كمرحلة اولى كي تصبح البيانات جاهزة للتطبيق المويجي وقد اثبتت تجارب المحاكاة كفاءة الطرائق المقترحة على بقية الطرائق الاخرى ، كذلك تضمن البحث التصحيح التلقائي لمشكلة الحدودية عن طريق استخدام نموذج متعدد الحدود فضلاً عن استخدام قيم عتبة مختلفة ضمن التقديرات المويجي.


Article
Using Different Threshold Value in Comparison Some of Methods Wavelet Estimation for Non Parametric Regression Function with Missing Data
استخدام قيم عتبة مختلفة في مقارنة بعض طرائق التقدير المويجي لدالة الانحدار اللامعلمي بوجود بيانات مفقودة

Author: Dhafir H. Rasheed ظافر حسين رشيد
Journal: Al-Rafidain University College For Sciences مجلة كلية الرافدين الجامعة للعلوم ISSN: 16816870 Year: 2016 Issue: 37 Pages: 1-33
Publisher: Rafidain University College كلية الرافدين الجامعة

Loading...
Loading...
Abstract

The problem of missing of some of sample observations is one of the main problems that face researcher during the statistical analysis , the main problem of missing data are as follows damage , negligence, death and morbidity as in the case of clinical studies The presence of such a problem within the data may influence on the analysis and accordingly it may lead to misleading conclusions despite the fact that the wavelet estimations are of high efficiency in estimating the regression function , but it may be influenced by the problem of missing data , in addition to the impact of the problem of miss of accuracy estimation it is not possible to apply these methods because of the miss of one of its conditions which is dyadic sample size .According to the great impact stem from that problem , many researchers who devoted their study to process this problem by using traditional methods in processing missing data , where as the researcher used imputation methods more efficient and effective to process the missing data as a primary stage so that these data will be ready and available to wavelet application, as a result simulation experiment proved that the suggested methods (DRPW) are more efficient and superior to other methods , this paper also includes the auto correction of boundaries problem by using polynomial models , and using different threshold values in wavelet estimations , SINCE the suitable choice of this value is decisive accuracy of these estimations

تعد مشكلة فقدان بعض مشاهدات العينة من اهم المشاكل التي تواجه الباحث اثناء التحليل الاحصائي ، ومن أسباب الفقدان كثيرة كأن تكون التلف والإهمال او موت مرضى كما في الدراسات السريرية . وان وجود مثل هكذا مشكلة ضمن البيانات يؤثر على التحليل وبالتالي يؤدي الى استنتاجات مظللة ، وعلى الرغم من الكفاءة العالية للتقديرات المويجية في تقدير دالة الانحدار الا انها هي الاخرى تتأثر بمشكلة فقدان البيانات ، حيث انه بالاضافة الى تأثير مشكلة الفقدان على دقة التقدير فانه ليس بالامكان تطبيق هذه الطرائق لفقدان احد شروطها وهي حجم العينة الدايديكي .ونظراً للتأثير الكبيرة الناجم عن تلك المشكلة فان الكثير من الباحثين ممن كرسوا بحوثهم لمعالجة تلك المشكلة باستخدام طرائق تقليدية في معالجة البيانات المفقودة ، بينما قام الباحث باستخدام طرائق تعويض اكثر كفاءة لمعالجة البيانات المفقودة كمرحلة اولى كي تصبح البيانات جاهزة للتطبيق المويجي وقد اثبتت تجارب المحاكاة كفاءة الطرائق المقترحة على بقية الطرائق الاخرى ، كذلك تضمن البحث التصحيح التلقائي لمشكلة الحدودية عن طريق استخدام نموذج متعدد الحدود بالاضافة الى استخدام قيم عتبة مختلفة ضمن التقديرات المويجية كون ان الاختيار المناسب لقيمة العتبة يكون حاسم في دقة تلك التقديرات.


Article
Processing of missing values in survey data using Principal Component Analysis and probabilistic Principal Component Analysis methods
معالجة القيم المفقودة باستعمال طريقة تحليل المركبات الرئيسة (PCA) و خرائط التنظيم الذاتي((SOM

Authors: قتيبة نبيل نايف --- بشرى رحيم جاسم
Journal: journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية ISSN: 2227 703X / 2518 5764 Year: 2018 Volume: 24 Issue: 104 Pages: 354-373
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

The idea of carrying out research on incomplete data came from the circumstances of our dear country and the horrors of war, which resulted in the missing of many important data and in all aspects of economic, natural, health, scientific life, etc.,. The reasons for the missing are different, including what is outside the will of the concerned or be the will of the concerned, which is planned for that because of the cost or risk or because of the lack of possibilities for inspection. The missing data in this study were processed using Principal Component Analysis and self-organizing map methods using simulation. The variables of child health and variables affecting children's health were taken into account: breastfeeding and maternal health. The maternal health variable contained missing value and was processed in Matlab2015a using Methods Principal Component Analysis and probabilistic Principal Component Analysis of where the missing values were processed and then the methods were compared using the root of the mean error squares. The best method to processed the missing values Was the PCA method

المستخلص : ان فكرة انجاز بحث حول البيانات غير التامة جاءت من ظروف بلدنا العزيـز ومـا تعرض له من ويلات الحروب حيث أدى ذلك الى فقدان الكثير من البيانات المهمة وفي جميع نواحي الحياة الاقتصادية والطبيعية والصحية والعلمية الصرفة ... الخ. كما ان أسباب الفقدان مختلفة ، منها ما يكون خـارجاً عـن ارادة المعنيين او تكون بإرادة المعنيين أي يكون مخططاً لذلك بسبب الكلفة او المخـاطرة او بـسبب عدم توافر الإمكانيات للمعاينة. وان معالجة البيانات المفقودة في هذا البحث تمت باستخدام طريقتي تحليل المركبات الرئيسة وتحليل المركبات الرئيسة الاحتمالية وذلك باستخدام المحاكاة, حيث تم اخذ متغيرات صحة الاطفال والمتغيرات التي تتاثر بها صحة الاطفال وهي الرضاعة وصحة الامهات ويحتوي متغير صحة الامهات على قيم مفقودة وتم معالجتها في برنامج ( Matlab2015a) باستخدام طريقة تحليل المركبات الرئيسة وخرائط التنظيم الذاتيSOM حيث تم معالجة القيم المفقودة ومن ثم مقارنة الطرائق باستعمال جذر متوسط مربعات الخطأ وكانت افضل طريقة لمعالجة القيم المفقودة هي طريقة تحليل المركبات الرئيسة (PCA).


Article
In this paper we suggest new method to estimate the missing data in bivariate normal distribution and compare it with Single Imputation method (Unconditional mean and Conditional mean) by using simulation.
مقارنة بعض طرائق التعويض الأحادي للبيانات المفقودة لدالة الكثافة الاحتمالية للتوزيع الطبيعي ثنائي المتغيرات

Authors: قتيبــة نبيل نايف --- محمد جاسم محمد --- تهاني مهدي عباس
Journal: journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية ISSN: 2227 703X / 2518 5764 Year: 2010 Volume: 16 Issue: 58 Pages: 167-180
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

In this paper we suggest new method to estimate the missing data in bivariate normal distribution and compare it with Single Imputation method (Unconditional mean and Conditional mean) by using simulation.

في هذا البحث تم اقتراح طريقة جديدة للتعويض عن القيم المفقودة في حالة دالة التوزيع الطبيعي ثنائي المتغيرات ومقارنة كفاءة هذا الطريقة مع طريقتي التعويض الأحادي، هما طريقة تعويض المتوسط الشرطي وطريقة تعويض المتوسط غير الشرطي وباستخدام المحاكاة التي اظهرت ان الطريقة المقترحة اكثر كفاءة من الطريقتين.
Abstract:

Listing 1 - 10 of 10
Sort by
Narrow your search

Resource type

article (10)


Language

Arabic and English (4)

Arabic (3)

English (3)


Year
From To Submit

2019 (2)

2018 (1)

2016 (3)

2012 (2)

2010 (1)

More...