Fulltext

Comparison some of methods wavelet estimation for non parametric regression function with missing response variable at random

مقارنة بعض طرائق التقدير المويجي لدالة الانحدار اللامعلمي عند فقدان متغير الاستجابة عشوائياً

ظافر حسين رشيد --- سعد كاظم حمزة

journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية
ISSN: 2227 703X / 2518 5764 Year: 2016 Volume: 22 Issue: 90 Pages: 382-406
Publisher: Baghdad University جامعة بغداد

Abstract

The problem of missing data represents a major obstacle before researchers in the process of data analysis in different fields since , this problem is a recurrent one in all fields of study including social , medical , astronomical and clinical experiments .The presence of such a problem within the data to be studied may influence negatively on the analysis and it may lead to misleading conclusions , together with the fact that these conclusions that result from a great bias caused by that problem in spite of the efficiency of wavelet methods but they are also affected by the missing of data , in addition to the impact of the problem of miss of accuracy estimation it is not possible to apply these methods because of the miss of one of its conditions which is dyadic sample size .According to the great impact resulted from the problem , many researchers who devoted their studies to process this problem , by using traditional methods in processing missing data , whereas the current research used imputation methods more efficient and effective to process missing data as a primary stage so that these data will be ready and available to wavelet application , as a result simulation experiment proved that the suggested methods (Nearset Nighbor Polynomial Wavelet) are more efficient and superior to other methods , this paper also includes the auto correction of boundaries problem by using local polynomial models , and using different threshold values in wavelet estimations .

تعد مشكلة البيانات المفقودة عقبة كبيرة أمام الباحثين في عملية تحليل البيانات في مختلف المجالات ، وان هذه المشكلة متكررة الظهور في جميع مجالات الدراسات الاجتماعية والطبية والفلكية والتجارب السريرية وغيرها.وان وجودها ضمن البيانات المراد دراستها سيؤثر بشكل سلبي على تحليلها ومن ثم يؤدي الى استنتاجات مظللة ، وان هذه الاستنتاجات ناتجة من التحيز الكبير التي تحدثه . وعلى الرغم من كفاءة الطرائق المويجية الا انها هي الاخرى تتأثر بمشكلة فقدان البيانات ، فهي فضلا عن تأثير مشكلة الفقدان على دقة التقدير فليس بالامكان تطبيق هذه الطرائق لفقدان احد شروطها وهي حجم العينة الدايديكي(Dyadic) .ونظراً للتأثير الكبيرة الناجم عنها فان الكثير من الباحثين ممن كرسوا بحوثهم لمعالجتها باستخدام طرائق تقليدية في معالجة البيانات المفقودة ، بينما قام الباحث باستخدام طرائق تعويض اكثر كفاءة لمعالجة البيانات المفقودة كمرحلة اولى كي تصبح البيانات جاهزة للتطبيق المويجي وقد اثبتت تجارب المحاكاة كفاءة الطرائق المقترحة على بقية الطرائق الاخرى ، كذلك تضمن البحث التصحيح التلقائي لمشكلة الحدودية عن طريق استخدام نموذج متعدد الحدود فضلاً عن استخدام قيم عتبة مختلفة ضمن التقديرات المويجي.

Keywords

Missing data- Wavelet regression- Local polynomial- K-Nearest Neighbor --- البيانات المفقودة - الانحدار المويجي - متعدد حدود موضعي – اقرب مجاور.