Fulltext

Comparison of some methods for estimating the parameters of the binary logistic regression model using the genetic algorithm with practical application

مقارنة بعض الطرائق لتقدير معلمات انموذج الانحدار اللوجستي الثنائي باستعمال الخوارزمية الجينية مع تطبيق عملي

rabaab abid alradhaa رباب عبد الرضا صالح البكري --- saraa adel ساره عادل مظلوم الرديني

journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية
ISSN: 2227 703X / 2518 5764 Year: 2019 Volume: 25 Issue: 112 Pages: 481-499
Publisher: Baghdad University جامعة بغداد

Abstract

Abstract Suffering the human because of pressure normal life of exposure to several types of heart disease as a result of due to different factors. Therefore, and in order to find out the case of a death whether or not, are to be modeled using binary logistic regression model In this research used, one of the most important models of nonlinear regression models extensive use in the modeling of applications statistical, in terms of heart disease which is the binary logistic regression model. and then estimating the parameters of this model using the statistical estimation methods, another problem will be appears in estimating its parameters, as well as when the number parameters , and to find estimate the parameters using the numerical methods, sometimes does not give optimum solution because it depends on the initial estimators. Some standard methods have been proposed and employed after modifying them by using the genetic algorithm approach in estimation to suit the estimation of the parameters of this of nonlinear regression models, and then making a comparison between two types of the important estimation methods including the standard estimation methods which included the maximum likelihood method, minimum chi-square method, and improved estimation methods developed which by the researcher which included genetic algorithm method depending on the technique estimates , genetic algorithm method depending on the technique estimates , to choose the best method of estimation by default values to estimate parameter multi-linear regression model a method ols and then convert values the real to standardized and different samples sizes during simulation and by using the statistical criteria Mean Squares Error (MSE) for estimators. The method is found to be the best one in the first place one among the standard estimation methods, and method is the best among the important estimation methods for the purpose of estimating the parameters for binary logistic regression model because it has less (MSE) for estimators compared to other methods. In the practical side of this study, this model has been used for modeling the own data infected heart disease and estimating the parameters using the method, reached in it by comparing reasons for cases of occurrence death the real with reasons for cases of occurrence death for the estimated to the appropriate model in the modeling of this type of data and extraction the main cause of death is smoking and also the accuracy of the method in estimating the parameters of the model

يعاني الانسان بسبب ضغوطات الحياة الطبيعية من تعرضه الى عدة انواع من امراض القلب وذلك نتيجة لعوامل مختلفة, وبهدف معرفة حالة حدوث الوفاة من عدمه يتم نمذجتها باستعمال أنموذج الانحدار اللوجستي الثنائي, لذا تم في هذا البحث استعمال أحد أهم نماذج الانحدار غير الخطية الواسعة الاستعمال في نمذجة التطبيقات الاحصائية, من حيث الاصابة بأمراض القلب وهو انموذج الانحدار اللوجستي الثنائي ,ومن ثم تقدير معلمات هذا الأنموذج باستعمال طرائق التقدير الاحصائية ولكن اثناء استعمال هذا الأنموذج تواجهنا مشكلة في تقدير معلماته وذلك عندما يكون عدد المعلمات , وان ايجاد تقدير المعلمات باستعمال الطرائق العددية احيانا لا تعطي الحل الامثل لأنها تعتمد على المقدرات البدائية, باستعمال بعض الطرائق الاعتيادية بعد تحسينها من خلال اتباع منهجية الخوارزمية الجينية في التقدير لتلائم تقدير معلمات هذا النوع من نماذج الانحدار غير الخطية, ومن ثم المقارنة بين طرائق التقدير, وقد شملت المقارنة نوعين من طرائق التقدير المهمة وهي طرائق التقدير الاعتيادية التي تضمنت طريقة الامكان الاعظم, وطريقة تصغير مربع كاي, وطرائق التقدير المحسنة التي تم تطويرها من الباحثة والتي تضمنت طريقة الخوارزمية الجينية بالاعتماد على تقنية تقديرات الامكان الاعظم , وطريقة الخوارزمية الجينية بالاعتماد على تقنية تقديرات تصغير مربع كاي , من أجل اختيار الطريقة الأفضل في التقدير وذلك من خلال القيم الافتراضية لتقدير معلمة انموذج الانحدار الخطي المتعدد بطريقة المربعات الصغرى الاعتيادية ols وكذلك تقدير المعلمة بتحويل القيم الحقيقية الى القياسية وبأحجام عينات مختلفة خلال المحاكاة وباستعمال المعيار الاحصائي متوسط مربعات الخطأ لمقدرات الانموذج اللوجستي لغرض المقارنة بين أفضلية طرائق تقدير معلمات الأنموذج, وقد تم التوصل بشكل عام الى أن طريقة هي الأفضل بالمرتبة الأولى من بين طرائق التقدير الاعتيادية, وطريقة هي الأفضل من بين طرائق التقدير المحسنة لغرض تقدير المعلمات للأنموذج اللوجستي الثنائي وذلك لأنها تمتلك اقل للمقدرات, وقد تم في الجانب التطبيقي استعمال هذا الأنموذج لنمذجة البيانات الخاصة بالمصابين بأمراض القلب وتقدير المعلمات باستعمال طريقة , وتم التوصل فيه من خلال مقارنة اسباب حالات حدوث الوفاة الحقيقية مع اسباب حالات حدوث الوفاة المقدرة الى مدى ملائمة الأنموذج في نمذجة هذا النوع من البيانات واستخلاص السبب الرئيسي لحدوث الوفاة هو التدخين, وكذلك دقة الطريقة في تقدير معلمات الأنموذج .

Keywords

Minimum Chi-Square --- Parameters --- Genetic Algorithm --- Newton-Raphson Algorithm. --- / تصغير مربع كاي --- انموذج الانحدار اللوجستي الثنائي --- المعلمات --- الخوارزمية الجينية --- خوارزمية نيوتن_ رافسون.