Fulltext

discriminate analysis and logistic regression existence of multicolleniarty problem(Empirical Study on Anemia)

التحليل المميز والانحدار اللوجستي بوجود مشكلة التعدد الخطي (دراسة تطبيقية على مرض فقر الدم)

رباب عبد الرضا صالح البكري --- محمد شاكر محمود العزي

journal of Economics And Administrative Sciences مجلة العلوم الاقتصادية والإدارية
ISSN: 2227 703X / 2518 5764 Year: 2017 Volume: 23 Issue: 99 Pages: 373-397
Publisher: Baghdad University جامعة بغداد

Abstract

Abstract The method binery logistic regression and linear discrimint function of the most important statistical methods used in the classification and prediction when the data of the kind of binery (0,1) you can not use the normal regression therefore resort to binary logistic regression and linear discriminant function in the case of two group in the case of a Multicollinearity problem between the data (the data containing high correlation) It became not possible to use binary logistic regression and linear discriminant function, to solve this problem, we resort to Partial least square regression. In this, search the comparison between binary logistic regression and linear discriminant function using error Category. In the practical side in the collection of data on the data on anemia collection Two variables are severe anemia (0) and and chronic anemia (1) and several variables about the disease. The Data were collected from several Iraqi hospitals, where samples collected from patients at the hospital are asleep, and previous cases lay in the hospital a sample of (140) the patient is infected with the disease. When the test data and found that Multicollinearity problem, It has been processed using a method partial least square. The research found that linear discriminant function It is the best in the classification of data from binary logistic regression classified as linear discriminant function the data correctly and more accurate than binary logistic regression.

المستخلصتعد طريقة الانحدار اللوجستي الثنائي Binary logistic regression والدالة المميزة الخطية Linear discriminant function من اهم الطرائق الاحصائية المستخدمة في التصنيف والتنبؤ، عندما تكون البيانات من النوع الثنائي (0،1) فانه لا يمكن استخدام الانحدار الاعتيادي فلذلك نلجأ الى الانحدار اللوجستي الثنائي والدالة المميزة الخطية في حالة وجود مجموعتين، وفي حالة وجود مشكلة التعدد الخطي Multicollinearity بين البيانات (ان البيانات يوجد فيها ارتباطات عالية بين المتغيرات) اصبح عدم الامكان في استخدام الانحدار اللوجستي والدالة المميزة الخطية، ولحل هذه المشكلة نلجأ الى طريقة انحدار المربعات الصغرى الجزئية Partial least square regression لحل مشكلة التعدد الخطي.وقد جرى في هذه البحث المقارنة بين الانحدار اللوجستي الثنائي binary logistic regression والدالة المميزة الخطية linear discriminant function عن طريق خطأ التصنيف. حيث تم جمع بيانات عن مرض فقر الدم بمتغيرين هما فقر الدم الحاد بالرمز (0)، وفقر الدم المزمن بالرمز (1) وبعدة متغيرات حول المرض. جمعت البيانات من عدة مستشفيات عراقية، وجمعت عينة من المرضى الراقدين في المستشفى وحالات سابقة رقدت في المستشفى بعينة قدرها (140) مريضاً مصاباً بهذا المرض. وعند اختبار البيانات وجدت ان هناك مشكلة التعدد الخطي Multicollinearity تمت معالجتها بأستعمال طريقة المربعات الصغرى الجزئية Partial least square.وتوصل البحث الى ان الدالة المميزة الخطية linear discriminant function هي أفضل في تصنيف البيانات من الانحدار اللوجستي الثنائي binary logistic regression، اذ صنفت الدالة المميزة البيانات بشكل صحيح وأكثر دقة من الانحدار اللوجستي الثنائي.

Keywords

linear discriminant function- binary logistic regression- partial least square– multicollinearity problem – ratio of classification. --- الدالة المميزة الخطية– الانحدار اللوجستي الثنائي– المربعات الصغرى الجزئية – مشكلة التعدد الخطي – نسبة التصنيف.