استفاده از متغیرهای پنهان برای حذف هم خطی چندگانه

مدیر انجمن: Ebrahim-Bayazidi

موضوع جدید ارسال پست
نمایه کاربر
Ebrahim-Bayazidi
مدير کل سايت
مدير کل سايت
پست: 2331
تاریخ عضویت: پنج‌شنبه ۲۸ مهر ۱۳۹۰, ۱۱:۵۸ ق.ظ
محل اقامت: تهران
تشکر کرده: 7 دفعه
تماس:

رﮔﺮﺳﻴﻮن ﻟﺠـﺴﺘﻴﻚ ﻳﻜـﻲ از ﻛـﺎرﺑﺮدي ﺗـﺮﻳﻦ ﻣـﺪل ﻫـﺎي ﺧﻄـﻲ
ﺗﻌﻤﻴﻢ ﻳﺎﻓﺘﻪ اﺳﺖ ﻛﻪ ﺑـﺮاي ﺗﺤﻠﻴـﻞ راﺑﻄـﻪ ي ﻳـﻚ ﻳـﺎ ﭼﻨـﺪ ﻣﺘﻐﻴـﺮ
ﺗﻮﺿﻴﺤﻲ ﺑﺮ ﻣﺘﻐﻴﺮ ﭘﺎﺳﺦ رﺳﺘﻪ اي ﺑـﻪ ﻛـﺎر ﻣـﻲ رود (1). زﻣـﺎﻧﻲ ﻛـﻪ
ﺗﻌﺪاد ﻣﺘﻐﻴﺮﻫﺎي ﺗﻮﺿﻴﺤﻲ اﻓﺰاﻳﺶ ﻣﻲ ﻳﺎﺑﺪ، ﻣﺪلﺳﺎزي ﻣﺸﻜﻞ ﺷﺪه
و ﻛﺎرآﻳﻲ آن ﻧﻴﺰ ﻛﺎﻫﺶ ﻣﻲ ﻳﺎﺑﺪ؛ ﺑﻪ ﺧﺼﻮص اﮔﺮ ﺑﺮﺧﻲ از ﻣﺘﻐﻴﺮﻫـﺎ
ﻋﻠﻲ رﻏﻢ ﻓﺮض اﺳﺘﻘﻼل در ﻣﺪل ﺳﺎزي، ﺑﺎ ﻳﻚ دﻳﮕﺮ ﻫﻢ ﺑﺴﺘﮕﻲ ﻗـﻮي
داﺷـــﺘﻪ ﺑﺎﺷـــﻨﺪ و ﺑـــﻪ ﻋﺒـــﺎرت دﻳﮕـــﺮ ﻫـــﻢﺧﻄـــﻲ ﭼﻨﺪﮔﺎﻧـــﻪ
(Multicollinearity) اﻳﺠﺎد ﺷﺪه ﺑﺎﺷﺪ (2). ﻫﻢ ﺧﻄﻲ ﭼﻨﺪﮔﺎﻧﻪ ﻳﻜـﻲ
از دﻻﻳﻞ اﻓـﺰاﻳﺶ ﺧﻄـﺎي اﺳـﺘﺎﻧﺪارد ﺑـﺮآورد ﺿـﺮاﻳﺐ رﮔﺮﺳـﻴﻮﻧﻲ و
درﻧﺘﻴﺠــﻪ ﻛــﺎﻫﺶ ﻛــﺎرآﻳﻲ ﻣــﺪل ﺑــﻮده و ﻣﻤﻜــﻦ اﺳــﺖ ﻣﻨﺠــﺮ ﺑــﻪ
ﭘﻴﺶﺑﻴﻨﻲﻫﺎﻳﻲ ﺧﺎرج از داﻣﻨﻪي ﻣﻮرد اﻧﺘﻈﺎر ﺷﻮد (3).
ﻣﺴﺌﻠﻪ ي ﻫﻢ ﺧﻄﻲ در ﻣﺪل ﻫـﺎي رﮔﺮﺳـﻴﻮن ﺧﻄـﻲ ﻣـﻮرد ﺗﻮﺟـﻪ
ﺑﺴﻴﺎري از ﻣﺤﻘﻘﺎن ﻗﺮار ﮔﺮﻓﺘﻪ و روشﻫﺎي ﮔﻮﻧﺎﮔﻮﻧﻲ ﺑﺮاي ﻣﻘﺎﺑﻠﻪ ﺑـﺎ
اﺛﺮات ﻧﺎﻣﻄﻠﻮب آن اﺑـﺪاع ﺷـﺪه اﺳـﺖ (2). از ﺟﻤﻠـﻪ اﻳـﻦ روش ﻫـﺎ،
ﻛــﺎﻫﺶ اﺑﻌــﺎد ﻣــﺪل ﺑــﺎ اﺳــﺘﻔﺎده از ﻣﺘﻐﻴﺮﻫــﺎي ﭘﻨﻬــﺎن ( Latent
Variables) اﺳﺖ. اﻳﻦ ﻧﻮع ﻣﺘﻐﻴﺮﻫﺎ ً ﻣﺴﺘﻘﻴﻤﺎ ﻣﺸﺎﻫﺪه ﻧﻤـﻲ ﺷـﻮﻧﺪ؛
ﺑﻠﻜﻪ از ﺗﺮﻛﻴﺐ ﺳﺎﻳﺮ ﻣﺘﻐﻴﺮﻫﺎي ﻣﺸﺎﻫﺪه ﺷﺪه ﻗﺎﺑﻞ دﺳﺘﻴﺎﺑﻲ ﺑﻮده، ﺑﻪ
ﻋﻨﻮان ﻧﻤﺎﻳﻨـﺪه ي ﺑﺮﺧـﻲ از ﻣﺘﻐﻴﺮﻫـﺎي ﻫﻤﺒـﺴﺘﻪ در ﻣـﺪل ﺑـﻪ ﻛـﺎر
ﻣﻲروﻧﺪ (4). اﮔﺮ ﭼﻪ اﺳﺘﻔﺎده از ﻣﺘﻐﻴﺮﻫﺎي ﭘﻨﻬﺎن ﺑﺮاي ﻛﺎﻫﺶ اﺑﻌـﺎد ﻣـﺪل، در
ﻋﻤﻞ ﺑﻴﺸﺘﺮﻳﻦ ﻛﺎرﺑﺮد را در ﻣﻄﺎﻟﻌﺎت ﻣﺮﺑﻮط ﺑـﻪ ﻋﻠـﻮم اﺟﺘﻤـﺎﻋﻲ و
رواﻧﺸﻨﺎﺳﻲ داﺷﺘﻪ اﺳﺖ، وﻟﻲ ﺑﻪ دﻟﻴﻞ ﻧﻮع ﻣﻄﺎﻟﻌﺎت اﻧﺠـﺎم ﺷـﺪه در
ﻋﻠﻮم ﭘﺰﺷﻜﻲ و ﺑﻬﺪاﺷﺖ ﻛﻪ ﻣﺴﺘﻠﺰم ﺟﻤﻊ آوري ﺗﻌﺪاد ﻗﺎﺑﻞ ﺗـﻮﺟﻬﻲ
ﻣﺘﻐﻴﺮﻫﺎي ﻣﺮﺗﺒﻂ ﺑﺎ ﻳﻚ دﻳﮕﺮ اﺳﺖ، ﻣﺸﻜﻞ ﻫﻢ ﺧﻄﻲ در ﺑـﺴﻴﺎري از
ﻣﺪل ﻫﺎي آﻣﺎري اﻳﻦ ﻣﻄﺎﻟﻌﺎت ﻗﺎﺑـﻞ اﻧﺘﻈـﺎر اﺳـﺖ (5) و ﻋﻠـﻲ رﻏـﻢ
اﻳﻦ ﻛﻪ ﻫﻢ ﺧﻄﻲ ﭼﻨﺪﮔﺎﻧﻪ در ﻣـﺪل رﮔﺮﺳـﻴﻮن ﻟﺠـﺴﺘﻴﻚ ﻧﻴﺰاﻳﺠـﺎد
ﻣﺸﻜﻞ ﻣﻲ ﻛﻨﺪ (6،7)، ﺗﺎﻛﻨﻮن ﺗﻮﺟﻪ ﻣﺤﻘﻘﺎن ﺑﻴـﺸﺘﺮ ﺑـﺮ رﮔﺮﺳـﻴﻮن
ﺧﻄﻲ ﺑﺎ ﻣﺘﻐﻴﺮ ﭘﺎﺳﺦ داراي ﺗﻮزﻳﻊ ﻧﺮﻣﺎل ﻣﺘﻤﺮﻛﺰ ﺑﻮده اﺳﺖ.
ﺗﺤﻠﻴـﻞ ﻣﺆﻟﻔـﻪﻫـﺎي اﺻـﻠﻲ (Principal Component Analysis)
ﻳﻜﻲ از ﻛﺎرﺑﺮدي ﺗﺮﻳﻦ روش ﻫﺎي ﻛـﺎﻫﺶ اﺑﻌـﺎد در روش ﻫـﺎي ﭼﻨـﺪ
ﻣﺘﻐﻴﺮي اﺳـﺖ. ﺗﺎرﻳﺨﭽـﻪ ي اﺑـﺪاع اﻳـﻦ روش ﺑـﻪ اﺑـﺪاﻋﺎت ﭘﻴﺮﺳـﻦ
(Pearson) در ﺑﺮازش ﺣﺪاﻗﻞ ﻣﺮﺑﻌﺎت ﻣﺘﻌﺎﻣﺪ ﺑﺮﻣﻲ ﮔﺮدد؛ وﻟﻲ ﺑﺴﻂ
ﻋﻤﺪه ي ﺗﺌﻮري ﺑﻪوﺳﻴﻠﻪ ي ﻫﺘﻠﻴﻨﮓ (Hotteling) اﻧﺠﺎم ﺷـﺪه اﺳـﺖ
(8). ﻣﺆﻟﻔﻪ ﻫﺎي اﺻﻠﻲ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺧﺼﻮﺻﻴﺎﺗﻲ ﻛﻪ دارﻧﺪ ﺑﺮاي ﻣﻘﺎﺑﻠـﻪ
ﺑﺎ ﻣﺸﻜﻞ ﻫﻢ ﺧﻄﻲ و ﻛﺎﻫﺶ اﺑﻌﺎد ﻣـﺪل در رﮔﺮﺳـﻴﻮن ﻫـﺎي ﺧﻄـﻲ
ﻣﻮرد اﺳﺘﻔﺎده ﻗﺮار ﻣـﻲ ﮔﻴﺮﻧـﺪ (2،9). در اﻳـﻦ روش ﺑـﺎ اﺳـﺘﻔﺎده از
ﻣﺎﺗﺮﻳﺲ ﻣﻘﺎدﻳﺮ وﻳﮋه (10) (Eigen Values)، ﻣﺆﻟﻔﻪﻫـﺎي اﺻـﻠﻲ ﺑـﻪ
ﺻــﻮرت ﺗﺮﻛﻴــﺐ ﺧﻄــﻲ از ﻣﺘﻐﻴﺮﻫــﺎي اوﻟﻴــﻪ و ﻣــﺴﺘﻘﻞ از ﻳﻜــﺪﻳﮕﺮ
ﺳﺎﺧﺘﻪ ﻣﻲ ﺷﻮﻧﺪ و در آﻧﺎﻟﻴﺰ داده ﻫﺎ، ﺑﻪ ﺟﺎي ﻣﺘﻐﻴﺮﻫﺎي اوﻟﻴـﻪ ﻣـﻮرد
اﺳﺘﻔﺎده ﻗﺮار ﻣﻲﮔﻴﺮﻧﺪ (11).
پیوست ها

[افزونه pdf غیرفعال شده است و قابل مشاهده نیست.]

بازگشت به “رگرسیون”

  • اطلاعات