لجستیک چند جمله ای(Multinomial Logistic Regression) كه رگرسیون چند جمله ای" نامیده میشود برای پیشبینی یک متغیر وابسته اسمی(طبقهاي) با توجه به یک یا چند متغیر مستقل استفاده میشود. گاهی اوقات به عنوان توسعه رگرسیون لجستیک دو جملهای(binomial logistic regression) در نظر گرفته میشود تا یک متغیر وابسته با بیش از دو دسته را مجاز کند. همانند سایر انواع رگرسیون، رگرسیون لجستیک چند جملهای میتواند متغیرهای مستقل اسمی و/یا پیوسته و میتواند برهمکنشهایی بین متغیرهای مستقل برای پیشبینی متغیر وابسته داشته باشد.
به عنوان مثال، میتوانید از رگرسیون لجستیک چند جملهای استفاده کنید تا بفهمید مصرفکنندگان کدام نوع نوشیدنی را بر اساس موقعیت مکانی در بریتانیا و سن ترجیح میدهند (به عنوان مثال، متغیر وابسته «نوع نوشیدنی» است، با چهار دسته: قهوه، نوشابه، چای و آب – و متغیرهای مستقل شما، متغیر اسمی «مکان در انگلستان» است که با استفاده از سه دسته ارزیابی میشود – لندن، جنوب بریتانیا و شمال بریتانیا – و متغیر پیوسته، «سن» که بر حسب سال اندازهگیری میشود).
به طور متناوب، میتوانید از رگرسیون لجستیک چند جملهای برای درک اینکه آیا عواملی مانند مدت زمان استخدام در شرکت، مدت زمان کل اشتغال، شرایط تحصیلی(صلاحيت) و جنسیت بر موقعیت شغلی یک فرد تأثیر میگذارد یا نه استفاده کنید (یعنی متغیر وابسته «موقعیت شغلی» با سه دسته است مدیریت، مدیریت میانی و مدیریت ارشد – و متغیرهای مستقل متغیرهای پیوسته، «مدت زمان استخدام در شرکت» و «مدت زمان اشتغال کل» هستند که هر دو بر حسب سال اندازهگیری میشوند، متغیرهای اسمی، «شرايط تحصيلي» با چهار دسته – بدون مدرک تحصیلی، کارشناسی، کارشناسی ارشد و دکتری – «جنسیت» که دارای دو دسته «مرد» و «زن» است).
به عبارت ديگر رگرسیون لجستیک چند جمله ای یک آزمون آماری است که برای پیش بینی یک متغیر طبقه ای منفرد با استفاده از یک یا چند متغیر دیگر استفاده می شود. همچنین برای تعیین رابطه عددی بین چنین مجموعه ای از متغیرها استفاده می شود. متغیری که میخواهید پیشبینی کنید باید مقولهای باشد و دادههای شما باید با سایر مفروضات فهرستشده در زیر مطابقت داشته باشد.
مفروضات رگرسیون لجستیک چند جمله ای
هر روش آماری دارای مفروضاتی است. مفروضات به این معنی است که داده های شما باید ویژگی های خاصی را داشته باشند تا نتایج روش آماری دقیق باشد.
مفروضات رگرسیون لجستیک چند جمله ای عبارتند از:
خطی بودن
خطی بودن
رگرسیون لجستیک یک منحنی لجستیک را با داده های باینری متناسب می کند. این منحنی لجستیک را می توان به عنوان احتمال مرتبط با هر نتیجه در بین مقادیر متغیر مستقل تفسیر کرد. رگرسیون لجستیک فرض می کند که رابطه بین لگاريتم طبیعی این احتمالات (هنگامی که به صورت شانس بیان می شود) و متغیر پیش بینی شما خطی است.
بدون داده گمشده
متغیرهایی که به آنها اهمیت می دهید نباید دارای مقادیر پرت باشند. رگرسیون لجستیک به نقاط پرت یا داده هایی که مقادیر غیرمعمول بزرگ یا کوچک دارند حساس است. شما می توانید با ترسیم آنها و مشاهده اینکه آیا هر نقطه ای از سایر نقاط دور است، متوجه شوید که آیا متغیرهای شما دارای نقاط پرت هستند یا خیر. ابزار مورد استفاده نمودار جعبه اي يا باكس پلات مي باشد.
استقلال مشاهدات
هر یک از مشاهدات شما (نقاط داده) باید مستقل باشد. این بدان معنی است که هر مقدار از متغیرهای شما به هیچ یک از متغیرهای دیگر "وابسته" ندارد. به عنوان مثال، این فرض معمولاً هنگامی نقض می شود که در طول زمان چندین نقطه داده از یک واحد مشاهده وجود داشته باشد (مثلاً موضوع/شرکت کننده/مشتری/فروشگاه)، زیرا نقاط داده از همان واحد مشاهده احتمالاً مرتبط هستند یا بر آن تأثیر می گذارند.
عدم وجود همخطي
همخطی چندگانه به سناریویی اطلاق می شود که دو یا چند متغیر مستقل به طور اساسی با یکدیگر همبستگی داشته باشند. وقتی همخطی وجود دارد، ضرایب رگرسیون و اهمیت آماری ناپایدار و کمتر قابل اعتماد میشوند، اگرچه تأثیری بر تناسب مدل با دادهها ندارد.
چه زمانی از رگرسیون لجستیک چند جمله ای استفاده کنیم؟
شما باید از رگرسیون لجستیک چند جمله ای در سناریو زیر استفاده کنید: شما می خواهید از یک متغیر در پیش بینی متغیر دیگر استفاده کنید، یا می خواهید رابطه عددی بین دو متغیر را کمی کنید. متغیری که می خواهید پیش بینی کنید (متغیر وابسته شما) دسته بندی است متغیرهای وابسته شما همگی پیوسته نیستند
این راهنمای "شروع سریع" به شما نشان میدهد که چگونه یک رگرسیون لجستیک چند جملهای را با استفاده از نرم افزار Spss انجام و برخی از جداول تولید شده يا خروجي هاي نرم افزار Spss را توضیح دهید. با این حال، قبل از اینکه شما را با این روش آشنا کنیم، باید مفروضات مختلفی را که دادههای شما باید رعایت کنند تا یک رگرسیون لجستیک چند جملهای به شما یک نتیجه معتبر بدهد، بدانید. در ادامه به این فرضیات میپردازیم.
فايل آموزش حاوي 16 صفحه در فرمت word بهمراه تحليل هر جدول از خروجي نرم افزار spss بوده كه شامل قسمت مقدمه و شرايط استفاده، انواع متغيرها ، تحقيقات تجربي و غيرتجربي و توضيح رگرسیون لجستیک چند جملهاي با ذكر يك مثال به صورت مرحله به مرحله مي باشد.
نظرات