ضريب همبستگی دورشته ای نقطه ای(point-biserial correlation) چیست؟
ضريب همبستگی دورشته ای نقطه ای برای درک قدرت رابطه بین دو متغیر استفاده می شود. متغیرهای مورد علاقه شما باید شامل یک متغیر پیوسته و یک متغیر باینری( صفر و يك ) باشند.
مفروضات ضريب همبستگی دورشته ای نقطه ای
هر روش آماری دارای مفروضاتی است. مفروضات به این معنی است که داده های شما باید ویژگی های خاصی را داشته باشند تا نتایج روش آماری دقیق باشد.
مفروضات ضريب همبستگی دورشته ای نقطه ای شامل موارد زیر است:
- پیوسته و باینری
- داراي توزيع نرمال
- بدون داده گمشده يا پرت
- واریانس های برابر
بیایید هر یک از اینها را جداگانه بررسی کنیم.
پیوسته و باینری
برای این آزمون باید یک متغیر پیوسته و یک متغیر باینری داشته باشید. Continuousيا پيوسته به این معنی است که متغیر می تواند هر مقدار معقولی را به خود بگیرد. چند نمونه خوب از متغیرهای پیوسته شامل سن، وزن، قد، نمرات آزمون، نمرات نظرسنجی، حقوق سالانه و غیره است.
باینری به این معنی است که متغیر شما یک دسته است که فقط دو مقدار ممکن دارد. برخی از نمونههای خوب متغیرهای باینری عبارتند از سیگاری (بله/خیر)، جنسیت (مرد/زن) یا هر متغیر True/False يا 0 يا 1.
داراي توزيع نرمال
متغیری که شما به آن اهمیت می دهید باید به صورت نرمال پخش شود. در آمار، به آن توزیع نرمال گفته می شود (معروف به این می شود که وقتی نمودار داده ها را ترسيم می کنید، باید مانند یک منحنی زنگوله به نظر برسد). فقط در صورتی از ضريب همبستگی دورشته ای نقطه ای روی داده های خود استفاده کنید که متغیری که به آن اهمیت می دهید به طور نرمال توزیع شده باشد.
بدون داده گمشده يا پرت
متغیرهایی که به آنها اهمیت می دهید نباید دارای مقادیر پرت باشند. ضريب همبستگي دورشته اي نقطه اي نسبت به نقاط پرت یا دادههایی که مقادیر غیرمعمول بزرگ یا کوچک دارند، حساس است. شما می توانید با ترسیم آنها و مشاهده اینکه آیا هر نقطه ای از سایر نقاط دور است، متوجه شوید که آیا متغیرهای شما دارای نقاط پرت هستند یا خیر.
واریانس های برابر
یکی از مفروضات همبستگي دورشته اي نقطه اي این است که بین دو گروه متغیر باینری پراکندگی مشابهی وجود دارد. شما می توانید این فرض را با ترسیم متغیر پیوسته خود در هر یک از دو گروه خود و تشخیص بصری اینکه آیا گسترش داده ها مشابه است، بررسی کنید.
چه زمانی از ضريب همبستگی دورشته ای نقطه ای استفاده کنیم؟
در سناریوی زیر باید از ضريب همبستگی دورشته ای نقطه ای استفاده کنید:
شما می خواهید رابطه بین دو متغیر را بدانید
متغیرهای مورد علاقه شما شامل یک متغیر پیوسته و یک متغیر باینری است
شما فقط دو متغیر دارید
بیایید این موارد را روشن کنیم تا به شما کمک کنیم بدانید چه زمانی باید از ضريب همبستگی دورشته ای نقطه ای استفاده کنید
رابطه بين دو متغير
شما به دنبال یک آزمون آماری برای بررسی چگونگی ارتباط دو متغیر هستید. انواع دیگر تجزیه و تحلیل عبارتند از: آزمون تفاوت بین دو متغیر یا پیش بینی یک متغیر با استفاده از متغیر دیگر (پیش بینی).
یک متغير پیوسته و یکی متغير باينري
برای این آزمون باید یک متغیر پیوسته و یک متغیر باینری داشته باشید. Continuous به این معنی است که متغیر می تواند هر مقدار معقولی را به خود بگیرد. چند نمونه خوب از متغیرهای پیوسته شامل سن، وزن، قد، نمرات آزمون، نمرات نظرسنجی، حقوق سالانه و غیره است.
باینری به این معنی است که متغیر شما یک دسته است که فقط دو مقدار ممکن دارد. برخی از نمونههای خوب متغیرهای باینری عبارتند از سیگاری (بله/خیر)، جنسیت (مرد/زن) یا هر متغیر True/False یا 0/1.
نكته: اگر دو متغیر پیوسته دارید، باید از همبستگی پیرسون استفاده کنید. و اگر حداقل یک متغیر ترتیبی دارید، باید به جای آن از ضريب همبستگي اسپيرمن يا تاوكندال استفاده کنید.
داشتن دو متغیر
ضريب همبستگی دورشته ای نقطه ای را فقط می توان برای مقایسه دو متغیر استفاده کرد.
مثال ضريب همبستگی دورشته ای نقطه ای
متغیر 1: ارتفاع.
متغیر 2: جنسیت.
در این مثال، ما به رابطه بین قد و جنسیت علاقه مندیم. برای شروع، ما این داده ها را از گروهی از افراد جمع آوری می کنیم. قبل از اجرای ضريب همبستگی دورشته ای نقطه ای، بررسی می کنیم که متغیرهای ما با فرضیات روش مطابقت دارند. پس از تأیید اینکه متغیر پیوسته ما به طور نرمال توزیع شده است، هیچ گونه داده پرت ندارد و دارای واریانس های مساوی در هر جنسیت است، با تحلیل پیش می رویم.
تجزیه و تحلیل منجر به یک ضریب همبستگی (به نام "r") و یک مقدار p خواهد شد. مقادیر R از 1- تا 1 متغیر است. مقدار منفی r نشان می دهد که متغیرها رابطه معکوس دارند، یا زمانی که یک متغیر افزایش می یابد، متغیر دیگر کاهش می یابد. از سوی دیگر، مقادیر مثبت نشان می دهد که وقتی یک متغیر افزایش می یابد، متغیر دیگر نیز افزایش می یابد. در این مثال، مثبت یا منفی بودن r بستگی به این دارد که کدام جنسیت را با مقدار 0 و کدام را با مقدار 1 نشان می دهید.
نظرات