مطالعات پیشآزمون- پسآزمون با گروه کنترل که بهعنوان طرح تجربی کلاسیک نامیده میشود بهطور گستردهای توسط پژوهشگران مورداستفاده قرار میگیرد (۱)؛ بهخصوص در مطالعاتی با رویکرد آموزشی که تغییر در نمرات پیامد بهعنوان نتیجه مداخله پژوهشی و متأثر از یادگیری تلقی میشود. (۲) بهطوریکه هدف اکثر طرحهای تجربی کلاسیک ارزیابی اختلاف نمرات پایه و نمرات کسبشده بعد از مداخله بین گروهها است (۳) بدین منظور در قدم اول تخصیص تصادفی افراد به گروه مداخله و کنترل صورت میپذیرد تا بدون وجود تورش انتخاب افراد در گروهها قرار بگیرند. اگرچه تصادفی سازی لزوماً بدین معنا نیست که گروه مداخله و کنترل ازنظر ویژگیهای جمعیت شناختی یکسان میشوند (۴) اما با توجه به اینکه یکسانسازی گروهها کار سادهای نیست باید از تخصیص تصادفی بهعنوان روشی برای متعادلسازی گروهها نسبت به متغیرهای مخدوشکننده استفاده کرد تا نتایج تحلیلهای آماری بااعتبار بیشتری تخمین زده شود (۵) با یا بدون تخصیص تصادفی درصورتیکه گروهها ازنظر متغیرهای زمینهای همسان نشده باشند، لازم است از روشهای آماری موجود برای حذف اثر دادههایی که همگنی پایهای ندارند استفاده کنیم. (۶)
روشهای آماری که جهت رفع ناهمگونی بین گروهها ازنظر نمرات پایهای دادهها در مطالعات پیشآزمون- پسآزمون استفاده میشوند بسیار مفید هستند (۷). با توجه به ماهیت مطالعات با طرحهای کلاسیک، تجربی ضرورت دارد روایی داخلی که درواقع اعتماد به صحت نتایج در مورد رابطه علیتی است مدنظر قرار گیرد تا اعتباری برای روایی خارجی که بهعنوان درجه قابلیت تعمیمپذیری اثرات درمان به جمعیت تحت مطالعه درمان و ابزارهای اندازهگیری است باشد. (۸) بهعبارتدیگر اگرچه روایی داخلی ضمانتی قطعی برای روایی خارجی محسوب نمیشود اما بهعنوان یک ضرورت جهت روایی خارجی و تعمیمپذیری نتایج به شمار میرود (۹) یکی از عوامل تهدیدکننده روایی داخلی و خارجی نمره پیشآزمون و اثر تعاملی (interaction effect) بین پیشآزمون و گروه است (۱۰) از طرفی دیگر اثر انتقال (carryover effect زمانی روی میدهد که درمان اولیه پاسخ مشارکتکنندگان را در درمان ثانویه تحت تأثیر قرار میدهد (۱۱) بهعبارتدیگر اثر انتقال زمانی رخ میدهند که پیشآزمون شرکتکنندگان را نسبت به مداخله و درمان حساس میکند و پاسخهای آنها را نمرات پسآزمون متفاوت از زمانی میکند که با نمرات پیشآزمون روبهرو نشده بودند (۱۲) شرکتکنندگان بهواسطه پیشآزمون با نمره پایینتر در مقایسه با همتایان خود با نمرات بالاتر احتمالاً نمرات کمتری نیز در نمره پسآزمون خواهند داشت حتی اگر درمان تأثیر قابلتوجهی بر نمرات پسآزمون داشته باشد. در مقابل، ایجاد تغییرات زیاد درنتیجه آزمون افرادی که نمرات بالاتری در پیشآزمون کسب کردهاند نیز موردتردید خواهد بود (۱۳) اگرچه تهدید بلوغ و تاریخ دو عامل بزرگ تهدیدکننده روایی داخلی در این نوع طرح محسوب میشوند، اما تعامل بین نمره پیشآزمون و نتیجه درمان (مداخله) بهعنوان یک عامل تهدیدکننده بزرگ و جدی روایی خارجی محسوب میشود (۱۲). درمجموع بحث قابلتوجهی نسبت به تجزیهوتحلیل دادههای پایهای این نوع مطالعه وجود دارد بهطوریکه بر اساس بررسی متون چهار روش استفاده میشود: ۱- تحلیل صرفاً روی نمرههای پسآزمون ۲- تحلیل روی اختلاف نمره - تحلیل آنکوا روی پسآزمون با کنترل پیشآزمون - تحلیل آنکوا روی اختلاف نمره با کنترل روی پیشآزمون (۱) اگرچه در شرایطی که اندازهگیری نمرات بعد از مداخله بیش از دو بار صورت بگیرد تحلیل اندازههای تکراری (Repeated Measures (ANOVA) نیز استفاده میشود (۱۲) یکی از راههای کنترل اثرات نمره پیشآزمون بهعنوان اثر انتقال استفاده از آزمون آنالیز کوواریانس (ANCOVA) است بهطوریکه شرایطی برای مطالعه فراهم میشود تا اثرات درمان را جدا از اثر بالقوه نمره پیشآزمون بررسی کند (۱۴) و به این سؤال پاسخ میدهد که آیا میانگین گروهی تعدیلشده بهصورت معناداری با یکدیگر تفاوت دارد یا ندارد؟ (۱۵) آنکوا با ترکیب رگرسیون و آنالیز واریانس بهعنوان یک تکنیک آماری و با کنترل اثر نمرات پیشآزمون در طرحهای پیشآزمون- پسآزمون تهدید روایی داخلی و خارجی را کنترل میکند و درنتیجه نتایج قابلاعتمادتری ارائه میکند (۶) بهعبارتدیگر با افزایش اعتبار نتایج تعمیمپذیری مطالعه بیشتر میشود (۹) آنکوا با کاهش خطای واریانس بین گروهی موجب افزایش و تقویت توان آماری نتایج میشود. (۱۵) برای درک این موضوع ابتدا باید آماره F را که بهعنوان ارزیابی اختلاف بین گروهها تلقی میشود درک کرد. آماره F با تقسیم واریانس توضیح دادهشده بین گروهی بهعنوانمثال بین گروه مداخله و کنترل با واریانس غیرقابل توضیح درونگروهی محاسبه میشود. بنابراین اگر این میزان از مقدار بحرانی بیشتر باشد میتوان نتیجه گرفت که اختلاف بین دو گروه معنادار است. (۱۶) همچنین واریانس غیرقابل توضیح شامل واریانس خطا بهطور مثال اختلاف بین افراد همراه با تأثیر عوامل دیگر است (۱۷) بنابراین تأثیر مخدوشکنندهها مثل نمره پیشآزمون کوواریانتها در مخرج کسر تأثیر میگذارد به همین دلیل زمانی که نمره کوواریانت را بر روی نمره پیامد مثلاً نمره پسآزمون کنترل میکنیم در حقیقت با کاهش مخرج کسر آماره F بیشتر میشود و درنتیجه توان آماری برای یافتن تأثیر معنادار در صورت وجود افزایش مییابد (۱۸) بهطورکلی یک مزیت تحلیل به کمک آنکوا این است که توان و قدرت بیشتری برای کشف اثرات درمان و مداخله دارد (۱۹)
همانند دیگر آزمونهای آماری برای استفاده از آزمون ANCOVA پیشفرضهایی باید محرز شود که شامل: ۱- خطی بودن رگرسیون (ارتباط خطی رگرسیونی بین متغیر وابسته و کوواریانت) ۲ همگنی واریانس خطاها
(خطا یک متغیر تصادفی با میانگین صفر و واریانس برابر برای گروههای مختلف درمان و مشاهدات) 3- استقلال خطاها (عدم همبستگی خطاها)4 - توزیع طبیعی خطاها، ۵- ارزیابی همگونی واریانسها به کمک آزمون Levene و یا Box و -۶ همگنی شیب رگرسیونها (شیب رگرسیونی خطوط مختلف در بین گروهها باید برابر باشد بهعبارتدیگر تعامل نمرات کوواریانت و متغیر مستقل در بین گروهها نباید اختلاف معناداری داشته باشد) (۲۰) یعنی اینکه شیبهای خطوط رگرسیونی برای کوواریانتها در ارتباط به متغیر (وابسته نیاز است که در بین گروهها یکسان باشد که به این پیشفرض همگنی شیب رگرسیونی گفته میشود که میتواند با یک آزمون F بر روی تعامل متغیرهای مستقل با کوواریانت ارزیابی شود. اگر آزمون F معنادار بود. بدین معنی است که این پیشفرض نقض شده است (۲۱) از میان فرضیات مطرحشده فرض ارتباط خطی بین نمرات پیشآزمون پسآزمون و همگنی شیب رگرسیونها بسیار مهم است بهطوریکه محققان در ابتدا باید این دو پیشفرض را ارزیابی کنند (۲۲).
برخی از پژوهشگران در مطالعه پیشآزمون- پسآزمون با گروه کنترل جهت ارزیابی آزمون فرضیه وجود اختلاف معنادار پس از مداخله بین گروهها، از آزمون تی مستقل به جای ANCOVA استفاده میکنند برای روشنتر شدن اختلاف نتایج آزمون تی مستقل با ANCOVA نویسندگان مقاله حاضر دادههای یک مطالعه فرضی را با این دو آزمون تحلیل و اندازه اثر به دست آمده از تحلیل با تی مستقل را با اندازه اثر ANCOVA مقایسه میکنند.
نتیجه گیری
همان طور که محقیق نشان دادند از دو رویکرد مختلف برای مقایسه و تحلیل نمرات به دست آمده در طرح تجربی دو گروهی با پیشآزمون- پسآزمون استفاده شد. اندازه اثر به دست آمده از آنکوا بیش از رویکرد آزمون تی مستقل بود. به نظر میرسد آزمون آنکوا که در حقیقت یک رگرسیون خطی چندگانه را اجرا میکند رویکردی مناسب برای مقایسه و تحلیل این دسته طرحها میباشد. اما برخی دیگر بیان میکنند درصورتیکه پیش شرط مهم همگنی شیب رگرسیونها برقرار نباشد باید از رویکردهای دیگری مثل آنکوای ناپارامتری Quade's، آنکوای ناپارامتری Sen's و Puri و یا آنکوای ناپارامتری برای رتبهها استفاده کرد (۶)
منبع:
شریف نیا سید حمید، یعقوب زاده آمنه. تجزیهوتحلیل مطالعات پیشآزمون- پسآزمون با گروه کنترل: مقایسه دو اندازه اثر. حیات. ۱۳۹۷; ۲۴ (۳): ۲۶۱-۲۶۸
1 - Schmidt NA, Brown JM. Evidence-based practice for nurses: appraisal and application of research.
3rd ed. Burlington, Massachusetts: Jones & Bartlett Learning; 2014.
2 - Dugard P. Todman J. Analysis of pre-test-post-test control group designs in educational research. Educational Psychology. 1995; 15(2): 181-98.
3- Johnson B, Christensen LB. Educational research: quantitative, qualitative, and mixed approaches.
4th ed. Thousand Oaks, California: SAGE Publications: 2010.
4- Altman DG, Dore CJ. Randomisation and baseline comparisons in clinical trials. Lancet. 1990 Jan 20; 335(8682): 149-53.
5- Zhao W, Berger V. Imbalance control in clinical trial subject randomization-from philosophy to strategy. J Clin Epidemiol. 2018 Sep; 101: 116-118.
6- Bonate PL. Analysis of pretest-posttest designs. 1st ed. Boca Raton: Chapman & Hall/CRC; 2000.
7- Roberts MC, Ilardi SS. Handbook of research methods in clinical psychology. Chichester: Wiley- Blackwell; 2008.
8 - Adams KA, Lawrence EK. Research methods, statistics, and applications. 1st ed. Thousand Oaks, California: SAGE Publications; 2014.
9 Bonita R, Beaglehole R, Kjellstrom T. Basic epidemiology. 2nd ed. Geneva: World Health Organization; 2006.
10 Lavrakas PJ. Encyclopedia of survey research methods. Thousand Oaks, California: SAGE Publications; 2008.
11 - Polit DF, Beck CT. Nursing research: generating and assessing evidence for nursing practice. 10th ed. Philadelphia: Lippincott Williams & Wilkins; 2017.
12 - Dimitrov DM, Rumrill PD Jr. Pretest-posttest designs and measurement of change. Work. 2003; 20(2): 159-65.
13- Grove SK, Gray JR, Burns N. Understanding nursing research: building an evidence-based practice.
6th ed. St. Louis, Missouri: Elsevier Saunders; 2015.
14 - Verma JP. Data analysis in management with SPSS software. New Delhi, India: Springer; 2013.
15- Tabachnick BG, Fidell LS. Using multivariate statistics. 7th ed. London: Pearson; 2018.
16 - Pace L. The excel data and statistics cookbook. 3rd ed. United States; 2012.
17 - Jackson SL. Research methods: a modular approach. 1st ed. Belmont, CA: Thomson Wadsworth; 2007.
18 - Kirk RE. Experimental design: procedures for the behavioral sciences. 4th ed. Thousand Oaks, California: SAGE Publications; 2012.
19 Vickers AJ, Altman DG. Analysing controlled trials with baseline and follow up measurements. BMJ. 2001; 323: 1123-1124.
20 - Field A. Discovering statistics using IBM SPSS statistics 4e+ eBook + Web Assign Single Term + SPSS version 23.0. 5th ed. London: SAGE Publications; 2018.
21 - Morgan GA, Leech NL, Gloeckner GW, Barrett KC. IBM SPSS for introductory statistics: use and interpretation. 5th ed. New York: Taylor & Francis; 2013.
نظرات