Cohen’s D - اندازه اثر در آزمون T
Cohen’s D اختلاف بین 2 میانگینی می باشد که توسط انحراف معیار بیان شده است.
- Cohen’s D- فرمول ها
- Cohen’s D و توان
- Cohen’s D& همبستگی دو رشته ای
- Cohen’s D- تفسیر
- ابزار اکسل برایCohen’s D
چرا به Cohen’s D نیاز داریم؟
فرزندان والدین متاهل و مطلقه برخی آزمایش های روانشناختی را ، انجام داده اند:مثل اضطراب ، افسردگی و سایر آزمایشات که برای مقایسه 2 گروه از کودکان بوده است ، میانگین نمرات آنها با استفاده از آزمون t دو نمونه مستقل مقایسه شده است. که نتایج آن در زیر نشان داده شده است.
برخی از نتیجه گیری های اساسی به شرح زیر می باشد:
- همه اختلافات میانگین منفی است. بنابراین گروه دوم – فرزندان والدین مطلقه- در تمام آزمون ها از توانایی بالاتری برخوردارمی باشند.
- به جز آزمون اضطراب، همه اختلاف ها، از نظر آماری معنی دارند.
- میانگین اختلافات بین 1.3-و9.3-نمره می باشد.
با این حال، آنچه که می خواهیم بدانیم این است که مقدار اختلافات، کوچک، متوسط یا بزرگ می باشند؟ پاسخ به این پرسش، به دو دلیل دشوار است:
- نمرات آزمون روانشناختی، واحد اندازه گیری ثابتی مانند متر، دلار یا ثانیه ندارد.
- معنی داری آماری به معنای معنی داری عملی نیست(یا برعکس). چرا که مقادیر p به شدت به اندازه نمونه بستگی دارند.
یک راه حل برای هر دو مسئله ذکرشده دربالا،استفاده از انحراف استاندارد به عنوان یک واحد اندازه گیری است مانند کاری که در هنگام محاسبه نمرات z انجام می دادیم. و اختلاف میانگین بیان شده در انحراف استاندارد -Cohen’s D- مقیاس اندازه اثر قابل تفسیر، در آزمونهای t می باشد.
Cohen’s D - فرمول ها
Cohen’s D به شکل زیر محاسبه می شود:
وقتی که
- M1 و M2 میانگین نمونه برای گروههای 1 و 2
- Sp نشانگر انحراف معیار استاندارد جامعه باشد .
اما دقیقاً “برآورد انحراف معیار جوامع ادغام شده” چه می باشد؟ خوب، در آزمون t دو نمونه مستقل فرض می کنیم که 2 گروهی را که مقایسه می کنیم انحراف معیار یکسانی در جامعه دارند. و ما آن را با “جمع کردن” هر 2 انحراف استاندارد نمونه، برآورد می کنیم
خوشبختانه، به ندرت به این فرمول نیاز پیدا میکنیم: JASP یا Excel، به راحتی می توانند آزمون t را به همراه Cohen’s D برایمان محاسبه کنند.
Cohen’s D در JASP
اجرای دقیق همان آزمونهای t در JASP و درخواست “اندازه اثر” به همراه نتایج فواصل اطمینان، خروجی نشان داده شده در زیر می باشد.
توجه داشته باشید که Cohen’s D بین 0.43- و 2.13- می باشد. برخی از دستورالعمل های حداقلی، اینگونه می باشد
- d = 0.20 نشان دهنده یک اثر کم است ،
- 0.50 =d نشانگر تأثیر متوسط است.
- d = 0.80 نشان دهنده تأثیر زیاد است.
و حالا ما آن را در اختیار داریم. به طور تقریبی، اثرات برای
- آزمون های اضطراب (43 /0- =d) و افسردگی (48 / 0- =d) متوسط هستند.
- آزمون رفتار اجباری (71 / 0- =d) نسبتاً زیاد است.
- آزمون رفتار ضد اجتماعی (13 / 2- =d) بسیار زیاد می باشد.
بعداً به تفسیر Cohen’s D به طور مفصل خواهیم پرداخت. در ابتدا می خواهیم ببینیم که Cohen’s D چگونه به توان و همبستگی نقطه ای-دو رشته ای، مقدار اندازه اثر متفاوت، در آزمون t مربوط می شود.
Cohen’s D و توان
خیلی جالب است که توان آزمون t را، می توان مستقیماً از Cohen’s D محاسبه کرد. این امر نیاز به مشخص کردن اندازه هر دو نمونه و مقدار α، معمولا برابر با 0.05 دارد. تصویر زیر -که با G * Power مشخص شده است- نشان می دهد که چگونه توان با اندازه کل نمونه، افزایش می یابد. فرض براین است که هر دو نمونه به یک اندازه بزرگ هستند.
اگر 0/05 = α را آزمون کنیم، می خواهیم توان (1 – β) = 0/8 را داشته باشیم
اگر d = 0.8 (اثر بزرگ)باشد، انتظار داریم از 2 نمونه n = 26 (کل N = 52) استفاده کنید.
اگر از d = 0.5 (اثر متوسط)باشد انتظار داریم ، از 2 نمونه n = 64 (کل N = 128) استفاده کنید.
اگر از d = 0.2 (تأثیر ناچیز) انتظار داریم ، از 2 نمونه n = 394 (کل N = 788) استفاده کنید.
Cohen’s D و توزیع های همپوشانی
فرضیات مربوط به آزمون t دو نمونه مستقل موارد زیر می باشند
- مشاهدات مستقل؛
- نرمال بودن: متغیر هدف، باید به طور نرمال در هر زیر جامعه، توزیع شده باشد.
- همگنی: هر دو زیرمجموعه باید دارای انحراف معیارهای استاندارد و -همچنین- واریانس های برابر باشند.
اگر فرضیات 2 و 3 برقرار باشند، Cohen’s D نشان می دهد که چند درصد از توزیع فراوانی ها، با یکدیگر همپوشانی دارند. مثال زیر نشان می دهد که چگونه برخی از مردان در جامعه با 69٪ از برخی زنان جامعه، هنگامی که 0.8 = Cohen’s D، که تأثیر بزرگی می باشد، همپوشانی دارند.
با کاهش Cohen’s D درصد همپوشانی افزایش می یابد. در این حالت، نقاط میانی توزیع به یکدیگر یکدیگر نزدیک میشوند. برخی از معیارهای اصلی، در جدول تفسیر، گنجانده شده است که در عرض یک دقیقه ارائه خواهیم داد.
Cohen’s D & همبستگی دورشته ای- نقطه ای
مقیاس اندازه اثر دیگری برای آزمون t دو نمونه مستقل ، Rpb ،که همبستگی نقطه ای-دو رشته ای است، می باشد. که به سادگی همبستگی پیرسون، بین یک متغیر کمی و دوگانه است. می توان آن را از Cohen’s D به صورت زیر محاسبه کرد.
3 مقدار از این معیار
- Cohen’s d = 0.2به معنای Rpb ± 0.100 می باشد.
- Cohen’s d = 0.5به معنای Rpb ± 0.243 است.
- Cohen’s d = 0.8دلالت بر Rpb ± 0.371 دارد.
متناوباً، Rpb را از مقدار t و درجه آزادی آن به صورت زیر محاسبه کنید:
Cohen’s D - تفسیر
جدول زیر خلاصه ای از قواعد مربوط به Cohen’s D است که در پاراگراف های قبلی راجع آن صحبت کردیم.
COHEN’S D | INTERPRETATION | RPB | % OVERLAP | RECOMMENDED N |
d = 0.2 | Small effect | ± 0.100 | ± 92% | 788 |
d = 0.5 | Medium effect | ± 0.243 | ± 80% | 128 |
d = 0.8 | Large effect | ± 0.371 | ± 69% | 52 |
ابزار اکسل برای Cohen’s D
جدا از گرد کردن، همه خروجی ها با نتایج بدست آمده از JASP که قبلاً مشاهده کردیم، یکسان هستند. با این حال، ابزار اکسل نیازی به JASP یا حتی داده های خام ندارد: تعداد معدودی از آمار توصیفی -احتمالاً در برخی از گزارش ها- کافیست.
قالب ورودی مخصوصاً برای کاربران SPSS مفید می باشد: دستور اولیه، MEANS اگر حداقل شامل 2 متغیر باشد، در قالب درست، نتایج صحیحی را به ما می دهد. یک مثال (با استفاده از divorced) می باشد.
* با جداکردن(کات کردن)، برای کپی کردن در اکسل، جدولی شامل، N، میانگین و انحراف استاندارد برای نمرات آزمون ایجاد کنید.
means anxi to anti by divorced
/cells count mean stddev.
کپی پیست کردن جدول خروجی در SPSS به این دلیل است که اکسل، اعشار (پنهان) نتایج را حفظ می کند. این موارد را می توان در اکسل قابل مشاهده کرد تا از مقدار اشتباه، به دلیل گرد گردن اعداد، کاسته شود.
یادداشت های نهایی
نظر من این است که Cohen’s D، مفید می باشد، اما هنوز هم R2، که همبستگی نقطه ای دورشته ای می باشد را ترجیح می دهم. دلیل آن هم، مطابقت با سایر مقیاس های اندازه گیری اثر است. آزمون t دو نمونه مستقل، مدل خاصی از ANOVA (تحلیل واریانس یکطرفه)می باشد. و اگر بخواهیم آن را بصورت ANOVA اجرا کنیم، R2 = η2 (eta squared): هر دو نسبت واریانس حساب شده توسط متغیر مستقل هستند. بنابراین باید از مقیاس اندازه ی اثر متفاوتی استفاده کنیم.
چنانچه به جای 3+، 2 زیر جامعه را مقایسه کنیم، چه اتفاقی می افتد؟ این نوع از استدلال، همچنین با گزارش معنی داری یکطرفه برای آزمونهای t، بحث می کند: اگر آزمون t را به صورت ANOVA اجرا کنیم، p – مقدار، همیشه معنی داری، برای آزمون t مربوطه می باشد. پس چرا باید مقیاس متفاوتی را برای مقایسه 2 میانگین به جای 3+ ،گزارش دهید؟
اما به هر حال، این کار را، امروز انجام می دهیم. اگر بازخورد مثبت یا منفی دارید، لطفاً نظر خود را برای ما در زیر بنویسید.