آزمون من ویتنی جایگزینی برای آزمون t نمونه های مستقل است ، زمانی که مفروضات مورد نیاز توسط داده ها برآورده نمی شود. متداول ترین سناریو برای  آزمون کردن یک متغیر نتیجه ای که معمولاً توزیع نرمال ندارد در یک نمونه کوچک (مثلاً n <25  ) است .

آزمون من ویتنی همچنین به عنوان آزمون ویلکاکسون برای نمونه های مستقل شناخته می شود-که نباید با آزمون علامت رتبه های ویلکاکسون برای نمونه های مرتبط اشتباه گرفته شود .

سوال تحقیق

ما در طول این آموزش از adratings.sav استفاده می کنیم که تصویری از آن در بالا نشان داده شده است. این داده ها شامل رتبه بندی 3 آگهی تجاری خودرو توسط 18 پاسخ دهنده ای است که از نظر جنسیت و رده سنی متعادل اند. سوال تحقیقی ما این است که آیا مردان و زنان تبلیغات تجاری ما را به طور یکسان قضاوت می کنند؟ برای هر تبلیغ جداگانه ، فرضیه صفر ما این است:“میانگین رتبه بندی مردان و زنان برابر است.”

بررسی سریع داده ها - جداسازی هیستوگرام

قبل از اجرای هرگونه آزمایش معنی داری ، ابتدا فقط بررسی کنیم که داده های ما در وهله اول چگونه هستند. یک راه عالی برای انجام این کار اجرای هیستوگرام ها است . از آنجا که ما به تفاوت بین پاسخگویان زن و مرد علاقه مند هستیم ، بیایید هیستوگرام های خود را بر اساس جنسیت تقسیم کنیم. تصاویر زیر شما را راهنمایی می کند.

جداسازی هیستوگرام - دستور

با استفاده از منو در ردیف اول می توانید دستور زیر را انجام دهید. ما آن را دوبار کپی-پیست می کنیم، نام متغیر را جایگزین کرده و اجرا می کنیم.

*Run split histograms to see if data look plausible.

GRAPH
/HISTOGRAM=ad1
/PANEL COLVAR=gender COLOP=CROSS.

GRAPH
/HISTOGRAM=ad2
/PANEL COLVAR=gender COLOP=CROSS.

GRAPH
/HISTOGRAM=ad3
/PANEL COLVAR=gender COLOP=CROSS.

جداسازی هیستوگرام - نتایج

همه نتایج قابل قبول به نظر می رسند . ما هیچ مقدار یا الگوی غیرمعمولی نمی بینیم. ثانیاً، به نظر نمی رسد که متغیرهای نتیجه ما توزیع نرمال داشته باشند و نمونه ما فقط n = 18 است پس نمی توانیم از آزمون t استفاده کنیم.
با نگاهی دقیق به هیستوگرام های تقسیم شده ، می توانید ببینید کدام آگهی های تبلیغاتی از طرف پاسخ دهندگان مرد در مقابل پاسخ دهندگان زن مطلوب ترارزیابی شده است. اما حتی اگر امتیاز آنها  در جامعه بزرگی از زنان و مردان کاملا مشابه باشد، ممکن است تفاوت هایی در نمونه های کوچک ببینیم. تفاوت در نمونه های بزرگ بعید است با این حال، اگر فرضیه صفر – میانگین های برابر جامعه – واقعاً درست باشد. اکنون خواهیم فهمید که آیا تفاوت نمونه های ما به اندازه کافی برای رد این فرضیه بزرگ است یا خیر.

آزمون من ویتنی در SPSS - منو

توضیح قسمت (6) بسته به نسخه SPSS  شما، ممکن است زیر منوی Exact را در دسترس داشته باشید یا نداشته باشید. اگر آن را ندارید، فقط مرحله زیر را انجام دهید.

آزمون من ویتنی در– SPSS دستور

توجه: انتخاب  Exact منجر به یک خط اضافی در دستور می شود (در زیر حذف شده است).

*Run Mann-Whitney test on 3 outcome variables at once.

NPAR TESTS
/M-W= ad1 ad2 ad3 BY gender(0 1)
/MISSING ANALYSIS.

آزمون من ویتنی در SPSS - خروجی آمار توصیفی

آزمون من ویتنی اساساً همه نمرات را با شماره رتبه آنها جایگزین می کند: 1 ، 2 ، 3 تا 18 برای هر 18 مورد. نمرات بالاتر، رتبه بالاتری کسب می کنند. اگر متغیر گروه بندی (جنسیت) بر رتبه بندی ما تأثیر نمی گذارد، میانگین رتبه ها باید برای مردان و زنان تقریباً برابر باشد.

اولین آگهی تجاری ما (“ماشین خانواده”) بیشترین تفاوت را در میانگین رتبه ها بین پاسخ دهندگان زن و مرد نشان می دهد: زنان بسیار مشتاق تر به نظر می رسند. الگوی معکوس – بسیار ضعیف تر – برای دو تبلیغ دیگر مشاهده می شود.

آزمون من ویتنی در SPSS - خروجی معنی داری آزمون

بسته به نسخه SPSS و اندازه نمونه ممکن است برخی از خروجی های نشان داده شده در زیر وجود نداشته باشد: برای n = 40 مورد یا کمتر ، همیشه نتایج 3 دقتی دریافت خواهید کرد .

1  Mann-Whitney U و Wilcoxon W  آماره آزمون ما هستند. آنها تفاوت میانگین رتبه اعداد را در یک عدد خلاصه می کنند. 

2 ما ترجیح می دهیم Exact Sig. (2-tailed) را گزارش دهیم p-value  دقیق تصحیح شده برای گره ها.

3 Exact Sig. [2*(1-tailed Sig.)]  بهتر است، چون  p-value دقیق است اما برای گره ها تصحیح نشده است. 

4 برای اندازه نمونه های بزرگتر، آزمون آماری تقریباً نرمال توزیع شده است. p-value تقریبی (یا ” مجانبی “) بر اساس توزیع نرمال استاندارد است.  z-score و p-value گزارش شده توسط SPSS بدون تصحیح پیوستگی لازم محاسبه می شود و منجر به برخی اشتباهات (جزئی) می شود.

آزمون من ویتنی در SPSS - نتیجه گیری

همانطور که دیدیم، خروجی آزمون SPSS من ویتنی ممکن است شامل 3 مقدار مختلف p-value دوطرفه باشد. همه آنها نتیجه یکسانی دارند اگر از رویکرد رد فرضیه صفر پیروی کنیم که p < 0.05 باشد: زنان نسبت به مردان از تبلیغات “ماشین خانوادگی” بیشتر استقبال کردند (p = 0.001). برای دو تبلیغ دیگر تفاوت جنسیتی وجود نداشت (p > 0.10) . 0.001= p-value احتمال 1 در 1000 را نشان می دهد: اگر جامعه مردان و زنان به این تبلیغات به طور یکسان امتیاز دهند، در این صورت شانس پیدا کردن اختلاف زیاد در نمونه 1 در 1000 است. احتمالاً، جامعه مردان و زنان به طور یکسان به آن امتیاز نمی دهند.

ممنون از مطالعه شما