آزمون شاپیرو -ویلک - چیست؟
آزمون شاپیرو -ویلک بررسی می کند که آیا متغیری دارای توزیع نرمال در جامعه است. شاپیرو-ویلک هم دقیقاً همان هدف آزمون کلموگروف- اسمیرنوف (Kolmogorov-Smirnov) را دارد. برخی از آمارشناسان ادعا می کنند که آزمون کلموگروف-اسمیرنوف مناسب نیست، چون که قدرت آماری پایینی دارد. اما بقیه کارشناسان مخالف هستند.
به عنوان مثالی از آزمون شاپیرو-ویلک، فرض کنید یک دانشمند ادعا می کند که زمان واکنش همه افراد-یک جامعه- در برخی کارها توزیع نرمال دارد. او یک نمونه تصادفی از N = 233 نفر می گیرد و زمان واکنش آنها را اندازه گیری می کند. هیستوگرام زیر نتایج را نشان می دهد.
این توزیع فراوانی تا حدودی دو حالته به نظر می رسد. به غیر از این ، منطقی به نظر می رسد – اما نه دقیقاً – نرمال . به هرحال ، نتایج نمونه معمولاً با همتایان جامعه آنها متفاوت است. سوال بزرگ این است: چقدر احتمال دارد توزیع مشاهده شده که زمان واکنش است دقیقاً توزیع نرمان در کل جامعه داشته باشد. آزمون شاپیرو-ویلک دقیقاً به آن پاسخ می دهد.
آزمایش شاپیرو -ویلک چگونه کار می کند؟
یک توضیح فنی صحیح در این صفحه ویکی پدیا ارائه شده است . یک توضیح ساده تر-اما از نظر فنی درست نیست: آزمون شاپیرو-ویلک ابتدا شباهت بین مشاهدات و توزیع نرمال را به صورت یک عدد واحد کمی می کند: به توزیع مشاهدات یک منحنی نرمال مانند شکل زیر اضافه میکنیم. سپس محاسبه می کند که نمونه ما چند درصد با آن همپوشانی دارد: درصد تشابه .
در نهایت ، آزمایش شاپیرو-ویلک احتمال یافتن درصد شباهت این مشاهدات را محاسبه می کند. این کار را با این فرض انجام می دهد که توزیع جامعه کاملاً نرمال است:این فرضیه صفر است .
آزمون شاپیرو -ویلک - فرضیه صفر
فرضیه صفر برای آزمون شاپیرو-ویلک این است:
“متغیر دارای توزیع نرمال در جامعه مورد بررسی است.”
یک روش متفاوت برای بیان همین جمله این است که مقادیر متغیر یک نمونه تصادفی ساده توزیع نرمال دارند. به عنوان یک قاعده کلی ، اگر p < 0.05 ، فرضیه صفر را رد کنید. بنابراین در این مورد نتیجه می گیریم که متغیر ما توزیع نرمال ندارد.
چرا؟ خوب، درصورتیکه فرضیه صفر صحیح باشد p اساساً احتمال یافتن داده های ما است. اگر این احتمال (بسیار) اندک باشد – اما ما به هر حال داده های خود را پیدا کردیم – فرضیه صفر احتمالاً اشتباه است .
آزمون شاپیرو -ویلک - داده های مثال در SPSS
نمونه ای از N = 236 نفر تعدادی از کارهای سرعتی را انجام دادند. زمان واکنش آنها در speedtasks.sav است که قسمتی از آن در زیر نشان داده شده است. ما فقط از پنج آزمایش اول در متغیرهای r01 تا r05 استفاده می کنیم.
توصیه می کنم همیشه همه متغیرهایی را که می خواهید تجزیه و تحلیل کنید کاملاً بررسی کنید. از آنجایی که زمان واکنش ها در میلی ثانیه متغیرهای کمی هستند ، برخی هیستوگرام ها را روی آنها اجرا می کنیم. من ترجیح می دهم این کار را از دستور کوتاه زیر انجام دهیم . روشهای ساده تر- اما کندتر- در ایجاد هیستوگرام در SPSS آمده است
*Quick histograms with normal curves as data check.
frequencies r01 to r05
/format notable
/histogram normal.
نتیجه
توجه داشته باشید که برخی از 5 هیستوگرام به هم ریخته به نظر می رسند. برخی از داده ها خراب هستند و بهتر است به طور جدی مورد تجزیه و تحلیل قرار نگیرند. آزمایش 4 استثنا است (در زیر نشان داده شده است) که قابل پذیرش به نظر می رسد و حتی توزیع نرمال دارد.
آمار توصیفی – چولگی و کشیدگی
اگر این مقاله را برای تکمیل تکلیفی می خوانید، احتمالاً از شما خواسته می شود که برخی از آمار توصیفی را برای برخی متغیرها گزارش دهید. اینها اغلب شامل میانه، انحراف معیار، چولگی و کشیدگی است. چرا؟ خوب، برای توزیع نرمال،
- کشیدگی = 0 : یعنی کاملاً متقارن است و
- چولگی = 0 نیز: یعنی نه قله دارد (“leptokurtic “)و نه مسطح است (“platykurtic “) .
بنابراین اگر از چنین توزیعی مقادیر زیادی را نمونه برداری کنیم، متغیر حاصله باید دارای کشیدگی و چولگی نزدیک به صفر باشد. شما می توانید این اطلاعات آماری را از فراوانی ها دریافت کنید، اما من ترجیح می دهم از MEANS استفاده کنم: این بهترین فرمت جدول را دارد و دستور آن کوتاه و ساده است.
*جدول توصیفی*Descriptives table.
means r01 to r05
/cells count mean median stddev skew kurt.
*Optionally: transpose table (requires SPSS 22 or higher).
output modify
/select tables
/if instances = last /*process last table in output, whatever it is…
/table transpose = yes.
نتیجه
آزمایشات 2، 3 و 5 همه دارای چولگی و یا کشیدگی هستند. این نشان می دهد که آنها توزیع نرمال در کل جامعه ندارند. چولگی و کشیدگی در آزمایشات 1 و 4 به صفر نزدیک شده است.
بنابراین اکنون که یک ایده اساسی داریم که داده های ما چگونه به نظر می رسند، بیایید به آزمایش واقعی ادامه دهیم.
اجرای آزمون شاپیرو -ویلک در SPSS
تصاویر زیر شما را در اجرای صحیح آزمون شاپیرو -ویلک در SPSS راهنمایی می کند. دستور حاصله را نیز اضافه می کنیم.
با دنبال کردن این عکس ها، دستور زیر به دست می آید.
*Shapiro-Wilk test pasted from Analyze – Descriptive Statistics – Explore…
EXAMINE VARIABLES=r01 r02 r03 r04 r05
/PLOT BOXPLOT NPPLOT
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING PAIRWISE /*IMPORTANT!
/NOTOTAL.
اجرای این دستور یک دسته خروجی ایجاد می کند. با این حال ، جدولی که ما به دنبال آن هستیم – “آزمون نرمال بودن” – در زیر نشان داده شده است.
آزمون شاپیرو -ویلک : تفسیر
ما فرضیه های صفر توزیع نرمال جامعه را برای آزمایشات 1 ، 2 ، 3 و 5 در α = 0.05 رد می کنیم.” Sig ” یا همان p احتمال یافتن مشاهدات –یا بیشتر –انحراف از نرمال بودن در نمونه است اگر توزیع کاملاً نرمال باشد در جامعه. حال اگر آزمایش 1 توزیع نرمال در جامعه داشته باشد ، احتمال یافتن این داده های نمونه فقط 0.01 یا 1% است. بعید است که این مقادیر از توزیع نرمال نمونه برداری شده باشند. بنابراین توزیع جامعه احتمالاً نرمال نیست.
بنابراین ما این فرضیه صفر را رد می کنیم. نتیجه گیری : آزمایش های 1 ، 2 ، 3 و 5 احتمالاً توزیع جامعه نرمال نیست.
تنها استثنا آزمایش چهارم است: اگر این متغیر توزیع نرمال در جامعه داشته باشد ،0.075 یا7.5% احتمال یافتن غیرنرمال بودن مشاهدات در داده های ما وجود دارد. یعنی احتمال منطقی وجود دارد که این غیرنرمال بودن فقط به دلیل خطای نمونه گیری باشد. بنابراین برای آزمایش 4، ما فرضیه صفر نرمال بودن جامعه را می پذیریم. زیرا p> 0.05 ما نمی توانیم به طور قطعی بگوییم که توزیع جامعه نرمال است. اما با توجه به این داده ها، ما آن را باور می کنیم.
گزارش آزمون شاپیرو-ویلک به سبک APA
برای گزارش آزمایش شاپیرو -ویلک به سبک APA ، ما 3 عدد را شامل می شود:
- آزمون آماری W – برچسب غلط “Statistic” رادر SPSS دارد؛
- مرتبط با آن df -مخفف درجه آزادی و
- سطح معنی داری آن p با برچسب “Sig.” در SPSS
تصویر زیر چگونه قرار دادن این اعداد برای آزمایش 1 را نشان می دهد.
محدودیت مفید بودن آزمون های نرمال بودن
آزمون شاپیرو -ویلک و کلموگروف اسمیر نوف هر دو بررسی می کنند که آیا یک متغیر توزیع نرمال در جامعه دارد. اما چرا فرض نرمال بودن را بررسی میکنیم؟ به این دلیل که بسیاری از آزمون های آماری -از جمله ANOVA ، آزمون t و رگرسیون -به فرض نرمال بودن نیاز دارند : متغیرها باید توزیع نرمال در جامعه داشته باشند. با این حال،فرض نرمال بودن فقط برای نمونه های کوچک مورد نیاز است از N ≤ 20. برای اندازه نمونه های بزرگتر، توزیع نمونه گیری از میانگین همیشه نرمال است ، صرف نظر از اینکه مقادیر چه توزیعی در جامعه دارند . این پدیده به عنوان قضیه حد مرکزی شناخته می شود. و نتیجه این است که بسیاری از نتایج آزمایش ها حتی با نقض نرمال بودن نیز تحت تأثیر قرار نمی گیرند.
بنابراین اگر اندازه نمونه ها معقول باشد ، آزمون های نرمال بودن اغلب بی معنی هستند. متأسفانه، به نظر می رسد تعداد کمی از مربیان آمار از این امر آگاه هستند و هنوز دانش آموزان را با چنین آزمون هایی خسته می کنند. و به همین دلیل من این آموزش را به هر حال نوشتم.
اما اگر اندازه نمونه کوچک باشد ، مثلاً N < 20؟ در این مورد، بسیاری از آزمون ها به توزیع نرمال متغیر ها نیاز دارند. با این حال، آزمون های نرمال معمولاً در اندازه های کوچک نمونه دارای قدرت کمی هستند. در نتیجه، حتی انحرافات اساسی از حالت نرمال ممکن است از نظر آماری معنی دار نباشد. بنابراین وقتی واقعاً به حالت نرمال نیاز دارید، بعید است آزمون های نرمال بودن تشخیص دهند که در واقع نقض شده است. که آنها را کاملاً بی فایده می کند.
ممنون از مطالعه شما.