فرضیه صفر – معرفی ساده

فرضیه صفر یک عبارت دقیق در مورد یک جامعه میباشد که ما قصد داریم توسط یک نمونه داده این فرضیه را رد کنیم. معمولا فرض میکنیم که فرضیه صفر(یا H0 ) عبارتی درست نیست. با این حال، ما به تعدادی عبارت دقیق به عنوان نقطه شروع آزمونهای آماری نیاز داریم.

آزمونهای آماری مولفه های اصلی

مثال های فرضیه صفر

فرضیه صفر اغلب(نه همیشه) بیان کننده‌ی این است که هیچ ارتباط و یا تفاوتی بین متغیرها یا خوشه ها وجود ندارد. بدین طریق  فرضیه های صفر  متداول عبارتند از :

       همبستگی بین شکست و پیروزی صفر است. (تجزیه و تحلیل همبستگی(

       میانگین دریافت حقوق برای مردان و زنان یکسان است. (ازمون استقلال نمونه ها (آزمون-t  )

      ملیت افراد (کاملا) با سلیقه‌ی موسیقی آنها نامرتبط است.(آزمون استقلال کی دو(

       متوسط درآمد جمعیت در سال ۲۰۱۲ تا ۲۰۱۶ یکسان بوده است.(اندازه گیری مکرر ANOVA (تحلیل واریانس))

 

“NULL” به معنای” صفر ” نیست

 

یک اشتباه و سوتفاهم رایج این است که “NULL ” دلالت بر “صفر” دارد. این همیشه درست نیست. برای مثال، فرضیه صفر ممکن است همبستگی بین ناامیدی و موفقیت را برابر با 0.5 بیان کند. در اینجا هیچ مقدار صفری نداریم-اگر چه ممکن است غیرعادی به نظر برسد- و کاملا دارای مقدار است.

 

واژه‌ی “NULL ” در کلمه‌ی ” NULL HYPOTHSIS ” (فرضیه صفر) از کلمه  Nullify به معنای باطل و لغو کردن می آید: فرضیه‌ی صفر عبارت است از عبارتی که ما قصد داریم آن را با استدلال رد کنیم، صرف نظر از اینکه مفهوم صفر را میرساند یا خیر .

آزمودن فرضیه صفر- چگونه عمل میکند؟

میخواهیم بدانیم که آیا شادی و ثروت در بین مردم کشور هلند با یکدیگر مرتبط است یا نه. یک رویکرد برای پی بردن به این مسئله، فرمول بندی فرضیه صفر می باشد. از آنجایی که این ارتباط دقیق نیست، ما یک عبارت مخالف را به عنوان فرضیه صفر در نظر میگیریم: همبستگی بین شادی و ثروت میان مردم هلندی برابر با صفر می باشد. حال تلاش میکنیم که این فرضیه را به منظور اثبات اینکه بین شادی و ثروت مردم  به طور حتمی ارتباطی وجود دارد، رد کنیم.

حال به طور منطقی نمیتوانیم از همه‌ی هفده میلیون هلندی بپرسیم که چگونه احساس شادی میکنند.

 

بنابراین از نمونه ای (بر فرض ، ۱۰۰ نفر) در مورد شادی و ثروت آنها سوال میکنیم. همبستگی بین شادی و ثروت در این نمونه برابر با 0.25 میشود. اکنون یک مشکل داریم :

 حال خروجی های نمونه تمایل دارند که تا حدی از خروجی های جامعه متفاوت باشند. پس اگر همبستگی در جامعه واقعا صفر باشد، ممکن است ما یک همبستگی غیر صفر در نمونه داشته باشیم. برای توضیح دادن این نکته مهم، به نمودار پراکنش زیر توجه کنید. این نمودار یک همبستگی صفر بین شادی و ثروت در یک جامعه با ۲۰۰ (N=200 )عضو را به تصویر میکشد.

حال یک نمونه تصادفی با N=20 از جامعه بیرون میکشیم ( نقاط قرمز در نمودار پراکنش قبلی) . اگر چه همبستگی جامعه برابر با صفر میباشد، یک همبستگی تعجب انگیز برابر با 0.82 در نمونه مشاهده میکنیم . شکل زیر با حذف کردن واحدهای دیگر که در نمونه نیستند از نمودار پراکنش قبلی، این مسئله را به تصویر میکشد.

ممکن است این سوال پیش بیاید که پس چگونه میتوان در مورد جامعه چیزی گفت اگر ما فقط یک نمونه کوچک از جامعه داریم. پاسخ اصلی این است : ما به ندرت میتوانیم با اطمینان 100% چیزی در مورد جامعه بگوییم.

با این حال، میتوان اظهارات زیادی با اطمینان 99% ، 95% و یا 90% گفت.  

احتمال

پس چگونه کار میکند؟ اساسا، با توجه به فرضیه صفر داده شده، برخی نتایج نمونه ما بسیار بعید است‌. بدین طریق، شکل زیر احتمالات همبستگی نمونه های متفاوت(N=100 ) را نشان میدهد اگر همبستگی جامعه واقعا صفر باشد.

یک کامپیوتر به راحتی این احتمالها را محاسبه میکند. محاسبه آن به یک حجمی از داده (در این مثال ۱۰۰ داده) و همبستگی فرضی جامعه (در این مثال 0 )نیاز دارد. به همین دلیل ما به یک فرضیه صفر نیاز داریم.

اگر به توزیع نمونه توجه کنیم، همبستگی های نمونه اطراف 0 دارای احتمال زیاد میباشند: دستیابی به همبستگی بین 0.1- و 0.1 دارای احتمالی برابر با 0.68 میباشد. این به چه معناست؟ توجه داشته باشید که احتمالات را میتوان به عنوان فراوانی های نسبی در نظر گرفت‌. فرض کنید که ما به جای یک نمونه‌ای داریم، ۱۰۰۰ نمونه را از جامعه بیرون بکشیم. با این کار ۱۰۰۰ ضریب همبستگی به دست می آوریم که حدود ۶۸۰ تا از آنها (یک فراوانی نسبی از 0.68 ) دارای مقداری بین 0.1- و 0.1 میباشند. به همین ترتیب، دستیابی به همبستگی بین 0.2- و 0.2 دارای احتمالی برابر با 90% (یا 95% ) میباشد.

P – مقدار

ما به یک همبستگی برابر با 0.25 دست یافتیم. چقدر احتمال دارد که همبستگی جامعه برابر با صفر باشد؟

پاسخ این سوال به عنوان p -مقدار(کوتاه شده‌ی عبارت مقدار احتمال) شناخته شده است: p -مقدار عبارت است از احتمال یافتن برخی نتایج نمونه و یا چیزی شدیدتر از آن تحت فرض درست بودن فرضیه H0 میباشد. با توجه به همبستگی به دست آمده ما که برابر 0.25 است ، ” چیزی شدیدتر ” به معنای بزرگتر از 0.25 یا کمتر از 0.25- میباشد. ما نمیتوانیم از روی نمودار چیزی بگوییم اما جدول زیر بیانگر این است که p تقریبا برابر با 0.012 میباشد. اگر فرضیه صفر درست باشد، احتمال یافتن همبستگی نمونه برابر با 1.2% میباشد.

 

نتیجه؟

اگر همبستگی جامعه واقعا برابر با صفر باشد، ممکن است همبستگی نمونه در یک نمونه به حجم ۱۰۰(N=100 ) برابر شود با 0.25. احتمال رخداد این اتفاق فقط برابر با 0.012 میباشد پس این اتفاق خیلی بعید است‌. در نهایت یک نتیجه و دلیل منطقی این است که همبستگی جامعه برابر با صفر نیست.

نتیجه: فرضیه صفر را رد میکنیم. بر اساس نتایج نمونه، دیگر قبول نداریم که شادی و ثروت با یکدیگر نا مرتبط هستند. با این حال، ما هنوز هم نمیتوانیم این نتیجه را با قطعیت بیان کنیم.

فرضیه صفر – محدودیت ها

تا به اینجا نتیجه گرفتیم که همبستگی جامعه احتمالا برابر با صفر نیست. این تنها نتیجه از رویکرد فرضیه صفر میباشد و این جالب نیست.

چیزی که دقیقا میخواهیم بدانیم همبستگی جامعه است. همبستگی برابر با 0.25 نمونه یک برآورد منطقی به نظر میرسد. ما این عدد را برآورد نقطه‌ای مینامیم.

حال ممکن است یک نمونه جدید با یک مقدار همبستگی متفاوت به دست آید. سوال جالب این است که اگر ما تعدادی نمونه از جامعه بگیریم ، همبستگی نمونه ها تا چه مقدار ممکن است نوسان داشته باشند. شکل زیر دقیقا این مسئله را نشان میدهد، با فرض اینکه حجم نمونه برابر با 100 و برآورد نقطه‌ای برای همبستگی جامعه برابر با 0.25 میباشد.

فواصل اطمینان

نتیجه‌ی نمونه نشان میدهد که 95% این نمونه ها همبستگی بین 0.06 و 0.43 دارند. این بازه به عنوان فاصله اطمینان شناخته میشود. اگر چه که دقیقا درست نیست، به راحتی فرض میکنیم که احتمالا پهنای باند احتمال همبستگی را در بر میگیرد.

یک نکته که باید به آن توجه داشت این است که فاصله اطمینان کاملا گسترده است. این فاصله اغلب همبستگی صفر را نیز در برمیگیرد،  دقیقا فرضیه‌ی صفری که ما قبلا آن را رد کردیم.

نکته دیگری که باید به آن توجه داشت این است که توزیع نمونه و فاصله اطمینان ما کمی نامتقارن میباشند. اینها برای آماره های دیگر متقارن خواهند بود(مانند ضریب بتا یا میانگین) اما نه برای همبستگی.

منابع

  1. Agresti, A. & Franklin, C. (2014).  The Art & Science of Learning from Data.Essex: Pearson Education Limited.
  2. Cohen, J (1988). Statistical Power Analysis for the Social Sciences (2nd. Edition). Hillsdale, New Jersey, Lawrence Erlbaum Associates.
  3. Field, A. (2013). Discovering Statistics with IBM SPSSNewbury Park, CA: Sage.
  4. Howell, D.C. (2002). Statistical Methods for Psychology(5th ed.). Pacific Grove CA: Duxbury.
  5. Van den Brink, W.P. & Koele, P. (2002). Statistiek, deel 3 [Statistics, part 3]. Amsterdam: Boom.