یک آزمون دو جمله ای  نسبت احتمالات جامعه را با  x بررسی می کند . به عنوان مثال ، آیا 50٪ – نسبت 0.50- از کل جمعیت هلند با نام تجاری من آشنا هستند؟ ما از یک نمونه تصادفی ساده N = 10 نفر سوال کردیم. فقط 2 نفر از آنها – نسبت 0.2- یا 20٪ برند من را می شناسند. آیا این نسبت نمونه 0.2 به این معنی است که نسبت جمعیت 0.5 نیست؟ یا اگر 50 درصد از مردم واقعا برند من را می شناسند ، 2 از 10 نتیجه طبیعی است؟
آزمون دو جمله ای ساده ترین آزمون آماری موجود است. درک نحوه عملکرد آن بسیار آسان است و به شما کمک می کند تا سایر آزمونهای معنی داری آماری را نیز به راحتی درک کنید. بنابراین چگونه کار می کند؟

آزمون دو جمله ای - ایده اولیه

اگر نسبت جامعه واقعاً 0.5 باشد ، می توانیم نسبت نمونه 0.2 را بیابیم. با این حال ، اگر نسبت جامعه تنها 0.1 باشد (فقط 10% ازکل بزرگسالان هلندی برند را می شناسند) ، ممکن است نسبت نمونه 0.2 را نیز بیابیم. یا 0.9 یا هر عددی بین 0 تا 1. شکل زیر مشکل اساسی – چالش – را در اینجا نشان می دهد.

آیا درصد واقعی جامعه این است ؟؟

بنابراین چگونه می توانیم در مورد جامعه خود تنها بر اساس یک نمونه نتیجه گیری کنیم؟ خوب ، ما ابتدا یک حدس اولیه در مورد نسبت جامعه می زنیم که ما آن را فرضیه صفر می نامیم : نسبت جامعه 0.5 از برند من را می شناسد.
با توجه به این فرضیه ، تناسب نمونه های زیادی امکان پذیر است . با این حال ، برخی از نتایج بسیار بعید یا تقریباً غیرممکن است . اگر با توجه به برخی فرضیه ها نتیجه ای را پیدا کنیم که تقریباً غیرممکن است ، احتمالاً این فرضیه اشتباه است:و نتیجه می گیریم که نسبت جامعه در نهایت x نیست .
بنابراین این گونه است که ما بر اساس نتایج نمونه ، نتیجه گیری های جامعه را انجام میدهیم.  اساساً همه آزمونهای آماری این استدلال را دنبال میکنند .در حال حاضر سوال اساسی این است: اگر نسبت جامعه 0.5 باشد ، احتمال یافتن 2 موفقیت در نمونه 10تایی چقدر است؟

مفروضات آزمون دو جمله ای

ابتدا ، باید مشاهدات مستقل باشند. این اساساً بدان معناست که پاسخ هر پاسخ دهنده ای باید مستقل از پاسخی باشد که پاسخ دهنده دیگر داده است. این فرض (تقریباً در همه آزمون های آماری مورد نیاز است) توسط داده های ما برآورده شده است.

توزیع دو جمله ای - فرمول

اگر 50 درصد از مردم برند من را می شناسند و من از 10 نفر سوال می کنم ، نمونه من می تواند بین 0 تا 10 موفقیت را به همراه داشته باشد. هر یک از این 11 نتیجه احتمالی و احتمالات مربوط به آنها نمونه ای از توزیع دو جمله ای است که به صورت زیر تعریف شده است

P(B=k)=(nk)pk(1−p)n−k

در این جا:

  • n تعداد آزمایشات (اندازه نمونه) است.
  • k تعداد موفقیت ها است ؛
  • p احتمال موفقیت برای یک آزمایش واحد یا(فرض شده)  نسبت جامعه است.

توجه داشته باشید که (nk) مخفف n!k!(n−k)!  و !! نشان دهنده فاکتوریل است

برای اهداف عملی ، ما احتمالات خود را مستقیماً از Google Sheets دریافت می کنیم (فرمول فوق در زیر کاپوت استفاده می شود اما ما را با آن اذیت نمی کند).

توزیع دو جمله ای - نمودار

بنابراین ما احتمالات 11 نتیجه احتمالی خود (0 تا 10 موفقیت) را بدست آوردیم و آنها را در زیر تجسم کردیم.

اگر نسبت جامعه 0.5 باشد و ما 10 مشاهده را نمونه گیری کنیم ، بیشترین احتمال 5 موفقیت است:    P(B = 5) ≈ 0.24  یا 4 یا 6 موفقیت است که نتایج احتمالات آن  (P ≈ 0.2   برای هر یک) است.
احتمال یافتن 2موفقیت یا کمتراز آن – همانطور که ما بدست آوردیم-  0.055است .این p-value یک طرفه ما است .
تعداد موفقیت های بسیار کم یا بسیار زیاد  هر دو نتایج احتمالات هستند و هر دو فرضیه را تحت تاثیر قرار میدهند. بنابراین ما p-value  را برای نتیجه معکوس -8 موفقیت یا بیشتر- در نظر می گیریم که این هم 0.055 است. مانند این ، ما p-value  دو طرفه 0.11 را پیدا می کنیم. اگر ما به جای 1 نمونه ، 1000 نمونه بگیریم ، درصورتی که نسبت جامعه 0.5 باشد ، 11٪ از آنها باید 2 (-) یا 8 (+) موفقیت به دست آورند. نتیجه نمونه ما باید در درصد معقولی از نمونه ها رخ دهد. و از آنجا که 11 بسیار بعید نیست ، نمونه گرفته شده فرضیه ما را مبنی بر اینکه 50% از مردم جامعه برند ما را می شناسند رد نمی کند .

آزمون دو جمله ای - Google Sheets

ما مثال خود را در this simple Google Sheet  بیان کرده ایم این برای همه قابل دسترسی است بنابراین با خیال راحت می توانید آن را ببینید.

آزمون دو جمله ای - SPSS

شاید ساده ترین راه برای اجرای آزمون دو جمله ای SPSS  باشد – برای یک آموزش خوب ، آزمون دو جمله ای در SPSS را نگاه کنید . شکل زیر خروجی مثال فعلی ما را نشان می دهد. واضح است Google Sheet همان p-value  0.109 را باز می گرداند .

توجه داشته باشید که نرم افزار SPSS ، p را به صورت Exact Sig. (2-tailed) نشان میدهد. آیا در این صورت p-value دقیق وجود ندارد؟  بیایید ببینیم چگونه کار می کند.

آزمون دو جمله ای یا آزمون Z؟

بیایید نگاهی دیگر به توزیع احتمال دو جمله ای که قبلاً گفتیم بیندازیم. تقریباً شبیه توزیع نرمال است حال به توزیع دو جمله ای زیر توجه کنید.

برای نمونه ای از N = 100 ، توزیع دو جمله ای ما تقریباً با توزیع نرمال یکسان است. این به دلیل قضیه حد مرکزی است . نتیجه این است که -برای حجم نمونه بزرگتر- یک آزمون z برای یک نسبت (با استفاده از توزیع نرمال استاندارد) p-value های تقریباً یکسانی با آزمون دو جمله ای ما (با استفاده از توزیع دو جمله ای) دارد.

اما چرا آزمون z را به آزمون دو جمله ای ترجیح می دهیم؟

  • ما همیشه می توانیم از آزمون z  دو طرفه استفاده کنیم. اما یک آزمون دو جمله ای همیشه یک طرفه است مگر اینکه P0 = 0.5 .
  • آزمون z به ما اجازه می دهد تا فاصله اطمینان را برای نسبت نمونه خود محاسبه کنیم.
  • ما به راحتی می توانیم قدرت آماری را برای آزمون z تخمین بزنیم اما برای آزمون دو جمله ای نمی توانیم.
  • از نظر محاسباتی ، وزن z کمتر است ، مخصوصاً برای نمونه های بزرگتر. 

بنابراین چه زمانی می توانیم از آزمون z به جای آزمون دو جمله ای استفاده کنیم؟ یک قاعده کلی این است که P0*n  و (1 – P0)*n  هر دو باید > 5 باشند ، که P 0 نسبت فرض شده جامعه و n اندازه نمونه را نشان می دهد.

 امیدوارم این آموزش برای شما مفید بوده باشد. 

ممنون از مطالعه شما