آزمون T دو نمونه مستقل - معرفی سریع

آزمون T دو نمونه مستقل – چیست؟

آزمون T دو نمونه مستقل، برابری میانگین 2 جامعه در برخی متغیرها را بررسی می کند.

چنانچه میانگین جوامع دقیقا برابر باشند ، احتمالاً میانگین نمونه، کمی (نه خیلی زیاد) متفاوت خواهد بود. اگر میانگین جوامع برابر باشند ،وجود میانگین نمونه های با اختلاف زیاد، غیرمحتمل می باشد. بنابراین این نتیجه گیری ازنمونه، نشان می دهد که میانگین جوامع یکسان نمی باشند.

نمونه ها مستقل می باشند چراکه تداخلی با یکدیگر ندارند. هیچ یک از مشاهدات به طور همزمان به هر دو نمونه تعلق ندارد.

مثال کتاب درسی پاسخگویان مرد در مقابل زن است

در یک جزیره 1000 مرد و 1000 زن زندگی می کنند. یک محقق می خواهد بداند که مردان درهر ماه چند دقیقه از وقتشان را با تلفن صحبت کردن می گذرانند. در حالت ایده آل ،می بایست این سوال را از همه 2000 نفر ساکن در جزیره می پرسید، اما این کارزمان زیادی را از او می گیرد. بنابراین او 10 مرد و 10 زن را به عنوان نمونه انتخاب می کند و از آنها سوال را می پرسد. بخشی از داده ها در زیر نشان داده شده است.

درادامه ، میانگین وانحراف معیار،مقدار صحبت کردن باتلفن، درهرماه را، برای پاسخ دهندگان زن و مرد، به طور جداگانه محاسبه می کند. نتایج در زیر نشان داده شده اند.

میانگین نمونه ها به مقدار (99 – 106 =) -7  دقیقه، بایک دیگراختلاف دارند: به طور متوسط، زنان حدود 7 دقیقه کمتر از مردان باتلفن صحبت می کنند. اما این نتیجه گیری، تنها در نمونه کوچک مان اینگونه بود. در مورد کل جامعه چه می توان گفت؟ با تشکیل دادن فرضیه صفر متوجه این موضوع، خواهیم شد.

فرضیه صفر

 

 

فرضیه صفر برای آزمون t دو نمونه مستقل ،(معمولاً) ،میانگین 2 جامعه برابراست، می باشد . اگر فرضیه صفر درست باشد ،ممکن است به راحتی بتوانیم، اختلاف میانگین اندکی را در نمونه ها، پیدا کنیم. اما چه مقداراختلاف را می توان انتظار داشت؟ یک روش بصری برای این سوال، شبیه سازی ساده می باشد.

شبیه سازی

 یک مجموعه داده جعلی ایجاد کرده ام که شامل کل جمعیت 1000 مرد و 1000 زن است. به طور متوسط، هر دو گروه، 103 دقیقه از وقتشان را، با انحراف معیار 14.5، صرف صحبت کردن باتلفن می کنند. توجه داشته باشید که فرضیه صفر برابری میانگین ها، برای این جامعه، به وضوح صحیح می باشد.

شبیه سازی آزمون تی روی نمودار هیستوگرام

درادامه 10 مرد و 10 زن را به عنوان نمونه انتخاب کرده و اختلاف میانگین را محاسبه کردم. واین فرآیند را 999 بار تکرار کردم ، در نتیجه 1000 مورد، اختلاف میانگین نمونه، در زیر نشان داده شده است.

 اولاً، میانگین اختلافات تقریباً به طور نرمال توزیع می شود. اکثر این اختلافات نزدیک به صفر است – تعجب آور نیست چراکه اختلاف جوامع صفر می باشد. اما آنچه واقعاً جالب می باشد، اینست که اختلافات میانگین مثلاً، -12.5 و 12.5 کاملاً رایج است و 95٪ از 1000 نتیجه را، تشکیل می دهد.

این پیشنهاد میکند که یک اختلاف مطلق از 2.5دقیقه برای معنی داری اماری در سطح معنی داری 5 درصد نیاز است

در انتها، انحراف معیار، 1000 مورد اختلاف میانگین -خطای استاندارد- 6.4 می باشد. توجه داشته باشید که 95٪ همه نتایج بین -2 و +2 خطای استاندارد ،میانگین (صفر) نهفته است. که یکی از بهترین خواص شناخته شده در توزیع نرمال می باشد.

حال، یک روش آسان تر – گرچه کمتر بصری – برای نتیجه گیری ، استفاده از چند فرمول ساده می باشد.

آماره آزمون

مجددا : اگر اختلاف جوامع صفر باشد ، میانگین نمونه “نرمال می باشد” به چه معناست؟

اولاً ، این موضوع به انحراف معیار جامعه، از متغیر نتیجه ،بستگی دارد. ما معمولاً آن را نمی دانیم اما می توانیم با

Sw=(n1−1)S21+(n2−1)S22n1+n2−2−−−−−−−−−−−−−−−−−−−−−Sw=(n1−1)S12+(n2−1)S22n1+n2−2

تخمین بزنیم.

که در آن SwSw ،انحراف معیار جامعه تخمین مان ، می باشد. در داده ها ، خلاصه می شود به

Sw=(10−1)224+(10−1)19110+10−2−−−−−−−−−−−−−−−−−−−−−−≈14.4Sw=(10−1)224+(10−1)19110+10−2≈14.4

در درجه دوم ، اختلاف میانگین باید کمتر نوسان کند – یعنی خطای استاندارد کمتری داشته باشد – از آنجا که اندازه نمونه بزرگترمی باشد. خطای استاندارد به صورت زیر محاسبه می شود

Se=Sw1n1+1n2−−−−−−−−Se=Sw1n1+1n2

و نتیجه می دهد

Se=14.4110+110−−−−−−−≈6.4Se=14.4110+110≈6.4

اگر اختلاف میانگین جوامع صفر باشد ، به طور متوسط- میانگین اختلاف نمونه ها نیز، صفر خواهد بود. با این حال ، انحراف معیار 6.4 خواهد بود. اکنون می توانیم فقط نمره z را برای اختلاف میانگین نمونه محاسبه کنیم اما -به دلایلی- به جای Z به آن T می گویند:

T=X¯¯¯¯1X¯¯¯¯2SeT=X¯1−X¯2Se

که، برای داده هایمان

T=99.4−106.66.4≈−1.11T=99.4−106.66.4≈−1.11

را نتیجه می دهد.

درست است ، این مقدار، آماهر آزمون می باشد: عددی که نتیجه نمونه ما را با توجه به فرضیه صفر خلاصه می کند.

اساسا اختلاف میانگین استاندارد شده نمونه است

T=1یعنی اختلاف از 7دقیقه تقریبا1انحراف استاندارد کمتر از متوسط صفر است 

فرضیات

مقدار t از توزیع t پیروی می کند اما تنها درصورتی که فرضیات زیربرقرار باشد :

1.     مشاهدات مستقل یا به طوردقیق متغیرهای مستقل وبه طور یکسان توزیع شده.

2.    نرمال بودن: متغیر نتیجه از توزیع نرمال در جامعه پیروی می کند. این فرض برای مقادیرمناسب نمونه لازم نیست (مثلاً N> 25).

3.    همگنی: متغیر نتیجه در 2 (زیر) جامعه ،انحراف معیار برابری دارد. اگر اندازه نمونه ها تقریباً برابر باشد ، برقراری این مورد نیازی نیست. . برای بررسی این فرض، گاهی از آزمون لون استفاده می شود.

 

اگر داده ها با این مفروضات مطابقت داشته باشند ،متغیر T ازتوزیع t با (n1 + n2 -2) درجه آزادی (df) پیروی می کند. در مثال ما ، df = (10 + 10 – 2 – = 18). شکل زیر توزیع دقیق را نشان می دهد. توجه داشته باشید که برای معنی داری دو طرفه در سطح      a= 0.05 به مقدار t مطلق برابر با 2.1 نیاز داریم.

توجه کنید:با بزرگتر شدن درجه ازادی, توزیع t به توزیع نرمال استاندارد میل میکنداگر df> 15 یا همین حدود باشد، اختلافی وجود ندارد.

معنی داری آماری

 

آخرین و نه کمترین، اختلاف میانگین 7- دقیقه ای ،از نظر آماری معنی دار نیست:  t (18) = -1.11 ، p ≈ 0.28 این بدان معناست که اگر میانگین جوامع دقیقا برابر باشد، 28٪ احتمال داردکه اختلاف میانگین نمونه یا بیشتر از آن را بدست آوریم. این یک نتیجه نرمال است که با فرضیه صفرمان مغایرتی ندارد.

شکل نهایی این نتایج را در SPSS نشان می دهد.

اندازه اثر

سرانجام، مقدار اندازه اثر که معمولاً ، Cohen’s D ترجیح داده می شود که به صورت زیر تعریف شده است.

D=X¯¯¯¯1X¯¯¯¯2SwD=X¯1−X¯2Sw

که در آن Sw برآورد انحراف معیار استاندارد جامعه می باشد، که قبلاً راجع آن صحبت کرده ایم.

یعنی Cohen’s D مقدار انحراف معیار، بین 2 میانگین نمونه می باشد. بنابراین یک اثر کوچک یا بزرگ به چه معناست؟ قواعد اولیه زیر ارائه شده است:

 (D=0.2)نشان دهنده یک تأثیر کوچک است.

 (D=0.5)نشانگر تأثیر متوسط است.

 (D=0.8)بیانگر یک تأثیر بزرگ است.

متاسفانه Cohen’s D  تنها در نسخه 27 SPSS  وجود دارد . با این وجود می توانید آن را به راحتی از Cohens-d.xlsx تهیه کنید. فقط 2 اندازه نمونه را پر کنید، میانگین و انحراف استاندارد و فرمول های آن، همه آنچه را که باید بدانید را محاسبه می کند.