آزمون T تک نمونه ای – آموزش سریع و مثال

• فرضیه صفر

• فرضیات

• فرمول ها

• اندازه اثر

• فاصله اطمینان برای میانگین ها

• گزارش به روش APA

 آزمون t تک نمونه ای میانگین جمعیت را ارزیابی می کند

 

مثال آزمون t تک نمونه ای

یک مدیر مدرسه فکر می کند دانش آموزانش به دلیل داشتن نمره پایین در ضریب هوشی، عملکرد ضعیفی دارند. حالا مدیر تست های ضریب هوشی تنظیم نموده تا میانگین ضریب هوشی را در جامعه کلی بدست بیاورند. بنابراین این سوال پیش می آید که آیا میانگین ضریب هوشی جامعه دانش آموزان، 100 است؟ خب، مدرسه ما 1114 دانش آموز دارد و انجام آزمون های ضریب هوشی تا حدی هزینه بر می باشد. بنابراین مدیر، یک نمونه تصادفی ساده با حجم 38 از دانش آموزان انتخاب می کند و 4 مولفه IQ را برروی آنها آزمایش می کند:

• verb  (هوش کلامی)

• math (توانایی در ریاضی)

• clas (مهارت های طبقه بندی)

• logi (مهارت های استدلال منطقی)

داده های خام در این صفحه از گوگل بدین ترتیب جمع آوری شده اند که بخشی از آن در زیر نشان داده شده است. توجه داشته باشید که دو نمره، به دلیل بیماری ویا دلایلی نامشخص گمشده اند .

فرضیه صفر

با رد فرضیه صفر که بیانگر میانگین نمره ضریب هوشی کلیه دانش آموزان جامعه، برای هر 4 مولفه IQ اندازه گیری شده 100است، سعی خواهیم کرد نشان دهیم که دانش آموزان ما از ضریب هوشی پایینی برخوردارند. چالش اصلی این است که ما فقط داده هایی در مورد نمونه 38 تایی دانش آموزان، از جامعه 1111 تایی آنان داریم. اما در ابتدا بیایید برای هر مولفه، مقداری  از آمار توصیفی را، نگاهی بیندازیم:

N – اندازه نمونه 

M – میانگین نمونه 

SD – انحراف استاندارد نمونه 

آمار توصیفی در جدول زیر نشان داده شده است.

اولین نتیجه گیری اساسی ما این است که، تمامی 38 دانش آموز، در هر 4 مولفه ضریب هوشی، نمره کمتر از 100 کسب می کنند. تفاوت مولفه هوش کلامی با نمره به دست آمده (99.29) با مولفه توانایی درریاضی بانمره به دست آمده (97.97) اندک می باشد. این برای مولفه clas با نمره به دست آمده(93.9) ومولفه logi بانمره(94.7)، تا حدودی جدی تر به نظر می رسند.

حال، فرض کنیم نمونه 38 تایی دانش آموزان به وضوح، کمی اختلاف میانگین نسبت به جامعه 1114 نفری داشته باشد. پس در مورد جامعه خود چه نتیجه ای میگیریم/نمیگیریم؟

سعی خواهیم کرد نتایج نمونه را با 2 رویکرد مختلف، به جامعه تعمیم دهیم:

• معنی داری آماری: اگر میانگین جامعه واقعاً 100 باشد، این نمونه ها چه مقدار محتمل هستند؟

• فواصل اطمینان: با توجه به نتایج نمونه، محدوده های احتمالی جامعه چیست؟

هر دو رویكرد، نیازمند برخی فرضیات می باشند، بنابراین بیایید ابتدا به بررسی آنها بپردازیم.

 

فرضیات

فرضیات مورد نیاز برای آزمونهای t تک نمونه ای موارد زیر می باشند

1. مشاهدات مستقل باشند

2. نرمال بودن: نمرات ضریب هوشی باید به صورت نرمال در کل جامعه توزیع شوند.

آیا داده های ما با این مفروضات مطابقت دارند؟ اول از همه،

1.     دانش آموزان در طول آزمونشان، بایک دیگر ارتباط برقرار نکردند. بنابراین، احتمالاً مشاهدات مستقلند.

2.     نرمال بودن تنها برای اندازه های کوچک نمونه، ضروری است، مثلاً برای N>25 یا همین حدود. برای داده های موجود، نرمال بودن ضرری نمی باشد.

برای اندازه های کوچکتر نمونه، می توانید فرض نرمال بودن را با استفاده از موارد زیر ارزیابی کنید.

• بررسی اینکه آیا نمودارهای هیستوگرام، به طور تقریبی از منحنی های نرمال پیروی می کنند

• بررسی اینکه آیا چولگی و کشیدگی، هر دومقدارشان نزدیک به 0 می باشد

• انجام آزمون شاپیرو-ویلک یا آزمون کولموگروف-اسمیرنوف.

با این حال، داده های موجود همه فرضیات را دارا می باشند، حال بیایید آزمایشات واقعی را بررسی کنیم.

 

فرمول ها

اگر نمونه های زیادی از دانشجویان را بیرون بکشید، این نمونه ها با میانگین متفاوتی اتفاق می افتد.

می توانیم انحراف معیار  میانگین ها را با  فرضیه نمونه ها محاسبه کنیم: خطای استاندارد میانگین یا SEmean 

 

 

S E m e a n = S D N

برای اولین مؤلفه IQ ما، این نتیجه می شود

S E m e a n = 12.45 38 = 2.02

فرضیه صفر ما این است که میانگین جمعیت، μ0=100 است.
اگر این درست باشد، میانگین نمونه نیز باید 100 باشد. اکنون اساساً نمره z را برای میانگین نمونه خود محاسبه می کنیم: آمار آزمون t

t = M μ 0 S E m e a n

برای اولین مؤلفه IQ ما، این نتیجه می شود

t = 99.29 100 2.02 = 0.35

اگر مفروضات برآورده شوند، t از توزیع t-student با درجات آزادی یا df که توسط

d f = N 1

برای نمونه ای متشکل از 38 پاسخ دهنده، این نتیجه به دست می آید

d f = 38 1 = 37

با توجه به t و df، می‌توانیم به سادگی سطح معنی‌داری دوطرفه p=0.73 را در این Googlesheet جستجو کنیم که تا حدی در زیر نشان داده شده است.

تفسیر

به عنوان یک قانون کلی، اگر P <0.05 ،فرضیه صفر را رد می کنیم. مقدار p را برابر با 0.73 مجاسبه کردیم. درنتیجه فرضیه صفر را رد نمی کنیم: با توجه به داده های نمونه ، میانگین جامعه مقداری برابر با 100 بودن، یک حکم معتبر است.

اما دقیقاً معنای 0.73 = p چیست؟ خب ، این بدان معنی است که 0.73 (یا 73٪) احتمال دارد که t <-0.35 یا t> 0.35 باشد. شکل زیر نشان می دهد که چگونه این احتمال، از توزیع نمونه ای t با37 درجه آزادی به دست می آید.

 

درادامه، به یاد داشته باشید که t، فقط یک اختلاف میانگین استاندارد می باشد. در داده ها، t=-035 مربوط به اختلاف 0.71 – ،نمره های IQ است.

بنابراین، p = 0.73 به معنای وجود 0.73 احتمال یافتن اختلاف مطلق میانگین حداقل 0.71 امتیاز است به طور تقریبی ، میانگین نمونه ای که به دست آوردیم احتمالاً معنی دار باشد

اگر فرضیه صفر درست باشد.

اندازه اثر

تنها مقیاس اندازه اثر برای آزمون t تک نمونه ای، D Cohen است که به صورت    

         Cohen′sD = M − μ0SD

 

C o h e n s D = M μ 0 S D

تعریف شده است

 

برای اولین مولفه آزمون ضریب هوشی نمونه، Cohen′sD = 99.29−10012.45 = -0.06 را نتیجه می دهد.

برخی از قراردادهای عمومی، این است که

  •  0.20 =| Cohen’s D | نشانگر کوچک بودن اندازه اثر است.
  •  0.5= | Cohen’s D | اندازه اثر متوسط را نشان می دهد.
  • 0.8 = | Cohen’s D | نشانگر بزرگ بودن اندازه اثر است.

D-Cohen= -0.06 این نشان دهنده یک اثر ناچیز برای اولین مولفه آزمایش می باشد.

Cohen’s D  تنها درنسخه 27 spss به طورکامل وجود دارد. اما به راحتی می توانیم آن را از JASP تهیه کنیم. خروجی JASP ،اندازه اثر را برای هر 4 مولفه آزمایش ضریب هوشی، در زیر نشان می دهد.

توجه داشته باشید که 2 مولفه آخر ضریب هوشی – طبقه بندی و منطقی – دارای اندازه اثر، تقریباً متوسطی هستند. همچنین این دو مولفه، میانگینشان  با عدد 100 تفاوت معنی داری دارد: p <0.05 برای هر دو میانگین (ستون سوم جدول).

فاصله اطمینان برای میانگین ها

داده های ما برای 4مولفه ازمون ضریب هوشی با میانگین نمونه مطرح شد. اکنون، می دانیم که میانگین های نمونه، به نوعی با نمونه های جامعه خود، تا حدودی متفاوت هستند. بنابراین محدوده های احتمالی برای میانگین جامعه چیست؟ که اغلب با محاسبه فواصل اطمینان 95٪ پاسخ داده می شود. روش مربوط به آخرین مولفه ضریب هوشی،یعنی استدلال منطقی را نشان خواهیم داد. از آنجا که 34 مشاهده داریم، t از توزیع t با 33 = df(درجه آزادی) پیروی می کند. ابتدا بررسی خواهیم کرد که کدام مقادیر t 95٪ از توزیع معکوس t را، احتمالاً دربرمی گیرند. این کار را با تایپ کردن (0.025،33) = T.INV در هر خانه از صفحه Googlesheet انجام می دهیم، که 2.03- را نتیجه می دهد. توجه داشته باشید که 0.025، 2.5درصد است. دلیل این امر اینست که 5درصد غیرمحتمل ترین مقادیر، بر روی هر دو دم توزیع تقسیم شده است که در زیر نشان داده شده است.

اکنون مقدار t ما 2.03 تخمین می زند که 95٪ میانگین نمونه ما بین 2.03 ± در نوسان است خطاهای استاندارد شده توسط SEmean برای اخرین مولفه ضریب هوشی نشان داده شده است:

 

S E m e a n = 12.57 3 4 = 2.16

اکنون می دانیم که 95٪ از میانگین نمونه هایمان بین 2.03±  در نوسان است. 2.16 = 39/4 امتیاز آزمون IQ. در آخر، این نوسان ها را با میانگین نمونه مشاهده شده 94.74 ترکیب می کنیم:

C I 95 % = [ 94.74 4.39 , 94.74 + 4.39 ] = [ 90.35 , 99.12 ]

توجه داشته باشید که فاصله اطمینان 95٪ ،شامل میانگین جامعه بامقدار 100 فرضمان، نمی باشد. این بدان معنی است که فرضیه صفر را در α = 0/05 رد خواهیم کرد. برای نتیجه گیری حتی نیازی به انجام واقعی آزمون t نیست.

گزارش به روش APA

 

آزمون t معمولاً در متن گزارش می شود، به این صورت که 

“میانگین مهارتهای کلامی با عدد 100 تفاوتی نداشت:t (37) = -0.35 ، p = 0.73 ، Cohen’s D = 0.06.”

برای چندین آزمون، یک جدول ساده، با نمای کلی، همانطور که در زیر نشان داده شده است، توصیه می شود. احساس می کنیم که فواصل اطمینان برای میانگین ها (نه اختلاف میانگین ها) نیز باید در نظر گرفته شود. از آنجا که APA این موارد را ذکر نمی کند، فعلاً آنها را کنار گذاشتیم.

  نمونه جدول گزارش به روش APA برای آزمون های t تک نمونه ای

بسیار خوب، من نمی توانم به هر موضوع دیگری که مربوط به آزمون t تک نمونه ای می باشد، فکر کنم. اگر شما فکر کردید، خجالتی نباشید. در زیر فقط برایمان نظراتتان را بنویسید. ما همیشه از شنیدن نظرات شما خوشحال میشویم! ضمنا ما تحلیل آماری شما را با SPSS انجام می دهیم.