1. ایجادنمودار پراکنش با برازش خط
  2. گفتگوی رگرسیون خطی در SPSS
  3. تفسیر خروجی رگرسیون در SPSS
  4. ارزیابی مفروضات رگرسیون
  5. دستورالعمل های APA برای گزارش رگرسیون

سوال و داده های تحقیق

شرکت X دارای 10 کارمند بوده که در آزمون ضریب هوشی و عملکرد شغلی شرکت می کردند. داده های حاصل که بخشی از آنها در زیر نشان داده شده است – در simple-linear-regression.savقرار دارند.

نکته اصلی شرکت X می خواهد بفهمد که آیا ضریب هوشی عملکرد شغلی را پیش بینی می کند؟ و اگر چنین است چگونه؟ ما با اجرای یک تحلیل رگرسیون خطی ساده در SPSS به این سوالات پاسخ خواهیم داد.

 ایجاد نمودارپراکنش با برازش خط  

یک نقطه شروع عالی برای تحلیل ما ، نمودارپراکنش است. این به ما می گوید که آیا ضریب هوشی و عملکرد و رابطه آنها – در صورت وجود – در وهله اول معنایی دارند یا خیر. نمودار خود را از

Graphs     >>     Legacy Dialogs     >>       Scatter/Dot 

ایجاد کرده و سپس تصاویر زیر را دنبال خواهیم کرد.

5من دوست دارم بگذارم

  • عنوانی که آنچه مخاطب من به آن نگاه می کند را به او می گوید و
  • زیرنویسی که می گوید کدام پاسخ دهندگان یا مشاهدات نشان داده می شوند و چه تعدادی اند.

6 با کلیک روی دکمه Paste دستور زیر حاصل شد. بنابراین بیایید آن را اجرا کنیم.

دستورگذاشتن عنوان برای نمودار پراکنش در SPSS

*Scatterplot with title and subtitle from Graphs -> Legacy Dialogs -> Scatter.

GRAPH
/SCATTERPLOT(BIVAR)=iq WITH performance
/MISSING=LISTWISE
/TITLE=’Scatterplot Performance with IQ’
/subtitle ‘All Respondents | N = 10′.

نتیجه

 ما چیز عجیبی در نمودارپراکنش خود نمی بینیم. به نظر می رسد همبستگی متوسطی بین ضریب هوشی و عملکرد وجود دارد: به طور متوسط ​​پاسخ دهندگان با امتیاز بهره هوشی بالاتر عملکرد بهتری دارند. این رابطه تقریباً خطی به نظر می رسد. بیایید اکنون یک خط رگرسیون به نمودارپراکنش خود اضافه کنیم. با کلیک راست روی آن و انتخاب

 Edit content      >>      In Separate Window

یک پنجره Chart Editor باز می شود. در اینجا ما به سادگی بر روی نماد“Add Fit Line at Tota” کلیک میکنیم همانطور که در زیر نشان داده شده است.

به طور پیش فرض ، SPSS اکنون یک خط رگرسیونی به نمودارپراکنش ما اضافه می کند. نتیجه در پاین نشان داده شده است.

در حال حاضر ما چند پاسخ اولیه برای سوالات تحقیق خود داریم. R2 = 0.403 نشان می دهد که ضریب هوشی 40.3٪ از واریانس عملکرد شغلی را تشکیل می دهد. یعنی ضریب هوشی عملکرد را در این نمونه نسبتاً خوب پیش بینی می کند.

اما چگونه می توانیم بهترین پیش بینی عملکرد شغلی از طریق ضریب هوشی را داشته باشیم؟ خوب ، در نمودارپراکنش ما y  عملکرد شغلی است (در محور y نشان داده شده است) و x ضریب هوشی (در محور xنشان داده شده است ). بنابراین  

ضریب هوشی * 34.26 + 0.64 =عملکرد

بنابراین برای کارمندی با نمره ضریب هوشی 115 ، 34.26 + 0.64 * 115 = 107.86  به عنوان نمره احتمالی عملکرد شغلی وی در آینده پیش بینی می شود. درست است ، بنابراین این یک ایده اساسی در مورد رابطه بین ضریب هوشی و عملکرد به ما می دهد و آن را از نظر بصری ارائه می دهد. با این حال ، اطلاعات بسیاری ازجمله – معنی داری آماری و فواصل اطمینان – هنوز از دست رفته است. پس بیایید آن را اجرا کنیم.

گفتگوی رگرسیون خطی در SPSS

با اجرای مجدد تحلیل حداقلی رگرسیون ، از تجزیه و تحلیل رگرسیون

Analyze     >>       Regression     >>       Linear 

خروجی بسیار دقیق تری به ما می دهد. تصاویر صفحه زیر دستوره کار ما را نشان می دهد.

انتخاب این گزینه ها منجر به دستور زیر می شود. بیایید آن را اجرا کنیم.

دستور رگرسیون خطی ساده SPSS

*Simple regression with residual plots and confidence intervals.

REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS CI(95) R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT performance
/METHOD=ENTER iq
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/RESIDUALS HISTOGRAM(ZRESID).

خروجی i رگرسیون در SPSS - ضرایب

 متأسفانه ، SPSS بیشتر از آنچه که نیاز داریم به ما خروجی رگرسیون می دهد. با خیال راحت می توانیم بیشتر آن ها را نادیده بگیریم. با این حال ، جدول ضرایب نشان داده شده در زیر یک جدول با اهمیت است.

این جدول ضرایبB را نشان می دهد که قبلاً در نمودارپراکنش خود مشاهده کردیم. همانطور که نشان داده شد ، این ها معادله رگرسیون خطی را نشان می دهد که بهترین عملکرد را از ضریب هوشی در نمونه ما تخمین می زند.

 دوم ، به یاد داشته باشید  فرضیه صفر را رد میکنیم ، اگر p < 0.05 باشد. ضریب B برای ضریب هوشی دارای “” Sig یا p = 0.049 است. از نظر آماری تفاوت معناداری با صفر دارد.

فاصله اطمینان 95٪ آن – به طور کلی ، یک محدوده احتمالی برای مقدار جامعه آن – [0.004.1.281] است. بنابراین B ​​احتمالاً صفر نیست اما ممکن است بسیار نزدیک به صفر باشد. فاصله اطمینان بسیار زیاد است – تخمین ما برای B دقیق نیست – و این به دلیل حجم کم نمونه است که تجزیه و تحلیل بر اساس آن انجام می شود.

خروجی ii رگرسیون در SPSS - خلاصه مدل

به غیر از جدول ضرایب ، برای گزارش نتایج خود به جدول خلاصه مدل نیز نیاز داریم.

1 R همبستگی بین مقادیر پیش بینی شده رگرسیون و مقادیر واقعی است. برای رگرسیون ساده ، R برابر با همبستگی بین پیش بینی کننده و متغیر وابسته است.

2 مربع R -ضریب همبستگی – نسبت واریانس متغیر وابسته را که برای پیش بینی کننده (های) داده های نمونه ما محاسبه می شود ، نشان می دهد.

3 مربع R تنظیم شده  تخمین می زند مربع R را هنگامی که معادله رگرسیون (مبتنی بر نمونه) را برای کل جامعه برازش میدهیم .

 مربع r تنظیم شده ، تخمین واقع بینانه تری از صحت پیش بینی نسبت به مربع r ساده ارائه می دهد. در مثال ما ، اختلاف زیاد بین آنها – که به طور کلی انقباض نامیده می شود – به دلیل حجم کم نمونه 10 = N است.

این خبر بدی برای شرکت X است: چون ضریب هوشی عملکرد شغلی را خیلی خوب پیش بینی نمی کند.

ارزیابی مفروضات رگرسیون

فرضیات اصلی برای رگرسیون عبارتند از:

  • مشاهدات مستقل ؛
  • نرمال بودن: خطاها باید از توزیع نرمال در جامعه پیروی کنند.
  • خطی بودن: رابطه بین هر پیش بینی کننده و متغیر وابسته خطی است.
  • همبستگی: خطاها باید در همه سطوح مقدار پیش بینی شده واریانس ثابتی داشته باشند.
  1. اگر هر مورد (هرردیف سلول ها در نمایش داده ها) در SPSS شخص جداگانه ای را نشان می دهد ، ما معمولاً تصور می کنیم که اینها “مشاهدات مستقل” هستند. در مرحله بعدی ، فرضیات 2-4 با بررسی نمودارهای رگرسیون در خروجی ما به بهترین وجه ارزیابی می شوند.
  2. اگر نرمال بودن برقرار باشد ، پس مانده های رگرسیون ما باید (تقریبا) توزیع نرمال داشته باشند. هیستوگرام زیر تصویر واضحی از نرمال بودن را نشان نمی دهد.

رگرسیون می تواند این پس مانده ها را به عنوان یک متغیر جدید به داده های شما اضافه کند. با این کار می توانید یک آزمون کلموگروف-اسمیرنوف را برای نرمال بودن روی آنها انجام دهید. اما برای نمونه کوچک موجود ، این آزمون قدرت آماری پایینی خواهد داشت. پس بیایید از آن بگذریم. فرضیه های 3. خطی بودن و 4. همبستگی بهتر ارزیابی شود از یک نمودار باقیمانده. این یک نمودارپراکنش با مقادیر پیش بینی شده در محور x و باقی مانده های محور y است که در زیر نشان داده شده است. هر دو متغیر استاندارد شده اند اما بر شکل الگوی نقاط تأثیر نمی گذارد.

نمودار باقی مانده انحنای زیادی نشان می دهد. منحنی متناسب با الگوی کلی را دستی ترسیم کردم. فرض یک خط منحنی احتمالاً ناهمگونی را نیز برطرف می کند ، اما اکنون همه چیز بسیار فنی شده است. نکته اساسی این است که برخی از فرضیات چندان قابل قبول نیستند. رایج ترین راه حل برای این مشکلات از بدترین تا بهترین 

  • نادیده گرفتن این مفروضات به طور کلی است
  • دروغ گفتن که نمودار های رگرسیونی هیچ نقضی از مفروضات مدل را نشان نمی دهد.
  • یک تحول غیر خطی – مانند لگاریتم – به متغیر وابسته ؛
  • برازش یک خط منحنی به مدل – که در یک دقیقه رسم خواهیم کرد.

دستورالعمل های APA برای گزارش رگرسیون

شکل زیر  یک تصویر از کتاب برای گزارش رگرسیون در قالب APA است.

ایجاد این جدول دقیق از خروجی SPSS یک درد واقعی است. ویرایش آن در اکسل آسان تر از WORD است بنابراین ممکن است برای شما مشکل ایجاد کند.

 سعی کنید با کپی پیست کردن خروجی SPSS (ویرایش نشده) کنار بیایید و وانمود کنید که از قالب دقیق APA بی اطلاع هستید.

آزمون رگرسیون غیر خطی

اندازه نمونه ما خیلی کوچک است که با یک مدل خطی متناسب باشد. اما ما به هر حال این کار را کردیم – از روی کنجکاوی. ساده ترین گزینه در SPSS تحت

Analyze       >>         Regression       >>          Curve Estimation

است. ما قرار نیست در مورد گفتگوها بحث کنیم اما دستور زیر را جایگذاری کردیم.

دستور رگرسیون غیر خطی در SPSS

*Non linear regression from Analyze – Regression – Curve Estimation.

TSET NEWVAR=NONE.
CURVEFIT
/VARIABLES=performance WITH iq
/CONSTANT
/MODEL= quadratic linear
/PLOT FIT.

نتیجه

باز هم ، نمونه ما برای نتیجه گیری هر چیز جدی خیلی کوچک است. با این حال ، نتایج به نوعی نشان می دهد که یک مدل منحنی خطی بسیار بهتر از مدل خطی با داده های ما متناسب است. ما دیگر این مورد را بررسی نخواهیم کرد اما می خواهیم آن را ذکر کنیم. ما احساس می کنیم که مدل های منحنی به طور معمول توسط دانشمندان علوم اجتماعی نادیده گرفته می شوند.

 ممنون از مطالعه شما