یک ناشر مجله از خوانندگان آنها درمورد موارد زیر نظرسنجی کرد:

1 رضایت کلی آنها از مجلات

2 جنبه های مختلف کیفیت

بخشی از داده ها که در زیر نشان داده شده است در فایل magazine.sav  آمده است.

سوال اصلی تحقیق این است که کدام یک از جنبه های کیفیت بیشترین تأثیر را در رضایت کلی دارند؟ اکنون ، هنگام کار با داده های دنیای واقعی ، اولین کاری که می خواهید انجام دهید بررسی های اساسی داده ها است. این آموزش شما را از طریق این داده راهنمایی می کند. تحلیل واقعی رگرسیون بر روی داده های تهیه شده در آموزش بعدی ، رگرسیون گام به گام در SPSS – مثال آورده شده است.

بررسی مقادیر از دست رفته کاربر و کدگذاری

ابتدا بررسی می کنیم که آیا باید مقادیر از دست رفته کاربر را تنظیم کنیم. یک روش جامع در اینجا اجرای جداول فراوانی است که مقادیر و همچنین برچسب های مقادیر را نشان میدهد.

*Show values and value labels as well as variable names and labels in output.

set tnumbers both tvars both.

*Check frequency tables for user missing values.

frequencies satov to sat9.

نتیجه

تنظیم مقادیر از دست رفته کاربر

ما از جداول فراوانی خود دو چیز را یاد می گیریم. اول ، همه متغیرها به طور مثبت کدگذاری می شوند: مقادیر بالاتر عدد مثبت بزرگتری را میگیرند. اگر اینگونه نباشد ، روش ساده ای برای رفع آن در SPSS Recode Values ​​with Value Labels ارائه شده است. دوم ، ما باید 6 را به عنوان مقادیر از دست رفته کاربر از نظر جنبه های کیفیت ، تنظیم کنیم. این کار را با دستور زیر انجام می دهیم. همچنین نگاهی به توزیع فراوانی خواهیم انداخت.

*Set 6 as user missing values for all regression variables.

missing values sat1 to sat9 (6).

*Inspect histograms but don’t create frequency tables again.

frequencies satov to sat9
/format notable /*DON’T CREATE ANY TABLES*/
/histogram.

نتیجه

هیستوگرام های ما هیچ چیز هشداردهنده ای نشان نمی دهد به جز اینکه از متغیرها واریانس نسبتاً کمی دارند. این منجر به ایجاد همبستگی های نسبتاً محدودی می شود که در عرض یک دقیقه خواهیم دید.

بررسی مقادیر گمشده در هر مورد

اکنون با دستور زیر توزیع مقادیر از دست رفته خود را بر روی موارد بررسی خواهیم کرد.

*Add missing values per case as new variable to data.

compute mis1 = nmiss(satov to sat9).

*Apply variable label to new missingness variable.

variable labels mis1 “Number of (system or user) missings over satov to sat9”.

*Inspect missing values per case.

frequencies mis1.

نتیجه

مواردی که مقادیراز دست رفته زیادی دارند ممکن است تجزیه و تحلیل ها را پیچیده کرده ما به آنها اعتماد نکنیم. اما باز هم ، ما می خواهیم تا آنجا که ممکن است از داده های خود استفاده کنیم. اگر اجازه هیچ گونه مفقودی را ندهیم ، 19٪ از نمونه خود را از دست خواهیم داد. بنابراین تصمیم می گیریم مواردی را که 4 یا بیشتر از 4مقداراز دست رفته دارند را ، حذف کنیم.

 

*Create filter variable for cases with 3 or fewer missings.

compute filt1 = (mis1 <= 3).

*Apply variable label to filter variable.

variable labels filt1 “Filter for 3 or fewer missings over satov to sat9”.

*Activate filter variable.

filter by filt1.

*Check if filter works properly.

frequencies mis1.

بررسی مقادیر ازدست رفته در هر متغیر

همچنین نگاهی به چگونگی توزیع مفقوده ها بر روی متغیرهای خود میندازیم : آیا همه متغیرها دارای تعداد کافی مقادیر معتبر هستند یا باید یک یا چند متغیر را از تجزیه و تحلیل خود حذف کنیم؟

 *Inspect missing values per variable.

descriptives satov to sat9.

نتیجه

هیچ یک از متغیرهای ما مشکل ساز به نظر نمی رسند. کمترین N برای ردیف 6(قابلیت اطمینان اطلاعات) دیده می شود. شاید برای پاسخ دهندگان ما قضاوت در مورد این جنبه سخت باشد.

 بررسی همبستگی های پیرسون

نکته آخر اینکه ، ما می خواهیم اطمینان حاصل کنیم که همبستگی های ما قابل قبول به نظر می رسند. نگاهی سریع به کل ماتریس همبستگی خواهیم انداخت.

*Inspect Pearson correlations.

correlations satov to sat9.

*Save edited data file for regression.

save outfile ‘magazine_reg.sav’.

نتیجه

مواردی که باید مراقب آنها باشید همبستگی در جهتاشتباه” است (مثبت در صورت منفی بودن معنی دارد یا برعکس). این ممکن است در نتیجه کدگذاری مثبت برخی از متغیرها و سایر موارد منفی باشد اما ما قبلاً دیدیم که در مورد داده های ما چنین نیست.

کمتر رایجه اما بسیار مشکل ساز است که همبستگی ها نزدیک یا برابر با 1- یا 1باشد که (تقریباً) بدلیل متغیرهای تکراری است.البته این در اینجا وجود ندارد.

اکنون خوب هست که به سراغ تحلیل رگرسیون برویم. از آنجا که یک متغیر فیلتر ایجاد کردیم ، داده های خود را به عنوان magazine_reg.sav ذخیره خواهیم کرد. ما از این فایل به عنوان ورودی در آموزش بعدی خود استفاده خواهیم کرد.