یک مجله می خواهد رضایت مشتریان را بهبود بخشد. آنها برخی از خوانندگان را در مورد 1 رضایت کلی و همچنین 2 رضایت از برخی جنبه های کیفی بررسی کردند. سوال اصلی آنها این است که “کدام جنبه ها بیشترین تأثیر را در رضایت مشتری دارند؟” ما سعی خواهیم کرد با تحلیل رگرسیون به این سوال پاسخ دهیم. رضایت کلی، متغیر وابسته(یا معیار) ما است و جنبه های کیفیت متغیرهای مستقل (یا پیش بینی کننده ها) ما هستند. این داده ها از magazine_reg.sav قابل بارگیری است که در آموزش قبلی در آماده سازی داده ها برای رگرسیون در SPSS بررسی و آماده شده اند.
تنظیمات اولیه
داده های ما شامل یک متغیر FILTER است که با دستور زیر آن را روشن خواهیم کرد. و همچنین می خواهیم هم نام متغیرها و هم برچسب ها را در خروجی خود ببینیم بنابراین آن را نیز تنظیم خواهیم کرد.
*1. Switch filter variable on.
filter by filt1.
*2. Show variable names and labels in output.
set tvars both.
واردکردن رگرسیون در spss
ابتدا رگرسیون خطی پیش فرض را بر روی داده های خود اجرا می کنیم. همانطور که در تصاویر زیر نشان داده شده است.
بیایید اکنون گفتگو و زیر دیالوگ ها را مانند تصویر زیر پر کنید.
توجه داشته باشید که معمولاً در شماره 6 در تصویر فوق، حذف موارد به صورت دو به دو را انتخاب می کنیم زیرا در محاسبه همبستگی هایی که رگرسیون ما بر اساس آنها ساخته شده است، از بیشتر موارد استفاده می شود. با کلیک روی Paste، دستور زیر حاصل می شود. بلافاصله آن را اجرا خواهیم کرد.
دستور واردکردن رگرسیون در spss
*Basic regression syntax. Note that “method=enter” in last line.
در خروجی، ابتدا جدول ضرایب خود را همانطور که در زیر نشان داده شده است، بررسی و تفسیر می کنیم.
بعضی چیزها در اینجا به طرز وحشتناکی اشتباه پیش می روند:
1ضریب (B) 0.075- نشان می دهد که پایین بودن متغییر “قابلیت اعتماد به اطلاعات” با رضایت بالاتر همراه است! با این حال، این متغیرها همبستگی مثبتی دارند (0.28 = r و 0.000=p-value است)
2- خوشبختانه این ضریب عجیب b از نظر آماری معنادار نیست: 0.063 احتمال داشت که در حالی که در جامعه این ضریب صفر باشد ما ضریب نزدیک به معنی داری در نمونه پیدا کنیم. این برای برخی دیگر از پیش بینی کننده ها نیز صدق می کند. این مشکل به عنوان همخطی شناخته می شود: ما متغیرهای پیش بینی کننده زیادی که خیلی باهم مرتبط اند را وارد مدل رگرسیون خود کردیم. مربع r در اینجا 9 متغیر پیش بینی کننده را دارای مشکل نشان می دهد. بنابراین، تاثیر منحصر به فرد برخی از متغیرها آنقدر کم می شود که دیگر نمی توان تفاوت آنها را از صفر تشخیص داد.
3فواصل اطمینان این را تأیید می کند: برای سه ضرایب b صفر را شامل می شود.
4یک قانون کلی این است که تحمل 0.01 نشانگر چند خطی بودن است. در این مورد، تحمل آماری به طور چشم گیری شکست می خورد، در تشخیص چند خطی بودن که به وضوح وجود دارد. تجربه ما این است که معمولاً همینطور است.
حل چند خطی بودن با رگرسیون گام به گام
روشی که تقریباً همیشه چند خطی را برطرف می کند، رگرسیون گام به گام است. ما مشخص می کنیم که می خواهیم کدام یک از پیش بینی کننده ها را شامل شوند. سپس SPSS بررسی می کند که کدام یک از این پیش بینی ها واقعاً در پیش بینی متغیر وابسته ما نقش دارند و مواردی را که این کار را نمی کنند، مستثنی می کند. به همین ترتیب، ما معمولاً با پیش بینی کننده های کمتری نسبت به آنچه مشخص می کنیم، درنهایت به نتیجه می رسیم. با این حال، آنهایی که باقی می مانند دارای ضرایب b ثابت و قابل توجهی در جهت مورد انتظار هستند: نمرات بالاتر کیفیت با نمرات بالاتر رضایت همراه است. خب بیاید انجامش بدیم.
دستور رگرسیون گام به گام درSPSS
دستور قبلی خود را کپی پیست کرده و METHOD = STEPWISE را در سطر آخر قرار می دهیم. به همین ترتیب، در انتها به دستور زیر می رسیم. آن را اجرا خواهیم کرد و نتایج اصلی را توضیح خواهیم داد.
این جدول روش گام به گام را نشان می دهد: SPSS با پیش بینی کننده های صفر شروع می شود و سپس قوی ترین پیش بینی کننده ،سطر1 را به مدل اضافه می کند اگر ضریب b آن از نظر آماری معنادار باشد (p < 0.05 ، ستون آخر را ببینید).
سپس دومین پیش بینی کننده قوی (سطر 3) را اضافه می کند. از آنجا که با انجام این کار ممکن است پیش بینی های وارد شده از قبل قابل توجه نباشد، SPSS ممکن است برخی از آنها را حذف کند که در این مثال اتفاق نمی افتد.
این روند ادامه می یابد تا جایی که هیچ یک از پیش بینی کننده های اضافه شده به طور قابل توجهی به بهبود پیش بینی های موجود کمک نکنند. در مثال ما، از 9 پیش بینی کننده 6 مورد وارد می شود و هیچ یک از آنها حذف نمی شوند.
خلاصه مدل رگرسیون گام به گام درSPSS
spssمدلی را در 6 مرحله ساخت که هر مرحله یک پیش بینی کننده را به معادله اضافه می کند. در حالیکه پیش بینی های بیشتری به آن افزوده می شود؛ سطوح Adj Rsq نادرست است: افزودن پیش بینی دوم به اولین، آن را با 0.087 افزایش می دهد، اما افزودن پیش بینی کننده ششم به پنجمی فقط منجر به افزایش 0.012 امتیاز می شود. افزودن بیش از 6 پیش بینی کننده فایده ای ندارد. عدد نهایی Adj Rsq ما 0.39 است، به این معنی که 6 پیش بینی کننده 39٪ از واریانس رضایت کلی را به خود اختصاص می دهند. این در تحقیقات علوم اجتماعی تا حدودی ناامید کننده است اما کاملاً طبیعی است.
ضرایب رگرسیون گام به گام درSPSS
در جدول ضرایب، ما فقط به مدل ششم و آخرین خود نگاه می کنیم. همانطور که پیش بینی کردیم، ضرایب b همه قابل توجه و در جهات منطقی هستند. از آنجا که همه پیش بینی کننده ها مقیاس های مشابه لیکرت دارند، ما ترجیح می دهیم ضرایب b را به جای ضرایب بتا تفسیر کنیم. مدل نهایی ما بیان می کند که
قویترین پیش بینی کننده ما ردیف5 (خوانایی) است: افزایش 1 امتیاز با افزایش 0.179 واحد در رضایت کلی همراه است. مدل ما اثبات نمی کند که این رابطه علیت است اما منطقی به نظر می رسد که بهبود خوانایی باعث رضایت کلی بالاتر از مجله ما شود.