تجسم داده ها بهترین کاری است که می توانید با آن ها انجام دهید. انجام این کار ممکن است به کمی تلاش نیاز داشته باشد: دستور FREQUENCIES در SPSS می تواند هیستوگرام ها یا نمودارهای میله ای بسیاری را با یک حرکت ایجاد کند.
متأسفانه ، وضعیت پراکندگی ها متفاوت است: هر یک از آنها به دستور جداگانه ای نیاز دارند. بنابراین ما به ابزاری برای ایجاد آنها نیاز داریم ، بسیاری یا همه نمودار های پراکنش در میان مجموعه ای از متغیرها ، به صورت اختیاری با خطوط متناسب (غیر خطی) و جداول رگرسیون ، ایجاد کردیم.
داده های مثال
ما در طول این آموزش از داده های health-costs.sav استفاده میکنیم(بخشی از آن در زیر نشان داده شده است).
ما شما را به دانلود و باز کردن این فایل و تکرار مثالی که در عرض یک دقیقه ارائه می دهیم تشویق می کنیم.
پیش نیازها و نصب
ما به SPSS نسخه 24 یا بالاتر نیاز دارد. همچنین ، SPSS Python 3 باید نصب شود (معمولاً این مورد در نسخه های اخیر SPSS وجود دارد).
با کلیک بر روی SPSS_TUTORIALS_SCATTERS.spe ابزار نمودار پراکندگی بارگیری می شود. همانطور که در زیر نشان داده شده است ، می توانید آن را از طریق
Extensions >> Install local extension bundle
نصب کنید.
در گفتگویی که باز می شود ، به سمت دانلود آن هدایت می شوید. spe فایل و آن را نصب کنید. سپس SPSS تأیید می کند که برنامه افزودنی با موفقیت نصب شده است در قسمت
Graphs >>> SPSS tutorials – Create All Scatterplots
می توانید مشاهده کنید
مثال i - ایجاد همه نمودارهای پراکنش منحصر به فرد
بیایید اکنون همه نمودار های پراکنش منحصر به فرد بین هزینه های سلامتی ، مصرف الکل و سیگار و ورزش را بررسی کنیم. ما به بخش
Graphs >> SPSS tutorials – Create All Scatterplots
می رویم و کادر گفتگو را مانند تصویر زیر پرمیکنیم.
1همه متغیرهای مربوطه را به عنوان متغیرهای محور y وارد می کنیم. ما توصیه می کنیم همیشه ابتدا متغیر وابسته را وارد کنید (در صورت وجود).
2همین متغیرها را به عنوان متغیرهای محور x هم وارد می کنیم.
3این ترکیب متغیرهای محور y و محور x منجر به نمودار تکراری می شود. به عنوان مثال ، نمودار هزینه با الکل همان نمودار الکل با هزینه است که محور های آن جا به جا شده اند. اگر گزینه “analyze only y,x and skip x,y” را انتخاب کنید از نمودار های تکراری صرف نظر می شود.
4علاوه بر ایجاد نمودارهای پراکنش ، همچنین نگاهی سریع به دستورSPSS برای ایجاد آن می اندازیم.
5اگر هیچ عنوانی وارد نشود ، ابزار ما عناوین خودکار را اعمال می کنند. برای این مثال ، عناوین اتوماتیک نسبتاً طولانی بودند. ما عنوان (“”Scatterplot)را برای همه آنها گذاشتیم. تنها راه برای نگذاشتن عنوان برای همه آنها ، رسم نمودار های جداگانه است.
7با کلیک روی Paste ، دستور زیر نتیجه می شود. بیایید آن را اجرا کنیم.
ابزار نمودار پراکنش در – SPSS دستور 1
*Create all unique scatterplots among costs, alco, cigs and exer.
در ابتدا توجه داشته باشید که دستورات GRAPH که توسط ابزار ما اجرا می شوند نیز در پنجره خروجی چاپ شده اند (در زیر نشان داده شده است). می توانید این موارد را کپی ، پیست ، ویرایش و اجرا کنید روی هر SPSS نصب شده ای، حتی اگر ابزار ما نصب نشده باشند.
در زیر این دستور ، ما همه 6 نمودار پراکنش منحصر به فرد را پیدا می کنیم. اکثر آنها همبستگی های اساسی را نشان می دهند و همه آنها قابل قبول به نظر می رسند. با این حال ، توجه داشته باشید که برخی از نمودار ها مخصوصاً اولین مورد اشاره به کمی منحنی بودن دارد. در مثال دوم خود به طور کامل این موضوع را بررسی خواهیم کرد.
در هر صورت ، ما احساس می کنیم که نگاه سریع به چنین پراکندگی هایی باید همیشه قبل از تجزیه و تحلیل همبستگی SPSS باشد.
مثال ii - بررسی خطی پیش بینی کننده ها
اکنون می خواهم یک تحلیل رگرسیون چندگانه را برای پیش بینی هزینه های سلامتی از چندین پیش بینی کننده انجام دهم. اما قبل از انجام این کار ، بیایید ببینیم که آیا هر یک از پیش بینی ها ارتباط خطی با متغیر وابسته ما دارند یا خیر. مجدداً ، ما به قسمت
Graphs >> SPSS tutorials – Create All Scatterplots
رفته و کادر گفتگو را مانند تصویر زیر پر کنید.
1متغیر وابسته متغیر محور y ما است.
2همه متغیرهای مستقل محور x هستند.
3گزینه نمودار پراکنش با تمام خطوط متناسب و جداول رگرسیون را انتخاب میکنیم.
4بعد از کلیک روی دکمه Paste ، دستور زیر را اجرا میکنیم.
ابزار نمودار پراکنش در – SPSS دستور 2
*Fit all possible curves for 4 predictors onto single dependent variable.
توجه داشته باشید که اجرای این دستور باعث ایجاد برخی هشدارها در مورد مقادیر صفر در برخی متغیرها می شود. با اطمینان می توان این موارد را نادیده گرفت.
نتایج
در اولین نمودار پراکنش با خطوط رگرسیون ، برخی از منحنی ها به طور قابل توجهی از خط منحرف می شوند همانطور که در زیر نشان داده شده است.
متأسفانه ، خطوط این نمودار کاملاً مشخص نیست که کدام منحنی کدام تابع را تجسم می کند. بنابراین بیایید به جدول رگرسیون نشان داده شده در زیر نگاه کنیم.
بسیار جالب است که وقتی پیش بینی مربعr را به مدل خود اضافه می کنیم ، r-square از 0.138 تا 0.200 تغییر می کند. ضرایب b به ما می گویند که معادله رگرسیون برای این مدل عبارت است از Costs’ = 4,246.22 – 55.597 * alco + 6.273 * alco2 متاسفانه ، این جدول شامل سطح معنی داری یا فواصل اطمینان برای این ضرایب b نیست. با این حال ، اینها پس از افزودن پیش بینی مربع به داده های ما ، به راحتی از تحلیل رگرسیون بدست می آیند. دستور زیر این کار را انجام می دهد.
*Compute squared alcohol consumption.
compute alco2 = alco**2.
*Multiple regression for costs on squared and non squared alcohol consumption.
regression /statistics r coeff ci(95) /dependent costs /method enter alco alco2.