متغیر دو حالتی چیست؟

 

متغیر دو حالتی متغیری است که دو مقدار دقیق متمایز را در برمیگیرد. در ابتدا به چند مثال برای درک بهتر این نکته توجه  کنید. سپس به این مسئله اشاره خواهیم کرد که چرا تشخیص متغیر دو حالتی از متغیرهای دیگر ،تحلیل داده ها و انتخاب آزمون آماری مناسب را راحتتر میکند.

 

چند مثال ساده

خواندن داده های روی عکس صفحه :

       متغیر کامل یک متغیر دو حالتی نیست . این متغیر فقط یک مقدار دقیق را شامل میشود پس به جای متغیر آن را ثابت مینامیم.

       متغیر جنسیت یک متغیر دوحالتی است زیرا دقیقا دو مقدار مشخص را شامل میشود‌.

       وضعیت تاهل یک متغیر دو حالتی نیست چرا که ۳ مقدار را شامل میشود(مجرد،متاهل،ازدواج ناموفق)‌. اگر فقط این را در نظر بگیریم که هم اکنون مجرد هستند یا متاهل، میتوان آن را به عنوان یک متغیر دو حالتی در نظر گرفت.

       Q1 یک متغیر دو حالتی است. از آنجایی که یاخته های تهی(مقادیر از دست رفته) همواره از تحلیلها کنار گذاشته میشوند، در سمت چپ دو مقدار دقیق داریم.

       اگر دسته “بدون پاسخ” را کنار بگذاریم،  متغیر Q2 یک متغیر دوحالتی است .در غیر اینصورت دوگانه نیست.

 

متغیر دو حالتی – چه چیزی موجب اهمیت آن میشود؟

متغیرهای دو حالتی راحتترین متغیرهای ممکن هستند. نکته اینجا این است که -اگر حجم نمونه داده شده باشد– توزیع فراوانی متغیر دو حالته دقیقا فقط با یک عدد روشن می شود. اگر ما ۴۵ مشاهده روی جنسیت داشته باشیم و ۴۵ درصد آنها مرد باشند، آنگاه ما همه چیز را در مورد این متغیر می دانیم.

توجه داشته باشید که این نکته برای متغیرهای دسته‌ای دیگر برقرار نیست. اگر به طور مثال ما بدانیم که ۴۵ درصد از نمونه ما(حجم نمونه=۱۰۰) دارای چشم های قهوه‌ای هستند، دیگر نمیدانیم چند درصد دارای چشمهای آبی هستند، چند درصد سبز و الی آخر. موضوع این است‌ که در اینجا نمی توانیم توزیع دقیق فراوانی را فقط با یک عدد مشخص کنیم.

مشابه نکته بالا برای متغیرهای متریک نیز برقرار است: اگر بدانیم که میانگین سن یک نمونه(10=n) دقیقا برابر با ۲۵سال است، واریانس، چولگی، کشیدگی و موارد مورد نیاز دیگر برای رسم نمودار هیستوگرام داده ها را نمی دانیم.

 

متغیرهای دوحالتی هم متغیر دسته ای هستند و هم متریک

انتخاب درست تکنیک تحلیل داده ها زمانی راحتتر میشود که ما از معیار اندازه گیری متغیرهای موجود آگاه باشیم. رده بندی متغیرها به طور معمول شامل متغیرهای دسته‌ای(اسمی، ترتیبی) و متریک(فاصله‌ای، نسبتی) می شود. اگر چه متغیرهای دوحالتی با این دسته بندی مطابقت ندارد، چرا که این متغیرهای هم دسته ای هستند و هم متریک‌.

 این ویژگی عجیب (چیزی که دریک دقیقه به تصویر خواهیم کشید) رفتار متغیرهای دوگانه را به عنوان یک معیار اندازه‌ گیری جدا توجیه می کند.

متغیرهای دوحالتی خروجی

 

بعضی سوالات تحقیقاتی متغیرهای دوحالتی وابسته(خروجی) را درگیر می کنند. در این صورت برای خلاصه سازی بعضی متغیرها از نسبت و یا درصد به عنوان آمار توصیفی استفاده می کنیم. به عنوان مثال، در سال ۲۰۱۷مردم تمایل دارند که ماشین جدید خریداری کنند. ممکن است بخواهیم بدانیم که چه درصد از مردم ماشین جدید می خرند. این سوال برای یک قیاس هم با آزمون دو جمله ای پاسخ داده می شود و هم با آزمون Z

آزمونهای ذکر شده -و موارد دیگر- صرفا برای متغیرهای دوحالتی وابسته استفاده میشوند. در همه مناطق این آزمونها از پرکاربردترین-و ساده ترین- آزمونهای آماری می باشند.

متغیرهای دوحالتی ورودی

یک مثال از یک آزمون با استفاده از یک متغیر دوحالتی مستقل -به عنوان ورودی-، آزمونt مستقل یک نمونه‌ای(t-test) میباشد. که در زیر توضیح داده شده است.

در این آزمون متغیرهای دوحالتی گروهی از مواردی را تعریف میکنند و از این رو به عنوان متغیر دسته ای استفاده میشوند‌. آزمون استقلال نمونه‌ای t-test اکیدا یک آزمون غیر ضروری میباشد زیرا این آزمون با ANOVAیک طرفه معادل میباشد. با این حال، متغیر مستقلی که تنها ۲ مقدار دقیق را در برمیگیرد محاسابات موجود را به طور چشم گیری ساده تر میکند. به همین دلیل است که در کتابهای درسی این آزمون به طور جداگانه بیشتر از آزمون کلی ANOVA مورد بررسی قرار میگیرد.

 کسانی که با رگرسیون آشنایی دارند میدانند که برآوردگرها(یا متغیرهای مستقل) باید متریک و یا دوحالتی باشند. به عنوان در نظر گرفتن یک متغیر دسته ای، این متغیر باید به تعدادی از متغیرهای دوحالتی تبدیل شود ، معمولا به عنوان متغیر ساختگی یا مجازی شناخته میشود‌.

این مسئله نشان میدهد که در رگرسیون، متغیرهای دوحالتی نسبت به متغیرهای دسته‌ای  به عنوان یک مقیاس اندازه گیری در نظر گرفته  میشود‌.

دو حالتی سازی متغیرها

آخرین موضوع ولی به همان میزان اهمیت این است که گاهی اوقات بین متغیرهای دوحالتی طبیعی و متغیرهای دو حالتی غیر طبیعی یک تمایز ایجاد میشود. یک متغیر دوحالتی غیر طبیعی است اگر که این متغیر دقیقا ۲ مقدار را بپذیرد‌(مانند جنسیت، متاهل بودن یا زنده بودن) . اگر متغیر شما در داده هایتان دقیقا دو مقدار را بپذیرد اما ممکن باشد که در جهان طبیعت بیشتر از دو مقدار را بپذیرد، در این صورت متغیر یک متغیر دو حالتی غیر طبیعی میباشد.

ساختن متغیرهای دوحالتی از متغیرهایی که دو حالتی نیستند به عنوان دوحالتی سازی(دو بخشی سازی) شناخته شده است‌. عکس آخر یک حقه‌ی دستی اما کمتر شناخته شده را برای انجام این عمل در SPSS به نمایش میکشد.

امیدواریم که این آموزش برایتان مفید بوده باشد‌. بابت مطالعه این آموزش متشکرم