مثالی از هیستوگرام

هیستوگرام نموداری است که فراوانی متغیر را در فواصل بین مقادیر آن در متغیرهای متریک(کمی) نشان می دهد.

این فواصل به عنوان “سطل” معروف است و همه آنها دارای عرض یکسان هستند. مثال بالا از 25 دلار به عنوان عرض سطل استفاده می کند. بنابراین نشان می دهد که چقدر افراد بین 800 تا 825 دلار ، 825 تا 850 دلار و غیره درآمد دارند.
توجه داشته باشید که “نما یا مد” در توزیع فراوانی بالا بین 900 تا 925 دلار است که حدود 150 بار اتفاق می افتد.

مثالی از هیستوگرام

یک شرکت می خواهد بداند که چگونه حقوق ماهانه بین 1110 کارمند دارای مشاغل عملیاتی، متوسط یا بالاتر توزیع می شود. تصویر زیر نشان می دهد که داده های خام آنها چگونه است.

مقادیر مثال هیستوگرام

از آنجا که این حقوق تا حدی بر اساس کمیسیون است ، اساساً هر کارمند حقوق کمی متفاوت دارد. حال چگونه می توان بین تقسیم حقوق و دستمزد بینشی پیدا کرد؟

هیستوگرام در مقابل بارچارت(BarChart)

ابتدا یک نمودار بارچارت برای حقوق ماهیانه رسم میکنیم که به صورت زیر نشان داده شده است.

مقایسه بارچارت

نمودار میله ای ما تقریباً بی ارزش است. تنها چیزی که از آن یاد می گیریم این است که بیشتر حقوق ها فقط یک بار و برخی دیگر دو بار تکرار شده است. مشکل اصلی در اینجا این است که یک نمودار میله ای فراوانی را نشان می دهد که هر مقدار متمایز در داده ها رخ می دهد.

نکته مهم این است که فاصله اول (832 دلار – 802 دلار =) 30 دلار عرض دارد. آخرین فاصله نشان دهنده (1206 دلار – 1119 دلار =) 87 دلار است. اما هر دو به اندازه یک میلی متر بر روی صفحه نمایش شما نشان داده شده اند. این به ما می گوید که
محور x مقیاس خطی ندارد
که این نمودار را برای متغیر متریک مانند حقوق ماهانه نامناسب می کند.

از آنجا که نمودار میله ای ما خوب نبود، اکنون سعی می کنیم یک هیستوگرام بر روی داده های خود اجرا کنیم. نتیجه در پایین نشان داده شده است.

مثالی از هیستوگرام

این نمودار بسیار مفیدتر به نظر می رسد اما چگونه تهیه شده است؟ خوب، ما حقوق هر کارمند را به فاصله 25 دلار (800 دلار – 825 دلار ، 825 دلار – 850 دلار و غیره) اختصاص دادیم. در مرحله بعد، تعداد کارکنانی را که در هر بازه زمانی قرار دارند، بررسی کردیم. ما این فراوانی ها را با میله در نمودار تجسم می کنیم.
نکته مهم این است که محور x نمودار ما دارای مقیاس خطی است: هر فاصله 25 دلاری با عرض یکسان در میلی متر مطابقت دارد حتی اگر صفر کارمند داشته باشد. نمودار ما به عنوان هیستوگرام شناخته می شود و همانطور که در مشاهده می شود یک نمودار بسیار مفید است.

هیستوگرام: طول دسته بندی

طول دسته بندی، طول فواصلی است که
فراوانی های آن را در هیستوگرام تجسم می کنیم.


در مثال اول ما از عرض سطر 25 دلار استفاده شد. نوار اول نشان دهنده تعداد حقوق بین 800 تا 825 دلار و غیره است. عرض این دسته 25 دلاری یک انتخاب نسبتاً دلخواه است. شکل زیر هیستوگرام هایی را روی داده های یکسان، با استفاده از عرض های مختلف دسته بندی نشان می دهد.

اگرچه عرض های مختلف دسته بندی منطقی به نظر می رسد، اما ما احساس می کنیم که 10 دلار نسبتاً باریک و 100 دلار نسبت به داده های موجود بسیار وسیع است. 25 دلار یا 50 دلار مناسب تر به نظر می رسد.

هیستوگرام ها: چرا اینقدر مفید هستند؟

چرا هیستوگرام ها اینقدر مفید هستند؟ خوب، اول از همه، نمودارها بسیار بصری تر از جداول هستند. پس از مشاهده نمودار به مدت 10 ثانیه، می توانید اطلاعات خود را بسیار بیشتر از بررسی 10 ثانیه جدول مربوطه بیان کنید. به طور کلی نمودارها اطلاعات مربوط به داده های ما را سریعتر از جداول(هرچند با دقت کمتر) منتقل می کنند.


علاوه بر این، هیستوگرام ها همچنین اطلاعات بسیار بیشتری در مورد داده های ما به ما می دهند. به خاطر داشته باشید که می توانید به طور منطقی میانگین، انحراف معیار، چولگی و کشیدگی متغیر را از هیستوگرام تخمین بزنید. با این حال، شما نمی توانید هیستوگرام یک متغیر را از آمارهای جداول ذکر شده برآورد کنید. ما این را با یک مثال نشان می دهیم.

هیستوگرام در برابر جدول آمارهای توصیفی

فرض کنید ما دو متغیر سنی در داده های خود پیدا کرده ایم و مطمئن نیستیم که از کدام یک باید استفاده کنیم. ما برخی از آمار توصیفی اساسی را برای هر دو متغیر مقایسه می کنیم و تقریباً یکسان به نظر می رسند.

بنابراین آیا می توان نتیجه گرفت که هر دو متغیر سنی تقریباً دارای توزیع مشابه هستند؟ اگر اینطور فکر می کنید، به هیستوگرام های آنها در زیر نگاه کنید.

هیستوگرام توزیع فراوانی ها

هر یک از 1110 کارمند داده های ما دارای سطح شغلی هستند: عملیاتی، مدیریت میانی یا مدیریت بالاتر. اگر بخواهیم توزیع حقوق بین این سه گروه را مقایسه کنیم، ممکن است هیستوگرام تقسیم شده را بررسی کنیم: برای هر سطح شغلی هیستوگرام جداگانه ایجاد می کنیم و این سه هیستوگرام دارای محورهای یکسان هستند. نتیجه در پایین نشان داده شده است.

هیستوگرام تقسیم شده ما کاملاً بی معنی شده است. مشکل این است که اندازه گروهها بسیار نابرابر است و اینها بطور خطی به مساحت سطوح هیستوگرامهای ما مربوط می شوند. نتیجه این است که سطح برای مدیریت بالاتر (n = 10) تنها 1٪ از سطح برای “عملیاتی” (n = 1000) است. هیستوگرام برای مدیریت بالاتر آنقدر کوچک است که دیگر قابل مشاهده نیست.

هیستوگرام جداشده بر اساس نسبت(درصد)

ما فقط دیدیم که چگونه جداسازی هیستوگرام با فراوانی برای داده های موجود بی فایده است. آیا این بدان معناست که ما نمی توانیم جداسازی حقوق را در سطوح شغلی مقایسه کنیم؟ جواب منفی. اگر درصدهایی را در گروههای سطح شغلی انتخاب کنیم، هر هیستوگرام مساحت یکسانی 100٪ خواهد داشت. نتیجه در پایین نشان داده شده است.

هیستوگرام جداسازی شده نسبتی

هیستوگرام: نکته نهایی

هدف این آموزش توضیح هیستوگرام ها و تفاوت آنها با نمودارهای میله ای است. به نظر ما، هیستوگرام ها یکی از مفیدترین نمودارها برای متغیرهای متریک هستند. با استفاده از نرم افزار مناسب (مانند SPSS)، می توانید هیستوگرام ها را سریع ایجاد و بررسی کنید و انجام این کار راهی عالی برای آشنایی با داده های شما است.