نمودار میلهای: راهنمای جامع از دبیرستان تا تحلیل داده
ماهیت و کاربردهای اصلی نمودار میلهای
نمودار میلهای یکی از سادهترین و در عین حال مؤثرترین روشهای نمایش دادههای آماری است. در این نمودار، دادهها به صورت میلههای مستطیلی جدا از هم نشان داده میشوند. طول یا ارتفاع هر میله متناسب با مقداری است که نشان میدهد (مانند فراوانی، درصد یا هر کمیت عددی دیگر). ویژگی کلیدی که آن را از هیستوگرام متمایز میکند، وجود فاصله بین میلههاست که تأکید میکند دادهها از نوع گسسته1 یا کیفی2 هستند و پیوستگی بین مقادیر معنا ندارد.
برای مثال، فرض کنید میخواهیم تعداد دانشآموزان هر پایه تحصیلی یک دبیرستان را نشان دهیم. پایههای هفتم، هشتم، نهم، دهم، یازدهم و دوازدهم مقولههای مجزا هستند و مفهوم «پایه هفتم و نیم» وجود ندارد. به همین دلیل، نمودار میلهای بهترین انتخاب است. هر میله نشاندهنده یک پایه و ارتفاع آن نشاندهنده تعداد دانشآموزان آن پایه است. فاصله بین میلهها هم به ما میگوید که این مقولهها از هم جدا هستند.
اجزای اصلی و انواع دادههای مناسب
برای درک بهتر نحوه خواندن و رسم نمودار میلهای، لازم است با اجزای اصلی آن آشنا شویم. هر نمودار میلهای استاندارد از بخشهای زیر تشکیل شده است:
- محور افقی (محور x): این محور محل قرارگیری مقولهها یا دستههای داده است. مانند نام رنگها، گروههای سنی، یا انواع خوراکیها.
- محور عمودی (محور y): این محور نشاندهنده مقیاس عددی است که فراوانی، درصد یا مقدار هر دسته را اندازهگیری میکند.
- میلهها: هر میله متناظر با یک دسته است و ارتفاع (یا طول) آن با مقدار متناظر روی محور عمودی برابر است.
- عنوان نمودار: توضیحی کلی از آنچه نمودار نمایش میدهد.
- برچسبهای محورها: توضیح میدهند که هر محور نشاندهنده چه نوع دادهای است.
همانطور که اشاره شد، این نمودار برای دو نوع داده اصلی کاربرد دارد:
دادههای گسسته مقادیری هستند که تنها میتوانند اعداد صحیح و مشخصی باشند (مثل تعداد افراد خانواده یا تعداد دفعات انجام یک کار). دادههای کیفی مقادیری هستند که به جای عدد، یک ویژگی یا صفت را توصیف میکنند (مثل رنگ چشم، رشته تحصیلی، یا نوع فیلم مورد علاقه).
مثال عینی: نظرسنجی طعم محبوب بستنی
برای روشن شدن موضوع، یک نظرسنجی ساده در یک کلاس 30 نفره انجام دادهایم. از دانشآموزان پرسیدهایم «کدام طعم بستنی را بیشتر از همه دوست داری؟» و نتایج به صورت زیر بوده است:
| طعم بستنی | تعداد دانشآموزان (فراوانی) | فراوانی نسبی (درصد) |
|---|---|---|
| وانیل | 12 | 40% |
| شکلاتی | 10 | 33.3% |
| توتفرنگی | 5 | 16.7% |
| لیمویی | 3 | 10% |
حال اگر بخواهیم این دادهها را به صورت نمودار میلهای رسم کنیم، محور افقی شامل نام طعمها (وانیل، شکلاتی و ...) و محور عمودی شامل اعداد 0 تا 12 خواهد بود. برای هر طعم، یک میله رسم میکنیم که ارتفاع آن برابر با تعداد دانشآموزان علاقهمند به آن طعم است. به این ترتیب، در یک نگاه میتوان فهمید که وانیل محبوبترین و لیمویی کممحبوبترین طعم در این کلاس است. اگر به جای فراوانی مطلق، بخواهیم درصدها را نشان دهیم، کافی است محور عمودی را بر حسب درصد مدرج کنیم.
چالشهای مفهومی در مواجهه با نمودار میلهای
مهمترین تفاوت در نوع دادهای است که نمایش میدهند. نمودار میلهای برای دادههای گسسته و کیفی به کار میرود و میلهها از هم جدا هستند. هیستوگرام برای دادههای پیوسته3 استفاده میشود و میلهها به هم چسبیده هستند، زیرا مرز بین دستهها (مثلاً بازههای سنی 10-20 و 20-30) پیوسته است. در هیستوگرام، مساحت هر میله نمایانگر فراوانی است، در حالی که در نمودار میلهای، ارتفاع میله اهمیت دارد.
خیر، در این شرایط نمودار میلهای شلوغ شده و خوانایی خود را از دست میدهد. برای دادههای گسسته با دستههای زیاد (مثلاً نمرات دقیق دانشآموزان از 0 تا 20) میتوان ابتدا دادهها را در گروههای کوچک (مثلاً نمرات 0-5، 5-10 و ...) طبقهبندی کرد و سپس برای نمایش این گروههای جدید از هیستوگرام استفاده نمود. گاهی نیز از نمودار میلهای افقی برای جا دادن نام دستههای طولانی استفاده میکنیم.
بله، به این نوع نمودارها، «نمودار میلهای گروهی» یا «نمودار میلهای چندگانه» میگویند. برای مثال، فرض کنید میخواهیم نتایج نظرسنجی طعم بستنی را در دو کلاس متفاوت با هم مقایسه کنیم. در این حالت، به ازای هر طعم (مثلاً وانیل)، دو میله در کنار هم رسم میشود: یکی برای کلاس اول و دیگری برای کلاس دوم. برای تمایز، هر مجموعه داده را با رنگ یا الگوی متفاوتی نشان میدهیم و از یک راهنمای رنگ (legend) در کنار نمودار استفاده میکنیم.
پاورقی
1 داده گسسته (Discrete Data): دادههایی که تنها میتوانند مقادیر مشخص و مجزایی به خود بگیرند و بین آن مقادیر، عدد دیگری وجود ندارد. مانند تعداد فرزندان یک خانواده.
2 داده کیفی (Qualitative Data): دادههایی که به جای عدد، یک ویژگی یا صفت غیرعددی را توصیف میکنند. مانند گروه خونی یا ملیت.
3 داده پیوسته (Continuous Data): دادههایی که میتوانند هر مقداری را در یک بازه مشخص اختیار کنند (شامل اعداد اعشاری). مانند قد، وزن یا دما.