جدول فراوانی: پلی از دادههای خام به اطلاعات معنادار
۱. چیستی جدول فراوانی و اجزای اصلی آن
جدول فراوانی ساختاری جدولی دارد که دادههای خام را بر اساس مقادیر یا گروههای مشخصی مرتب میکند. سادهترین نوع آن شامل دو ستون اصلی است: ستون اول مقادیر یا دستهها و ستون دوم فراوانی مطلق (تعداد تکرار) را نشان میدهد. برای درک بهتر، فرض کنید نظرسنجیای از ۲۰ دانشآموز درباره رنگ مورد علاقهشان انجام دادهایم و نتایج به این صورت است: آبی، قرمز، سبز، آبی، آبی، زرد، قرمز، سبز، آبی، سبز، قرمز، آبی، آبی، زرد، سبز، قرمز، آبی، سبز، آبی، قرمز.
برای تبدیل این دادههای خام به جدول فراوانی، ابتدا رنگهای منحصربهفرد را در یک ستون مینویسیم و سپس تعداد دفعات تکرار هر کدام را در ستون بعدی ثبت میکنیم. نتیجه جدولی شبیه زیر خواهد بود:
| رنگ مورد علاقه | فراوانی مطلق (تعداد) |
|---|---|
| آبی | ۸ |
| قرمز | ۵ |
| سبز | ۵ |
| زرد | ۲ |
این جدول ساده به ما نشان میدهد که رنگ آبی با ۸ رأی محبوبترین رنگ در این کلاس است.
۲. توسعه جدول: فراوانی نسبی و درصدی
فراوانی مطلق تعداد را نشان میدهد، اما برای مقایسه گروهها با اندازههای مختلف، به فراوانی نسبی نیاز داریم. فراوانی نسبی از تقسیم فراوانی مطلق هر دسته بر کل دادهها به دست میآید. اگر این نسبت را در ۱۰۰ ضرب کنیم، به فراوانی درصدی میرسیم.
برای مثال بالا، کل دانشآموزان ۲۰ نفر هستند. بنابراین فراوانی نسبی رنگ آبی برابر است با ۸/۲۰ = ۰/۴ و فراوانی درصدی آن ۴۰٪ خواهد بود. جدول کاملتر به این شکل درمیآید:
| رنگ | فراوانی مطلق | فراوانی نسبی | فراوانی درصدی |
|---|---|---|---|
| آبی | ۸ | ۰/۴ | ۴۰٪ |
| قرمز | ۵ | ۰/۲۵ | ۲۵٪ |
| سبز | ۵ | ۰/۲۵ | ۲۵٪ |
| زرد | ۲ | ۰/۱ | ۱۰٪ |
۳. جدول فراوانی برای دادههای پیوسته (دستهبندی)
زمانی که دادهها به صورت اعداد پیوسته مانند نمرات، قد، وزن یا دما باشند، معمولاً هر مقدار تکرار کافی ندارد. در این حالت، دادهها را در بازههای مشخصی به نام طبقه4 دستهبندی میکنیم. فرض کنید نمرات ۲۰ دانشآموز در یک آزمون ۲۰ نمرهای به این شرح است: ۱۲، ۱۵، ۸، ۱۶، ۱۴، ۱۹، ۵، ۱۳، ۱۷، ۱۰، ۱۸، ۱۴، ۱۱، ۹، ۲۰، ۱۳، ۷، ۱۶، ۱۲، ۱۴. برای ساخت جدول فراوانی، ابتدا باید تعداد طبقات و طول هر طبقه را مشخص کنیم. یک روش معمول استفاده از ۵ تا ۱۰ طبقه است. ما در اینجا از ۵ طبقه با طول ۳ نمره استفاده میکنیم ((۲۰-۵)/۵ ≈ ۳).
| طبقات نمرات | شمارش (علامتگذاری) | فراوانی مطلق | فراوانی نسبی |
|---|---|---|---|
| ۵ - ۷/۹۹ | ||| | ۳ | ۰/۱۵ |
| ۸ - ۱۰/۹۹ | ||| | ۳ | ۰/۱۵ |
| ۱۱ - ۱۳/۹۹ | ||||| | ۵ | ۰/۲۵ |
| ۱۴ - ۱۶/۹۹ | ||||| || | ۷ | ۰/۳۵ |
| ۱۷ - ۲۰ | || | ۲ | ۰/۱ |
این جدول نشان میدهد که بیشتر دانشآموزان (۷ نفر) نمراتی در بازه ۱۴ تا ۱۷ کسب کردهاند.
۴. کاربرد عملی: تحلیل نتایج یک نظرسنجی
فرض کنید یک فروشگاه اینترنتی قصد دارد برای بهبود خدمات خود، نظرسنجیای با این سوال انجام دهد: "سفارش خود را در کدام بازه زمانی تحویل گرفتهاید؟" گزینهها: ۸-۱۰ صبح، ۱۰-۱۲ ظهر، ۱۲-۱۴ بعدازظهر، ۱۴-۱۶ عصر، ۱۶-۱۸ عصر. نتایج حاصل از ۱۵۰ پاسخ به شرح زیر است. استفاده از جدول فراوانی میتواند به مدیر فروشگاه دید روشنی بدهد:
| بازه زمانی تحویل | تعداد مشتریان | درصد از کل | نتیجهگیری |
|---|---|---|---|
| ۸-۱۰ صبح | ۱۵ | ۱۰٪ | کمترین |
| ۱۰-۱۲ ظهر | ۴۵ | ۳۰٪ | پربسامد |
| ۱۲-۱۴ بعدازظهر | ۶۰ | ۴۰٪ | پربسامدترین |
| ۱۴-۱۶ عصر | ۲۰ | ۱۳/۳٪ | متوسط |
| ۱۶-۱۸ عصر | ۱۰ | ۶/۷٪ | کمترین |
مدیر فروشگاه با دیدن این جدول متوجه میشود که اوج تحویل سفارشات در بازه ۱۲ تا ۱۴ است و میتواند برنامهریزی نیروی انسانی را برای این ساعات افزایش دهد.
۵. چالشهای مفهومی در جدول فراوانی
پاسخ: اگر دادهها کیفی5 (مانند رنگ، جنسیت) یا کمی گسسته6 با تنوع کم (مثل تعداد فرزندان) باشند، میتوان هر مقدار را جداگانه آورد. اما برای دادههای کمی پیوسته7 با دامنه وسیع (مثل قد یا نمره)، دستهبندی باعث میشود الگوی کلی دادهها را بهتر ببینیم و جدول خلاصهتر و قابل فهمتر شود.
پاسخ: انتخاب طول طبقه خیلی مهم است. اگر طبقات خیلی کوچک باشند، جدول شلوغ و غیرقابل نتیجهگیری میشود. اگر خیلی بزرگ باشند، جزئیات مهم از بین میروند. یک قانون سرانگشتی استفاده از ۵ تا ۱۰ طبقه است. همچنین میتوان از فرمول $طول\ طبقه = \frac{بیشترین\ مقدار - کمترین\ مقدار}{تعداد\ طبقات}$ استفاده کرد.
پاسخ: برای جلوگیری از همپوشانی، مرز طبقات را با دقت مشخص میکنیم. مثلاً اگر طبقات ۱۰-۱۲ و ۱۲-۱۴ باشند، عدد ۱۲ در کدام طبقه قرار میگیرد؟ برای رفع این ابهام، معمولاً مرزها را به صورت ۱۰ - ۱۲ (شامل ۱۰ تا کمتر از ۱۲) و ۱۲ - ۱۴ (شامل ۱۲ تا کمتر از ۱۴) تعریف میکنیم. این روش دقت شمارش را بالا میبرد.
پاورقی
1 جدول فراوانی (Frequency Table): جدولی که دادهها را بر اساس مقادیر یا دستهها مرتب کرده و تعداد مشاهدات هر کدام را نشان میدهد.
2 فراوانی مطلق (Absolute Frequency): تعداد دفعات تکرار یک مقدار یا یک گروه در مجموعه دادهها.
3 فراوانی نسبی (Relative Frequency): نسبت فراوانی مطلق یک دسته به جمع کل دادهها.
4 طبقه (Class): بازهای از مقادیر که دادههای پیوسته در آن دستهبندی میشوند.
5 داده کیفی (Qualitative Data): دادههای غیرعددی که توصیفکننده یک ویژگی هستند (مانند رنگ، جنسیت).
6 داده کمی گسسته (Discrete Quantitative Data): دادههای عددی که مقادیر قابل شمارش و مجزا دارند (مانند تعداد اعضای خانواده).
7 داده کمی پیوسته (Continuous Quantitative Data): دادههای عددی که میتوانند هر مقداری در یک بازه اختیار کنند (مانند قد، وزن).