میانه (Median): شاخص مرکزی مقاوم در برابر دادههای پرت
با روشی ساده و گامبهگام، موقعیت مرکز دادهها را بدون تأثیرپذیری از اعداد بسیار بزرگ یا کوچک پیدا کنید.
میانه یکی از مهمترین شاخصهای گرایش مرکزی در آمار است که مقدار دقیقاً وسط یک مجموعه دادههای مرتبشده را نشان میدهد. برخلاف میانگین، میانه تحت تأثیر دادههای پرت (Outliers) قرار نمیگیرد و تصویر واقعیتری از وضعیت مرکز دادهها، بهویژه در توزیعهای نامتقارن، ارائه میدهد. در این مقاله با زبانی ساده و مثالهای گوناگون، روش محاسبه میانه برای دادههای فرد و زوج را بررسی میکنیم.
۱. مفهوم میانه و تفاوت آن با میانگین
فرض کنید در یک کلاس درس، نمرات دانشآموزان را داریم. اگر یک دانشآموز نمره بسیار بالایی کسب کند، میانگین کل کلاس بالا میرود و ممکن است تصور کنیم همه دانشآموزان قوی هستند. اما میانه اینطور نیست. میانه به ما میگوید: «نمره دانشآموز وسطی که دقیقاً ۵۰٪ از دانشآموزان نمره کمتر و ۵۰٪ نمره بیشتر از او گرفتهاند، چقدر است؟»
نکته کلیدی: برای یافتن میانه، اولین و مهمترین گام، مرتبسازی دادهها به ترتیب صعودی (از کوچک به بزرگ) است. بدون این مرتبسازی، پیدا کردن عدد وسط بیمعنا خواهد بود.
۲. گامهای طلایی محاسبه میانه
فرآیند محاسبه میانه را میتوان در سه گام ساده خلاصه کرد:
- مرتبسازی: دادهها را از کوچکترین به بزرگترین مقدار مرتب کنید.
- شمارش: تعداد کل دادهها (n) را بشمارید.
- اعمال قانون فرد یا زوج:
- اگر nفرد بود، میانه همان دادهای است که در موقعیت (n+1) ÷ 2 قرار دارد.
- اگر nزوج بود، میانه میانگین دو دادهای است که در موقعیتهای n ÷ 2 و (n ÷ 2) + 1 قرار دارند.
۳. حالت اول: وقتی تعداد دادهها فرد است (مثال عملی)
فرض کنید وزن ۵ عدد پرتقال (به گرم) به شرح زیر است:
120, 110, 150, 130, 140
گام ۱: مرتبسازی
110, 120, 130, 140, 150
گام ۲: تعداد دادهها
n = 5 که فرد است.
گام ۳: یافتن موقعیت میانه
موقعیت میانه = (n+1) ÷ 2 = (5+1) ÷ 2 = 3
نتیجه: سومین داده در مجموعه مرتبشده، مقدار 130 گرم است. بنابراین، میانه وزن پرتقالها 130 گرم است.
۴. حالت دوم: وقتی تعداد دادهها زوج است (مثال عملی)
فرض کنید نمرات ۶ دانشآموز در یک آزمون ریاضی به شرح زیر است:
18, 15, 20, 17, 16, 19
گام ۱: مرتبسازی
15, 16, 17, 18, 19, 20
گام ۲: تعداد دادهها
n = 6 که زوج است.
گام ۳: یافتن دو داده وسطی
موقعیت اول = n ÷ 2 = 6 ÷ 2 = 3 (داده سوم: 17)
موقعیت دوم = (n ÷ 2) + 1 = 3 + 1 = 4 (داده چهارم: 18)
گام ۴: میانگین دو داده وسطی
میانه = (17 + 18) ÷ 2 = 35 ÷ 2 = 17.5
نتیجه: میانه نمرات دانشآموزان 17.5 است.
۵. جدول مقایسه: میانه در دادههای فرد و زوج
| ویژگی |
تعداد داده فرد (n فرد) |
تعداد داده زوج (n زوج) |
| موقعیت میانه |
(n+1) / 2 |
دو موقعیت: n/2 و (n/2)+1 |
| مقدار میانه |
یکی از دادههای موجود در مجموعه |
معمولاً مقداری بین دو داده (میانگین آنها) |
| مثال |
دادهها: 2, 4, 6 → میانه 4 |
دادهها: 2, 4, 6, 8 → میانه (4+6)/2 = 5 |
۶. کاربرد میانه در زندگی روزمره
فرض کنید میخواهیم وضعیت درآمد مردم یک شهر را بررسی کنیم. در این شهر، چند نفر درآمدهای بسیار بالا (میلیاردی) و بقیه درآمدهای معمولی دارند. اگر میانگین درآمد را حساب کنیم، عدد بهدستآمده بسیار بزرگ و دور از واقعیت زندگی اکثر مردم خواهد بود. اما میانه درآمد، درآمد فردی را نشان میدهد که دقیقاً در وسط جامعه قرار دارد و نیمی از مردم کمتر و نیمی بیشتر از او درآمد دارند. این عدد تصویر بسیار واقعیتری از وضعیت اقتصادی شهر به ما میدهد.
۷. فرمولنویسی میانه با زبان ریاضی
اگر دادههای مرتبشده را با
x_1, x_2, ..., x_n نمایش دهیم، میانه (
\tilde{x}) به صورت زیر تعریف میشود:
$
\tilde{x} =
\begin{cases}
x_{\frac{n+1}{2}} & \text{if } n \text{ فرد} \\[2ex]
\frac{1}{2} \left( x_{\frac{n}{2}} + x_{\frac{n}{2}+1} \right) & \text{if } n \text{ زوج}
\end{cases}
$
۸. چالشهای مفهومی (پرسش و پاسخ)
❓ چالش ۱: اگر به مجموعه دادهها، یک داده جدید اضافه کنیم، آیا میانه حتماً تغییر میکند؟
✅ پاسخ: نه لزوماً. اگر داده جدید به یک سمت توزیع اضافه شود، ممکن است میانه تغییر نکند یا جابهجا شود. برای مثال، در مجموعه {1, 2, 3} میانه 2 است. با اضافه کردن عدد 4، مجموعه {1, 2, 3, 4} میانه (2+3)/2 = 2.5 میشود که تغییر کرده است. اما اگر عدد 10 اضافه کنیم، میانه باز هم 2.5 است.
❓ چالش ۲: آیا میتوان برای دادههای کیفی (مثل رنگها) میانه محاسبه کرد؟
✅ پاسخ: خیر. میانه برای دادههای عددی معنا دارد که قابل مرتبسازی هستند. برای دادههای کیفی ترتیبی (مثل «بد»، «متوسط»، «خوب») میتوان میانه را محاسبه کرد، چون ترتیب دارند.
❓ چالش ۳: چرا در دادههای زوج، میانه را میانگین دو عدد وسط میگیریم؟
✅ پاسخ: چون در دادههای زوج، هیچ داده واحدی وجود ندارد که دقیقاً ۵۰٪ دادهها قبل و ۵۰٪ بعد از آن باشند. بنابراین، با میانگین گرفتن از دو داده وسط، یک مقدار مرکزی ایجاد میکنیم که به بهترین نحو مرکز توزیع را نشان دهد.
✨ جمعبندی: میانه یک شاخص آماری قدرتمند و مقاوم است که با مرتبسازی دادهها و شناسایی مقدار وسطی (در دادههای فرد) یا میانگین دو مقدار وسطی (در دادههای زوج) محاسبه میشود. این شاخص به دلیل عدم تأثیرپذیری از دادههای پرت، در تحلیلهای واقعی مانند بررسی درآمد، قیمت مسکن و نمرات آموزشی، کاربرد فراوانی دارد و تصویری شفافتر از «وضعیت معمول» دادهها ارائه میدهد.
پاورقی
1 داده پرت (Outlier): به دادهای گفته میشود که با سایر دادهها فاصله زیادی داشته باشد و بتواند میانگین را به شدت تحت تأثیر قرار دهد.
2 شاخص گرایش مرکزی (Central Tendency): معیاری که یک مقدار مرکزی یا معمولی را برای یک توزیع داده مشخص میکند؛ مانند میانگین، میانه و نما.
3 داده کیفی ترتیبی (Ordinal Data): دادههایی که در دستهبندیهای قابل ترتیب قرار میگیرند، مانند مقاطع تحصیلی یا رضایتمندی.