میانه: شاخص مرکزی و کاربرد آن در تحلیل دادههای آماری
محاسبه میانه در دادههای فرد و زوج
برای درک میانه، اولین قدم مرتبسازی دادهها از کوچکترین به بزرگترین است. پس از این مرحله، بسته به تعداد دادهها (فرد یا زوج)، روش یافتن میانه متفاوت خواهد بود.
تعداد دادهها فرد: در این حالت، میانه دقیقاً همان دادهای است که در وسط قرار گرفته است. به عبارت دیگر، اگر تعداد دادهها n باشد، موقعیت میانه در دادههای مرتبشده برابر است با (n+1) ÷ 2.
تعداد دادهها زوج: در این حالت، دو داده وسط وجود دارند. میانه از میانگین این دو عدد به دست میآید. موقعیت دو داده وسط عبارتند از n ÷ 2 و (n ÷ 2) + 1.
مثال ۲ (زوج): سن ۶ نفر در یک اتوبوس: ۲۵, ۳۲, ۲۸, ۴۵, ۲۲, ۳۰. مرتبسازی: ۲۲, ۲۵, ۲۸, ۳۰, ۳۲, ۴۵. دو داده سوم (۲۸) و چهارم (۳۰) هستند. میانه برابر است با میانگین آنها: (۲۸ + ۳۰) ÷ ۲ = ۲۹.
میانه در مقابل میانگین: مقاومت در برابر دادههای پرت
یکی از مهمترین ویژگیهای میانه، مقاوم بودن آن در برابر دادههای پرت (دادههای بسیار بزرگ یا بسیار کوچک) است. این ویژگی باعث میشود میانه تصویر واقعیتری از «مرکز» دادهها در شرایطی که دادههای غیرعادی وجود دارند، ارائه دهد. برای درک بهتر، به مثال زیر توجه کنید:
فرض کنید حقوق ماهانه ۵ کارمند یک شرکت کوچک به این شرح است (به تومان): ۱۲, ۱۳, ۱۴, ۱۵, ۱۰۰ میلیون. میانگین حقوق برابر است با (۱۲+۱۳+۱۴+۱۵+۱۰۰) ÷ ۵ = ۳۰.۸ میلیون تومان. این عدد نشان میدهد که میانگین تحت تأثیر حقوق ۱۰۰ میلیونی (داده پرت) قرار گرفته و به ۳۰.۸ میلیون افزایش یافته است، در حالی که بیشتر کارمندان حقوقی حدود ۱۳ میلیون دریافت میکنند. اما میانه که داده سوم پس از مرتبسازی (۱۴ میلیون) است، بهخوبی وضعیت مرکزی و واقعیتر دادهها را نشان میدهد.
| ویژگی | میانه | میانگین |
|---|---|---|
| تعریف | مقدار وسط دادههای مرتبشده | مجموع دادهها تقسیم بر تعداد آنها |
| حساسیت به داده پرت | مقاوم | حساس |
| محاسبه | بر اساس موقعیت (نیاز به مرتبسازی) | بر اساس مقادیر (جمع و تقسیم) |
| کاربرد | دادههای نامتقارن (درآمد، قیمت مسکن) | دادههای متقارن (نمرات همگن) |
کاربرد عملی میانه در زندگی روزمره و علوم مختلف
میانه به دلیل مقاومت در برابر دادههای پرت، در بسیاری از حوزهها کاربرد دارد. در اقتصاد و آمارهای اجتماعی، برای گزارش «درآمد میانه» خانوار استفاده میشود، زیرا این عدد نسبت به «میانگین درآمد» که تحت تأثیر درآمدهای بسیار بالای یک اقلیت کوچک قرار میگیرد، نمایندهتر است. در علوم پزشکی، برای توصیف «سن میانه» بیماران مبتلا به یک بیماری خاص به کار میرود.
مثال عینی در بازار مسکن: فرض کنید در یک محله، قیمت ۵ خانه به میلیون تومان به این شرح باشد: ۸۰۰, ۹۵۰, ۱۰۰۰, ۱۱۰۰, ۴۰۰۰. میانگین قیمت ۱۵۷۰ میلیون تومان است که به دلیل وجود خانه گرانقیمت (۴۰۰۰)، بالا نشان داده میشود. اما میانه (۱۰۰۰ میلیون تومان) بهدرستی نشان میدهد که قیمت خانهها در این محله حول و حوش ۱۰۰۰ میلیون تومان است و یک خریدار عادی باید انتظار چنین قیمتی را داشته باشد.
چالشهای مفهومی در درک میانه
میانه تنها به موقعیت دادهها وابسته است، نه به مقدار دقیق آنها. اگر دادهای به مجموعه اضافه شود که در یک سمت میانه قرار گیرد، ممکن است میانه تغییر کند یا نکند. به عنوان مثال، در دادههای ۱, ۲, ۳، میانه ۲ است. اگر عدد ۱۰۰ را اضافه کنیم، دادهها به ۱, ۲, ۳, ۱۰۰ تبدیل میشوند. حالا دو داده وسط ۲ و ۳ هستند و میانه جدید (۲+۳)/۲ = ۲.۵ میشود (تغییر کرد). اما اگر عدد ۲.۵ را اضافه کنیم، دادهها ۱, ۲, ۲.۵, ۳, ۱۰۰ میشوند و میانه ۲.۵ خواهد بود. بنابراین تغییر میانه به موقعیت داده جدید نسبت به میانه قبلی وابسته است.
بله، قطعاً. همانطور که در مثال زوج دیدیم، میانه از میانگین دو عدد وسط به دست میآید. این میانگین ممکن است عددی باشد که در مجموعه دادهها وجود نداشته باشد. برای مثال در دادههای ۲, ۴, ۶, ۸، میانه برابر با (۴+۶)/۲ = ۵ است که در مجموعه دادهها وجود ندارد.
در یک توزیع کاملاً متقارن (مانند توزیع نرمال۱)، مقدار میانه، میانگین و مد (نما) با هم برابر هستند. اما در توزیعهای نامتقارن (چوله۲)، این سه شاخص از یکدیگر فاصله میگیرند. اگر توزیع به راست چوله باشد (دم سمت راست کشیدهتر)، میانگین از میانه بزرگتر است و اگر توزیع به چپ چوله باشد، میانگین از میانه کوچکتر است.
پاورقی
۱ توزیع نرمال (Normal Distribution): توزیع احتمالی متقارن زنگولهشکلی که در آن میانگین، میانه و مد با هم برابر هستند.
۲ چولگی (Skewness): معیاری برای اندازهگیری عدم تقارن در توزیع دادهها. چولگی مثبت (به راست) به معنای وجود دم کشیدهتر در سمت راست است.