میانگین نمونه (x̄): نمایندهٔ عددی دادههای انتخابی
تعریف و فرمول میانگین نمونه
میانگین نمونه ($ \bar{x} $) یکی از مهمترین شاخصهای گرایش مرکزی است. اگر دادههای نمونه شامل $ n $ مشاهده مانند $ x_1, x_2, ..., x_n $ باشد، میانگین نمونه از رابطهٔ زیر محاسبه میشود:
به عبارت دیگر، ابتدا همهٔ مقادیر را با هم جمع میکنیم و سپس حاصل را بر تعداد دادهها تقسیم مینماییم. برای نمونهای با $ n=5 $ و مقادیر $ 4, 8, 6, 5, 3 $ داریم:
$ \bar{x} = \frac{4+8+6+5+3}{5} = \frac{26}{5} = 5.2 $
تفاوت میانگین نمونه با میانگین جامعه
در آمار، میانگین جامعه (پارامتر) را با نماد $ \mu $ و میانگین نمونه (آماره) را با $ \bar{x} $ نشان میدهند. میانگین نمونه یک برآوردگر نااریب برای میانگین جامعه است، یعنی انتظار ریاضی $ \bar{x} $ برابر $ \mu $ میباشد.
| ویژگی | میانگین نمونه ($ \bar{x} $) | میانگین جامعه ($ \mu $) |
|---|---|---|
| نوع | آماره (محاسبه شده از نمونه) | پارامتر (مربوط به کل جامعه) |
| نماد | $ \bar{x} $ | $ \mu $ |
| تغییرپذیری | از نمونهای به نمونه دیگر تغییر میکند | مقداری ثابت (برای یک جامعه مشخص) |
مراحل گام به گام محاسبه میانگین نمونه
برای محاسبهٔ میانگین یک نمونه، مراحل زیر را به ترتیب انجام دهید:
- گام ۱ دادههای نمونه را به صورت یک لیست مرتب یا نامرتب یادداشت کنید.
- گام ۲ همهٔ مقادیر را با دقت جمع بزنید. $ S = x_1 + x_2 + ... + x_n $
- گام ۳ تعداد دادهها یعنی $ n $ را مشخص کنید.
- گام ۴ حاصل جمع را بر $ n $ تقسیم کنید: $ \bar{x} = \frac{S}{n} $
مثال عملی: فرض کنید معلم ریاضی نمرات 5 دانشآموز را از آزمونک کوتاهی به صورت $ 12, 15, 14, 10, 9 $ دریافت کرده است. برای محاسبهٔ میانگین نمرهٔ نمونه: جمع مقادیر برابر $ 12+15+14+10+9 = 60 $ و $ n=5 $ است. بنابراین $ \bar{x} = 60/5 = 12 $. این یعنی میانگین نمرهٔ این گروه از دانشآموزان 12 از 20 است.
کاربرد میانگین نمونه در پژوهشهای علمی
در بسیاری از پژوهشها، بررسی کل جامعه ممکن یا مقرون به صرفه نیست. به عنوان مثال، یک زیستشناس میخواهد میانگین وزن ماهیان یک دریاچهٔ بزرگ را تخمین بزند. او نمیتواند همهٔ ماهیان را صید کند، بنابراین نمونهای تصادفی به حجم $ n=50 $ انتخاب کرده و میانگین وزن آنها را محاسبه میکند. این میانگین نمونه، بهترین برآورد او از میانگین وزن جامعهٔ ماهیان دریاچه خواهد بود. هرچه حجم نمونه بزرگتر باشد، $ \bar{x} $ به $ \mu $ نزدیکتر میشود (قانون اعداد بزرگ1).
در علوم اجتماعی، محققان با استفاده از میانگین نمونه، شاخصهایی مانند درآمد متوسط خانوار، سطح رضایت شغلی یا نمرهٔ میانگین آزمون را برآورد میکنند. همچنین در کنترل کیفیت کارخانهها، میانگین نمونه از محصولات تولیدی برای تصمیمگیری دربارهٔ تطابق با استانداردها استفاده میشود.
چالشهای مفهومی پیرامون میانگین نمونه
۱) چرا میانگین نمونه تحت تأثیر مقادیر پرت قرار میگیرد؟
میانگین نمونه به همهٔ دادهها حساس است. اگر در نمونه یک مقدار خیلی بزرگ (نظیر درآمد یک میلیارد تومانی در نمونهای از درآمدهای ماهانه) وجود داشته باشد، جمع کل به شدت افزایش یافته و میانگین را به سمت خود میکشد. در چنین شرایطی، میانه2 میتواند نمایندهٔ بهتری برای گرایش مرکزی باشد.
۲) چگونه حجم نمونه روی دقت میانگین نمونه تأثیر میگذارد؟
با افزایش حجم نمونه ($ n $)، واریانس میانگین نمونه کاهش مییابد. به بیان ساده تر، $ \bar{x} $ در نمونههای بزرگ تر، تغییرات کمتری از نمونهای به نمونهٔ دیگر دارد و به میانگین واقعی جامعه نزدیکتر است. فرمول واریانس میانگین نمونه برابر $ \frac{\sigma^2}{n} $ است که در آن $ \sigma^2 $ واریانس جامعه میباشد.
۳) چه زمانی نباید از میانگین نمونه استفاده کرد؟
زمانی که توزیع دادهها بسیار چوله (نامتقارن) باشد یا دادههای پرت قابل توجهی وجود داشته باشند، میانگین نمونه میتواند گمراه کننده باشد. همچنین برای دادههای کیفی (مثل رنگ چشم یا جنسیت) محاسبهٔ میانگین معنا ندارد. در این موارد از نما3 یا میانه استفاده میشود.
تأثیر تبدیل خطی روی میانگین نمونه
اگر هر دادهٔ نمونه مانند $ x_i $ را به صورت خطی تبدیل کنیم، یعنی $ y_i = a x_i + b $ که $ a $ و $ b $ اعداد حقیقی هستند، میانگین نمونهٔ جدید به صورت $ \bar{y} = a \bar{x} + b $ محاسبه میشود. این ویژگی در استانداردسازی دادهها و تبدیل واحدها بسیار کاربرد دارد. برای نمونه، اگر دمای هوا به درجهٔ سانتیگراد ($ C $) داشته باشیم و بخواهیم میانگین دما را به فارنهایت ($ F $) تبدیل کنیم، از رابطهٔ $ F = 1.8C + 32 $ استفاده میکنیم. بنابراین میانگین فارنهایت برابر $ 1.8 \times \bar{C} + 32 $ خواهد بود.
پاورقی
1 قانون اعداد بزرگ (Law of Large Numbers): اصلی در آمار که میگوید با افزایش حجم نمونه، میانگین نمونه به میانگین جامعه نزدیک و نزدیکتر میشود.
2 میانه (Median): مقداری که دادهها را به دو نیمهٔ مساوی تقسیم میکند؛ نصف دادهها از آن کوچکتر و نصف دیگر بزرگتر هستند.
3 نما (Mode): مقداری که بیشترین فراوانی را در مجموعه داده دارد.