انحراف از میانگین: تفاوت هر داده با میانگین همان دادهها
انحراف از میانگین چیست؟ (تعریف و مفهوم اولیه)
فرض کنید نمرات یک دانشآموز در 5 درس به صورت 18, 15, 12, 19, 16 باشد. میانگین این نمرات چند است؟ مجموع نمرات 80 و میانگین آن 16 میشود. حالا اگر بخواهیم بدانیم نمره هر درس چقدر از این میانگین (16) فاصله دارد، کافی است میانگین را از هر نمره کم کنیم. به این تفاوت، «انحراف از میانگین» میگویند. برای نمره 18، انحراف برابر 2+ و برای نمره 12، انحراف برابر 4- است. علامت مثبت و منفی نشان میدهد که داده بالاتر یا پایینتر از میانگین قرار دارد.
به زبان سادهتر، اگر میانگین را نقطه تعادل در نظر بگیریم، انحراف هر داده فاصله و جهت آن را نسبت به این نقطه تعادل نشان میدهد. این مفهوم پایه و اساس بسیاری از محاسبات آماری مانند واریانس و انحراف معیار است.
اگر دادهها را با xi و میانگین را با x̄ نشان دهیم، آنگاه انحراف داده iام (di) برابر است با: $d_i = x_i - \bar{x}$
محاسبه گامبهگام انحراف دادهها (مثال نمرات)
برای درک بهتر، به همان مثال نمرات 18, 15, 12, 19, 16 بازمیگردیم. مراحل محاسبه انحراف هر داده به صورت زیر است:
- محاسبه میانگین: مجموع نمرات = 80 و تعداد دادهها = 5، بنابراین میانگین (x̄) برابر 80 / 5 = 16 است.
- تفریق میانگین از هر داده: برای هر نمره، مقدار 16 را کم میکنیم.
| ردیف | نمره (xi) | انحراف (di = xi - 16) | نوع انحراف |
|---|---|---|---|
| 1 | 18 | 2+ | بالاتر از میانگین |
| 2 | 15 | 1- | پایینتر از میانگین |
| 3 | 12 | 4- | پایینتر از میانگین |
| 4 | 19 | 3+ | بالاتر از میانگین |
| 5 | 16 | 0 | برابر با میانگین |
ویژگی مهم: جمع انحرافات همیشه صفر است
یکی از جالبترین و مهمترین ویژگیهای انحراف از میانگین این است که اگر همه انحرافات را با هم جمع کنیم، نتیجه همیشه صفر میشود. در مثال بالا، جمع انحرافات (2) + (-1) + (-4) + (3) + (0) = 0 است. این یک خاصیت ریاضی میانگین است. میانگین طوری محاسبه میشود که مجموع فاصلههای دادهها تا آن (با علامت) صفر شود. به عبارت دیگر، میانگین نقطهای است که دادهها در دو طرف آن متوازن شدهاند.
مجموع انحرافات: $\sum_{i=1}^{n} (x_i - \bar{x}) = \sum_{i=1}^{n} x_i - \sum_{i=1}^{n} \bar{x} = n\bar{x} - n\bar{x} = 0$
این ویژگی نشان میدهد که برای اندازهگیری پراکندگی دادهها، نمیتوانیم مستقیماً از خود انحرافات استفاده کنیم، زیرا آنها یکدیگر را خنثی میکنند. به همین دلیل است که در آمار، برای محاسبه واریانس و انحراف معیار، از مربع انحرافات استفاده میشود.
میانگین انحرافات: راهی برای سنجش پراکندگی
اگرچه جمع انحرافات با علامت صفر میشود، اما میتوانیم برای درک میزان پراکندگی دادهها، از قدر مطلق انحرافات استفاده کنیم. به این ترتیب، «میانگین انحرافات مطلق» به دست میآید. در مثال نمرات، قدر مطلق انحرافات به ترتیب 2, 1, 4, 3, 0 است. میانگین این مقادیر برابر (2+1+4+3+0) / 5 = 10 / 5 = 2 است. یعنی به طور متوسط، هر نمره حدود 2 نمره با میانگین فاصله دارد.
$MAD = \frac{\sum_{i=1}^{n} |x_i - \bar{x}|}{n}$
که در آن MAD مخفف Mean Absolute Deviation است.
برای درک بهتر، دو کلاس با میانگین نمره یکسان 15 را تصور کنید. در کلاس اول، نمرات دانشآموزان بسیار نزدیک به هم و بین 14 تا 16 است. میانگین انحرافات مطلق این کلاس پایین (مثلاً 0.5) خواهد بود. در کلاس دوم، نمرات بسیار پراکنده و بین 5 تا 25 است. میانگین انحرافات مطلق این کلاس بالا (مثلاً 5) خواهد بود. بنابراین، میانگین انحرافات مطلق یک معیار ساده و سرراست برای مقایسه پراکندگی دو مجموعه داده است.
کاربرد عملی انحراف از میانگین در زندگی روزمره
فرض کنید مدیر یک فروشگاه اینترنتی هستید. شما میانگین فروش روزانه خود را در 30 روز گذشته محاسبه کردهاید. حالا انحراف فروش هر روز از این میانگین به شما نشان میدهد که کدام روزها فروش فوقالعاده (انحراف مثبت بالا) و کدام روزها فروش بسیار کم (انحراف منفی بالا) داشتهاید. این اطلاعات میتواند به شما در شناسایی دلایل موفقیت یا شکست در فروش کمک کند. آیا روزهای پر فروش با تخفیفهای ویژه همزمان بودهاند؟ آیا روزهای کم فروش با تعطیلات رسمی مصادف شدهاند؟
مثال دیگر در ورزش است. میانگین گلهای زده یک تیم در فصل را در نظر بگیرید. انحراف تعداد گلهای زده در هر بازی از این میانگین، ثبات خط حمله تیم را نشان میدهد. تیمی که انحراف کمتری دارد، عملکردی باثباتتر داشته و تیمی که انحراف بالایی دارد، یا خیلی خوب گل میزند یا خیلی بد. مربیان از این تحلیلها برای بهبود عملکرد تیم استفاده میکنند.
چالشهای مفهومی (پرسش و پاسخ)
❓ چرا جمع انحرافات از میانگین همیشه صفر است؟ آیا این یک قانون کلی برای همه دادههاست؟
بله، این یک قانون ریاضی و ویژگی ذاتی میانگین حسابی است. همانطور که در بخش قبل اثبات شد، مجموع انحرافات (با علامت) برای هر مجموعه از دادهها و میانگین آنها همواره صفر است. این خاصیت به این دلیل است که میانگین به عنوان نقطه تعریف میشود که مجموع فاصلههای (با علامت) دادهها تا آن نقطه را به حداقل میرساند و این حداقل مقدار صفر است.
❓ اگر جمع انحرافات صفر است، پس چطور میتوان پراکندگی دادهها را اندازهگیری کرد؟
به دلیل صفر شدن جمع انحرافات، از آنها مستقیماً برای سنجش پراکندگی استفاده نمیکنیم. به جای آن، از دو روش رایج استفاده میشود: ۱) میانگین انحرافات مطلق که در آن علامت انحرافات را نادیده میگیریم و ۲) واریانس و انحراف معیار که در آن انحرافات را به توان دو میرسانیم تا علامت آنها مثبت شود و سپس میانگین گرفته میشود.
❓ تفاوت بین «انحراف از میانگین» و «انحراف معیار» چیست؟ آیا این دو یکی هستند؟
خیر، این دو مفهوم متفاوت اما مرتبط هستند. انحراف از میانگین برای هر داده به صورت جداگانه تعریف میشود و یک مقدار اختصاصی برای آن داده است. اما انحراف معیار یک شاخص کلی برای کل مجموعه دادههاست و پراکندگی کلی آنها را نشان میدهد. انحراف معیار از طریق میانگینگیری از مربع انحرافات (واریانس) و سپس جذر گرفتن از آن به دست میآید.
✍️ جمعبندی
انحراف از میانگین یک مفهوم بنیادین در آمار است که فاصله و جهت هر داده را نسبت به میانگین مجموعه نشان میدهد. اگرچه جمع انحرافات با علامت همواره صفر است، اما با استفاده از قدر مطلق آنها میتوان به معیاری ساده به نام میانگین انحرافات مطلق برای سنجش پراکندگی دست یافت. این مفهوم پایهای برای درک واریانس و انحراف معیار است و در تحلیلهای روزمره از جمله بررسی عملکرد فروش، تحلیل نمرات و ارزیابی ثبات در ورزش کاربرد فراوانی دارد. درک صحیح این مفهوم، گام اول برای ورود به دنیای تحلیلهای آماری پیشرفتهتر است.
پاورقی
1 میانگین (Mean): معیار سنجش مرکزی که از جمع تمام دادهها تقسیم بر تعداد آنها به دست میآید.
2 واریانس (Variance): میانگین مجذور انحرافات دادهها از میانگین.
3 انحراف معیار (Standard Deviation): جذر واریانس، که پراکندگی دادهها را در مقیاس دادههای اصلی نشان میدهد.
4 قدر مطلق (Absolute Value): فاصله یک عدد از صفر، که همیشه مثبت است. برای مثال قدر مطلق 4- برابر 4 است.