گاما رو نصب کن!

{{ number }}
اعلان ها
اعلان جدیدی وجود ندارد!
کاربر جدید

جستجو

پربازدیدها: #{{ tag.title }}

میتونی لایو بذاری!

واریانس: توان دوم انحراف معیار که پراکندگی را با واحدِ مربع اندازه می‌گیرد.

بروزرسانی شده در: 12:56 1404/12/7 مشاهده: 8     دسته بندی: کپسول آموزشی

واریانس: توان دوم انحراف معیار و نقش آن در سنجش پراکندگی

آشنایی با مفهوم واریانس، محاسبه گام‌به‌گام، تفاوت آن با انحراف معیار و کاربردهای روزمره در تحلیل داده‌ها
در این مقاله با یکی از مفاهیم پایه‌ای آمار به نام واریانس آشنا می‌شوید. واریانس که با مربع انحراف معیار محاسبه می‌شود، معیاری برای سنجش پراکندگی داده‌ها حول میانگین است. یاد می‌گیریم که چگونه واریانس را محاسبه کنیم، چرا واحد آن مربع است و تفاوت آن با انحراف معیار چیست. همچنین با مثال‌های ملموس مانند بررسی نمرات امتحانی یا دماهای روزانه، کاربرد عملی واریانس را درک خواهید کرد.

۱. واریانس چیست؟ تعریف و مفهوم اصلی

واریانس یکی از مهم‌ترین سنجه‌های پراکندگی در آمار است. وقتی مجموعه‌ای از داده‌ها داریم، معمولاً میانگین آن‌ها را حساب می‌کنیم تا یک عدد معرف کل داده‌ها داشته باشیم. اما میانگین به تنهایی نمی‌گوید که داده‌ها چقدر از هم فاصله دارند یا چقدر حول این میانگین متمرکز شده‌اند. اینجا است که واریانس وارد می‌شود. واریانس میانگین مجذور فاصله هر داده تا میانگین است. به زبان ساده‌تر، ابتدا اختلاف هر عدد را با میانگین حساب می‌کنیم، این اختلاف‌ها را به توان دو می‌رسانیم و سپس میانگین آن‌ها را می‌گیریم. دلیل اینکه اختلاف‌ها را به توان دو می‌رسانیم، دو هدف اصلی دارد: اول اینکه علامت اختلاف‌ها (مثبت یا منفی) را از بین می‌بریم و همه مقادیر مثبت می‌شوند، و دوم اینکه به اختلاف‌های بزرگ‌تر وزن بیشتری می‌دهیم. برای نمونه، فرض کنید نمرات سه دانش‌آموز در یک امتحان ساده به این صورت است: 18، 20 و 22. میانگین این نمرات 20 است. حالا اختلاف هر نمره از میانگین را حساب می‌کنیم: -2، 0 و +2. مجذور این اختلاف‌ها می‌شود: 4، 0 و 4. میانگین این اعداد برابر است با (4+0+4)/3 = 8/3 ≈ 2.67. بنابراین واریانس این مجموعه داده تقریباً 2.67 است.
فرمول ریاضی واریانس جامعه (جمعیت) به صورت زیر تعریف می‌شود:
$ \sigma^2 = \frac{\sum_{i=1}^{N} (x_i - \mu)^2}{N} $
در این فرمول، $\sigma^2$ نماد واریانس، $x_i$ها مقادیر داده‌ها، $\mu$ میانگین جامعه و $N$ تعداد کل داده‌ها است.

۲. محاسبه گام‌به‌گام واریانس برای داده‌های ساده

برای درک بهتر، بیایید یک مثال عددی دیگر را با جزئیات کامل بررسی کنیم. فرض کنید در یک هفته، دمای هوای یک شهر (بر حسب درجه سلسیوس) به صورت زیر ثبت شده است:
روز هفته شنبه یک‌شنبه دوشنبه سه‌شنبه چهارشنبه پنج‌شنبه جمعه
دما (سلسیوس) 22 25 19 26 23 21 20
حالا مراحل محاسبه واریانس را قدم به قدم پیش می‌رویم: گام ۱: محاسبه میانگین مجموع دماها: 22 + 25 + 19 + 26 + 23 + 21 + 20 = 156 تعداد روزها: 7 میانگین (μ): 156 / 7 ≈ 22.29 گام ۲: محاسبه اختلاف هر داده از میانگین شنبه: 22 - 22.29 = -0.29 یک‌شنبه: 25 - 22.29 = 2.71 دوشنبه: 19 - 22.29 = -3.29 سه‌شنبه: 26 - 22.29 = 3.71 چهارشنبه: 23 - 22.29 = 0.71 پنج‌شنبه: 21 - 22.29 = -1.29 جمعه: 20 - 22.29 = -2.29 گام ۳: مجذور کردن اختلاف‌ها شنبه: (-0.29)^2 ≈ 0.084 یک‌شنبه: (2.71)^2 ≈ 7.344 دوشنبه: (-3.29)^2 ≈ 10.824 سه‌شنبه: (3.71)^2 ≈ 13.764 چهارشنبه: (0.71)^2 ≈ 0.504 پنج‌شنبه: (-1.29)^2 ≈ 1.664 جمعه: (-2.29)^2 ≈ 5.244 گام ۴: محاسبه میانگین مجذور اختلاف‌ها (واریانس) مجموع مجذور اختلاف‌ها: 0.084 + 7.344 + 10.824 + 13.764 + 0.504 + 1.664 + 5.244 = 39.428 واریانس (σ²): 39.428 / 7 ≈ 5.63 بنابراین واریانس دمای هفته حدود 5.63 درجهٔ سلسیوس به توان دو است. همانطور که می‌بینید، واحد واریانس مربع واحد داده اصلی است که می‌تواند تفسیر آن را کمی دشوار کند.

۳. تفاوت واریانس با انحراف معیار و ارتباط آن‌ها

یکی از سوالات رایجی که برای دانش‌آموزان پیش می‌آید این است: اگر واریانس پراکندگی را نشان می‌دهد، پس انحراف معیار چیست و چه فرقی با آن دارد؟ پاسخ ساده است: انحراف معیار1 جذر واریانس است. اگر واریانس را با σ² نشان دهیم، انحراف معیار (σ) برابر است با جذر آن. چرا به انحراف معیار نیاز داریم؟ چون واحد انحراف معیار با خود داده‌ها یکی است. در مثال دمای هوا، واریانس 5.63 (درجهٔ مربع) بود، اما انحراف معیار برابر است با √5.63 ≈ 2.37 درجه سلسیوس. این عدد به ما می‌گوید که به طور میانگین، دمای هر روز حدود 2.37 درجه با میانگین هفتگی فاصله دارد. برای روشن‌تر شدن تفاوت، جدول زیر را ببینید:
ویژگی واریانس (σ²) انحراف معیار (σ)
تعریف میانگین مجذور فاصله‌ها از میانگین جذر واریانس، میانگین فاصله داده‌ها از میانگین
واحد اندازه‌گیری مربع واحد داده (مثلاً cm²، یا درجه²) همان واحد داده (مثلاً cm، درجه)
کاربرد اصلی محاسبات آماری پیشرفته، تحلیل واریانس تفسیر پراکندگی داده‌ها در واحد اصلی
حساسیت به داده‌های پرت بسیار زیاد (به دلیل مجذور کردن) کمتر از واریانس

۴. کاربرد عملی واریانس در زندگی روزمره

شاید فکر کنید واریانس فقط یک مفهوم خشک و بی‌کاربرد در کتاب‌های آمار است، اما واقعیت این است که ما در زندگی روزمره زیاد با آن سر و کار داریم، حتی بدون اینکه بدانیم. یک مثال ملموس: فرض کنید دو دانش‌آموز به نام‌های علی و مریم در پنج امتحان ریاضی شرکت کرده‌اند. نمرات علی: 18, 17, 19, 18, 18 و نمرات مریم: 20, 15, 20, 15, 20. میانگین هر دو نفر 18 است. اگر فقط به میانگین نگاه کنیم، هر دو در یک سطح هستند. اما واریانس نمرات علی کم است (چون نمراتش نزدیک به هم و به میانگین نزدیک هستند) در حالی که واریانس نمرات مریم بالا است (چون نمراتش پراکندگی زیادی دارند). معلم با دیدن واریانس متوجه می‌شود که علی عملکردی ثابت و قابل پیش‌بینی داشته، در حالی که مریم گاهی عالی و گاهی ضعیف عمل کرده است. در صنعت و کنترل کیفیت، واریانس نقش حیاتی دارد. فرض کنید کارخانه‌ای چیپس تولید می‌کند. وزن هر بسته چیپس نباید خیلی از وزن استاندارد 100 گرم دور شود. اگر واریانس وزن بسته‌ها کم باشد، یعنی دستگاه به درستی کار می‌کند و همه بسته‌ها تقریباً وزن یکسانی دارند. اما اگر واریانس بالا باشد، برخی بسته‌ها خیلی سبک و برخی خیلی سنگین هستند که باعث نارضایتی مشتری یا ضرر کارخانه می‌شود. در هواشناسی نیز از واریانس استفاده می‌شود. برای مثال، واریانس دمای روزانه در یک منطقه کویری در طول سال بسیار بالاست (روزها بسیار گرم و شب‌ها بسیار سرد)، در حالی که در یک منطقه نزدیک به دریا، واریانس دما پایین‌تر است.

۵. چالش‌های مفهومی

چالش ۱: چرا در فرمول واریانس، اختلاف‌ها را به توان دو می‌رسانیم؟
اگر اختلاف‌ها را بدون توان جمع کنیم، مجموع آن‌ها همیشه صفر می‌شود (چون اختلاف‌های مثبت و منفی همدیگر را خنثی می‌کنند). با مجذور کردن، هم علامت‌ها مثبت می‌شوند و هم به اختلاف‌های بزرگ‌تر وزن بیشتری می‌دهیم تا پراکندگی واقعی بهتر نشان داده شود.
چالش ۲: چه زمانی واریانس یک مجموعه داده صفر می‌شود؟
واریانس صفر است وقتی همه داده‌ها با هم برابر باشند. در این حالت، هیچ داده‌ای از میانگین فاصله ندارد، همه اختلاف‌ها صفر هستند و بنابراین واریانس نیز صفر خواهد بود. مثلاً اگر نمرات همه دانش‌آموزان 20 باشد، واریانس صفر است.
چالش ۳: آیا واریانس می‌تواند منفی باشد؟
خیر، واریانس هرگز منفی نمی‌شود. چون حاصل جمع مجذور اعداد (که همیشه نامنفی هستند) تقسیم بر تعداد داده‌ها است. کوچک‌ترین مقدار ممکن برای واریانس صفر است و هر چه داده‌ها پراکنده‌تر باشند، واریانس بزرگ‌تر می‌شود.
جمع‌بندی: واریانس یک معیار کلیدی برای درک پراکندگی داده‌ها است. با مجذور کردن فاصله داده‌ها از میانگین، تصویری از میزان نوسان و تغییرپذیری آن‌ها به دست می‌دهد. اگرچه واحد آن مربع واحد اصلی است و تفسیر مستقیمش دشوار به نظر می‌رسد، اما پایه محاسبه انحراف معیار و بسیاری از آزمون‌های آماری پیشرفته است. درک واریانس به ما کمک می‌کند فراتر از میانگین نگاه کنیم و داده‌ها را بهتر تحلیل نماییم. از کنترل کیفیت در کارخانه‌ها گرفته تا بررسی نوسانات آب و هوا و ارزیابی عملکرد دانش‌آموزان، واریانس ابزاری قدرتمند و پرکاربرد است.

پاورقی

1 واریانس (Variance): معیاری عددی برای نشان دادن میزان پراکندگی داده‌های عددی حول میانگین. هر چه داده‌ها از میانگین دورتر باشند، واریانس بزرگ‌تر است.
2 انحراف معیار (Standard Deviation): معیاری برای سنجش پراکندگی داده‌ها که از جذر واریانس به دست می‌آید و واحدی مشابه داده‌های اصلی دارد.
3 جامعه (Population): در آمار، به مجموعه تمام داده‌ها یا مشاهدات مورد نظر که می‌خواهیم درباره آن‌ها تحقیق کنیم، جامعه گفته می‌شود.
4 نمونه (Sample): زیرمجموعه‌ای از جامعه که برای صرفه‌جویی در زمان و هزینه مورد مطالعه قرار می‌گیرد. فرمول واریانس نمونه کمی با واریانس جامعه تفاوت دارد (تقسیم بر n-1 به جای n).