برآورد نسبت: تخمین سهم افراد دارای یک ویژگی در جامعه
نسبت جامعه و نسبت نمونه: تعریف و تفاوت
در آمار، هنگامی که میخواهیم درباره یک جامعه بزرگ (مثل همه دانشآموزان یک کشور) اظهار نظر کنیم، بررسی تکتک افراد تقریباً غیرممکن است. به جای آن، از یک گروه کوچکتر به نام نمونه2 استفاده میکنیم. نسبت افراد دارای یک ویژگی در کل جامعه را با حرف $p$ نشان میدهیم که به آن نسبت واقعی جامعه میگوییم. اما چون معمولاً $p$ را نمیدانیم، آن را با استفاده از نمونه تخمین میزنیم. تخمین ما را با $\hat{p}$ (بخوانید «پِی هت») نمایش میدهند که همان نسبت نمونه است. فرمول آن ساده است:
در این فرمول، $x$ تعداد افراد دارای ویژگی در نمونه و $n$ حجم نمونه است. برای نمونهگیری تصادفی ساده، $\hat{p}$ یک تخمینگر نااریب3 برای $p$ محسوب میشود. یعنی اگر بارها و بارها نمونهگیری کنیم، میانگین $\hat{p}$ها به $p$ نزدیک خواهد بود.
توزیع نمونهگیری نسبت و خطای استاندارد
برای تعیین میزان خطای تخمین، باید بدانیم $\hat{p}$ در نمونههای مختلف چگونه رفتار میکند. بر اساس قضیه حد مرکزی4، اگر حجم نمونه به اندازه کافی بزرگ باشد (معمولاً $n \ge 30$ و همچنین $n \hat{p} \ge 5$ و $n(1-\hat{p}) \ge 5$)، توزیع $\hat{p}$ تقریباً نرمال5 خواهد بود با میانگین $p$ و انحراف معیار که به آن خطای استاندارد نسبت میگوییم:
از آنجا که $p$ را نمیدانیم، در عمل از تخمین آن یعنی $\hat{p}$ استفاده میکنیم و خطای استاندارد برآوردی را محاسبه مینماییم:
این خطای استاندارد نشان میدهد که نسبت نمونه تا چه اندازه میتواند از نسبت واقعی جامعه فاصله داشته باشد. هرچه حجم نمونه $n$ بیشتر باشد، خطای استاندارد کوچکتر و تخمین ما دقیقتر خواهد بود.
فاصله اطمینان برای نسبت واقعی جامعه
به جای آنکه فقط یک عدد (مثل 0.12) را به عنوان تخمین ارائه دهیم، بهتر است یک بازه (فاصله) تعریف کنیم که با احتمال معینی نسبت واقعی $p$ درون آن قرار دارد. به این بازه، فاصله اطمینان میگوییم. رایجترین سطح اطمینان، 95% است. فرمول عمومی فاصله اطمینان برای نسبت به شکل زیر است:
در اینجا $z^*$ مقدار بحرانی از توزیع نرمال استاندارد است که به سطح اطمینان بستگی دارد. برای سطح اطمینان 95%، $z^* = 1.96$ (تقریباً 2). برای سطح اطمینان 90%، $z^* = 1.645$ و برای 99%، $z^* = 2.576$.
| سطح اطمینان | مقدار بحرانی ($z^*$) | کاربرد رایج |
|---|---|---|
| 90% | 1.645 | بررسیهای سریع با خطای نسبتاً بیشتر |
| 95% | 1.96 | استاندارد طلایی در پژوهشهای علوم اجتماعی و پزشکی |
| 99% | 2.576 | زمانی که دقت بسیار بالا لازم است (مثل مطالعات دارویی) |
به مثال دانشآموزان چپدست بازگردیم. با $\hat{p}=0.12$ و $n=100$، فاصله اطمینان 95% به صورت زیر محاسبه میشود:
بنابراین بازه تقریباً از $0.0563$ تا $0.1837$ (یعنی 5.6% تا 18.4%) خواهد بود. با 95% اطمینان میگوییم که نسبت واقعی دانشآموزان چپدست در کل دبیرستان بین 5.6% و 18.4% قرار دارد.
تعیین حجم نمونه مورد نیاز برای دقت مشخص
گاهی پیش از انجام پژوهش میخواهیم بدانیم چه تعداد نفر باید نمونهگیری کنیم تا فاصله اطمینان دارای طول معین (یا حاشیه خطای مشخص) باشد. اگر حاشیه خطای مورد نظر را با $E$ نشان دهیم، از رابطه زیر استفاده میکنیم:
از آنجا که $p$ را نمیدانیم، میتوانیم از یک تخمین اولیه یا محافظهکارانهترین حالت (که $p=0.5$ است) استفاده کنیم، زیرا حاصلضرب $p(1-p)$ در $p=0.5$ به بیشینه خود میرسد و بزرگترین حجم نمونه را نتیجه میدهد. برای مثال، اگر بخواهیم با سطح اطمینان 95% حاشیه خطای حداکثر 0.03 (سه درصد) داشته باشیم و تخمینی از $p$ نداشته باشیم، حجم نمونه لازم برابر است با:
بنابراین به حدود 1067 نفر نیاز داریم.
مثال عینی: نظرسنجی از طرفداران یک تیم فوتبال
فرض کنید یک شبکه ورزشی میخواهد درصد طرفداران تیم «پیروزی» را در بین همه بینندگان خود در یک شهر تخمین بزند. از میان 500 نفر که به طور تصادفی انتخاب شدهاند، 200 نفر اعلام میکنند که طرفدار این تیم هستند. بنابراین $\hat{p} = 200/500 = 0.40$. برای ساختن فاصله اطمینان 95%، خطای استاندارد را محاسبه میکنیم:
حاشیه خطا برابر $1.96 \times 0.0219 \approx 0.0429$ است. بازه اطمینان: $0.40 \pm 0.0429$ یعنی از $0.3571$ تا $0.4429$ (35.7% تا 44.3%). شبکه ورزشی میتواند با اطمینان 95% گزارش دهد که طرفداران تیم پیروزی بین 35.7% و 44.3% از کل بینندگان را تشکیل میدهند.
چالشهای مفهومی
سوال 1: آیا فاصله اطمینان 95% یعنی با 95% احتمال، پارامتر واقعی درون این بازه قرار دارد؟
پاسخ: نه، این یک تفسیر رایج اما نادرست است. فاصله اطمینان یک بازه تصادفی است (چون به نمونه بستگی دارد) و پارامتر واقعی $p$ یک مقدار ثابت (غیرتصادفی) است. تفسیر صحیح این است: اگر بارها و بارها نمونهگیری کنیم و برای هر نمونه یک فاصله اطمینان 95% بسازیم، انتظار داریم حدود 95% از این بازهها دارای $p$ باشند. برای یک بازه مشخص، نمیتوانیم احتمال بدهیم، بلکه فقط «اطمینان» داریم که آن بازه جزو 95% بازههای موفق است.
سوال 2: اگر حجم نمونه خیلی کوچک باشد و شرط $n\hat{p} \ge 5$ برقرار نباشد، چه باید کرد؟
پاسخ: در این صورت توزیع نرمال تقریب خوبی نیست و فاصله اطمینان استاندارد معتبر نخواهد بود. روشهای جایگزینی وجود دارد، مانند فاصله اطمینان «ویلسون»6 یا روش «بوتاسترپ»7. همچنین میتوان از «تصحیح پیوستگی» استفاده کرد. اما در سطح دبیرستان، معمولاً توصیه میشود حجم نمونه را افزایش دهید تا شرایط تقریب نرمال برقرار شود.
سوال 3: آیا نسبت نمونه $\hat{p}$ همیشه برابر با نسبت واقعی جامعه $p$ است؟
پاسخ: خیر، به دلیل تغییرپذیری نمونهگیری، $\hat{p}$ معمولاً با $p$ تفاوت دارد. این تفاوت را خطای نمونهگیری مینامند. با افزایش حجم نمونه، خطای نمونهگیری کاهش مییابد، اما هرگز به طور کامل از بین نمیرود مگر اینکه کل جامعه بررسی شود. هدف روشهای برآورد فاصلهای، کمی کردن همین خطاست.
در این مقاله با مفهوم نسبت واقعی جامعه ($p$) و تخمین آن توسط نسبت نمونه ($\hat{p}$) آشنا شدیم. یاد گرفتیم که چگونه با استفاده از توزیع نرمال، فاصله اطمینان برای $p$ محاسبه کنیم و این فاصله را برای سطوح اطمینان مختلف به دست آوریم. همچنین دیدیم که حجم نمونه چه نقشی در دقت تخمین دارد و چگونه میتوان از قبل حجم نمونه لازم برای دستیابی به حاشیه خطای مشخص را تعیین کرد. درک صحیح از فاصله اطمینان و تفاوت آن با احتمال، از رایجترین چالشهای مفهومی است که در بخش پرسش و پاسخ به آن پرداخته شد. این ابزارهای آماری در نظرسنجیها، تحقیقات پزشکی، کنترل کیفیت و بسیاری از حوزههای دیگر کاربرد گسترده دارند.
پاورقی
1 فاصله اطمینان (Confidence Interval): بازهای که با روشی مشخص ساخته میشود تا با سطح اطمینان معینی، پارامتر جامعه را دربر گیرد.
2 نمونه (Sample): زیرمجموعهای از جامعه که برای جمعآوری دادهها انتخاب میشود و قرار است نماینده کل جامعه باشد.
3 تخمینگر نااریب (Unbiased Estimator): تخمینگری که امید ریاضی آن برابر با پارامتر واقعی جامعه باشد.
4 قضیه حد مرکزی (Central Limit Theorem): قضیهای که میگوید برای حجم نمونه بزرگ، توزیع میانگین نمونهگیری (و به تبع آن نسبت نمونهگیری) به توزیع نرمال نزدیک میشود، مستقل از توزیع جامعه اصلی.
5 توزیع نرمال (Normal Distribution): توزیع احتمال پیوسته به شکل زنگی که با میانگین و انحراف معیار مشخص میشود و در آمار استنباطی کاربرد فراوان دارد.
6 فاصله اطمینان ویلسون (Wilson Score Interval): روش دقیقتری برای محاسبه فاصله اطمینان نسبت که برای نمونههای کوچک و نسبتهای نزدیک به صفر یا یک عملکرد بهتری دارد.
7 روش بوتاسترپ (Bootstrap Method): روش بازنمونهگیری که با تولید نمونههای متعدد از دادههای موجود، توزیع نمونهگیری آماره را تقریب میزند.