دلیل اریبی: وقتی آمار از حقیقت جا میماند
انواع اریبی: ریشههای اصلی انحراف از واقعیت
اریبی میتواند از منابع مختلفی ناشی شود. درک این منابع اولین گام برای شناسایی و اجتناب از آنها در تحقیقات است. به طور کلی، عوامل ایجاد اریبی را میتوان در چند دستهٔ اصلی طبقهبندی کرد.
اریبی انتخاب زمانی رخ میدهد که گروهی از افراد که در مطالعه شرکت میکنند، نمایندهٔ کل جامعه نباشند. برای مثال، اگر بخواهیم نظر دانشآموزان یک مدرسه را دربارهٔ کیفیت غذای سلفسرویس بدانیم و نظرسنجی را فقط در روزی انجام دهیم که غذای محبوب (مثلاً پیتزا) سرو میشود، نتایج بهشدت مثبت و غیرواقعی خواهد بود.
اریبی پاسخدهی به موقعیتی گفته میشود که افراد بهدلیل شرایط مختلف، پاسخهای نادرست یا غیرصادقانه بدهند. در یک نظرسنجی دربارهٔ میزان مطالعه، ممکن است افراد میزان مطالعهٔ خود را بیشتر از آنچه هست اعلام کنند تا در نظر دیگران فردی کتابخوان به نظر برسند. این نوع اریبی را «سوگیری مطلوبیت اجتماعی»1 نیز مینامند.
نمونهگیری و اریبی: ریشهٔ بسیاری از خطاهای آماری
یکی از مهمترین مراحل هر پژوهش، انتخاب نمونه است. اگر نمونهگیری به درستی انجام نشود، حتی با بهترین روشهای تحلیل نیز نمیتوان به نتایج درست رسید. جدول زیر تفاوت بین نمونهگیری صحیح و نمونهگیری اریبدار را نشان میدهد.
| ویژگی | نمونهگیری تصادفی ساده | نمونهگیری آسان (اریبدار) |
|---|---|---|
| روش انتخاب | همهٔ اعضای جامعه شانس برابر برای انتخاب دارند. | انتخاب بر اساس دسترسی آسان (مثلاً دوستان، افرادی در خیابان). |
| نمایندگی جامعه | بالا | پایین |
| تعمیمپذیری نتایج | نتایج قابل تعمیم به کل جامعه است. | نتایج فقط مربوط به همان گروه خاص است. |
| مثال | قرعهکشی از بین همهٔ دانشآموزان یک مدرسه برای نظرسنجی. | نظرسنجی فقط از دانشآموزانی که در زنگ تفریح در حیاط مدرسه هستند. |
ریاضیات پشت اریبی: فرمول خطای سیستماتیک
در آمار، برای درک تفاوت بین یک برآورد و مقدار واقعی، از دو مفهوم «خطای تصادفی» و «اریبی» استفاده میشود. اگر $\hat{\theta}$ برآورد ما از یک ویژگی جامعه به نام $\theta$ باشد، آنگاه اریبی به صورت زیر تعریف میشود:
در این فرمول، $E[\hat{\theta}]$ امید ریاضی (میانگین) برآورد ما در صورت تکرار نمونهگیری است. اگر این مقدار با $\theta$ برابر نباشد، برآورد ما اریبدار است. به عبارت سادهتر، اگر یک تیرانداز را در نظر بگیریم که هدفی دارد. اگر تیرهای او به طور سیستماتیک به سمت چپ هدف اصابت کند (و نه به طور تصادفی در اطراف هدف پخش شود)، او یک اریبی دارد.
کاربرد عملی: چرا در بازاریابی و نظرسنجیها باید حواسمان به اریبی باشد؟
اریبی فقط یک مفهوم آکادمیک نیست؛ در دنیای واقعی کسبوکار و سیاستگذاری، نادیده گرفتن آن میتواند هزینههای سنگینی به همراه داشته باشد. شرکتهای بزرگ برای تصمیمگیری دربارهٔ تولید محصولات جدید، قیمتگذاری و تبلیغات به شدت به دادههای جمعآوریشده از مشتریان متکی هستند.
فرض کنید یک شرکت تولیدکنندهٔ گوشی هوشمند، نظرسنجی آنلاین دربارهٔ طراحی جدید خود منتشر میکند. طبیعتاً افرادی به این نظرسنجی پاسخ میدهند که به فناوری علاقه بیشتری دارند و وقت خود را در اینترنت میگذرانند. نتیجه این نظرسنجی احتمالاً طراحی جدید را بسیار موفق نشان میدهد، اما ممکن است نظر مشتریان سنتیتر یا کسانی که به اینترنت دسترسی آسان ندارند کاملاً متفاوت باشد. اگر شرکت بر اساس این نظرسنجی اریبدار، تولید انبوه را شروع کند، با شکست تجاری بزرگی روبهرو خواهد شد. این نوع اریبی، اریبی عدمپاسخ2 نیز نامیده میشود.
چالشهای مفهومی
خیر. خطاها به دو دستهٔ کلی تقسیم میشوند: خطاهای تصادفی و خطاهای سیستماتیک (اریبی). خطای تصادفی به دلیل نوسانات طبیعی در نمونهگیری رخ میدهد و با افزایش حجم نمونه کاهش مییابد. اما اریبی یک خطای سیستماتیک است که جهت آن ثابت است و با افزایش حجم نمونه نه تنها کاهش نمییابد، بلکه ممکن است بزرگتر هم دیده شود.
تشخیص قطعی اریبی گاهی سخت است، زیرا ما معمولاً به مقدار واقعی جامعه دسترسی نداریم. اما میتوان با بررسی دقیق روش تحقیق، نحوهٔ نمونهگیری، ابزار اندازهگیری و مقایسهٔ نتایج با سایر مطالعات معتبر، به وجود اریبی مشکوک شد. استفاده از روشهای نمونهگیری تصادفی و طراحی دقیق پرسشنامه، احتمال بروز اریبی را کاهش میدهد.
گاهی با استفاده از روشهای آماری پیچیده مانند «وزندهی»3 میتوان تا حدودی اثر اریبی را تعدیل کرد، اما حذف کامل آن تقریباً غیرممکن است. بهترین راه، پیشگیری از بروز اریبی در مرحلهٔ طراحی پژوهش است. همانطور که ضربالمثلی معروف میگوید: «پیشگیری بهتر از درمان است.»