قانون احتمال کل: حالت دو عضوی
مفهوم افراز و فضای نمونه دو تکهای
تصور کنید فضای نمونه (تمام نتایج ممکن یک آزمایش تصادفی) مانند یک کیک گرد است. گاهی اوقات برای محاسبه احتمال یک رویداد خاص، بهتر است این کیک را به دو تکهی مجزا و غیرهمپوشان (B و متمم B) تقسیم کنیم که روی هم رفته کل کیک را پوشش دهند. در ریاضیات به این دو تکه، یک «افراز»1 از فضای نمونه میگویند. وقتی این کار را انجام دادیم، هر رویداد دلخواه مانند A، بخشی از خود را در تکه B و بخشی دیگر را در تکه متمم B خواهد داشت. برای درک بهتر، فرض کنید فضای نمونه، دانشآموزان یک مدرسه هستند. اگر B را مجموعهی دانشآموزان ورزشکار تعریف کنیم، آنگاه متمم B به طور خودکار دانشآموزان غیرورزشکار خواهد بود. این دو گروه هیچ عضو مشترکی ندارند و مجموع آنها تمام دانشآموزان مدرسه است. حال اگر رویداد A به معنای «قد بلندتر از 170 سانتیمتر» باشد، میتوانیم ببینیم چه تعدادی از ورزشکاران و چه تعدادی از غیرورزشکاران این ویژگی را دارند.ریشهیابی فرمول: چرا B و متمم آن؟
فرمول مشهور قانون احتمال کل برای حالت دو عضوی به صورت زیر است:$P(A) = P(B) \times P(A|B) + P(B') \times P(A|B')$
مثال علمی: تشخیص یک بیماری نادر
برای درک عمیقتر، یک مثال کلاسیک از علم پزشکی را بررسی میکنیم. فرض کنید بیماری نادری در جامعه وجود دارد که فقط 0.1% از مردم به آن مبتلا هستند (یعنی $P(\text{بیمار}) = 0.001$). یک آزمایش تشخیصی برای این بیماری طراحی شده است که: - اگر فرد بیمار باشد، در 99% موارد آزمایش مثبت میشود (حساسیت2 بالا). - اگر فرد سالم باشد، در 95% موارد آزمایش منفی میشود (ویژگی3 بالا). یعنی 5% افراد سالم به اشتباه جواب مثبت میگیرند (مثبت کاذب). میخواهیم بدانیم احتمال اینکه یک فرد از کل جامعه، نتیجهی آزمایشش مثبت شود چقدر است؟ در اینجا: - فضای نمونه: همه افراد جامعه. - B: فرد بیمار باشد. - $B'$: فرد سالم باشد. - A: نتیجه آزمایش مثبت باشد. با استفاده از قانون احتمال کل: $P(A) = P(B) \times P(A|B) + P(B') \times P(A|B')$ $P(A) = (0.001 \times 0.99) + (0.999 \times 0.05)$ $P(A) = 0.00099 + 0.04995 = 0.05094$ یعنی تقریباً 5.1% افراد جامعه نتیجه آزمایش مثبت خواهند داشت. جالب است که این عدد بسیار بیشتر از میزان شیوع واقعی بیماری (0.1%) است. این نشاندهنده تأثیر بالای مثبت کاذب در آزمایشهای پزشکی است.کاربرد در زندگی روزمره و تحلیل تصمیمگیری
این قانون فقط در پزشکی کاربرد ندارد. در بسیاری از تصمیمگیریهای روزمره، ناخودآگاه از این مفهوم استفاده میکنیم. برای مثال، فرض کنید میخواهید تصمیم بگیرید که برای یک پیکنیک آخر هفته، چقدر احتمال بارندگی وجود دارد. اطلاعات شما به این صورت است: - احتمال اینکه هوا ابری باشد (B): 40%. - اگر هوا ابری باشد، احتمال باران ($P(A|B)$): 70%. - اگر هوا ابری نباشد ($B'$ با احتمال 60%)، احتمال باران ($P(A|B')$): 20%. با استفاده از قانون احتمال کل، احتمال باران در آن روز به این صورت محاسبه میشود: $P(\text{باران}) = (0.4 \times 0.7) + (0.6 \times 0.2) = 0.28 + 0.12 = 0.40$ یعنی 40% احتمال باران وجود دارد. این عدد به شما کمک میکند تصمیم بگیرید که آیا برنامه را لغو کنید یا نه. برای مقایسه بهتر مفاهیم، جدول زیر را ببینید:| مؤلفه | نماد ریاضی | توضیح ساده | مثال (بیماری) |
|---|---|---|---|
| رویداد شرط (تکه اول) | $B$ | یکی از دو حالت ممکن که میخواهیم بر اساس آن شرط ببندیم. | بیمار بودن |
| متمم شرط (تکه دوم) | $B'$ | حالت مخالف B که مکمل آن است. | سالم بودن |
| احتمال رویداد اصلی | $P(A)$ | احتمال نهایی که به دنبال آن هستیم. | احتمال مثبت شدن آزمایش |
| احتمال شرطی | $P(A|B)$ | احتمال وقوع A به شرط اینکه B رخ داده باشد. | احتمال مثبت شدن آزمایش اگر بیمار باشیم (99%) |
چالشهای مفهومی
پاسخ: خیر. این فرمول دقیقاً بر اساس خاصیت افراز بنا شده است. اگر B و متمم B همپوشانی داشته باشند، آنگاه $A \cap B$ و $A \cap B'$ دیگر لزوماً ناسازگار (Mutually Exclusive) نیستند و جمع سادهی آنها احتمال A را به دست نمیدهد و باعث شمارش مضاعف میشود.
پاسخ: این پدیده به دلیل «نرخ پایه»4 رخ میدهد. چون تعداد افراد سالم (متمم B) بسیار زیاد است، حتی درصد کوچکی از خطا در آنها (مثبت کاذب) تعداد زیادی خطا تولید میکند و بر نتیجه نهایی غلبه میکند.
پاسخ: در حالت کلی، فضای نمونه به n تکهی جدا از هم (نه فقط دو تکه) افراز میشود. فرمول به صورت $P(A) = \sum_{i=1}^{n} P(B_i) P(A|B_i)$ در میآید. حالت دو عضوی سادهترین و رایجترین حالت این قانون است که مفاهیم پایه را به خوبی منتقل میکند.
جمعبندی
پاورقی
1 افراز (Partition): مجموعهای از زیرمجموعههای ناتهی از یک مجموعه که با هم دو به دو ناسازگار (مجزا) هستند و اجتماع آنها برابر مجموعه اصلی است.2 حساسیت (Sensitivity): توانایی یک آزمایش در تشخیص صحیح افراد بیمار که برابر با احتمال مثبت شدن آزمایش به شرط بیمار بودن است.
3 ویژگی (Specificity): توانایی یک آزمایش در تشخیص صحیح افراد سالم که برابر با احتمال منفی شدن آزمایش به شرط سالم بودن است.
4 نرخ پایه (Base Rate): فراوانی یا شیوع یک ویژگی یا رویداد در کل جامعه (مانند 0.1% ابتلا به بیماری در مثال).