شرطیسازی فعال: یادگیری از طریق پیامدهای رفتار
مبانی شرطیسازی فعال: رفتار و پیامد
فرض کنید شما یک موش کوچک در یک قفس هستید. یک اهرم جلوی شماست. وقتی به طور تصادفی اهرم را فشار میدهید، یک تکه غذا از دستگاه بیرون میآید. چه میکنید؟ احتمالاً دوباره اهرم را فشار میدهید! این دقیقاً آزمایش معروف بافوس اسکینر۶ بود که اساس شرطیسازی فعال را بنا نهاد. در این نوع یادگیری، موجود زنده (چه انسان و چه حیوان) به صورت فعال بر محیط اثر میگذارد و بسته به نتیجه عملش، یاد میگیرد که آن رفتار را تکرار کند یا نه.
سه جزء اصلی در این فرآیند وجود دارد:
| عنوان جزء | توضیح | مثال |
|---|---|---|
| پاسخ یا رفتار | عملی که توسط یادگیرنده انجام میشود. | فشار دادن اهرم توسط موش |
| پیامد | نتیجهای که بلافاصله پس از رفتار رخ میدهد. | دریافت غذا |
| نوع ارتباط | چگونگی تأثیر پیامد بر رفتار در آینده. | افزایش احتمال فشار دادن اهرم در آینده |
انواع پیامدها: چهار حالت اصلی
پیامدهای رفتار را میتوان در یک جدول ساده و بسیار کاربردی دستهبندی کرد. این جدول به "جعبه ابزار رفتار" معروف است و نشان میدهد چگونه میتوان یک رفتار را تقویت کرد (یعنی احتمال وقوعش را افزایش داد) یا تضعیف کرد (یعنی احتمال وقوعش را کاهش داد).
| هدف شما | اضافه کردن یک محرک (مثبت) | حذف کردن یک محرک (منفی) |
|---|---|---|
| تقویت رفتار (افزایش احتمال) |
تقویت مثبت۷ اضافه کردن یک محرک خوشایند پس از رفتار. مثال: گرفتن نمره 20 برای انجام تکالیف. موفق
|
تقویت منفی۸ حذف یک محرک ناخوشایند پس از رفتار. مثال: خاموش کردن زنگ هشدار با بستن کمربند ایمنی. موفق
|
| تضعیف رفتار (کاهش احتمال) |
تنبیه مثبت۹ اضافه کردن یک محرک ناخوشایند پس از رفتار. مثال: گرفتن نمره انضباطی برای شلوغ کردن در کلاس. هشدار
|
حذف تقویت کننده (تنبیه منفی)۱۰ حذف یک محرک خوشایند پس از رفتار. مثال: محروم شدن از بازی ویدیویی به دلیل دعوا با خواهر یا برادر. هشدار
|
نکته کلیدی: کلمات "مثبت" و "منفی" در اینجا به معنای "خوب" و "بد" نیستند. "مثبت" به معنی اضافه کردن چیزی و "منفی" به معنی کم کردن یا حذف چیزی است. برای مثال، تقویت منفی با حذف یک چیز آزاردهنده، رفتار را تقویت میکند و یک روش قدرتمند برای یادگیری است.
برنامههای تقویت: چه زمانی پاداش بدهیم؟
آیا باید بعد از هر بار انجام رفتار صحیح، پاداش داد؟ یا فقط گاهی اوقات؟ پاسخ این سؤال در "برنامههای تقویت" نهفته است. این برنامهها مشخص میکنند که تقویتکننده با چه الگویی ارائه شود. انتخاب برنامه تقویت مناسب، تأثیر شگفتانگیزی بر سرعت یادگیری و ماندگاری رفتار دارد.
| نام برنامه | شرح | مثال | اثر بر رفتار |
|---|---|---|---|
| نسبت ثابت | پس از تعداد مشخصی از پاسخها پاداش داده میشود. | دستمزد برای هر 10 محصول ساختهشده. | میزان پاسخدهی بسیار بالا |
| نسبت متغیر | پس از تعداد میانگین و غیرقابل پیشبینی از پاسخها پاداش داده میشود. | برنده شدن در بازیهای قمار یا شرطبندی. | میزان پاسخدهی بسیار بالا و مقاوم در برابر خاموشی |
| فاصله ثابت | پس از گذشت زمان مشخصی پاداش داده میشود. | دریافت حقوق هر آخر ماه. | میزان پاسخدهی نزدیک به زمان پاداش افزایش مییابد |
| فاصله متغیر | پس از گذشت زمان میانگین و غیرقابل پیشبینی پاداش داده میشود. | بررسی غیرمنتظرهٔ تکالیف توسط معلم. | میزان پاسخدهی پایدار و مداوم |
به عنوان یک قاعده کلی، برنامههای متغیر (هم نسبت و هم فاصله) باعث ایجاد رفتارهایی میشوند که در برابر خاموشی۱۱ (توقف رفتار وقتی پاداش قطع میشود) بسیار مقاومتر هستند. به همین دلیل است که افراد حتی پس از چندین بار باخت هم به شرطبندی ادامه میدهند؛ چون امیدوارند دفعه بعد برنده شوند (برنامه تقویت با نسبت متغیر).
کاربردهای عملی در آموزش و زندگی روزمره
اصول شرطیسازی فعال فقط محدود به آزمایشگاه نیست و در موقعیتهای بیشماری در اطراف ما در جریان است.
در کلاس درس: یک معلم میتواند با استفاده از تقویت مثبت مانند دادن ستاره، نمره خوب یا حتی یک تشویق ساده کلامی، مشارکت دانشآموزان در بحثهای کلاسی را افزایش دهد. از طرفی، تقویت منفی نیز میتواند مؤثر باشد؛ مثلاً معلم اعلام کند اگر همه تکالیف خود را به موقع انجام دهند، از حجم امتحان هفتگی کم خواهد کرد (حذف یک محرک ناخوشایند).
در تربیت حیوانات خانگی: وقتی به سگ خود یاد میدهید بنشیند، به محض انجام این کار به او تشویقی میدهید (تقویت مثبت). یا اگر برای آموزش دستشویی به تولهسگ، از اسپری آب برای بازداشتن او از انجام کار اشتباه استفاده کنید، این یک تنبیه مثبت است (اضافه کردن یک محرک ناخوشایند).
در parenting (فرزندپریری): سیستم "اقتصاد ژتونی" نمونهای عالی است. کودک برای انجام کارهای خوب (مانند مرتب کردن تختخواب یا کمک در خانه) ژتون میگیرد (تقویت مثبت) و سپس میتواند ژتونهایش را برای یک پاداش بزرگتر (مثلاً یک اسباببازی یا وقت بیشتر برای تماشای تلویزیون) معاوضه کند. محروم کردن موقت کودک از بازی مورد علاقهاش به دلیل رفتار نامناسب نیز یک تنبیه منفی مؤثر است.
اشتباهات رایج و پرسشهای مهم
پاسخ: اگرچه تقویت معمولاً روش مؤثرتر و اخلاقیتری برای شکلدهی رفتارهای جدید است، اما تنبیه در برخی موقعیتهای خاص میتواند لازم باشد، به شرطی که بلافاصله، متناسب و بهطور مستمر اعمال شود. مثلاً برای متوقف کردن یک رفتار خطرناک (مانند دویدن به سمت خیابان) ممکن است از یک تنبیه ملایم استفاده شود. مشکل اصلی تنبیه این است که اغلب فقط رفتار را به طور موقت سرکوب میکند و به فرد نمیآموزد که رفتار جایگزین و مناسب چیست. همچنین میتواند باعث ترس، اضطراب و اجتناب شود.
پاسخ: این یک اشتباه رایج است. در شرطیسازی کلاسیک۱۲ (مانند آزمایش سگ پاولف)، یادگیرنده منفعل است و یک پاسخ غیرارادی (مانند بزاق دهان) را با یک محرک جدید (مثل صدای زنگ) مرتبط میکند. اما در شرطیسازی فعال، یادگیرنده فعال است و یک رفتار ارادی را برای به دست آوردن پاداش یا اجتناب از تنبیه انجام میدهد. در شرطیسازی کلاسیک، رفتارها بازتابی و غیرارادی هستند، اما در شرطیسازی فعال، رفتارها ارادی و هدفمندند.
پاسخ: خاموشی زمانی رخ میدهد که یک رفتار تقویتشده، دیگر تقویت نشود و در نهایت کاهش یافته یا کاملاً متوقف شود. مثلاً اگر دیگر با فشار دادن اهرم، غذایی به موش نرسد، سرانجام از فشار دادن اهرم دست میکشد. جالب اینجاست که در مرحله خاموشی، ممکن است رفتار به طور موقت و حتی با شدت بیشتری ظاهر شود (فوران خاموشی) قبل از اینکه برای همیشه ناپدید شود.
پاورقی
۱ Operant Conditioning (شرطیسازی فعال): نوعی یادگیری که در آن قدرت یک رفتار با پیامدهای آن (پاداش یا تنبیه) تغییر میکند.
۲ Reinforcement (تقویت): هر رویدادی که احتمال تکرار یک رفتار را افزایش دهد.
۳ Punishment (تنبیه): هر رویدادی که احتمال تکرار یک رفتار را کاهش دهد.
۴ Positive (مثبت): به معنی اضافه کردن یک محرک.
۵ Negative (منفی): به معنی حذف کردن یک محرک.
۶ B.F. Skinner: روانشناس آمریکایی که به عنوان پدر شرطیسازی فعال شناخته میشود.
۷ Positive Reinforcement (تقویت مثبت): اضافه کردن یک محرک مطلوب پس از رفتار برای افزایش احتمال وقوع آن.
۸ Negative Reinforcement (تقویت منفی): حذف یک محرک نامطلوب پس از رفتار برای افزایش احتمال وقوع آن.
۹ Positive Punishment (تنبیه مثبت): اضافه کردن یک محرک نامطلوب پس از رفتار برای کاهش احتمال وقوع آن.
۱۰ Negative Punishment / Omission Training (تنبیه منفی): حذف یک محرک مطلوب پس از رفتار برای کاهش احتمال وقوع آن.
۱۱ Extinction (خاموشی): تضعیف و ناپدید شدن یک رفتار تقویتشده زمانی که دیگر تقویت نمیشود.
۱۲ Classical Conditioning (شرطیسازی کلاسیک): نوعی یادگیری که در آن یک محرک خنثی با یک محرک طبیعی جفت شده میشود تا پاسخ یکسانی را برانگیزد.