強化スケジュール(1) 連続強化と部分強化

強化スケジュール(schedule of reinforcement)

強化スケジュールとは、いつ、どんな条件で強化するのかについてのスケジュールのことです。行動する度に毎回強化子が与えられる連続強化スケジュールと特定の条件を満たしたときだけ強化子が与えられる部分強化スケジュールに分けられます。

連続強化スケジュール
(Continuous Reinforcement schedule :CRF)

行動する度に毎回強化子が与えられる強化スケジュール。自発回数が少ない行動に対して、行動を獲得させるのに有効なスケジュールです。

部分強化スケジュール・間欠強化スケジュール
(partial reinforcement schedule)

時間や回数など、特定の条件をクリアしたときだけ、強化子が与えられる強化スケジュールです。部分強化の方式を大きく固定比率、変動比率、固定時隔、変動時隔の4つの基本スケジュールに分けることができます。

例 おねだりをされてたまに買ってあげると、(間欠強化が成立して)子どものおねだりは(強化されて)止まらない。

強化スケジュールの消去

消去が速いか遅いかはスケジュールの値によって異なりますが、強化スケジュールの中でも行動が消去されやすいです。これは部分強化効果と呼ばれており、その理由の説明として弁別仮説があります。

連続強化の場合は、反応すれば必ず強化子が得られるため、消去スケジュールへの変更がされればそれを弁別するのは容易ですから、反応しなくなるまでそれほど時間はかかりません。部分強化の場合は反応によって強化子が得られる場合と得られない場合の両方を経験していますから、しばらく強化子が得られない状態が続いても、それが消去に転じたことを弁別するのにかなりの時間を必要になります。

部分強化による基本スケジュール

① 固定比率スケジュール(Fixed Ratio schedule:FR)

強化子が与えられる条件が一定の回数によって決まるスケジュールです。例えばレバーを
3回押したら強化する(FR3)などになります。

固定比率スケジュールでの累積反応記録は、階段状の特徴的な反応パターンを示します。強化子を得た後はしばらく反応がない状態が見られ、これは強化後反応休止(Post Reinforcement Pause:PRP)と呼ばれます。この反応休止期間が階段の水平部分となり、しばらくすると再び反応がはじまります(傾斜部)。

この強化後反応休止の期間は、強化子を得るための反応数が多くなるほど長くなります。これはいくつかの実験から、強化子が得られたころによる一時的な要求の低減や疲労の回復の影響は小さいことがわかっています。以下に紹介する他の強化スケジュールでは、この強化後反応休止の期間が極端に短いかほとんど見られません。強化後反応休止は、どの程度反応すれば強化子が得られるか分かっている場合に生じやすく、その期間は各スケジュールの比率に依存しています。

例 スタンプカード
例 カフェや飲食店で「スタンプを8個集めたらコーヒー珈琲一杯無料」など

固定比率スケジュールにおいて強化期間終了直後に生じる休止を、
一般に「強化後休止(postreinforcement pause:PRP)」と呼びます。

② 変動比率スケジュール(Variable Ratio schedule:VR)

強化子が与えられる条件が変動する回数によって決まるスケジュールです。

このスケジュールで獲得された行動は、高頻度で自発され、、消去されにくい傾向があります。ほとんどのギャンブルがVRで強化されています。典型的な累積反応記録は、一本の直線に近い傾斜になります。これは反応の頻度が比較的安定していることを示しています。
変動比率スケジュールの特別なタイプのランダム比率スケジュール(Random Ratio:RR)があります。これは一回の反応ごとに強化子が得られるかどうかの判定が行われます。

例 スロットゲーム、お金を入れる → 勝つかもしれないし負けるかもしれない