オペラント条件づけとは

オペラント条件づけ operant conditioning

動物(ヒトを含む)が自発した反応の直後に報酬など特定の刺激を与えることで、その反応が生起する頻度を変化させる実験手続きであり、アメリカの心理学者スキナーが考案した条件づけの手法です。

動物に様々な行動課題を訓練するための方法として広く活用されています。オペラントというのはオペレート(operate:働きかける)から作られた造語です。つまりオペラントは「働きかけるもの」という意味になります。

オペラント条件づけの訓練

オペラント条件づけでは、動物にとって随意的で身体的に可能な反応であれば、どのような反応も条件づけることが出来ます。その際、まず条件づけるオペラント反応を選び、その反応のみを強化しなければならないが、そこに至るまでの訓練を行動形成(shaping)と呼び、具体的な手続きを逐次接近法(successive approximation method)と呼びます。例えば、ラットにレバー押しを条件づける際、目的とするオペラント反応(レバー押し)により近い反応を順次条件づけていきます。

オペラント行動と強化

条件づけの対象とする自発反応をオペラント反応またはオペラント行動といいます。その直後に与えられる報酬などの刺激を強化子、強化子を与える操作を強化と言いますが、報酬そのものはオペラント反応を強化する力があるので一次強化子(primary reinforcer)といいます。

一次強化子と一緒に提示することによって意味を持つものは二次強化子(secondary reinfocer)といい、二次強化子以降はレスポンデント条件づけによるものと考えられています。このような強化子全体を条件性強化子といいます。ちなみに強化の定義は、「ある行動に後続して与えられ、その行動の生起頻度を高める」ものとされます。

オペラント条件付けの基本は、オペラント反応-強化子の関係(強化随伴性 contingency of reinforcement)を設定し操作することです。

報酬のように、与えることで反応(行動)の生起頻度を増大させる強化子を正の強化子(positive reinforce)、嫌悪性の刺激(嫌なにおいや暗闇など)のように、それを取り去ることで反応の生起頻度を増大させる強化子を負の強化子(negative reinforce)と呼びます。例えば、ラットにレバー押し反応を行わせるためには、レバー押しというオペラント反応とエサという正の強化子の間に強化随伴性を形成し訓練することになります。訓練を効率的に進めるうえで最も肝心な手続きは、オペラント反応の直後に強化子を与えること(即時強化 immediacy of reinforcement)です。

なお、オペラント反応の直後に与えることでその生起頻度を減少させる刺激は、強化子ではなく罰(punishment)と呼ばれます。レバー押しの後に罰として電気ショックを与えると、当然ラットはその後レバーを押さなくなります。罰を用いると、動物は実験自体その物を嫌悪するようになり訓練が進まなくなることも多いため、特別な目的がない限り用いない方が望ましいです。