强化理论的激励原理
斯金纳认为,激励涉及到以下两种反射过程:S(刺激)→R(反应)和R(反应)→S(刺激)。从而补充和丰富了此前心理学家提出的行为反应模式。 所有的行为主义者都注重刺激与反应的关系。在斯金纳之前,人们一般看到的是“刺激→反应”模式,也就是关注那些引发行为的刺激。这种刺激能使行为者产生反应,所以具有激励作用。但这种激励不一定有效。因为这种模式是先有刺激,后有行为,行为者得到刺激不见得会产生相应行为。“有钱能使鬼推磨”,而拿了钱的鬼不见得会去推磨。这种模式下,刺激对其后的行为无法形成有效的制约,而且具有被动性。所以,在现实中依据这种模式进行的激励,往往不尽人意。很多管理者都会遇到这种困境。例如,不发奖金不干活,但发了奖金不见得就有积极性;没钱的时候觉得有了钱就一切好办,有了钱才发现钱也不是万能的。 鉴于上述激励模式的缺陷,斯金纳提出了“反应→刺激”模式,也就是关注行为结果给行为者带来的刺激,由此而形成了他的强化理论,这正是斯金纳对管理学贡献最大的地方。按照这一模式,激励不能局限于行为前的刺激,更重要的是取决于行为后的结果。换句话说,激励来自于行为后果的强化。某种行为出现后,如果会带来具有强化这种行为的后果,反复持续,就能使行为与强化之间形成很强的相倚关系,这样,管理者就可以通过强化来调节这种行为。管理者可以调节强化物的种类、频率、强度,但归根到底,激励作用是由被管理者的自身行为产生的,从而使强化对后续行为形成有效制约,而且具有主动性。例如,能不能拿到奖金,不是由头儿说了算,而是由自己的行为决定的。管理者的作用,不在于直接给被管理者提供刺激,而在于调整行为与强化物之间的相倚关系。 斯金纳认为,即使对“反应→刺激”模式而言,也需要区分外部环境的强化和行为本身的强化。一般来说,在行为发生后的强化有两种:一种是强化的内在相倚性;另一种是强化的外在相倚性。所谓强化的内在相倚性,是指行为本身的结果所产生的强化效应;所谓强化的外在相倚性,是指行为发生后来自外部的强化效应。比如,一个研发人员,他的某种新发现会使自己沉浸于这种发现之中,甚至为之探根究底而废寝忘食,这里表现出的是内在相倚性。而这种研发人员的行为,也会得到上司的表扬或者同事的赞许,没有这种行为就得不到相应的表扬和赞许,这里表现出的是外在相倚性。在管理活动中,这两种相倚性所形成的激励都应该予以重视。 斯金纳之前的激励,往往着眼于对激励对象提供刺激物,甚至会对刺激物的大小多少斤斤计较,但是,却不太重视刺激物与激励对象行为后果的关联。这样,很容易使激励失效,或者使激励的作用扭曲。这种所谓激励,不能有效地建立强化的外在相倚性,更谈不上形成强化的内在相倚性。所谓外在相倚性,强调的不是刺激物本身,而是刺激物与行为后果的联系。如果外在刺激与行为后果没有关联或关联度不大,那么,这种外在刺激就不能促成有效的后续行为。例如,人们往往重视报酬的高低,但如果报酬与当事人的努力没有多少关联,不论报酬的高与低,都无法起到激励作用。在这种情况下的高报酬,会使当事人对付酬者形成感恩心理或依赖心理,但不能调动积极性。更常见的情况是,管理者由于激励措施不当,会建立起错误的外在相倚性。例如,以完成定额作为付酬依据,这样,完成定额与得到报酬的外在相倚性建立了,然而这种相倚性却割断了工作质量与报酬的联系,员工的后续行为就很有可能只管数量不管质量。再进一步,如果把质量与报酬也关联起来,这样,外在相倚性不再发生偏差,但是假设没有内在相倚性,员工依然有可能仅仅追求表面的质量而忽视内在的质量。所以,还需要有员工自己对质量的认可程度和追求力度,形成内在相倚性。外在的赞许和期盼的目光,都会对内在相倚性的形成起到或大或小的作用。管理者最需要警惕的是,本意是为了建立符合管理者意图的外在相倚性,但采取的刺激手段却破坏了或妨碍了与其匹配的内在相倚性。在现实中,有些管理者采取的刺激手段,往往会鼓励弄虚作假、蒙混过关,就同这种相倚性的不匹配现象有关。
强化物及其分类
强化作用离不开强化物。所谓强化物(reinforcer)不一定是实物,也可以是行为、表情等等。只要在某种行为之后,这种行为本身或者由它带来的后果可以刺激该行为的再次出现,就属于强化物。强化物在塑造人们的行为上有着极大作用。 一般来说,强化有两种:正强化和负强化。通过某种强化物,能使管理者期望的行为发生概率增大,行为者受到这种强化物的激励,其积极性会得到提高,这就是正强化。反过来,通过某种强化物,能使管理者期望的行为发生概率减小,行为者受到这种强化物的激励,其积极性会消退甚至丧失,这就是负强化。由此出发,斯金纳把强化物分为两种:正强化物(positive reinforcers)和负强化物(negative reinforcers)。 对正强化物的效用可以从两个层面来理解。一个层面是某一行为如果会带来行为者的愉快和满足,如给予食物、金钱、赞誉和关爱等,行为者就会倾向于重复该行为;另一个层面是某一行为如果能减少和消除行为者的不快和厌恶,如减少噪声、严寒、酷热、电击和责骂等,行为者也会倾向于重复该行为。 与此类似,对负强化物的效用照样可以从两个层面来理解。惩罚性强化物和消退性强化物。惩罚性强化物是指会给行为者带来不快的东西,能使行为者的行为倾向减弱;消退性强化物是指减少或取消令行为者愉快的东西,也能使行为者倾向于终止或避免重复该行为。 对正强化物与负强化物的区分,不能想当然,而要以其效果确定。比如,限制一个孩子获得某种玩具的欲望,其效果很可能是极大地激发了这个孩子获得这种玩具的行为。现实中某些东西,越禁止反而越流行,实际上这种禁止就起着正强化作用。而不恰当地对某种行为进行言过其实的赞扬,很有可能引起反感而削弱这种行为,赞扬起的是负强化作用。有时候官方树立的先进模范反而收不到正面效果,就是这种机制。一个部下过于明显地逢迎上司,有可能会引起这个上司的反感。这些,都是值得激励研究注意的。更有意思的是,有些表面上截然相反的强化物,其强化作用却高度一致。如果对赌博进行强化分析,就不难发现,不论是输是赢,都会起到强烈的正强化作用。赢了,会刺激赌徒继续;输了,还会刺激赌徒继续。所以,单靠赌博本身的输赢,很难消退赌博行为。公司经营中,有些人偏爱投机方式,其中一个重要因素,就是因为投机方式不论后果是成功还是失败,都会产生类似赌博的正强化效应。 从强化物效用的大小和重要程度来讲,还可以进一步将强化物划分为初级强化物和条件强化物。初级强化物对有机体来说,往往是无条件的,它能满足人和动物的基本生理需要,如食物、水、安全、温暖、性等。条件强化物需要通过初级强化物才能产生作用。任何一个中性刺激物,如果与初级强化物反复联合,它就能使自身获得强化物性质。它是初级强化物的附属品。例如金钱,对小孩它不是强化物,但当小孩知道钱能换糖时,它就能对儿童的行为产生强化效果。在这个例子中,糖果就是初级强化物,而金钱则是条件强化物,金钱的强化作用是由于与糖果的结合才获得的。作为管理者应该注意,初级强化物是最基本的,然而条件强化物是最常用的。二者的匹配和结合方式值得进行深入探讨。 还有一种特殊情况,强化物与行为之间的关系是非理性的,斯金纳把这种强化行为称为“迷信”(superstition),也称为“非相倚强化”。在斯金纳的实验中,假如把给白鼠喂食的方式改为不是按压杠杆引发,而是每隔15秒固定送食一次,那么,白鼠在首次喂食之前的偶然动作就会形成“迷信”。如果白鼠正在作揖,它就会在此后不断作揖以求得食物;如果白鼠正在嗅通气孔,它则会不断嗅通气孔以求得食物。人类这种情况也十分多见,比如,天旱引发的祈雨行为,某个运动员对某种动作、某种服饰与获胜之间的看法以及由此而采取的行为等等,都属于迷信。迷信只有在多次无效的情形下,才会逐渐产生操作性消退。但是,只要有偶然性存在,迷信就不能彻底根除。 要使正负强化能达到各自预期的效果,对强化物的恰当选择是很重要的。一般而言,在使用强化理论之前,首先要弄清是要对行为进行正强化还是进行负强化,然后针对行为者的特点选择恰当的强化物。在选择时,并不是强化物的数量越多越好。斯金纳认为,由于强化物的数量与对行为的强化效果不一定成正比例,真正的强化物也可能被误用,因此,合理安排强化措施,比单一追求强化物数量更为重要。这里实际上涉及到了强化物的合理配置问题。为此,斯金纳设计了“强化表”,对强化物合理安排做出了有益尝试。对于现实中的管理者来说,更为重要的不是照搬斯金纳的强化表,而是参照和借鉴斯金纳的思路,根据自己所处的实际情况,尤其是考虑各种特定的环境因素,对强化物的选择、搭配和使用作出符合理性的科学安排。 此外,强化物效用的大小还与其接受者有关。一种强化能否起到应有的作用,取决于强化物运用是否恰当,而强化物运用是否恰当,又取决于强化物的作用对象接受与否。因此,在选择强化物时必须考虑到行为者的自身特征。比如,提升职务一般能够起到正强化作用,但是,在霍桑实验中曾经发现,某个女工拒绝了上级提升其职务的安排。理由很简单,在这个女工看来,提升职务有可能会破坏她同工友们之间良好的人际关系。对于这个女工而言,工友之间的人际关系,远远要比职务提拔更重要。所以,在多数人身上能起到强化作用的提拔方式,对于这个女工却不是合适的强化物。当然,这个女工对强化物的认知,并不是心血来潮的怪癖,而是环境因素的综合作用在她身上的反应。所以,管理中采用强化措施时,要以对员工状况的科学分析为前提。
强化物的组合运用
一般而言,强化物的选择至少要考虑到三个方面的因素:第一,是管理者所能提供的强化物;第二,该强化物是管理对象所能接受的;第三,该强化物能够起到应有的强化效果。从这三个方面来考虑强化物的选择,或许能找到很多有效的强化物。但人类需求的复杂性和多样性,往往需要更大范围的强化物来进行激励。现实中的强化物,会受到资源稀缺性的限制以及使用成本的限制。在这种情况下,可以通过强化物的恰当组合来扩大选择范围。对于管理者来说,弄清这种组合十分重要,因为在最常见的强化物中,金钱总是有限的,即便是有权印发钞票的政府,滥发钞票也会贬值;提拔总是有数的,人人都提拔为经理,名片上的经理就会变成事实上的业务员;一种物品一旦不再稀缺,强化作用就会迅速消失,哪怕是不花成本的微笑,用多了笑脸也会失去激励效应。 强化物的组合有两种方式:一是把本来就有强化作用的不同事物结合使用,只要恰当配置,可以产生出具有很大效力的强化物;二是把原本没有强化作用的事物按照行为关系结合使用,使它产生强化作用,这就是条件性强化物。条件性强化物的具体做法是,把一个中性刺激物与一个强化刺激物反复匹配联合,那么该中性刺激物就具备了强化的性质和作用。 条件性强化物本来不具有强化作用。例如,在斯金纳的实验中,真正的强化物是食物。但是,如果每次实验都是先打开灯再给鸽子喂食,最后,中性的灯光就会成为条件性强化物。此时,灯光的作用和食物一样,均能使操作条件化。斯金纳指出,中性刺激物要获得这种强化性质,须遵守这样三条规则:一是中性刺激物与初级强化物的联系次数越多,它就越具有强化作用;二是中性刺激物与初级强化物出现的时间不应间隔太长;三是初级强化物如果不再出现,中性刺激物的强化力会迅速消失(类强化物不在此例)。 如果某种条件性强化物与不止一种初级强化物相匹配,那么该条件性强化物便能通过这些初级强化物而具备多方面的强化作用,从而成为一个“类强化物”,也可称为概括性强化物。就是说,当一个中性物与两个以上的初级强化物形成联系时,它就会发生类化。最典型的例子莫过于金钱,由于它与衣、食、住、行等初级强化物密切联系和匹配,因而具备了广泛的强化作用。斯金纳进一步指出,类强化物因为具有联系的广泛性,即使没有赖以为基础的初级强化物伴随出现,由于它总能同另外的初级强化物发生这样那样的联系,所以,它的强化效果依然存在。 在这种条件性强化物的组合中,需要注意的是,与中性刺激物相组合的初级强化物必须具有很大的强化力量。如果初级强化物本身没有足够的强化力量,就无法调动行为者的积极性,失去吸引力,与它组合的中性刺激物当然无效。所以,初级强化物存在着强化力的临界点。在这个临界点之上,它能使与其组合的中性刺激物获得强化性质;在这个临界点之下,即使它本身还有一定强化作用,但与其组合的中性刺激物不能获得强化性质。
强化程式
在实验中,斯金纳发现强化与行为之间存在着一定的关系。如果强化的时间和比率不同,强化作用的效果也会大不相同。所谓强化程式,就是指反应受到强化的预先安排形式。对此,斯金纳提出了一个著名的强化类型表。 根据这个强化类型表,一切强化可分为两大类:一是连续性强化,即每次行为都受到强化;二是间歇性强化,即只是部分行为受到强化。间歇性强化又可按照时间和比率的不同分为以下四种:①固定间时强化,强化是定期的,如计时工资;②变动间时强化,强化是不定期的,如随时进行的奖励;③固定比率强化,强化按一定比率进行,如营业提成;④变动比率强化,强化按随机比率进行,如彩票得奖、赌博输赢等。 连续性强化和间歇性强化的效用,从行为的消退角度来看不尽相同。斯金纳的实验表明,间歇性强化停止后产生的反应消退,远远低于数量相同的连续性强化停止后产生的反应消退。例如,如果只是偶然对儿童的良好行为给予强化,在停止强化后,这种良好行为保持的时间,要比每一次良好行为都给予强化保持的时间长得多。斯金纳认为,当手头的强化物很有限时,这一差别具有实际意义。对于管理者来说,弄清间歇性强化与连续性强化在反应消退上的差别,进而弄清不同的间歇性强化在反应消退中的精确数据,对于设计激励方案有着重要作用。 间歇性强化的各自特点和不同效果如下。 (1)固定间时强化:固定间时强化每隔一个固定时段进行一次,其效果受强化的大小、数量和及时性的影响。强化越大,数量越多,则反应概率越大。如果反应和强化物出现的时间之间有相当大的间隔,则反应概率较低。这种强化因间隔的固定性,有一定规律可循。因此,在强化物出现后,由于行为者知道短期内不能再得到强化,所以在每次强化之后的区间反应概率较低。当行为者觉得再次强化快要到来时,反应概率又会增加。例如,在计时工资制中,工资定时发放,在这段固定时间中,工人的反应并不会得到强化,工作的水平可能会下降。对于这一问题,可以通过厌恶性的条件强化物(如扣除薪金)来作为工资的补充。 (2)变动间时强化:变动间时强化可以用来调节行为的发生概率,它能够消除强化物出现后的反应概率降低现象。由于这种强化程式没有一定的时间规律,随机性较大,行为者往往难以琢磨后续强化物出现的时间。因此,在它的作用下,能使行为者保持一个相对稳定的行为水平。 (3)固定比率强化:斯金纳认为,固定比率强化能产生很高的反应概率。因为在这种程式的刺激下,行为者的反应速率达到固定比率就会得到强化,行为的结果又促使反应速率进一步提高。如果没有其他因素干扰,这种程式能使激励作用达到最大值。值得注意的是,斯金纳强调,采用这种程式的关键在于“比率不是太高”。因为他的研究表明,某一特定的行为人和某一特定的强化指标之间,比率是有限的。超过这一比率,行为就不能保持,而且会出现快速消退。这种情况被斯金纳称为“行为缺失”。之所以会发生行为缺失,是因为行为人的能力和精力是有限的。如果固定比率过高,超出了行为人之所能,那么就会产生两种情况:一是行为人在初始时就无法达到规定的比率;二是在初始时虽然达到了比率,但后来无法持续达到。一旦出现这种情况,肯定发生行为消退。在现实中,某些本来行之有效的业务提成或类似制度,由于后来不断“加码”而导致失效,就属于这种情况。 (4)可变比率强化:可变比率强化是通过对受到强化的反应与未受到强化的反应之间比率的不确定性运用来进行激励的。这样,行为人对强化的力度(即自己的收益)不可预测。可变比率和固定比率的差别,同变动间时和固定间时的差别在逻辑上是一致的。所以,在理论上,它可以消除固定比率强化后所出现的反应消退现象。这种程式的比率幅度在变,但其平均值不变。所以,行为人的行为有可能得到高强化,也有可能得到低强化,或者很长时间得不到任何强化,而强化的平均值不变。行为人会根据这种随机性来调整自己,保持一种稳定的行为速率。 斯金纳主张综合使用各种不同的强化程式。可以把比率强化和间时强化、固定强化和可变强化结合使用或者交替使用,从而对行为人的行为进行更好的调节。
《管理学家》
任何管理手段,都要考虑实际运用中的可操作性,激励也一样。运用强化理论,在操作性方面,除了应当注意上文已经涉及到的持续性、适应性等问题外,还应注意强化的渐进性、时效性、正面性等方面。 (1)强化的渐进性。强化的渐进性包括两个方面:第一,对行为强化的力度要有层次性和持续性;第二,对行为的期望不能设置太高的标准。 斯金纳认为,对难度不同的行为应给予不同力度的强化,而且,对行为的强化应该具有持续性。例如,针对同样的行为,一次给某人50美元进行强化,可能不如每次给他5美元而分为10次的强化效果好。 对行为人来说,强化是以相应行为的发生为基础的;对管理者来说,总是当行为达到一定标准才给予强化的。如果给这种行为设置的目标过高,行为者不能达到,那么强化就不可能出现。这样,对管理者而言,他所期望的行为没有发生;对行为人而言,他的行为结果不能令自己满意。过高的目标会使双方都不能实现自己的预期。斯金纳指出,人的行为不是一次性形成的,而是有一个连续形成的过程。所以,塑造人的行为,应该采用连续接近的方法,对趋向于所要塑造的反应方向予以不断强化,直到引出所需要的新行为。也就是说,给某种行为制定的强化标准要具有渐进性和可及性。例如,如果要训练鸽子或老鼠头抬到一定的高度,就要当它的头朝着实验所需的方向抬起来时实施强化,下一次稍微再高一点,逐渐达到所需的方向和高度。这时,新的行为就塑造成了。在塑造行为时要注意这样一条原则:行为人必须在他的能力所及的范围内能得到强化,同时这些行为又必须能向新的行为水平延伸。在现实中,这种期望定位相当重要。例如,有一个三类高校,为了提高科研水平,在奖励办法中规定在《自然》和《科学》杂志上发表文章者予以高额奖励,力度确实够大,但由于这两个杂志的发表标准对于普通教师来说要求过高,没有可及性,因而这个奖励办法迎来的是教师的一片牢骚。企业管理中,动不动就以500强为标杆以及类似做法,常常会犯这种标准太高的失误。 从渐进的角度看,差别强化对于行为的改善具有重要意义。斯金纳以“孩子为何哭闹”为例来说明差别强化。当小孩哭喊引起母亲的抱怨时,母亲可能并没有意识到,正是她自己做出的强化行为,导致小孩的哭喊声音越来越大。因为小孩根据自己的经验,哭泣能够引起母亲的回应。一旦得不到回应,小孩可能会加大哭声。而母亲很有可能随着哭声的增大而提高回应概率,久而久之,小孩就会不断增加哭喊的强度。可见,差别强化主要用于调节现有行为水平。当行为水平需要改进时,就可以有步骤地适当调正强化标准。对于管理者来说,合理运用差别强化,可以收到不断改进之效。但必须注意的是,要提防差别过度导致行为缺失。另外,逆向的差别强化不可小觊,有些管理者对某些需要制止的行为采用差别强化,其结果则会适得其反。“乱世用重典”的经验,就是因为在乱世背景下司法由轻到重的变化,极有可能使违法行为得到差别强化反而增加犯罪。这种尺度到底如何掌握,需要根据环境条件做出准确判断。 (2)强化的时效性。强化的时效性也包括两个方面:第一,强化本身要具有时效性;第二,对强化的反馈要具有时效性。 强化的媒介是强化物。要使某种强化物对某种行为具有强化作用,前提就是要使行为与强化物之间形成紧密的相倚性联系,尤其是条件性强化物更是如此。斯金纳认为,反应和强化物的出现之间如果有延迟,反应概率则较低。当反应与强化物之间的时间紧密相连时,行为和强化就能形成很强的相倚性联系;反之,随着两者间隔的延长,相倚性联系就会弱化,强化的效果也会不断打折扣。 强化某种行为,依赖于行为人感到或者看到自己行为的结果。只有在这种情况下,行为人才能获知自己的这种行为能否得到强化,它究竟会给自己带来什么。对于管理者而言,也需要及时看到强化的效果,才能恰当实施和调整后续强化手段。所以就需要及时双向反馈。 (3)强化的正面性。以正强化为主,负强化为辅。 当行为的结果会带来愉快和满足,或者能消除不快和厌恶时,人们往往乐于接受,不会产生情绪上的不良反应,如恐惧、焦虑等,这恰恰是正强化的效用。正强化是使合意行为的发生概率增大,负强化是使不合意行为的发生概率降低。管理的基本目的是促进人们干正事,而不是仅仅防范人们干错事。如果负强化优先,就失去了管理的存在价值。所以,正强化是必须采用的手段,而负强化是不得不用的手段。 就强化效果而言,负强化的两种方式—惩罚性强化和消退性强化,其中消退性强化往往能收到较好的效果而副作用不明显,惩罚性强化的短期作用显著而副作用强烈。这种副作用来自于剥夺性和强制性,是无法克服的。 斯金纳认为,惩罚有三个作用:①可以制止眼前的行为但不对以后的行为起作用;②通过连续惩罚可以压抑某种行为;③引导人们形成某种被允许的行为即规避。从长远来看,惩罚实际上并不能消除相应的行为。例如,禁酒并不能减少酒类供应量,压抑青春期躁动有可能加剧青少年的反叛,禁止异性接触反而可能会增大同性恋的几率,等等。所以,惩罚虽然具有立竿见影的效果,但是会付出很大的代价。因为惩罚会降低团体的工作效率和满意感,会导致规避甚至报复。另外,惩罚能引起恐惧、焦虑和其他情绪反应,这种状况长期存在可能会干扰人们的正常行为。因此,斯金纳认为,在进行强化时应尽量运用除惩罚以外的其他强化方式。例如,改变有可能引起不良行为的环境,“冷处理”,用正强化来抗衡等等。 管理学所研究的问题归纳起来,不外是如何调控人的行为。然而,人的行为到底是怎样产生的?行为的机制是什么?弄清这些,对于管理学具有重要意义。但恰恰在这些问题上,学者们争论得一塌糊涂。针对这些问题,斯金纳从科学立场出发,强调人的行为不是由人的内在心理活动来决定的,而是源于外部环境,行为是在环境中各种刺激因素综合作用下所引起的反应。他指出,从导致人的行为发生的影响变量上来讲,人的行为在很大程度上是由环境决定的。在一定意义上,人的行为就是环境的产物。行为与环境之间有着很强的相倚联系。环境的改变在很大程度上也能改变人的行为,而人的行为又在不断改变着环境。由此出发,他提出了一种新的理论—操作性条件反射理论。
应答性行为和操作性行为
现代对人类行为的研究,源于俄国著名学者巴甫洛夫的“条件反射”理论。巴甫洛夫在20世纪初,通过对狗的实验,发现“无条件刺激”和“条件刺激”的衔接会产生出反应的相关性。狗看见肉就会分泌唾液,这是无条件刺激产生的反应。而当肉的出现同另一个新的刺激(如摇铃)同时发生时,会引起条件反应。经过多次重复,即使没有肉,一摇铃也会引起狗的唾液分泌,这就是条件反射。这说明,有机体的行为是外部各种刺激相互作用引起的反应,与心理活动无关。由此,巴甫洛夫奠定了学习机制和强化机制的科学基础。 之后,美国心理学家华生于1913年发表了《行为主义者眼中的心理学》一文,学界通常认为,这篇文章是行为主义心理学诞生的标志。华生推广了巴甫洛夫的“刺激-反应”原理,提出人的学习行为具有两条主要的规律:频因律与近因律。在华生眼里,心理学必须是严格的自然科学式的,不能关注那些不可测量、不可验证的“内心”,而只能研究可测量、可验证的行为。 斯金纳继承和发展了巴甫洛夫与华生的研究成果,而且走得更远。他坚信,人类行为同其他动物的行为没有本质区别,基于动物的行为研究,所发现的可实验、可重复的规律同样可以用到人身上。经过对有机体行为的研究,斯金纳认为华生所坚守的“没有刺激,就没有反应”的信条是不全面、不准确的,进而提出了“引发反应”与“自发反应”两个概念。如果是因为某种刺激的出现才发生的行为,就是“引发反应”;如果没有明显的外在刺激而自主发生的行为,就是“自发反应”。引发反应是先有刺激后有行为,而自发反应是先有行为后有刺激。之所以要区分这两种行为反应模式,是因为引发反应不具有可操作性,而自发反应具有可操作性。在这里,“可操作性”是一个十分重要的概念,其准确含义是自控而不是他控。 依据对行为的两种反应的区别,斯金纳提出了人的两种行为模式:应答性行为和操作性行为。应答性行为是指由特定的、可观察到的刺激所引起的行为,如巴甫洛夫的狗。操作性行为是指在没有可观察到的外部刺激的情境下发生的行为,它是自发的,如斯金纳箱中的白鼠和鸽子(见后)。 应答性行为实际上属于被动行为。它由刺激所控制,刺激的强弱和频率直接制约着行为的发生概率及其效果。在这个过程中,行为受制于环境,做出行为是为了获得刺激,这就是工具性条件反射。操作性行为实际上属于主动行为,它能对环境做出主动适应,是由行为的后果反过来控制下一步行为的。如果行为的后果能产生积极效应,使行为者获得较大的满足,那么这种行为就能得到正强化,使得该行为在以后发生的概率增大;如果行为的结果未能使行为者感到满足或满足程度不够,包括使行为者失望,这种行为就得到负强化,行为主体就会自动调节自己的行为,使这种行为在以后发生的可能性降低。 斯金纳的这一区分,在激励理论的发展上具有重要意义。可以说,从他开始,奠定了后来管理理论中X理论和Y理论区分的心理学基础。
斯金纳箱和操作性条件反射
斯金纳的操作性反射是针对人的行为的控制而提出的。他认为,人类的行为总有它产生的原因,通过发现和分析这些原因,就可以在一定程度上预测和控制人的行为。因此,只有了解和掌握影响行为的所有变量和原因,才能形成对行为的有效控制。他认为,任何行为的因果链都包括三个环节:①从外部对有机体进行的操作,如剥夺饮食;②内部状态,如饥饿;③行为,如觅食。斯金纳认为,当时的心理学试图从内部状态即心理感受上寻找行为原因,但是,这种内部状态是无法用科学加以测量和验证的,而内部状态依赖于外部操作,所以,科学的心理学应该避开无法测度的第二环节,直接建立起第一环节和第三环节之间的函数关系。从这种科学思维出发,斯金纳强调人的行为是环境的产物,人的行为取决于环境所给予的强化,人们完全可以通过改变环境和运用各种强化手段来改造和控制人的行为。正是在这种科学信念上,斯金纳继承了华生的观点。华生曾经提出,心理学要彻底摒弃意识、意志之类词汇,放弃一切对内在心理的猜测,而只对可测量的外显行为进行研究。尽管华生由于“不爱江山爱美人”,因婚变而离开了学界。但斯金纳继承了他的衣钵,并用“斯金纳箱”进行的白鼠实验,证实了行为可以由外界因素加以塑造。 所谓“斯金纳箱”,是一个高约1尺的长方形箱子。它一面是单向玻璃,用来观察动物而不惊扰它。箱内有照明小灯,并有一根连接着食物台的杠杆或踏板,当动物按压杠杆时,它可以得到食物。里面的记录装置可以把动物的按压反应记录下来。在实验中,要求排除一切外来刺激,让动物自由活动。 斯金纳箱的实验,与巴甫洛夫有着明显不同,它可以全面显示出动物的学习行为(斯金纳自己很少使用“学习”这一词汇,因为他反感这一词汇含有的内在性,通常他只用“强化”来表达人们常说的“学习”)。白鼠在箱子内自由活动,会偶然发现按压杠杆能得到食物,于是,白鼠就可能调正或改变自己的行为。它会再次按压杠杆,试图获得更多的食物。有意思的是,如果调整强化物的提供方式,白鼠的行为也会产生“聪明”的变化。比如,如果按压杠杆后必须间隔1分钟才再次供给食物,那么,白鼠在多次重复后,会把自己的行为调整为间隔1分钟左右才再次按压杠杆。如果每按压10次才掉下来一次食物,那么,白鼠也会逐步摸索,形成10次按压后停下来去取食物的行为惯性。由此可以说明,学习的本质不是刺激的替代或内心的追求,而是反应的改变。显然,斯金纳已经超越了巴甫洛夫的应答式条件反射,进而提出了操作性条件反射。所谓操作性条件反射,不是由外界刺激引起的,而是由主体行为触发的。只要出现相应的条件,即强化物和行为之间形成了明显的相倚关系,那么,相应的行为就会出现。斯金纳认为,某人之所以产生某一行为,是由于想得到过去同类行为所产生的某种结果,而不能说是由于想得到该行为将要产生的结果。这话听着拗口,但不这样说就弄不清两种条件反射的差别。归根到底,操作性行为最明显的特征是自发的,而不是诱发的。 那么,这种操作性行为能否得到维持,维持的时间长短,就成为激励重要内容。斯金纳认为,这取决于行为结果。想要一种行为长久维持下去,就必须给这个行为予以强化。换句话说,就是要使行为者感觉到这个行为是与一定的强化物相联系的。如果自己想要得到这种强化物,或者通过这种强化物来获得别的东西,从而使自己的需求得到满足,就必须做出这种行为。反之,则要避免这种行为。可见,只有把行为与一定的强化联系起来,才能达到预定的目的。这种联系就是强化与反应之间的相倚性联系。 对行为的强化是通过强化物来起作用的,要选择适当的强化物就需要辨明哪种事物能对行为产生有效的作用。如果某种东西在使用前和使用后能够观察到反应频率的变化,这种东西就具有强化作用。人的行为是一个“习得”的过程。在这个过程中,如果没有一定的强化激励来暗示或明示这种行为是否正确,那么行为者就没有评判标准。当某种强化物在行为者行为发生后给予相应的激励刺激,那么行为者就会认识到自己行为能带来什么样的后果,进而决定是否需要维持下去。偶然一次的激励,不能形成相倚性联系。只有行为结果出现后能得到持续(或递增或递减或随机或间隔,随机和间隔也是持续的表现方式)的强化,如此反复,行为就会与强化物形成紧密的相倚性联系。这种联系的强弱会影响以后行为维持的程度和时间的长短。相倚性联系越强,则行为维持的程度越强,时间越长;相倚性联系越弱,则行为维持的程度越弱,时间越短。
反射的强化
人类的行为,多数是经过强化而形成的操作性行为。也就是说,行为是可塑的。斯金纳把行为的可塑性作为他研究的依据,行为既然有可塑性,也就是说可以促使某种行为发生,或者抵制某种行为出现,这种愿望的实现恰恰是通过强化作用来实现的。与以往的理论不同处在于,斯金纳强调,强化作用不是取决于强化物的有无或大小,而是取决于强化物和行为的联系。相倚性联系的建立是强化不断延续的结果。当一种行为发生后带来了强化物,最初的强化刺激就形成了。只要这种行为和强化多次重复,就能形成分辨性刺激,行为主体会自行区分相倚性联系。例如,微笑意味着赞许,而皱眉意味着异议,这种判断就是来自于经验归纳的分辨性刺激。一旦行为主体认知到了相倚性联系,那么这种行为的可操作性就已经建立了。随后,可以通过控制强化的强度和频率来调节行为。假如这种行为是强化实施者所期望的行为,那么通过运用恰当的强化物,这种行为就会得到强化,从而导致这种行为出现的概率增大;反之,假如这种行为不是强化实施者所期望的行为,那么通过不同的强化物,这种行为会受到负强化,从而导致这种行为发生的概率降低,甚至为零。 依据这个原理,斯金纳认为人的行为是可以塑造的,而其塑造手段是通过强化来进行的。强化的效果,要受强化物种类的选择、强化方式的选择、强化程序的安排等因素影响。要使行为发生的概率增加,可以通过正强化物,使行为者得到这种行为的相应收益,使自己需求得以满足;反之,要使行为发生的概率减少,则可通过相应的负强化物来实现。