首页 理论教育后天训练直觉心理学:行为主义理论解释直觉的获得

后天训练直觉心理学:行为主义理论解释直觉的获得

【摘要】:如何通过后天训练而获得直觉,行为主义理论给出了很好的解释。任何能够自然诱发无条件反射的刺激均为无条件刺激如食物,由无条件刺激诱发的行为叫无条件反应即“本能”直觉。

如何通过后天训练而获得直觉,行为主义理论给出了很好的解释。早期的行为主义认为行为的产生在于刺激与反应之间的联结,经过多次重复训练之后,两者之间的联结更加牢固,因此再次给予相同刺激之时,个体便会直觉性地做出相应的反应。随后,新行为主义理论激进派的代表斯金纳进一步发展了行为理论并提出了强化理论。该理论进一步明确了强化在行为塑造中的作用,即对正确行为给予积极强化则会增加其再次出现的概率,对错误行为给予惩罚则会降低其再次出现的概率,而多次训练之后反应逐渐内化,在相同情境中个体便会依靠直觉做出正确反应,并回避错误反应。但是,无论是早期的经典行为主义理论还是激进派新行为主义理论均过于强调环境对个体的影响,甚至完全否定了遗传及认知因素等内在因素的作用,因此也受到了诸多研究者的批判。在此基础之上,新行为主义的另一代表人物班杜拉摒弃了传统行为主义的环境决定论观点,认为个体行为是内在认知因素与外在环境因素相互作用的结果,并进一步形成了社会学习理论。接下来,将从行为主义理论发展历史的角度,来介绍人类经验直觉从低级到高级的发展进程。

一、非条件反射

上一节我们对先天本能直觉进行了介绍。本能直觉也可称为非条件反射。非条件反射是生物学上的概念,简称“反射”,是指不需要经过学习或训练,自然而然发生的反射。如狗看见食物会流口水、手被针扎后缩回等现象均是反射(孙振陆,1995)。反射是神经系统特有的功能,它建立在反射弧的基础之上。反射弧由感受器、传入神经、神经中枢、传出神经、效应器等组成。拿“手指被针扎后缩回的反应”来说,反射的具体过程是这样的: 手指被针扎的一瞬间,神经末梢处的感受器接收到信号刺激,经由传入神经将刺激传递到脊髓(神经中枢),脊髓收到反应后通过传出神经发出指令,手指的肌肉(效应器)随即做出缩回反应,完成反射。反射是人人生来都有的反应,婴儿期的个体还不会开口讲话,反射机制的存在能够及时满足生理需求、保护婴儿远离危险,确保婴儿能够健康长大。而这一活动的完成是不需要经过大脑皮层指挥的,它只存在于脊髓等低级神经中枢,因而是直觉的一种,也是人类发展历程中最初的直觉。

二、条件反射

与“本能”直觉相对应,随着年龄的增长,个体逐渐发展出更加适应环境的直觉,我们把它称之为“经验”直觉。“经验”直觉的优点在于,个体能够替换刺激甚至能够主动选择刺激,而不仅仅是被动地对刺激做出反应。“经验”直觉的形成依赖于条件反射,包括经典条件反射与操作条件反射。

(一)经典性条件反射

知识窗: 经典条件反射实验

巴普洛夫通过对狗的消化系统进行研究,发现了经典的条件反射。他在狗的腺体和消化器官中植入管子,将分泌液导出体外以方便测量,然后将肉末放进狗的嘴里。重复进行这一实验后,巴普洛夫发现在肉末放进嘴里之前狗就开始分泌唾液了。后来狗看到拿着食物的助手,甚至仅仅听到助手的脚步声,就开始分泌唾液。于是巴普洛夫使用铃声为刺激对狗进行了研究。首先将食物放到狗面前,狗会分泌唾液;而在狗面前摇铃声,狗并不会分泌唾液;然后在呈现铃声刺激后紧接着呈现食物刺激,重复进行几次后发现,狗在这种情况下也会分泌唾液;最后取消食物刺激,仅呈现铃声刺激,狗依然会分泌唾液(Pavlov, 1927/1927)。

经典性条件反射建立在非条件反射之上。非条件反射是无需学习的、生来就有的反应。任何能够自然诱发无条件反射的刺激均为无条件刺激如食物,由无条件刺激诱发的行为叫无条件反应即“本能”直觉。通常在无条件反应中无任何意义的中性刺激如铃声经过与无条件刺激的多次匹配,便能预言无条件刺激随后出现,被称为条件刺激,因为它诱发无条件反应的行为是有“条件的”。而由条件刺激单独引发的反应为条件反射即“经验”直觉。在条件反射形成之前,狗只拥有“本能”直觉即对无条件刺激(食物)产生无条件反应(分泌唾液),不会对中性刺激(铃声)产生无条件反应(唾液分泌);随后先呈现中性刺激紧接着呈现无条件刺激,会诱发狗的无条件反应(分泌唾液),狗正在形成对铃声及食物出现情境的经验;经过多次匹配后,狗形成“经验”直觉即仅呈现铃声也会分泌唾液,这时铃声变为条件刺激,狗分泌唾液的现象也变为条件反应。

经典性条件反射的基本规律

(1)习得与消退

习得是指“经验”直觉(条件反应)首次被诱发出来并随着实验的重复而不断增强其频率的过程。“经验”直觉(条件反射)的习得一般需要满足两个条件: ① 条件刺激作为无条件刺激的信号必须先于无条件刺激出现。② 条件刺激与无条件刺激呈现的时间间隔不能太长。

消退是指条件刺激重复出现多次但无无条件刺激相伴随,“经验”直觉(条件反应)变弱最终消失的过程。所以说“经验”直觉并不是有机体行为库中永久的内容,习得的内容也是会消失的。

(2)泛化与分化

泛化是指当有机体学会对某一特定的条件刺激形成“经验”直觉(条件反射)后,其他与该条件刺激相类似的刺激也能诱发相同的直觉反应(反射),即反应自动扩展到从未与最初的无条件刺激匹配过的刺激的现象。借助于刺激泛化,有机体能够把已有的经验迁移到新的学习环境中去,从而扩大学习范围。

分化是指通过选择性强化和消退使有机体学会区分条件刺激及与条件刺激类似的刺激,并对它们作出不同的直觉反应。分化能够使有机体对不同的情境作出不同的反应,从而避免盲目行动。

综上所述,依赖经典性条件反射的直觉反应,实质为增强刺激与反应的联结,即增强条件刺激与“本能”直觉(无条件反应)的联结强度。需要指出的是,“经验”直觉还是遵循着先刺激后反应的规律,是刺激—反应过程(林永惠,1997)。由“本能”直觉(食物—口水)到“经验”直觉(铃声—口水),这一联结的转化使得有机体摆脱了生理反应,在经验的基础上对替代刺激产生直觉反应,直觉得到进一步的发展。

(二)操作性条件反射

知识窗: 操作性条件反射实验

斯金纳通过对老鼠的研究,发现了操作性条件反射。放置老鼠的特殊装置为斯金纳箱。斯金纳箱内壁装有杠杆,杠杆下面装有一个食物盘,当箱内的老鼠按压杠杆,就会有一粒食物丸掉到食物盘内,老鼠即可获食。斯金纳将饥饿的白鼠关在箱内,白鼠便会在箱内不安地乱跑。活动中偶然压上杠杆,则一粒食物丸落在食物盘中,白鼠吃掉了食物丸。以后白鼠再按压杠杆,又可获食,经过多次按压,白鼠学会了按压杠杆与得到食物之间的联结(Skinner, 1988/1973)。

1.操作性条件反射的形成过程

有机体随机作出的反应(直觉行为)与其随后出现的刺激条件(行为结果)之间的关系对行为起着控制作用。这意味着,个体在随机地产生一个直觉行为后,会根据行为结果决定该行为的发生频率。换言之,行为结果会自动激发个体的某些反应,这个过程我们也称之为“经验”直觉。如果刺激条件能够增加直觉行为反应发生的概率,则称之为强化,其中刺激物被称为强化物,它的呈现或撤除能够增加反应发生的概率。斯金纳将强化物分为初级强化物(primary reinforcers)和条件性强化物(conditioned reinforces)。初级强化物是指满足人们生存繁衍的基本需要,例如食物、水、安全。婴幼儿更容易受到初级强化物的影响,而随着年龄增长,社会化的人类行为则更多受到条件性强化物影响,例如金钱、名望、关注。如果刺激条件能够降低直觉行为反应发生的概率,则称之为惩罚。

2.操作性条件反射的基本规律

增加直觉行为可通过正强化和负强化两种方式实现。正强化是指环境中的某种刺激增加导致直觉行为反应发生的概率增加的过程,这时的刺激物为正强化物。如饥饿的白鼠按压杠杆获得食物,而后白鼠为了获得食物会继续按压杠杆。负强化是指环境中的某种刺激减少导致直觉行为反应发生的概率也增大的过程,这时的刺激物为负强化物。如白鼠处于轻微的电击状态,一旦按压杠杆,电击解除,白鼠会为了解除电击而继续按压杠杆。

减少一些错误的直觉行为也可以通过正惩罚和负惩罚两种方式实现。正惩罚是指有机体做出某种直觉反应后伴随着厌恶刺激的出现,该直觉反应被消除或抑制的过程。如小孩子说脏话之后被妈妈打手背。负惩罚是指有机体做出某种直觉反应后伴随着正强化物的撤除,该直觉反应被消除或抑制的过程。如小孩子过马路时闯了红灯,爸爸没有给他买想要的冰淇淋。

3.操作性条件反射的程序

不同强化和比例的安排会影响直觉行为增加(强化)的效果。斯金纳在一次实验中发现,多次按压杠杆,偶尔给予食物的老鼠与每一次按压杠杆都给予食物的老鼠相比,坚持作出直觉反应的时间更长。后续的研究者们基于强化的效果,根据改编强化物间隔或比例的可变性总结出4种类型的强化程序:(www.chuimin.cn)

(1)固定比例间隔(fixed-ratio schedule),当个体每作出一定数目的直觉反应后出现强化。在这种条件下,个体只要作出更多的直觉反应,就能得到更多的强化。较小反应次数的固定比例强化程序适合运用在训练新行为中,这是由于该程序产生反应速率很高。然而,如果过度增加每次强化所要求的反应次数,使反应速率延缓,则会导致反应很快消退。比如在儿童每次做完家务后都给予金钱奖励,儿童可能很短时间就能主动做家务,可一旦减少了给予金钱奖励的频率,儿童也许立马就不做了。

(2)可变比例间隔(variable-ratio schedule),同样是在个体做出一定数目的直觉反应后出现强化,尽管出现强化物的平均反应次数是确定的,但每次强化所需要的直觉反应次数不同。这种强化程序产生反应的速率最高,直觉反应也最不容易消退。赌博就是利用了可变比例程序,让人总是不受控制地下注,直至深陷其中。

(3)固定时间间隔(fixed-internal schedule),每隔一定时间出现一次强化,这种强化程序使得个体会在强化结束后直觉反应出现停顿,随着强化时间的临近,直觉反应次数增多,但是强化与直觉反应次数本身无关。如一些学生在其他时间内没有注重知识积累,只在考试临近前拼命复习,这种按月考试就是一种固定时间间隔强化。

(4)可变时间间隔(variable-internal schedule),尽管出现强化物的平均等待时间是确定的,但每次强化前所需要等待的时间不同。这种程序下的直觉反应速率稳定,直觉反应消退也较固定时间间隔慢许多。如同大学老师在课堂上的不定时点名能够保证大多数同学的出勤。

由此可见,直觉行为并不是“来无影去无踪”的,而是可以通过强化程序训练出来的。依靠强化程序训练儿童,儿童能够较快地产生高级、稳定的直觉行为。在儿童期能够较好地规范个体行为,迅速帮助他们掌握一些基本的社会规则。

经典性条件反射与操作性条件反射均属于“经验”直觉的范畴。如果说经典性条件反射是对替代刺激产生直觉反应的话,那么操作性条件反射就是要个体学会天生所没有的行为,利用直觉行为获取刺激以适应环境需要(林永惠,1997;文敏,2000)。操作性条件反射的实质为行为结果对行为发生频率的影响。该反射先有直觉行为,而后获得食物刺激,是反应—刺激过程。经典性条件反射处于被动接受刺激并作出反应的阶段,操作性条件反射能够依靠行为结果的强化做出直觉行为,进而主动地获取必要刺激如食物等,不仅增加了个体的主观能动性,而且更能适应环境需要。

三、观察学习

知识窗: 观察学习实验

班杜拉通过充气娃娃实验演示了儿童是如何通过观察学习,增加了攻击性行为。他将3~6岁的儿童分为两组观看成人殴打充气娃娃的录像。一组儿童所观看的录像中,成人在攻击行为后得到了实验主试的表扬与奖赏,而另一组录像中的成人则在攻击娃娃后,被实验主试批评。随后,两组儿童被带入放有充气娃娃的实验室。实验结果表明,观看到攻击能够带来奖励的儿童更多地表现出了对娃娃的攻击行为。这说明,尽管没有亲身体验过刺激和反馈,通过原型和替代性强化,儿童也能够学习到某种行为。

经典行为主义的局限在于过分突出环境的力量,S(刺激)—R(反应)的行为模式也只能解释少部分直觉行为的形成原因。社会学习理论的核心在于观察学习,即通过观察和模仿他人(榜样)的直觉行为及其结果来进行学习。观察学习认为个体是在心理和生理发展的基础上有意识地对榜样进行观察并模仿,从而获得大量的行为模式,并在不断重复的过程中行为模式日益内化进而转化为直觉。由此可以看出,观察学习强调行为是在人的内在因素与环境因素的不断交互下逐渐形成的,其中,原型和替代性强化起到了重要作用。

(一)观察学习中的原型及强化

通过观察学习,个体可以简化直觉行为的获得过程。依据斯金纳等行为主义研究者的观点,直觉行为的形成需要个体对强化的直接体验,对正确行为给予正强化,对错误行为给予惩罚。因此,强化对于幼儿行为的矫正具有显著的效果,例如为了改变儿童上课随意讲话的习惯,当其随意讲话时及时给予适当的惩罚,而表现良好时则给予奖励,多次强化之后儿童便能养成良好的上课习惯,遵守课堂纪律也成为其直觉行为。但是,事实证明仅依靠强化理论是无法完成生活中多种复杂行为的学习的。首先,生活中儿童学习使用筷子、铅笔等精细动作时,一般先观察并模仿父母、老师的使用方式,然后再由父母、老师对其不恰当处进行矫正,并最终形成正确的直觉习惯。所以说,幼儿在学习过程中先通过观察他人的行为模式并进行模仿,经过强化之后对不当行为进行修正,随后将行为逐渐内化成为直觉。因此,直觉原型的掌握对于个体学习进而形成直觉经验具有关键性作用,通过观察学习个体可以快速获得大量准确的直觉原型,从而大大提高学习的效率,有效避免无直觉原型情况下不断试错所造成的资源浪费。例如,在言语直觉的形成过程中,幼儿需观察父母的发音以获得直觉原型并以此为基础而进行模仿;父母则通过强化修正幼儿的发音并形成及加强幼儿语音和语义之间的联结,幼儿在此过程中逐渐掌握母语体系。在社会性直觉形成过程中,个体通过观察父母亲人而掌握基本的生活方式,观察长辈亲友而传承特有的文化习俗等。因此,难以想象,若是仅仅依靠忽视直觉原型的强化理论,人类是如何实现复杂行为的掌握与文化的传承的。

除直觉原型之外,观察学习还强调替代性强化。替代性强化即个体可以通过观察他人行为的后果,从而增加或降低自身以同样方式行事的概率,成语“杀鸡儆猴”体现的正是这个概念。在生活中,有些直觉行为既可以通过直接经验塑造,也可以通过替代经验塑造。例如前文中提到的培养儿童上课习惯的方式,既可以通过对儿童自身行为的强化培养其养成正确的直觉行为,也可以通过对其同学行为的塑造达到同样的效果,具体的操作方式可能是在课堂中若其同桌表现良好则给予奖励,若表现不好则给予惩罚,儿童观察同桌不同表现的后果便会主动模仿其得到奖励的行为,避免出现同桌受到惩罚的行为。但是,有些直觉行为一般通过替代经验学习,若通过直接经验学习不仅会造成浪费,甚至会带来不幸的后果。例如,教幼儿简单的交通规则不需要让其置于真实环境中进行强化,因为此时犯错误的代价太大、危险性过高,父母老师可以通过播放教育动画短片等替代性强化的方式,让其了解交通规则的重要性,这样既可以达到学习的目的,同时也能够避免直接体验而带来的风险。

(二)观察学习的形成过程

观察学习一方面可以快速获得原型,使学习者能够有针对性地对目标行为进行强化,有效简化行为获得过程,显著提高直觉形成的效率;另一方面也能够使学习者通过替代性经验而获得强化,在降低学习者时间精力损耗的同时,也能够极大程度避免直接体验隐藏风险的出现。事实上,生活中个体大多数直觉经验的获得都是通过观察学习的。例如,在幼儿时期,个体观察父母帮自己穿衣服的模式而逐渐学会穿衣;观察父母行为处事的方式并逐渐内化从而形成自己的价值观念。那么,个体观察学习的过程到底是什么呢?社会学习理论认为,观察学习包含注意过程、保持过程、复制过程与动机过程。

1.注意过程

当示范刺激出现时,注意过程决定了学习者从大量内容中选择什么进行观察,这也直接决定了观察的数量与类型以及直觉形成的质量与效率。可以说,注意过程是观察学习的关键一步,也是直觉形成的开始。而刺激物属性及学习者特征都是影响注意过程有效性的重要因素。

(1)就刺激物而言,较高的吸引力保证其能够引发学习者对自身的长时间关注。如电视节目轻松、生动,能够快速获得大家的关注,学习者可以在愉悦的氛围中掌握有效的直觉原型并轻松将其内化形成直觉经验。而对于幼儿等注意力容易分散的群体,一般通过讲故事、播放动画片等形式获得他们的注意,从而为后续直觉原型的获得过程创造充足的条件。

(2)就学习者特征而言,个体自身的状态也决定其观察直觉原型的速度及水平,例如年龄、兴趣、情绪等都是重要影响因素。一般而言,在婴幼儿到成年阶段观察的质量随着年龄的增长而增长,同时个体对于有兴趣的刺激的观察质量也会远高于没有兴趣的刺激。所以,总体而言,示范刺激的表现形式既要考虑其自身的客观属性,同时也要考虑学习者的内在属性,才能够保障注意过程的有效性。

2.保持过程

若个体不去记忆观察的直觉原型,那么观察学习便无法进行。保持过程强调个体对注意到的直觉原型的保持,也就是说需要学习者将注意到的直觉原型以符号的形式存储于记忆系统之中,为后续的调用做准备。保持过程主要依赖于两种表征系统,分别是表象系统及言语系统。在婴幼儿时期,由于言语系统发展不完全,个体主要依靠表象系统储存注意的直觉原型。当直觉原型重复出现并得到注意,那么在幼儿的记忆系统中该原型便会以表象的形式得以保存,以后再次出现直觉原型的相关线索时,记忆中的表象会被激活并浮现在脑海中。例如,幼儿经常观看动画片《熊出没》,对其中“熊大”的形象记忆深刻,当他人提到“熊大”的名字时,他的脑海中便会出现“熊大”的形象。随着年龄的增长,幼儿言语体系逐渐完善,此时除了表象系统外,言语系统也开始发挥作用。言语表征系统意味着个体可以通过语词编码的方式储存直觉原型。例如,儿童记忆放学回家的路线,单纯记忆表象可能信息量太大而无法完成,此时可以将视觉信息转化为言语信息,如“直走至红绿灯处左转再右转”,这样能够更加精确地保存记忆的路线。实验证明,当个体将注意到的直觉原型以符号的形式进行编码及储存,将更有利于以后对信息的提取及加工,从而更好地促进个体对直觉行为的观察学习。

3.复制过程

复制过程即将记忆系统中保持的直觉原型转化为相对应的行为。复制过程包括反应的提取、反应的发起与监测。在复制过程的初始阶段,个体首先对储存的直觉原型进行提取。这一阶段依赖于保持过程直觉原型的数量与质量。当保持过程储存的直觉原型出现缺漏时,行为的复制便会不完整或者出现错误。此时,个体需要重新经历注意和保持阶段,保证直觉原型的完整性。在直觉原型提取完成之后,个体开始行为的复制同时监测复制行为的正确性。一般而言,复制的行为很难在第一次就完整无缺,因此需要有效的监测,对错误或遗漏之处进行调整。但是,有时对于一些复杂行为的复制过程,个体很难实现有效的监测,例如学生在学校学习广播体操时,无法完全观察自己的动作,因而无法完成有效的监测。在这种情况下,个体只能依靠可观测的部分线索进行监测,或者借助于旁观者的反馈,但是监测的效果仍会受到限制。

4.动机过程

行为的结果是影响直觉行为是否再次出现的动机力量。一般而言,人们更愿意重复具有奖励效果的行为而避免具有惩罚效果的行为。如果直觉行为多次显示出个体所期望的结果,那么个体便会有更强的动机意愿再现这一行为,进而形成直觉。行为结果的影响力主要通过强化的作用来体现。班杜拉认为除直接强化及替代性强化之外,强化还包括自我强化。自我强化强调在行为发生之前,个体内心已经设定了一定的标准,并且在活动过程中不断将表现的直觉行为与此标准进行对比,如果直觉行为达到预期的标准便可以通过自我奖赏的方式强化自己的行为(如奖励自己看1小时电视、获得自豪感等),如果直觉行为未达到预期的标准则需自我惩罚(如惩罚自己周末不能看喜欢的综艺、自责等)。自我强化的本质是将学习的外部动机转化为内部动机,将外部刺激的影响转化为直觉意识。从强化方式而言,直接强化与替代性强化属于外部强化,而自我强化属于内部强化,在实施外部强化的基础上需更加注重自我强化的培养,为直觉行为的塑造提供更强的动因。

人类高级直觉的形成主要依赖于后天经验的积累,而在此过程中,强化及认知因素均发挥了关键作用。在个体发展过程中,随着认知功能的不断发育,后天经验的积累方式开始从简单依靠强化向依靠认知及强化两种方式的合作即观察学习转化。以观察学习理论为基础,人类大部分高级直觉的获得应包括两个阶段。第一个阶段为认知阶段。这一阶段中认知因素发挥主要作用,个体通过有意识地注意、观察,实现经验的从无到有,为直觉的形成提供基本的行为原型。第二阶段为强化阶段。个体获得原型之后,通过不断重复、训练等方式修正自己的行为,并将原型逐渐内化,在此基础上实现向直觉的转化。