哪种机制更好:是奖赏,还是惩罚?

  激励机制大概有两种,一种是奖励“好”的行为,一种是惩罚“坏”的行为。比如,想让孩子考个好成绩,我们可以选择“下次考试90分以上,妈妈就带你去游乐园”,也可以选择“下次考试再不到90分,下个月零花钱减半”。当然,比较两种方式哪个更有效通常要根据具体情况而定,比如奖赏力度和惩罚力度是否相当等等。

  不过,如果我们在一个简化的行为实验中把这些可变因素都平衡妥当,到底是奖赏更有效,还是惩罚更有效呢?奖罚措施是否对孩子的认知过程本身(而不是动机、动力、情绪等方面)有所影响呢?这就是本文所要探讨的内容。

我们这次要介绍的研究是在认知过程的框架下研究奖惩的影响。什么是认知过程呢?作者是从以下三方面来探讨的:

  • 1. 信息加工的数量,
  • 2. 信息加工的质量,以及
  • 3. 做决定的阈限(也就是收集够多少信息就做决定/行动了)。

  Ballard等人(2019)做了如下图的实验:一块黑屏幕上,先是什么也没有,然后闪现一个注视点,然后就是一大堆小白点点。这些小白点点有一部分向固定的地方一栋或是左上角,或是右上角,而另一部分则是随机乱序移动。实验参与者的任务就是判断往固定方向移动的点点是往左上还是右上移动,然后按键进行反应。这个任务呢有3种难度,简单的有8%的点点往固定方向移动;中等难度有6%的点点往固定方向移动;困难的就只有5%的点点往固定方向移动了。

  实验顺序:首先在黑屏中出现一个白色的十字,然后出现40个白点,这40个白点中有若干固定朝一个方向移动,其余则随机移动。被试需要鉴别其中固定移动的方向。

  这些研究者们先在没有奖赏和惩罚的情况下做了观察,然后根据观察结果设定了一个目标:要达到77%正确率并且平均1.071秒的反应时间。在正式实验中,每个人先给了7.5澳元做本金。1/3的人在奖赏组,也就是达到这个标准的话就再给他们2.5澳元;1/3的人在惩罚组,也就是没达到这个标准的话就罚款2.5澳元;最后1/3作为基准,既没有惩罚也没有奖赏。每个人都要做9组测试,每种难易程度各3次。那么大家的表现如何呢?

  正确率(左)和反应时间中位数(右)相对于难度作图。三个实验条件分别为不奖励也不惩罚、奖励和惩罚。

  同上图可以很明显的看出,无论是哪种难易程度,惩罚组的正确率都最低,反应时间也最长。之后,这些研究者们用了一种略复杂的模型来计算之前提到的三种信息加工方面(信息加工数量、质量,以及做决定的阈限。模型本身的算法不是我们要探讨的重点,让我们直接来看结果。

  如上图所示,无论在认知过程的哪一个方面,惩罚组的得分都是最低的。换句话说,惩罚组加工信息的质量最差、最少,反应最仓促(信息收集很少就作反应了)。

  总结一下,当人们面临可能的惩罚时,他们的信息处理质量整体下降,这可能是因为他们把大量的认知资源都用了监测自己的行为了(比如:哎呀,我到底对不对啊),于是,用到加工与任务本身相关的资源就少了。当然,还有一种可能是奖赏也让人们更多的监测自己的行为,但是同时整体提高了处理信息的能力,就补偿了监测所用的认知资源。总之,不管是哪一种,惩罚整体来看是有负面效果的。不是说动机上有负面效果,而是处理信息的能力有个暂时的下降。

  再说阈限,惩罚组的人在做反应时比较仓促——还没收集够足够的信息就作反应了。注意,这不是说他们反应快——因为单位时间内收集的信息少,虽然花的时间长(反应时间确实是更长哦),但是做决定的时候还是没收集够足够的信息。

  总的来说,这个研究告诉我们,人们处理问题的表现是跟外因有关的,而可能发生的惩罚似乎会让人们的表现更差一些。这不是说人们不在乎惩罚,或者跟你较劲偏要跟你对着干,而是“被惩罚”这个可能的结果自动的(负面地)影响了人们的信息加工策略和能力等等。所以说,教育孩子鼓励为主是不无道理的哦~~

P.S. 当然,犯了错误该惩罚还是要(有策略的)罚,要不然成了熊孩子可就不好了。

评论