summary
category
tags
date
原文地址:点击这里
翻译:OpenAI GPT-3.5-turbo
迈尔斯-布里格斯类型指标(MBTI人格测试)是世界上最受欢迎的人格测试。它是财富100强公司、政府机构和普通人的最爱。每年有超过150万人参加这个测试。这是一个每年创造数百万美元的蓬勃发展的行业。而且,任何值得一提的心理学家都会告诉你,它大部分都是胡扯。
这篇文章告诉你为什么。
原因1:它基于卡尔·荣格的理念
第一个原因是最不重要的之一,但从历史开始是个好方法。迈尔斯-布里格斯人格测试是基于荣格的观点,可以说是经验上没有证据支持的观点。荣格是一位瑞士精神病学家和精神分析学家,他在二十世纪上半叶工作。他对宗教、神话、炼金术和占星术有着持久的兴趣。这些兴趣在他的观点中回响,其中一些更接近于神秘或超自然的主张,而不是科学的观点。荣格并没有过多强调通过严格的经验研究来测试他的观点,这是他那个时代普遍存在的问题,这一点必须承认。在荣格去世后,两位非专家,他们在心理测量学或测试构建方面的培训有限,创造了迈尔斯-布里格斯类型指标(MBTI),这是一个基于荣格经验上没有证据支持的观点的人格测试。
这本身还不足以否定MBTI——一个测试理论上可以由非专家创建,并且建立在不被支持的观点上,但仍然能准确地衡量人类个性。
但这绝对是需要谨慎的理由。
原因2:测试缺乏预测效度:它不擅长预测现实世界中的结果
人格测试的目的不仅仅是告诉你关于自己的事情,还包括预测现实世界中的结果。但是一次又一次的研究表明,MBTI并不是一个好的职业结果、恋爱关系或其他我们关心的事情的预测工具。
相比之下,有一些经过科学验证的人格测试可以有用地预测从职业表现到离婚可能性再到你是否容易患有心理障碍的各种情况(例如,参见此处)。
有一些预测成功的测试存在,但迈尔斯-布里格斯测试不是其中之一。
原因3:人的个性应该是连续的,而不是离散的
这点非常重要。
有些变量是连续的:它们落在一个连续或光谱上。其他变量是分类的:它们落在整齐、离散的类别或类型中。例如,你的身高是连续的:它在一个从非常矮到非常高的光谱上。你可能在那个光谱的任何位置——比如5英尺4英寸、5英尺9英寸或6英尺2英寸和四分之三。相比之下,宗教是一个分类变量:你要么是犹太教徒、基督徒、穆斯林、无神论者、耆那教徒(或其他)。
如果我要衡量你能抛硬币的距离,答案是连续的,因为距离是一个连续的范围,硬币可以落在这个范围的任何地方。如果我要衡量硬币的落地方式(哪一面朝上),答案是离散的:只能是正面、反面或者侧面。没有其他选项,答案可以明确地归入其中一个类别。
人的个性是连续的,而不是分类的。它就像身高,而不是宗教。就像你能抛硬币的距离,而不是硬币会落在哪里。问题在于迈尔斯-布里格斯框架大胆地声称个性可以分为不同的类别或类型。而且它还声称,没有任何真实的证据,恰好有16种类型。
人的个性有不同的模型。一个著名的模型叫做“大五人格”,它认为每个人在经验开放度的连续谱上都有所处位置,从低到高;在责任心的连续谱上也有所处位置,从低到高;在外向性的连续谱上也有所处位置;在宜人性的连续谱上也有所处位置;在神经质的连续谱上也有所处位置(简称OCEAN)。每个人在这五个连续谱上都有一个得分。如果你给一个人做个测试,得到他们在这五个维度上的得分,你就能初步了解他们的整体个性(尽管不完全),也就是说,你能知道他们是谁,以及他们与其他人的不同之处。
一个名为HEXACO的不同人格模型认为,人格可以用六个关键维度而不是五个更好地进行统计捕捉。这六个特质是诚实谦逊、情绪化、外向性、宜人性、责任心和经验开放性。
这两个模型有所不同,但它们在核心事实上达成了一致:个性沿着几个连续的维度分布,而不是分为明确的类型。例如,最好的理解内向/外向的方式是将其定位在一个光谱上,而不是想象人们分为内向和外向这两种类型之一。这两个模型比迈尔斯-布里格斯更有证据支持。
一个连续体上有无限多个点,而我们在这里处理的是五六个连续体。所以,如果我们真的想要计算有多少种不同的人格类型,答案将是:无限乘以自身五六次。如果你觉得这种描述方式非常无益,那么你是对的。因为人格特征存在于一个连续体上,我们根本不应该谈论离散的人格类型。
迈尔斯-布里格斯将人类个性的美丽、丰富多样的复杂性压缩成了16种类型。这个框架整洁易记,个性类型的分类听起来很酷。但是,所得到的人类个性图像并不忠实于现实。
原因4:MBTI使用的类型具有任意的界限
将个性硬塞进类型中会产生任意的边界问题:一旦你指定了所谓存在的类型,就必须定义它们的边界。但是以非任意的方式定义边界非常困难。例如,想象一下我拿身高这个变量,在现实世界中它是连续的,然后试图将其分成几个类别。我可以声称有三个身高类别,并将它们标记为矮、中等和高。但现在我有一个问题:这些类别的分界线应该是什么?一个身高为5英尺10英寸的人应该属于中等还是高的类别?一个身高为5英尺5英寸的人算是矮还是中等?我应该根据什么来做出这个决定?我无法以原则性的方式定义这些类别的边界,而我选择的任何方法都是任意的。自然界中并不存在真正的中等或高的身高,所以我无法依靠外部世界来帮助我决定。我必须使用直觉、多数票或其他任意的方法来定义我的类别边界。
MBTI试图通过使用中位数分割来解决这个问题。这意味着会测试很多人,然后将他们在外向性等特质上的得分从最低到最高排列。例如,如果我们测试了50个人,最后会得到一个按顺序排列的外向性得分列表,从最低到最高。中位数分割方法是这样说的:让我们将这个列表从中间分开。我们将把中位数以上的所有得分视为外向,将中位数以下的所有得分视为内向。但问题仍然存在:为什么要使用中位数?为什么不用平均值?为什么不用其他方法?答案是没有一个有原则、非武断的方法可以决定。而且,没有任何方法能解决你的关键问题:你已经将一个连续性的变量强行塞进了你的床铺。这会带来许多下游问题,其中任意设定分割点只是第一个问题。下一个问题与测试的可靠性有关。
原因5:迈尔斯-布里格斯测验的可靠性较差
心理学家通过几种方法来衡量一个测试是否优秀。其中一种重要的测量方法叫做测验重复信度。这意味着,如果您进行一次测试,几周后再进行一次测试,结果应该大致相同。有一点波动是正常的,因为每个人都会根据具体情况发生一些变化。但是,你的性格不会在一周与一周之间大起大落,所以一个好的测试不应该在一次测试与下一次测试之间提供截然不同的结果。
MBTI毫不顾忌地违反了这个规则,引起了轰动和喧闹。它的测试再测信度非常糟糕,经常在不同的测试中将参与者重新分类为相反的人格类型。例如,一些研究发现,在五周的时间内,它将整整50%的参与者重新分类为不同的人格类型。在心理学中,这种低信度被认为是不可接受的。
就像任意边界的问题一样,可靠性差的问题是将连续变量转化为分类变量的结果。你被迫定义分类的边界,所以决定使用中位数。但这就产生了一个新问题:许多人的得分接近中位数,比极端值更多。如果这些人三周后再次参加测试,并且感觉更加合群(或精力充沛或焦虑),测试很容易将他们重新分类为相反的人格类型。这正是MBTI经常做的事情。
原因6:迈尔斯-布里格斯测试误导性地暗示了不同类型之间存在巨大差异,而同一类型内部的差异很小
通过将人们归入离散的人格类型,迈尔斯-布里格斯暗示了另外两件事情。
首先,这意味着那些刚好低于某一类型的分界线的人与刚好高于它的人在本质上是不同的——测试将他们归入不同的人格类型。但实际上,边缘内向者和边缘外向者彼此非常相似。
其次,通过将人们归类,这个测试暗示了同一类型的所有人都是相似的——所有外向者都有一个基本的核心品质,所有内向者也是如此。这意味着在同一类型中,极端得分者与边缘得分者是相似的。这是错误的——极端内向者实际上与边缘内向者非常不同。
例如,想象一下,你的外向性的分界线是50%。你会将得分为10%或45%的人归类为内向,将得分为55%的人归类为外向。但实际上,得分为45%的边缘内向者与得分为55%的边缘外向者相比,更接近于得分为10%的极端内向者。然而,测试会将边缘和极端内向者归为一类,尽管它们之间存在着巨大的差距(35个分数的差异),而且会认为边缘内向者与边缘外向者完全不同,尽管它们之间存在着相似之处(10个分数的差异)。
就像前面的两个问题一样,这个问题也是同一个核心问题的结果:试图将一个连续变量强行分成几个类别。在像迈尔斯-布里格斯这样的类型测试中,那些勉强进入某个类别的人被认为是该类别中的完全平等成员,与同一类别中的极端得分者一样。而那些勉强进入一个类别的人则被认为与勉强进入另一个类别的人完全不同。从概念上讲,这完全是颠倒的。
原因7:当你将一个连续变量转化为分类变量时,你会丢失信息
大多数研究人员警告我们不要将连续变量二分化的另一个原因是:这样做会丢弃有价值的信息。
假设我测量了我班所有学生的身高。我得到了一系列从4英尺11英寸到6英尺2英寸的准确身高。然后我决定将人们分为矮、中等和高三个类别。为了做到这一点,我必须舍弃一些信息。我最终从每个人的准确身高(精确)转变为矮、中等和高这些粗略的描述(不太精确)。换句话说,我选择舍弃了学生之间丰富的复杂性和差异,而采用了更粗糙、不太精确的分类方式。换句话说,我选择了舍弃信息。
在某些特定情况下,这样做可能会有所帮助。但是这些情况很少见,并且不适用于个性测量。大多数情况下,将连续变量强行转化为分类变量并不是一个好主意。
在这种情况下,其中一些属于心理病理学领域,基于类型的方法可能会有所帮助。但证据表明,这并不适用于大多数人格特质。
原因8:MBTI不衡量神经质
神经质是一个重要的人格变量。它描述了一个人的心理生活有多少被消极情绪所占据,尤其是焦虑、悲伤和脆弱感。神经质得分较高的人会经历更频繁、更强烈和持续时间更长的负面情绪,而得分较低的人则相对较少。神经质较高的人对世界上的危险更加警惕,他们在模糊的刺激中看到更多的威胁,这取决于他们所处的环境是安全还是不安全,可能是好事也可能是坏事。神经质是浪漫关系中最重要的预测因素之一(平均而言,它预测了更大的不满和关系破裂)。它还平均预测了更糟糕的职业结果、更糟糕的健康结果和各种各样的心理病理。它在跨文化上是普遍存在的。它不仅仅存在于人类,还存在于各种各样的物种中。
每个人都在神经质的连续性上有所不同。大五人格模型衡量这一特质并称之为神经质。HEXACO模型也衡量它,并称之为情绪性。这是人类变异的一个关键维度。还有其他在本文中未讨论的人格模型,它们也衡量神经质。唯一的例外是迈尔斯-布里格斯:它完全忽视了神经质,选择不衡量这一特质。如果目标是捕捉人类个性,那这是一个令人震惊的失败。
为什么迈尔斯-布里格斯会忽略与从职业成就到健康问题再到离婚等生活结果相关的个性变量?也许是因为测试制作者有动机使结果广泛吸引人。如果你不测量神经质,测试结束时就永远不必给参与者带来坏消息,也不会冒失去任何客户的风险。
话虽如此,我们无法确定为什么迈尔斯-布里格斯测试忽略了神经质。我们所知道的是,尽管神经质能够预测重要的生活结果,但它在测试中明显缺失。还要注意的是,根据MBTI提出的16种人格类型中,没有一种是负面的。(你可以在这里看到所有16种类型的无限积极性)。迈尔斯-布里格斯测试处于舒适且经济上明智的位置,从不传递坏消息。
「但是我的结果看起来还是相当准确的」
大多数听到这些问题的人都认为它们很严重。一个忽视神经质、把连续性强行分成类别、可靠性低且不能预测生活结果的测试是一个糟糕的组合。但是即使对于一些非常聪明的人来说,一个问题仍然存在:尽管如此,他们的MBTI结果似乎相当准确。
你对你的迈尔斯-布里格斯测试结果有这种感觉吗?如果是的话,请考虑以下事项。
首先,人们倾向于相信他们的星座运势能够准确地描述自己,即使他们读错了星座运势。人们似乎喜欢把自己的特点套入其中。
就像星座运势一样,迈尔斯-布里格斯测试似乎利用了这一事实,为人们提供包含巴纳姆陈述的个性描述。巴纳姆陈述是一种策略性模糊的描述,几乎没有实质内容,但又恰到好处地模棱两可,以便人们可以从中读出自己,并得出结论说它完美地描述了自己。它以著名的表演家P.T.巴纳姆命名,据说他曾说过每分钟都有一个傻瓜出生(恰好,他从未说过这句话:这是一个错误的归属)。
如果迈尔斯-布里格斯测试似乎很准确地描述了你,那是因为它被设计成如此,因为你希望将自己读入其中,因为它在神经质方面保持着谨慎的沉默,而且如果你已经部分相信它,确认偏见会巩固你的信念。
相比之下,考虑一下MBTI的主要缺陷:任意的界限,可靠性差,无法预测生活结果,忽略了神经质等等。要了解这些缺点,你需要是一个数据迷或者对这个问题进行了认真的实证研究。
「好吧,总比没有好,对吧?」
如果这听起来像一个合理的反驳,考虑一下以下情况。
首先,正如许多思想家所指出的,知识的幻觉比缺乏知识更加隐匿,也更难克服。通过描绘一个不准确且粗糙像素化的人格画像,MBTI成为了对更准确理解的障碍。从这个意义上说,它可能比没有更糟糕。
其次,如果人们对这些错误信息深信不疑,可能会对人们造成伤害。这可能会让人们远离那些据说不适合他们个性类型的职业或伴侣。如果这些建议的基础是错误的,我们就有可能伤害到人们的生活。
第三,选择并不是在迈尔斯-布里格斯和没有之间。选择是在迈尔斯-布里格斯和像HEXACO和大五这样基于连续模型的预测成功模型之间。这两种人格模型可以可靠地预测重要的生活结果,并避免了将连续变量强行归类的关键错误。
为什么迈尔斯-布里格斯人格测试如此受欢迎呢?
我不确定为什么尽管存在缺点,迈尔斯-布里格斯测试如此受欢迎。但可能的原因包括:
(1)它有出色的广告和资金支持;
(2)测试容易进行、易于管理和计算;
(3)结果易于解释和理解;
(4)测试巧妙地避免告诉读者任何负面信息;
总结
我们应该从中得出什么结论?
- 人格心理学是一个蓬勃发展的领域,它已经取得了关于人类个体差异和相似之处的重要发现。与心理学的一些子领域不同的是,它在复制危机中表现出色。人格可能看起来虚无缥缈,但如果你有正确的工具,它可以被严谨地测量。而且它具有重要的实际意义:它(平均而言)可以预测从薪水、职业表现、浪漫和友谊关系到违法行为等方面的一切。
- 但是迈尔斯-布里格斯测试并不适合这项工作,因为它在这些任务上表现得相当糟糕。如果公司和政府想要做出基于证据的决策,他们应该避免使用MBTI,而选择具有更好的有效性和可靠性的人格和职业倾向模型。
- 至于像你我这样的普通人,我们不应该被轻易地相信迈尔斯-布里格斯能够告诉我们关于自己的实质性信息,或者它能帮助我们找到合适的职业或伴侣。在这方面,我们必须依靠自己的思维,再加上这个漠不关心的宇宙的偶然性。
- 迈尔斯-布里格斯测试只能提供自我认知的幻觉,而非真正的认知。仔细观察会发现,它建立在未经实证的荣格主义和不可靠的心理测量实践基础上。