智商是谁定义的？

来一杯吗 · 发表于海洋技术发展 2022-12-30 19:03:37

这要看，你问的是智商这个词，还是智商这个词所代表的意义。

如果你问的是智商这个词，也就是我们常说的那个缩写“IQ”，那么一句话就能解答，是由德国心理学家威廉·斯特恩（William Stern, 1871~1938），在其著作《智力测验的心理学方法》（The Psychological Methods of Testing Intelligence）中，基于德语单词 Intelliligenzquotient所提出的。

如果你问的是智商这个词所代表的意义，那解释起来就麻烦了。

先驱者高尔顿

“智商”这个概念的出现是为了定量评估人类智力，无论有没有“智商”这个概念的出现，人的智力都是天然存在的，智商只是通过一种定量方式将人类的这种能力表述出来。

有记录的最早对人类智力进行测量的是英国学者弗朗西斯·高尔顿（Francis Galton, 1822~1911）。

弗朗西斯·高尔顿（Francis Galton, 1822~1911）

他是达尔文的表弟，智商爆表，传说1岁能认所有的字母，不到3岁就能阅读，4岁能写诗，6岁熟读荷马史诗，7岁开始学习博物学，17岁进入国王学院学习医学、生理学、植物学和化学，他的研究领域包括植物学、动物学、人类学、地理学、数学、力学、气象学、心理学、统计学等领域，且哪个拿出来都很能打。

不仅如此，这哥们儿是个分类狂，7岁开始学习博物的时候就开始按照各种特征给各种矿物啊、植物啊什么的进行分类。

要把分类做的更好，精准测量各种特征是第一步。

只要有可能，他都想量一量，量身高，量指纹，量人的眼睛的颜色……

1884年，高尔顿的人体测量实验室用于统计人眼颜色的工具，于伦敦科学博物馆

量着量着，一不小心就发现了一个向平均值回归的定律，就成了现代统计学的先驱之一。

后来，他开始对人类不可见的智力下手了，他开始尝试各种手段，例如头部大小、反应速度等可见特征对人的智力进行定量描述。

以我们今天的视角，这个试验显然不可能成功。

结果也确实如此，后来他放弃了，转而对人种进行测量和分类，创立了一门学问叫做“优生学（eugenics）”。

他的同胞和后继们本着这种严谨细致的精神一路走下去，又是一不小心就走向了另一条邪路。

纳粹用于测量和区分人种的工具

你猜，二战时，纳粹定义什么是雅利安人、犹太人等人种的方法，最早的源头是哪里？

回来，继续说智商的测量。

高尔顿定量描述智力的尝试没有成功，是因为他的假设有问题——智力跟人类可见特征的关系，并没有明确的关系。

第一个成功者，比奈

最早在测量智商领域挑战成功的，是法国人阿尔弗雷德·比奈（Alfred Binet, 1857~1911）。

阿尔弗雷德·比奈（Alfred Binet, 1857~1911）

他采用了比较线段长短、重复数字、语言等这些显然与认知能力有关的行为结果作为测量对象，作为智力的表征。

不过这时的智力测验与我们现在通常理解的智商测验还不一样，编制它最初的目的是为了诊断幼儿的智力缺陷，从而为这类儿童提供特殊的教育。

他成功了，这个测验很快得到推广和应用。

再后来，在他的学生泰奥多尔·西蒙（Théodore Simon, 1873~1961）的协助下，比奈开始对自己的量表进行修订，使其不仅能应用于特殊儿童群体，也可以测量正常儿童的智力水平，这套量表，叫做“比奈-西蒙智力测试（Binet-Simon intelligence test）”。

智力测验的广泛应用

历史总是惊人的相似，法国人逆袭德国人成功，总得有点儿美国人的影子。

20世纪10年代，比奈-西蒙量表被引入美国，斯坦福大学心理学家刘易斯·特曼（Lewis Terman, 1877~1956）对比奈-西蒙量表进行了修订改编，使其不再局限于测量孩子的智商，也能测量成人的智力水平，并能在美国进行大范围应用。

刘易斯·特曼（Lewis Terman, 1877~1956）

同时，这项工作也是为了他哪项雄心勃勃的，人类心理学历史上最早也是持续时间最长的研究“特曼资质研究”做准备。这项研究同时也开创了心理学研究中一个垂直细分领域，极端人才的心理学研究（Psychology of Extreme Talent）。

特曼研究所针对的人群与比奈最初的研究方向恰好相反，它瞄准了人类幼崽中最有天赋的那个群体，将其鉴定出来，进行观察或进行特殊培养，以其能创造普通人无法做到的突破和奇迹。

有关这个实验的故事我写在这里：

历史上有哪些智商逆天的天才？133 赞同 · 30 评论回答

智商140以上的人生是一种什么样的体验？44 赞同 · 5 评论回答

这项研究在二战和后来的冷战时达到高峰，美苏皆有类似的计划，走火入魔时，他们甚至开展了不少针对特异功能人士的研究。这是另一个故事，这里我们主要讨论特曼为这些研究所开发的测验。

1916年，特曼出版了“比奈-西蒙量表的斯坦福威力加强版以及其使用说明和指南（An Explanation of and a Complete Guide for the Use of the Stanford Revision and Extension of the Binet-Simon Intelligence Scale）”

这套智力测验叫做“斯坦福-比奈量表（Stanford–Binet Intelligence Scales）”。

特曼非常大度，他没有把自己的名字写在量表名字里，而是用了自己学校的名字。至于原始量表的第二作者泰奥多尔·西蒙，大概是因为特曼觉得名字里一下塞三个名字有些浮夸，也就帮西蒙大度了一下，直接去掉了。

好，到这里先总结一下，这里有很多细节，别看我写的时候很简单一笔带过。你细细品鉴一下，会发现其中细节非常复杂。

例如，从检测智力缺陷儿童到所有儿童均可以使用。

对前一个“检测智力缺陷”这个目标，我只需要确定一条“正常水平线”，然后找到那些偏离正常水平太多的人群，定义出“智力缺陷人群”，任务就完成了。

后一个“检测所有儿童”就麻烦多了，不仅要向下界定智力缺陷，还要向上确定智力优秀群体，而且不仅要定性，还要定量看出优秀的程度。

还有一个麻烦的问题，孩子的认知和思维发育是极快的，一套智力测验测30岁的人和20岁的人不会有太大问题，可能给一个3岁孩子做的测试，很有可能在2岁的孩子眼里完全不知所云。

比奈的方式是，每个年龄阶段设置一套题目，每个年龄段用各自的测试，测出来的结果叫做“智力年龄（mental age）”，简称志玲。

例如一个5岁孩子完全做完了5岁的题目，叫做5岁生理年龄（chronological age）5岁智龄，如果做完了6岁的题目，就是5岁年龄6岁智龄。

这表述方式，实在太让人难以理解了。

于是本文最开头那位，德国心理学家威廉·斯特恩说，要不我们把心理年龄和生理年龄除一下吧，不就拉成同一个参照系了吗？

于是乎，你看，操作方式是心理年龄除以生理年龄，除法，得到的结果叫做商，于是智商这个概念就诞生了。

由此，5岁年龄5岁智龄，智商就是1；5岁年龄6岁智龄，智商就是1.2，是不是就能很方便的比出优劣了？

后来特曼在修订斯坦福-比奈量表的时候，又觉得这样比总是带个小数，看上去很是麻烦。于是他说要不咱就保留两位小数再乘以个100吧。

智龄智商的计算公式

5岁年龄5岁智龄，智商就是100；5岁年龄6岁智龄，智商就是120，你看，咱们今天常见到的智商的形式不就诞生了？

别急，这套方法操作虽然是标准字面意义上的智商，展现形式也和我们今天看到的智商分数水平很是相似，但还不是我们今天普遍意义上的智商概念。

不知是否有小伙伴发现，我前文中一直都在用“智力水平”这个名词，直到这里才用上“智商”这个概念，是因为严格意义上讲，智力水平的表示方法也只有在此时能被称为智商。

而且，“标准的”智商概念，也就适用于这十几年间，在其后，虽然智商这个叫法被延续下来，实际上，已经完全没有那个商的概念了。

“离差智商” 一统江湖

继续沿着斯坦福-比奈量表的故事往下讲。

1937年，特曼针对自己开发的斯坦福-比奈量表又进行了一次大规模修订，这次修订的幅度基本上相当于完全重构了一遍代码，除了名字还一样，其中的内容已经找不到太多初版的元素。

重构这种工作，不到迫不得已，基本没人愿意做，而且要做，通常原因是底层逻辑出了问题。

事实也确实如此，斯坦福-比奈量表无论怎么修订，都无法绕开最初开发它的目的“区分智力缺陷儿童”这个紧箍咒。

哪怕进行了重构级别的修订，这一版量表仍然受到了学界的质疑。

其中音量最大的，是一位名为大卫·韦克斯勒（David Wechsler, 1896~1981）的罗马尼亚裔美国心理学家。

大卫·韦克斯勒（David Wechsler, 1896~1981）

他提出的问题包括但不限于：

比奈量表的开发针对的是儿童，其对于成人智力测量的有效性，是非常值得怀疑的。（这个前文中我已反复讲到）计算智商时所用的“智龄”这个概念，完全是一个人为制造的概念，它的定义，也是非常值得推敲的。例如，智龄以什么间隔区分合适呢？1岁？半岁？一个月？20岁和30岁的成人智力水平不会有太大差异，那么这个智龄应该算20岁还是30岁呢？比奈量表用了一个综合的总分界定了人的智力水平，这一个单一总分能否完整解释一个人综合的智力情况呢？在进行测量时，比奈量表的操作涉及不少需要语言理解的任务，例如让孩子补充没有说完的句子等，那对于语言的理解水平是否会影响被测者的智力水平测量的表现呢？是否应该讲关于语言的智力和“一般智力因素”进行区分呢？

提出这些疑问的学者，韦克斯勒绝对不是第一个，可几十年来比奈量表仍在智力测验中占据绝对权威的地位，是因为这些问题大家都知道，却没人有太好的办法解决。

韦克斯勒倒是头铁，撸袖子就上了，他没有像前人那样围绕着比奈体系进行修修补补，而是从hello world开始重建了一套测量体系。

1939年，他发表了一套新的智力测量体系，韦克斯勒-贝尔维尤智力量表（WAIS），也就是我们常说的“韦氏量表”。

咱实打实的说，韦克斯勒喷比奈量表的那些问题，其实他自己也并没有完全解决。

比如说，韦氏量表仍然无法实现针对所有人群使用同一个测量体系，最终结果也仍然有那个综合总分等等。

不过，韦氏量表在心理测量学发展历史上的地位是毋庸置疑的，其重要性主要表现在以下三个方面：

首先，这套量表彻底摆脱了比奈体系最初以临床目的构建这个桎梏。

然后呢，在这套量表中，韦克斯勒引入非语言类测试，也就是我们今天常见的那类“智商测试”题目的形式。

韦氏量表非语言测试的题目类型

这类题目，不需要被测者具有语言能力，跨语种依然适用，比起比奈体系，操作也简单了不止一个量级。

有一些智力测验专门以这种非语言测试为主，例如著名的瑞文推理测验（Ravens Progressive Matrices）。

经过几次改版后，它迅速流行开来，成为现在世界上流行程度最高的智力测量体系。

当前最新的韦氏智力量表为WAIS-IV（相应的儿童智力量表现在是第五版WISC-V，本文不展开讨论），由10个核心分量表和5个补充分量表组成。

其结果包含四个主要智力指数，分别为：

语言理解指数（VCI）知觉推理指数（PRI）工作记忆指数 (WMI) 处理速度指数 (PSI)

也可以得出两个综合分数，分别为：

全量表智商：Full Scale IQ (FSIQ)，即10个核心分量表分数的综合。一般能力指数（GAI）：即仅计算VCI和PRI两个指数所包含的6个分量表的分数综合。

与今天这个话题关系最密切的，是韦氏量表所采用的“离差智商（deviation IQ）”的计分方式。

这个是个什么意思呢?

我们知道，人类智力水平是符合正态分布的，符合正态分布，就能用平准数+标准差的方式标记出被测者处于人群中的位置。

例如，得分高于平均水平一个标准差，就可以说被测者得分在人群中处于84.1%的水平。

直接以平均数±标准差来表示，心理测量学里面叫做“z分数（z-score）”，也叫“标准分（standard score）”

正态分布与标准分

如果以100分为平均分，15分为标准差，就是韦氏量表分数的计量体系了。

z分数、IQ分数与百分位的关系

那个“离差智商”中离差二字，你可以理解为“偏离平均分多少个标准差为计量依据”的缩写。

再顺带提一嘴，如今我们非常熟悉的标准差这个统计学概念的诞生，本文开头提到的那位先驱者高尔顿也是功不可没。

讲到这里，你会发现，这“离差智商”只是一套分数解释体系，而非一种全新的测量方法，理论上，它可以适用于所有的智商测验。

比起比奈体系那种分年龄段进行解释的框架，离差智商具有连续、精确、适用性广、解释方便、不需要引入“智龄”这种人工概念等等诸多优点。

于是理所当然的，离差智商成为了今天几乎所有智商测验的通用解释依据，其中也包括最新版本的斯坦福-比奈量表第五版。

斯坦福-比奈量表

这个故事最终的结局，是离差智商这个解释体系最终一统江湖。

关于什么是智商，智商应该包含哪些方面的争论从未平息，各种测量智商的方法和手段更是层出不穷，唯一可以确定的是，最后它们差不多都要用这套标准来对自己的分数进行定义。

同时，由于不再需要引入智龄的概念，智商这个词中“商”这个概念，也就名存实亡了，至今我们还这么叫，完全是因为叫习惯了，也就没必要再改。

就像马路虽然叫马路，但你也没看到上面跑马，不是么。

智商是谁定义的？

先驱者高尔顿

第一个成功者，比奈

智力测验的广泛应用

“离差智商” 一统江湖

相关帖子

您看了很久哦，登陆下吧！