清华硕士IQ只有25分,但他在用AI改变行业:我们对”聪明”的理解全错了

你身边一定有这样的人——高考碾压全省,代码写得让同事自闭,创业融了几千万——但做完一套网上的IQ测试,得分还不如隔壁刚毕业的实习生。

我认识一个清华硕士,做完瑞文标准推理测验,得了25分,百分等级落在”中下”区间。这哥们儿现在带着十几个人的团队做AI产品,投资人评价他”逻辑极强、判断精准”。所以问题来了:是测试在搞笑,还是我们对”聪明”这件事的理解,从根子上就是错的?

答案可能让你不舒服:IQ测试本身没问题,但你对它的理解大概率是错的。

你以为的IQ ≠ 真正的IQ

绝大多数人心里有一个朴素的等式:IQ高 = 聪明,IQ低 = 笨。这个等式深入人心到什么程度呢?很多公司招聘居然还在用IQ测试筛人,仿佛一个数字就能概括一个人的全部认知能力。

但真相是,IQ测试只测量了人类智力的一个极窄切面。

打个程序员都懂的比方:IQ测试就像只跑了一个Redis的benchmark,然后宣布”这台服务器的综合性能是85分”。你的Redis延迟确实只有0.1ms,但你的MySQL查询可能慢得像蜗牛,你的磁盘IO可能随时要炸,你的网络带宽可能连个视频都跑不动。用一个指标给整个系统打分,这不是测量,这是玄学。

瑞文测验测的是什么?”流体推理”——简单说就是你发现抽象图形规律的速度和准确度。它确实是智力的一个重要维度,但把它等同于”聪明”,就像把”百米冲刺成绩”等同于”运动能力”。博尔特百米9秒58,但你让他去游一个1500米自由泳试试?

IQ测试 = 只跑了一个Benchmark

那个清华硕士为什么得分低?很可能他那天状态不好,也可能他就是对抽象图形不敏感。但他的语言理解、逻辑推演、复杂系统建模能力,瑞文测验一项都没测到。

心理学界的”脏秘密”:IQ从来不等于智力

这不是我在这儿胡说,心理学界自己都吵了快半个世纪了。

1983年,哈佛教授霍华德·加德纳提出了多元智力理论,直接把”智力”拆成了至少8个独立维度:语言智力、逻辑数学智力、空间智力、音乐智力、身体运动智力、人际智力、内省智力、自然观察智力。后来他还想加上第9个——”存在智力”,就是人思考”我是谁、从哪来”这类终极问题的能力。

IQ测试主要覆盖了哪几个?语言和逻辑数学,最多再加半个空间。也就是说,一套标准IQ测试最多覆盖了人类智力版图的三分之一。用三分之一的数据下百分之百的结论,这在任何数据分析师看来都是犯罪。

更魔幻的还在后面。你知道IQ分数会”通货膨胀”吗?

新西兰学者詹姆斯·弗林发现了一个诡异的现象:全世界的IQ测试平均分,每十年大约上涨3分。这意味着什么?如果用1950年的标准来评分,今天的普通人平均IQ大概在115-120,个个都是”高智商”。反过来,用今天的标准去测1950年的人,他们的平均IQ大概只有70-75——按现在的分类标准,这属于”智力障碍”边缘。

你爷爷那一代人真的比你笨吗?显然不是。

这就是弗林效应,它直接说明了一件事:IQ分数不是在测量某种固定不变的”智力本质”,它测的是你在特定文化环境下、对特定类型问题的熟练程度。 营养改善、教育普及、视觉信息环境的变化,都能让分数涨。这不是人变聪明了,是人对”做IQ测试题”这件事变熟练了。

就像你不能说今天的程序员比1980年的程序员聪明,你只能说今天的程序员对现代编程工具更熟练。给Dennis Ritchie一台现代MacBook,他上手可能比你慢,但这不代表他比你笨——他发明了C语言和Unix,你只是在用它们。

真正值得关注的三个能力指标

既然IQ这个指标这么片面,那什么才是更靠谱的”聪明”衡量方式?

我的观点是:与其纠结一个数字,不如关注三个真正影响你职业表现的底层能力。

第一,元认知能力——你知不知道自己不知道什么。

元认知是”关于认知的认知”,说人话就是:你能不能准确评估自己的能力边界。很多人的问题不是能力不够,是不知道自己能力不够,然后在错误的方向上狂奔。达克效应说的就是这个——越无知的人越觉得自己懂。

真正厉害的人有一个共同点:他们对自己的知识盲区有极其清晰的认知。他们知道什么时候该自己上,什么时候该找专家。这个能力,任何IQ测试都测不出来。

第二,迁移学习能力——你能不能把A领域的经验用到B领域。

机器学习里有个概念叫transfer learning,人类其实也有。真正聪明的人不是在单一领域刷分,而是能把在一个领域学到的模式,迁移到完全不同的领域。

为什么很多优秀的程序员转行做产品、做投资也能做得不错?因为他们在编程中训练出来的系统思维、debug思维、抽象建模能力,是可以迁移的。这种能力的价值远超任何IQ分数。

第三,情境判断力——在信息不完整时做出合理决策的能力。

IQ测试的题目都有标准答案,但现实世界没有。在真实的工作和生活中,你面对的几乎都是信息不完整、约束条件在变、多个目标互相冲突的局面。能在这种混沌中做出”不是最优但足够好”的决策,才是真正的智力实战能力。

这一点在创业者身上体现得尤为明显。那个IQ只有25分的清华硕士,他每天做的事情就是在信息高度不确定的情况下做决策——产品方向对不对、这个人该不该招、这轮融资要不要接。这些判断需要的智力复杂度,远不是”找出下一个图形规律”能衡量的。

三个比IQ更值得关注的能力

IQ测试不是废物,但它只是个开始

我不是要全盘否定IQ测试。作为心理测量学的工具,它在特定场景下有其价值——比如筛查认知发展障碍、评估某些特定的认知训练效果。瑞文测验测流体推理,韦克斯勒测验测多个认知维度,它们各有用处。

但问题在于:大众把一个有限的测量工具,神话成了智力的终极审判。

这就像拿体温计量血压——体温计本身没毛病,是你用错了场景。IQ测试本身没骗你,是你对”IQ = 聪明”这个等式的迷信骗了你自己。

回到开头那个清华硕士。他IQ测试只得了25分,但他正在用AI重新定义一个行业。如果你还在用一个数字来评判自己或别人”聪不聪明”,那被测试测出来的可能不是你的智力水平,而是你的认知局限。

真正的聪明从来不是测出来的,是活出来的。