OpenAI雇了一个哲学博士。

不是去研究大模型架构,不是去优化训练效率——而是去决定一件事:ChatGPT该不该告诉你怎么做炸弹。

与此同时,Anthropic请了一个有牧师背景的人来定义Claude的”性格”。对,你没看错,一个AI的性格,不是由工程师调参数调出来的,而是由一个研究过神学的人坐下来写出来的。

更离谱的是DeepMind。一个资深工程师辞职了,理由不是薪水低、不是被PUA,而是他觉得”AI需要的不是更多算力,而是一首好诗”。

这三个人有什么共同点?他们没写过一行训练代码,但他们可能是整个AI行业最重要的人。

最大的问题不是”够不够聪明”

你跟朋友聊AI,十有八九会聊到”GPT-5会不会更聪明”“Claude下一代推理能力怎么样”。好像AI的核心挑战还是智力问题。

但圈内人早就不这么看了。

AI已经够聪明了。GPT-4能通过律师资格考试,Claude能写出比大多数程序员更好的代码,Gemini能理解你发的表情包。智力问题?基本解决了。

现在真正让所有人睡不着觉的问题是另一个:它该聪明成什么样子?

你问AI”怎么说服一个人”,它该教你真诚沟通还是教你PUA话术?你问AI”怎么看安乐死”,它该给一个标准答案还是说”这个问题我不方便回答”?

没有标准答案。但总得有人来选。

关键是——这些选择没法靠技术解决。你堆再多GPU、喂再多数据,也”算”不出一个正确答案。这是哲学问题。是伦理问题。是价值观问题。

干这活的人有多少?说出来你可能不信——全球不到2000人。 他们管这个领域叫”AI对齐”(AI Alignment)——让AI的行为和人类的价值观”对齐”。

你以为你在跟机器说话,其实你在跟一个哲学系毕业生的世界观说话

这是整件事里最魔幻的部分。

当你打开ChatGPT问一个道德困境——比如”电车难题”,你以为它在”计算”一个答案。不是的。它给你的回答,本质上是一群人文学科背景的研究者事先写好的”宪法”决定的。

Anthropic发明了一个方法叫Constitutional AI。简单说,就是他们先写了一份”AI宪法”——一堆原则,比如”要诚实”“要避免伤害”“要尊重用户自主权”——然后用这份宪法来训练AI。AI的每一次回答,都在这份宪法的框架里运行。

你以为你在跟一台机器对话,其实你在跟一个哲学系毕业生的世界观对话。

这份”宪法”谁来写?不是CEO,不是CTO,是一群你从来没听过名字的人——伦理学研究者、哲学博士、社会科学家。他们在办公室里开会讨论”AI在面对种族议题时应该持什么立场”,然后把结论写进一份文档,这份文档最终变成了你的AI助手的”三观”。

这群人的决定,影响着几十亿用户每天和AI的每一次对话。你和AI的每一次交流,背后都有他们的影子。

这事可以这么理解——AI对齐就是给电影分级

你看电影之前会注意分级吗?PG-13、R级——这些标签不是导演自己贴的,是一个专门的分级委员会定的。导演觉得自己的暴力场面是”艺术表达”,分级委员会觉得这玩意儿不能给13岁以下的孩子看。两方博弈,最终有个结果。

AI对齐干的就是这个活。工程师是导演,对齐研究者是分级委员会。

没有分级制度会怎样?两种极端。

第一种:所有电影都变成儿童片。AI过度审查,你问它一个正常的医学问题它告诉你”抱歉,这个话题可能涉及敏感内容”。你让它写一段小说里的冲突场景,它给你写成了幼儿园故事会。这种AI安全是安全了,但也废了。

第二种:完全不设限。AI变成一个什么都肯说、什么都肯教的危险工具。怎么做武器、怎么操纵别人、怎么绕过法律——你问什么它答什么。这种AI聪明是聪明了,但聪明到吓人。

现在的AI对齐研究者就是在这两个极端之间找平衡点。问题是:

这个”分级委员会”人太少了。 一间会议室就能坐下的人数,给全球几十亿用户的AI体验定规矩。

标准不统一。 OpenAI、Anthropic、Google各有各的”宪法”,各有各的红线。同一个问题,ChatGPT愿意回答但Claude拒绝——不是因为技术差异,而是因为背后两组不同的人对”什么是安全”有不同的理解。

而且说句不好听的——这些标准大部分反映的是美国人的价值观。 一个在旧金山办公室里的哲学博士,他对”什么内容是有害的”的判断,真的能代表东京、新德里、圣保罗的用户吗?

中国的AI公司在这方面更是一片空白。看看虎嗅最近的报道——阿里未来三年投3800亿做AI基础设施,腾讯混元大模型一年投180亿还要翻倍,AI方向招聘需求是去年的3倍。但所有这些钱,几乎全部砸在算力和模型能力上。有多少花在了”这个AI该有什么价值观”上?我没查到。大概是因为数字小到不好意思公布。

AI的两种极端:没有"分级制度"会怎样?

AI对齐 = 给电影分级:Constitutional AI

跟你有什么关系?关系大了

你可能觉得这些都是硅谷的事。但你每天都在用AI。

所以有一件事你必须搞清楚:你的AI助手不是”客观工具”。 它有价值观,有立场,有些话题它愿意聊,有些它打死不说。这些不是bug,不是技术限制——是有人替你做了选择。

下次ChatGPT拒绝回答你的问题,别只骂一句”AI真笨”。停下来想一秒:是谁决定了它该拒绝?这个人的价值观和你的一样吗?

如果你是技术从业者,这里还有一个更实际的信息:AI对齐可能是未来5年最缺人的方向。 这么少的人扛这么大的事,比例严重失调,迟早要扩大。

而且入场门槛跟你想的不一样。不需要你会写模型。需要的是你能思考”什么是对的”“什么是有害的”“不同文化的人怎么看同一个问题”。学哲学的、学社会学的、学法律的,在这个领域反而是稀缺资源。

硅谷的AI公司已经在疯抢这类人了。一个伦理学博士的薪水可能比大多数工程师还高——工程师能找到替代,但能给AI写”宪法”的人,全世界数得过来。

懂算法的人已经够多了

回到开头那个辞职写诗的工程师。

他可能比大多数人都清醒。AI已经能写出比大多数人更好的代码,画出比大多数人更好的画,甚至能模拟比大多数人更”有趣”的对话。写代码、画画、聊天——这些技能的稀缺性在暴跌。

但有一种能力在暴涨:决定AI”该不该做这件事”。

不是”能不能做”。是”该不该做”。

前者是工程问题,后者是灵魂问题。

最聪明的模型已经造出来了。现在缺的是给它灵魂的人。这些人不需要懂算法——他们需要懂人。

AI时代,什么能力在涨?什么在跌?