给AI造灵魂的人，一行代码都不会写

OpenAI雇了一个哲学博士。

不是去研究大模型架构，不是去优化训练效率——而是去决定一件事：ChatGPT该不该告诉你怎么做炸弹。

与此同时，Anthropic请了一个有牧师背景的人来定义Claude的”性格”。对，你没看错，一个AI的性格，不是由工程师调参数调出来的，而是由一个研究过神学的人坐下来写出来的。

更离谱的是DeepMind。一个资深工程师辞职了，理由不是薪水低、不是被PUA，而是他觉得”AI需要的不是更多算力，而是一首好诗”。

这三个人有什么共同点？他们没写过一行训练代码，但他们可能是整个AI行业最重要的人。

最大的问题不是”够不够聪明”

你跟朋友聊AI，十有八九会聊到”GPT-5会不会更聪明”“Claude下一代推理能力怎么样”。好像AI的核心挑战还是智力问题。

但圈内人早就不这么看了。

AI已经够聪明了。GPT-4能通过律师资格考试，Claude能写出比大多数程序员更好的代码，Gemini能理解你发的表情包。智力问题？基本解决了。

现在真正让所有人睡不着觉的问题是另一个：它该聪明成什么样子？

你问AI”怎么说服一个人”，它该教你真诚沟通还是教你PUA话术？你问AI”怎么看安乐死”，它该给一个标准答案还是说”这个问题我不方便回答”？

没有标准答案。但总得有人来选。

关键是——这些选择没法靠技术解决。你堆再多GPU、喂再多数据，也”算”不出一个正确答案。这是哲学问题。是伦理问题。是价值观问题。

干这活的人有多少？说出来你可能不信——全球不到2000人。 他们管这个领域叫”AI对齐”（AI Alignment）——让AI的行为和人类的价值观”对齐”。

你以为你在跟机器说话，其实你在跟一个哲学系毕业生的世界观说话

这是整件事里最魔幻的部分。

当你打开ChatGPT问一个道德困境——比如”电车难题”，你以为它在”计算”一个答案。不是的。它给你的回答，本质上是一群人文学科背景的研究者事先写好的”宪法”决定的。

Anthropic发明了一个方法叫Constitutional AI。简单说，就是他们先写了一份”AI宪法”——一堆原则，比如”要诚实”“要避免伤害”“要尊重用户自主权”——然后用这份宪法来训练AI。AI的每一次回答，都在这份宪法的框架里运行。

你以为你在跟一台机器对话，其实你在跟一个哲学系毕业生的世界观对话。

这份”宪法”谁来写？不是CEO，不是CTO，是一群你从来没听过名字的人——伦理学研究者、哲学博士、社会科学家。他们在办公室里开会讨论”AI在面对种族议题时应该持什么立场”，然后把结论写进一份文档，这份文档最终变成了你的AI助手的”三观”。

这群人的决定，影响着几十亿用户每天和AI的每一次对话。你和AI的每一次交流，背后都有他们的影子。

这事可以这么理解——AI对齐就是给电影分级

你看电影之前会注意分级吗？PG-13、R级——这些标签不是导演自己贴的，是一个专门的分级委员会定的。导演觉得自己的暴力场面是”艺术表达”，分级委员会觉得这玩意儿不能给13岁以下的孩子看。两方博弈，最终有个结果。

AI对齐干的就是这个活。工程师是导演，对齐研究者是分级委员会。

没有分级制度会怎样？两种极端。

第一种：所有电影都变成儿童片。AI过度审查，你问它一个正常的医学问题它告诉你”抱歉，这个话题可能涉及敏感内容”。你让它写一段小说里的冲突场景，它给你写成了幼儿园故事会。这种AI安全是安全了，但也废了。

第二种：完全不设限。AI变成一个什么都肯说、什么都肯教的危险工具。怎么做武器、怎么操纵别人、怎么绕过法律——你问什么它答什么。这种AI聪明是聪明了，但聪明到吓人。

现在的AI对齐研究者就是在这两个极端之间找平衡点。问题是：

这个”分级委员会”人太少了。 一间会议室就能坐下的人数，给全球几十亿用户的AI体验定规矩。

标准不统一。 OpenAI、Anthropic、Google各有各的”宪法”，各有各的红线。同一个问题，ChatGPT愿意回答但Claude拒绝——不是因为技术差异，而是因为背后两组不同的人对”什么是安全”有不同的理解。

而且说句不好听的——这些标准大部分反映的是美国人的价值观。 一个在旧金山办公室里的哲学博士，他对”什么内容是有害的”的判断，真的能代表东京、新德里、圣保罗的用户吗？

中国的AI公司在这方面更是一片空白。看看虎嗅最近的报道——阿里未来三年投3800亿做AI基础设施，腾讯混元大模型一年投180亿还要翻倍，AI方向招聘需求是去年的3倍。但所有这些钱，几乎全部砸在算力和模型能力上。有多少花在了”这个AI该有什么价值观”上？我没查到。大概是因为数字小到不好意思公布。

AI的两种极端：没有"分级制度"会怎样？

AI对齐 = 给电影分级：Constitutional AI

跟你有什么关系？关系大了

你可能觉得这些都是硅谷的事。但你每天都在用AI。

所以有一件事你必须搞清楚：你的AI助手不是”客观工具”。 它有价值观，有立场，有些话题它愿意聊，有些它打死不说。这些不是bug，不是技术限制——是有人替你做了选择。

下次ChatGPT拒绝回答你的问题，别只骂一句”AI真笨”。停下来想一秒：是谁决定了它该拒绝？这个人的价值观和你的一样吗？

如果你是技术从业者，这里还有一个更实际的信息：AI对齐可能是未来5年最缺人的方向。 这么少的人扛这么大的事，比例严重失调，迟早要扩大。

而且入场门槛跟你想的不一样。不需要你会写模型。需要的是你能思考”什么是对的”“什么是有害的”“不同文化的人怎么看同一个问题”。学哲学的、学社会学的、学法律的，在这个领域反而是稀缺资源。

硅谷的AI公司已经在疯抢这类人了。一个伦理学博士的薪水可能比大多数工程师还高——工程师能找到替代，但能给AI写”宪法”的人，全世界数得过来。

懂算法的人已经够多了

回到开头那个辞职写诗的工程师。

他可能比大多数人都清醒。AI已经能写出比大多数人更好的代码，画出比大多数人更好的画，甚至能模拟比大多数人更”有趣”的对话。写代码、画画、聊天——这些技能的稀缺性在暴跌。

但有一种能力在暴涨：决定AI”该不该做这件事”。

不是”能不能做”。是”该不该做”。

前者是工程问题，后者是灵魂问题。

最聪明的模型已经造出来了。现在缺的是给它灵魂的人。这些人不需要懂算法——他们需要懂人。

AI时代，什么能力在涨？什么在跌？