两年前,科技圈的共识是:CPU已死,AI时代只认GPU。

但你猜怎么着?2026年一季度,英特尔股价悄悄涨了40%,AMD的服务器芯片订单排到了下半年,Arm架构芯片出货量同比暴增。被判了”死刑”的CPU,集体”诈尸”了。

这剧本,比爽文还离谱。

90%的人搞混了一件事

聊AI算力的时候,大部分人脑子里只有一个画面:一排排英伟达GPU在机房里嗡嗡转,烧着天价电费训练大模型。这个画面没错,但它只是故事的一半。

AI计算其实分两件事——训练推理

训练,就是教AI学会本事,像让一个人从零开始读完十万本书。这活儿确实得靠GPU,没得商量。但推理呢?推理是AI学完之后干活的过程。你每天用ChatGPT聊天、让Copilot帮你写代码、刷短视频时被算法精准投喂——这些全是推理。

打个比方:训练像盖房子,需要重型起重机(GPU);推理像住房子,你只需要正常的水电煤(CPU就够了)。

问题是,盖房子只需要盖一次,住房子却是每天24小时。

据业内估算,全球AI算力中,推理占比已经超过60%,而且这个数字还在涨。越来越多的AI应用落地,意味着越来越多的推理请求。这时候还一股脑堆GPU,就像每天上班通勤非要叫直升机——不是不行,是账算不过来。

一笔让CFO心跳加速的账

说到算账,来看几个真实数字。

一块英伟达H100显卡,市场价大约25万人民币。这还是你能买到的情况——现实中排队半年是常态,加价30%也不稀奇。一台搭载8块H100的DGX服务器,落地价超过200万。

再看CPU这边。一台搭载英特尔第五代至强(Emerald Rapids)处理器的双路服务器,满配内存和存储,大概5-8万人民币,现货供应,下单就发。

“等等,”你可能会说,”GPU快啊,一块H100的AI算力顶几十块CPU。”

没错,论绝对速度,GPU碾压CPU,这不用争。但企业做决策从来不看谁跑得快,看的是每块钱能干多少活

英特尔在第五代至强上加了个叫AMX(高级矩阵扩展)的加速模块,专门针对AI推理优化。实测下来,跑中小规模的推理任务——比如文本分类、意图识别、推荐排序这些占推理请求80%以上的日常活儿——至强的每美元推理吞吐量,已经能打平甚至超过A100。

注意,我说的是A100,不是H100。但A100单卡也要十几万人民币,是至强服务器整机价格的两三倍。

科技行业最残酷的真理不是”谁更强”,而是”谁更划算”。

AI推理的经济账:GPU vs CPU

GPU是高铁,CPU是私家车

为了把这事儿说透,用交通工具打个比方。

GPU像高铁。速度快,运力大,但造价贵、线路固定、发车时间不由你定。适合干嘛?适合长途、大批量、集中运输——对应的就是大模型训练,几千张卡一起上,跑几周甚至几个月。

CPU像私家车。速度一般,但便宜、灵活、随叫随到。车库里停着就行,想走就走,想停就停。对应的就是推理场景——请求来了就算,算完就闲着,负载忽高忽低。

两年前,AI还在”修高铁”的阶段。各大公司疯狂采购GPU建算力集群,训练自己的大模型。那时候说”CPU已死”,逻辑上没毛病。

但现在,高铁修得差不多了。AI的战场从”谁的模型更大”变成了”谁的应用落地更快”。企业需要的不再是少数几列高铁,而是千千万万辆出租车——7x24小时跑在城市的每个角落,随时响应用户请求。

当需求从”干线运输”变成”城市通勤”,私家车的时代就到了。

这也解释了为什么不只是英特尔在笑。AMD的EPYC处理器在云服务器市场份额突破30%,微软Azure和亚马逊AWS都在大规模部署。Arm架构更是杀出一匹黑马——AWS自研的Graviton芯片、微软的Cobalt芯片,都是Arm架构,专门为云端推理场景设计,能效比GPU方案高出一大截。

三条技术路线同时起势,说明这不是某一家的运气,而是整个市场在用脚投票。

异构计算:不是二选一,是排列组合

说到这儿,得补一句:我不是在说”GPU要完了”。说这话的人和两年前说”CPU已死”的人犯的是同一个错误——把复杂问题简单化。

真实的趋势是异构计算——不同类型的芯片各干各的活。

训练大模型?上GPU,甚至上英伟达最新的B200。跑日常推理?CPU完全够用,成本还低。对延迟要求极高的推理任务?可以上专用ASIC芯片,比如谷歌的TPU。边缘设备上的轻量推理?NPU(神经网络处理器)已经塞进了你的手机和笔记本里。

未来的AI基础设施,不是某一种芯片包打天下,而是一个精心编排的交响乐团——每种乐器都有自己的声部。

过去两年,市场犯了一个经典错误:把”训练时代的GPU崇拜”直接平移到了”推理时代”。就像因为高铁好用,就把所有公路都拆了修铁轨。

对你来说意味着什么

聊了这么多宏观的,落到个人头上。

如果你是技术决策者:别再盲目堆GPU了。先盘一下你的AI工作负载——训练和推理各占多少?批量推理还是实时推理?模型多大?很多时候,一台至强服务器能干的活,你正在用一块两万美元的GPU在干。把省下来的钱招两个工程师,投资回报率高得多。

如果你是开发者:关注CPU推理优化这个方向。ONNX Runtime、OpenVINO、llama.cpp这些框架和工具,专门做CPU上的模型推理加速。现在会这些的人不多,但需求在快速增长。两年前学CUDA是风口,现在学CPU推理优化同样是被低估的技能点。

如果你关注科技投资:AI算力的故事远不只有英伟达一个主角。英特尔、AMD、Arm、以及做ASIC的公司(比如博通、Marvell),都在这场算力重新分配中拿到了新剧本。当一个行业的供应链开始多元化,往往意味着更健康、更持久的增长。

能在风口起飞的是少数,能在风停之后还站着的才是赢家。

最后说回开头

回到开头那个问题:被判了”死刑”的CPU,怎么突然又活了?

答案一点都不戏剧性。那些说”CPU已死”的人忘了一件事——科技行业从来没有永远的王者,只有永远的性价比。

GPU确实伟大,英伟达确实强悍。但当一块GPU贵到企业的CFO开始失眠,当排队半年才能拿到货,当60%的AI计算其实不需要那么猛的算力——”诈尸”的CPU只不过做了一件事:

在对的时间,出现在对的价格上。

就像出租车永远不会取代高铁,但高铁也永远不会取代出租车。AI算力的世界,终于从”唯GPU论”走向了”谁合适用谁”。

这不是CPU的逆袭,这是常识的回归。