被判了"死刑"的CPU,怎么突然又活了?
两年前,科技圈的共识是:CPU已死,AI时代只认GPU。
但你猜怎么着?2026年一季度,英特尔股价悄悄涨了40%,AMD的服务器芯片订单排到了下半年,Arm架构芯片出货量同比暴增。被判了”死刑”的CPU,集体”诈尸”了。
这剧本,比爽文还离谱。
90%的人搞混了一件事
聊AI算力的时候,大部分人脑子里只有一个画面:一排排英伟达GPU在机房里嗡嗡转,烧着天价电费训练大模型。这个画面没错,但它只是故事的一半。
AI计算其实分两件事——训练和推理。
训练,就是教AI学会本事,像让一个人从零开始读完十万本书。这活儿确实得靠GPU,没得商量。但推理呢?推理是AI学完之后干活的过程。你每天用ChatGPT聊天、让Copilot帮你写代码、刷短视频时被算法精准投喂——这些全是推理。
打个比方:训练像盖房子,需要重型起重机(GPU);推理像住房子,你只需要正常的水电煤(CPU就够了)。
问题是,盖房子只需要盖一次,住房子却是每天24小时。
据业内估算,全球AI算力中,推理占比已经超过60%,而且这个数字还在涨。越来越多的AI应用落地,意味着越来越多的推理请求。这时候还一股脑堆GPU,就像每天上班通勤非要叫直升机——不是不行,是账算不过来。
一笔让CFO心跳加速的账
说到算账,来看几个真实数字。
一块英伟达H100显卡,市场价大约25万人民币。这还是你能买到的情况——现实中排队半年是常态,加价30%也不稀奇。一台搭载8块H100的DGX服务器,落地价超过200万。
再看CPU这边。一台搭载英特尔第五代至强(Emerald Rapids)处理器的双路服务器,满配内存和存储,大概5-8万人民币,现货供应,下单就发。
“等等,”你可能会说,”GPU快啊,一块H100的AI算力顶几十块CPU。”
没错,论绝对速度,GPU碾压CPU,这不用争。但企业做决策从来不看谁跑得快,看的是每块钱能干多少活。
英特尔在第五代至强上加了个叫AMX(高级矩阵扩展)的加速模块,专门针对AI推理优化。实测下来,跑中小规模的推理任务——比如文本分类、意图识别、推荐排序这些占推理请求80%以上的日常活儿——至强的每美元推理吞吐量,已经能打平甚至超过A100。
注意,我说的是A100,不是H100。但A100单卡也要十几万人民币,是至强服务器整机价格的两三倍。
科技行业最残酷的真理不是”谁更强”,而是”谁更划算”。

GPU是高铁,CPU是私家车
为了把这事儿说透,用交通工具打个比方。
GPU像高铁。速度快,运力大,但造价贵、线路固定、发车时间不由你定。适合干嘛?适合长途、大批量、集中运输——对应的就是大模型训练,几千张卡一起上,跑几周甚至几个月。
CPU像私家车。速度一般,但便宜、灵活、随叫随到。车库里停着就行,想走就走,想停就停。对应的就是推理场景——请求来了就算,算完就闲着,负载忽高忽低。
两年前,AI还在”修高铁”的阶段。各大公司疯狂采购GPU建算力集群,训练自己的大模型。那时候说”CPU已死”,逻辑上没毛病。
但现在,高铁修得差不多了。AI的战场从”谁的模型更大”变成了”谁的应用落地更快”。企业需要的不再是少数几列高铁,而是千千万万辆出租车——7x24小时跑在城市的每个角落,随时响应用户请求。
当需求从”干线运输”变成”城市通勤”,私家车的时代就到了。
这也解释了为什么不只是英特尔在笑。AMD的EPYC处理器在云服务器市场份额突破30%,微软Azure和亚马逊AWS都在大规模部署。Arm架构更是杀出一匹黑马——AWS自研的Graviton芯片、微软的Cobalt芯片,都是Arm架构,专门为云端推理场景设计,能效比GPU方案高出一大截。
三条技术路线同时起势,说明这不是某一家的运气,而是整个市场在用脚投票。
异构计算:不是二选一,是排列组合
说到这儿,得补一句:我不是在说”GPU要完了”。说这话的人和两年前说”CPU已死”的人犯的是同一个错误——把复杂问题简单化。
真实的趋势是异构计算——不同类型的芯片各干各的活。
训练大模型?上GPU,甚至上英伟达最新的B200。跑日常推理?CPU完全够用,成本还低。对延迟要求极高的推理任务?可以上专用ASIC芯片,比如谷歌的TPU。边缘设备上的轻量推理?NPU(神经网络处理器)已经塞进了你的手机和笔记本里。
未来的AI基础设施,不是某一种芯片包打天下,而是一个精心编排的交响乐团——每种乐器都有自己的声部。
过去两年,市场犯了一个经典错误:把”训练时代的GPU崇拜”直接平移到了”推理时代”。就像因为高铁好用,就把所有公路都拆了修铁轨。
对你来说意味着什么
聊了这么多宏观的,落到个人头上。
如果你是技术决策者:别再盲目堆GPU了。先盘一下你的AI工作负载——训练和推理各占多少?批量推理还是实时推理?模型多大?很多时候,一台至强服务器能干的活,你正在用一块两万美元的GPU在干。把省下来的钱招两个工程师,投资回报率高得多。
如果你是开发者:关注CPU推理优化这个方向。ONNX Runtime、OpenVINO、llama.cpp这些框架和工具,专门做CPU上的模型推理加速。现在会这些的人不多,但需求在快速增长。两年前学CUDA是风口,现在学CPU推理优化同样是被低估的技能点。
如果你关注科技投资:AI算力的故事远不只有英伟达一个主角。英特尔、AMD、Arm、以及做ASIC的公司(比如博通、Marvell),都在这场算力重新分配中拿到了新剧本。当一个行业的供应链开始多元化,往往意味着更健康、更持久的增长。
能在风口起飞的是少数,能在风停之后还站着的才是赢家。
最后说回开头
回到开头那个问题:被判了”死刑”的CPU,怎么突然又活了?
答案一点都不戏剧性。那些说”CPU已死”的人忘了一件事——科技行业从来没有永远的王者,只有永远的性价比。
GPU确实伟大,英伟达确实强悍。但当一块GPU贵到企业的CFO开始失眠,当排队半年才能拿到货,当60%的AI计算其实不需要那么猛的算力——”诈尸”的CPU只不过做了一件事:
在对的时间,出现在对的价格上。
就像出租车永远不会取代高铁,但高铁也永远不会取代出租车。AI算力的世界,终于从”唯GPU论”走向了”谁合适用谁”。
这不是CPU的逆袭,这是常识的回归。