被判了”死刑”的CPU，怎么突然又活了？

两年前，科技圈的共识是：CPU已死，AI时代只认GPU。

但你猜怎么着？2026年一季度，英特尔股价悄悄涨了40%，AMD的服务器芯片订单排到了下半年，Arm架构芯片出货量同比暴增。被判了”死刑”的CPU，集体”诈尸”了。

这剧本，比爽文还离谱。

90%的人搞混了一件事

聊AI算力的时候，大部分人脑子里只有一个画面：一排排英伟达GPU在机房里嗡嗡转，烧着天价电费训练大模型。这个画面没错，但它只是故事的一半。

AI计算其实分两件事——训练和推理。

训练，就是教AI学会本事，像让一个人从零开始读完十万本书。这活儿确实得靠GPU，没得商量。但推理呢？推理是AI学完之后干活的过程。你每天用ChatGPT聊天、让Copilot帮你写代码、刷短视频时被算法精准投喂——这些全是推理。

打个比方：训练像盖房子，需要重型起重机（GPU）；推理像住房子，你只需要正常的水电煤（CPU就够了）。

问题是，盖房子只需要盖一次，住房子却是每天24小时。

据业内估算，全球AI算力中，推理占比已经超过60%，而且这个数字还在涨。越来越多的AI应用落地，意味着越来越多的推理请求。这时候还一股脑堆GPU，就像每天上班通勤非要叫直升机——不是不行，是账算不过来。

说到算账，来看几个真实数字。

一块英伟达H100显卡，市场价大约25万人民币。这还是你能买到的情况——现实中排队半年是常态，加价30%也不稀奇。一台搭载8块H100的DGX服务器，落地价超过200万。

再看CPU这边。一台搭载英特尔第五代至强（Emerald Rapids）处理器的双路服务器，满配内存和存储，大概5-8万人民币，现货供应，下单就发。

“等等，”你可能会说，”GPU快啊，一块H100的AI算力顶几十块CPU。”

没错，论绝对速度，GPU碾压CPU，这不用争。但企业做决策从来不看谁跑得快，看的是每块钱能干多少活。

英特尔在第五代至强上加了个叫AMX（高级矩阵扩展）的加速模块，专门针对AI推理优化。实测下来，跑中小规模的推理任务——比如文本分类、意图识别、推荐排序这些占推理请求80%以上的日常活儿——至强的每美元推理吞吐量，已经能打平甚至超过A100。

注意，我说的是A100，不是H100。但A100单卡也要十几万人民币，是至强服务器整机价格的两三倍。

科技行业最残酷的真理不是”谁更强”，而是”谁更划算”。

AI推理的经济账：GPU vs CPU

为了把这事儿说透，用交通工具打个比方。

GPU像高铁。速度快，运力大，但造价贵、线路固定、发车时间不由你定。适合干嘛？适合长途、大批量、集中运输——对应的就是大模型训练，几千张卡一起上，跑几周甚至几个月。

CPU像私家车。速度一般，但便宜、灵活、随叫随到。车库里停着就行，想走就走，想停就停。对应的就是推理场景——请求来了就算，算完就闲着，负载忽高忽低。

两年前，AI还在”修高铁”的阶段。各大公司疯狂采购GPU建算力集群，训练自己的大模型。那时候说”CPU已死”，逻辑上没毛病。

但现在，高铁修得差不多了。AI的战场从”谁的模型更大”变成了”谁的应用落地更快”。企业需要的不再是少数几列高铁，而是千千万万辆出租车——7x24小时跑在城市的每个角落，随时响应用户请求。

当需求从”干线运输”变成”城市通勤”，私家车的时代就到了。

这也解释了为什么不只是英特尔在笑。AMD的EPYC处理器在云服务器市场份额突破30%，微软Azure和亚马逊AWS都在大规模部署。Arm架构更是杀出一匹黑马——AWS自研的Graviton芯片、微软的Cobalt芯片，都是Arm架构，专门为云端推理场景设计，能效比GPU方案高出一大截。

三条技术路线同时起势，说明这不是某一家的运气，而是整个市场在用脚投票。

说到这儿，得补一句：我不是在说”GPU要完了”。说这话的人和两年前说”CPU已死”的人犯的是同一个错误——把复杂问题简单化。

真实的趋势是异构计算——不同类型的芯片各干各的活。

训练大模型？上GPU，甚至上英伟达最新的B200。跑日常推理？CPU完全够用，成本还低。对延迟要求极高的推理任务？可以上专用ASIC芯片，比如谷歌的TPU。边缘设备上的轻量推理？NPU（神经网络处理器）已经塞进了你的手机和笔记本里。

未来的AI基础设施，不是某一种芯片包打天下，而是一个精心编排的交响乐团——每种乐器都有自己的声部。

过去两年，市场犯了一个经典错误：把”训练时代的GPU崇拜”直接平移到了”推理时代”。就像因为高铁好用，就把所有公路都拆了修铁轨。

聊了这么多宏观的，落到个人头上。

如果你是技术决策者：别再盲目堆GPU了。先盘一下你的AI工作负载——训练和推理各占多少？批量推理还是实时推理？模型多大？很多时候，一台至强服务器能干的活，你正在用一块两万美元的GPU在干。把省下来的钱招两个工程师，投资回报率高得多。

如果你是开发者：关注CPU推理优化这个方向。ONNX Runtime、OpenVINO、llama.cpp这些框架和工具，专门做CPU上的模型推理加速。现在会这些的人不多，但需求在快速增长。两年前学CUDA是风口，现在学CPU推理优化同样是被低估的技能点。

如果你关注科技投资：AI算力的故事远不只有英伟达一个主角。英特尔、AMD、Arm、以及做ASIC的公司（比如博通、Marvell），都在这场算力重新分配中拿到了新剧本。当一个行业的供应链开始多元化，往往意味着更健康、更持久的增长。

能在风口起飞的是少数，能在风停之后还站着的才是赢家。

回到开头那个问题：被判了”死刑”的CPU，怎么突然又活了？

答案一点都不戏剧性。那些说”CPU已死”的人忘了一件事——科技行业从来没有永远的王者，只有永远的性价比。

GPU确实伟大，英伟达确实强悍。但当一块GPU贵到企业的CFO开始失眠，当排队半年才能拿到货，当60%的AI计算其实不需要那么猛的算力——”诈尸”的CPU只不过做了一件事：

在对的时间，出现在对的价格上。

就像出租车永远不会取代高铁，但高铁也永远不会取代出租车。AI算力的世界，终于从”唯GPU论”走向了”谁合适用谁”。

这不是CPU的逆袭，这是常识的回归。