让AI Agent背KPI，有人省了50%成本，有人多雇了20%的人

施耐德电气的供应链团队曾经有个噩梦级日常：每天几百条供应链异常告警，每条都要人工判断、分级、派单、跟进。一个异常从发现到处理完毕，平均48小时。两天。在供应链的世界里，两天够一批货从深圳烂在仓库里了。

后来他们上了AI Agent。不是那种花哨的聊天机器人，而是一个死死盯着ERP系统的”数字值班员”——告警进来，自动分类，自动匹配历史处理方案，自动派单，自动跟进。响应时间从48小时压到了15分钟。

同一时期，森马服饰把Agent塞进了库存管理。上千个SKU，每个SKU在不同区域、不同季节、不同渠道的销售节奏完全不同。以前靠人盯Excel表格，预测准确率也就那样。Agent接手后，库存预测准确率提升了30%，过季滞销库存减少了近四分之一——对服装行业来说，少压一批货就是少亏几百万。

听起来是不是很美好？再来看第三个案例。

钉钉把Agent塞进了企业审批流。想法很好——让Agent自动审批那些”显然应该通过”的申请，减少管理层的审批负担。结果呢？一个月下来，业务部门怨声载道：Agent把一堆该加急的申请按常规流程处理了，把几个需要特殊审批的项目直接放行了，甚至有个采购申请因为金额刚好卡在阈值边上，Agent反复在”通过”和”退回”之间来回弹。

最后钉钉不得不给Agent配了个”人类监工”，专门盯着它的审批结果做二次复核。本来是想省人力的，结果多花了20%的人力来”看管”这个不省心的新同事。

三个企业的Agent实战成绩单

所以，Agent到底能不能背KPI？

答案是：看你让它背的是什么KPI。

你以为的Agent vs 真实的Agent

大多数人一听”AI Agent”，脑子里蹦出来的画面是：一个特别聪明的客服机器人，能理解人话，能解决问题，说不定还能讲笑话。

错得离谱。

真正在企业里跑起来的Agent，干的根本不是聊天。它们干的是那些人类不愿意做、但又不得不做的脏活累活——扫描几千条告警日志找异常，在十几个系统之间搬运数据做对账，按照一本200页的规则手册逐条检查合规性，把散落在邮件、IM、工单系统里的信息汇总成一份报告。

这些活有什么共同点？规则明确，重复度高，容错空间大，但极其消耗人的时间和注意力。

换句话说，Agent干的不是”聪明人的活”，而是”聪明人不想干的活”。

搞清楚这一点，你就理解了为什么有的企业用Agent用得飞起，有的企业用Agent用成了灾难。

成功和翻车，差别就一个字：选

这里有一组对比很刺眼。企业部署AI Agent的ROI差异大到离谱。做对了的企业，流程成本砍掉30%到50%；做错了的，反而多花20%的人力来收拾Agent捅的娄子。

差别在哪？跟技术先不先进没关系，跟模型参数量没关系，跟砸了多少预算也没关系。就一个字：选。选对了场景，Agent如鱼得水；选错了，它就是个添乱的。

施耐德为什么成功？因为他们的供应链异常处理绝大多数是标准流程。告警来了→查历史→匹配方案→派单→跟进，每一步都有清晰的规则。Agent不需要”理解”供应链，它只需要比人更快地查表和派单。

森马为什么成功？因为库存预测本质上是个数学题。历史销售数据、季节因子、渠道权重、促销日历——全是结构化数据，全是可以量化的变量。Agent不需要”懂时尚”，它只需要比人更快地跑回归模型。

钉钉为什么翻车？因为审批决策有大量场景需要”看人下菜碟”——这个申请人上次承诺的交付日期兑现了吗？那个部门最近预算吃紧，这笔采购是不是可以缓缓？老板昨天刚发了邮件说要控制差旅支出，这个出差申请还批不批？

这些判断需要上下文、需要人际感知、需要”读空气”。Agent读不了空气，它连空气是什么都不知道。

一个好用的类比：机械臂和大厨

想理解Agent的能力边界，最好的类比不是”人工智能”，而是工厂里的机械臂。

机械臂最擅长什么？标准化动作的高速重复。拧螺丝、焊接点、搬箱子——给它一个明确的指令和固定的工位，它能7×24小时不停地干，不抱怨不请假不划水。速度是人的10倍，出错率是人的百分之一。

但你让机械臂去炒一盘回锅肉试试？

大厨炒菜靠的是什么？火候——这个不是温度计能量化的，是手掌悬在锅上方感受热浪的经验。调味——”盐少许”这个”少许”不是克数，是根据今天的肉质、湿度、甚至食客的口味偏好做的实时判断。翻勺的时机、出锅的瞬间——全是模糊决策，全是经验直觉。

Agent就是机械臂。它不是大厨。

回到企业场景：你的业务流程里，哪些环节是”拧螺丝”，哪些环节是”炒回锅肉”？前者交给Agent，后者留给人。就这么简单。

机械臂vs大厨：Agent的能力边界

三步判断你的业务适不适合上Agent

别急着找供应商，先花半天时间做这三步自检。

第一步：画出你团队耗时最多的前5个流程。 不是拍脑袋，是真的掐表计时。很多管理者以为”我们团队最耗时的是方案设计”，实际一统计，60%的时间花在了数据整理、报告汇总、跨系统对账这些事上。Agent的菜，恰恰是这些你觉得”不重要但很花时间”的活。

第二步：判断每个流程中”规则化操作”占多少比例。 如果一个流程70%以上的步骤都有明确的规则——”如果A则做B，如果C则做D”——那它就是Agent的菜。如果超过30%的步骤需要”具体情况具体分析”“这个得看是谁”“要考虑一下上下文”——那它就不是Agent的菜，至少现在不是。

第三步：评估出错成本。 出错了能轻松回滚的流程先上——比如数据报表生成错了，重跑一遍就行。出错了会丢客户的流程最后上——比如客户投诉处理，Agent要是给客户发了一封态度冰冷的模板回复，你这个客户就没了。

算笔账再决定。 把这个流程目前每月消耗的人力成本算出来（人数×工时×时薪），再估算Agent能替代多少比例的工时。一般来说，如果Agent能替代的工时价值超过部署和维护成本的2倍，这事儿就值得干。达不到2倍？先放放，等技术更成熟再说。

还有一条铁律：先让Agent当助手，不要一上来就让它当执行者。 什么意思？先让Agent做完一件事，人来复核确认，再放行。跑一个月，统计它的准确率和出错模式。等你摸清了它的脾气，知道它在什么地方会犯傻，再逐步放开权限让它自主执行。

这就跟带新人一样——你不会Day 1就把核心客户的项目交给一个刚入职的应届生吧？

三步判断你的业务适不适合上Agent

Agent能背的KPI，得是那种”不需要拍桌子”的KPI

回到开头的问题。

施耐德的Agent每天处理上千条供应链告警，从不抱怨加班，从不要求调薪，周末节假日照常在岗。它的KPI是”告警响应时间”和”处理完成率”——这些KPI不需要谈判，不需要协调，不需要拍桌子。

但你要是让同一个Agent去跟供应商谈判降价——它大概会直接同意对方的报价。因为”接受对方提出的条件”是最符合”快速达成一致”这条规则的做法。它不懂什么叫博弈，不懂什么叫”先压一压看对方底牌”，更不懂什么叫”这个供应商虽然贵但质量稳定，那个便宜但上次交期延了两周”。

Agent能背的KPI：响应速度、处理量、准确率、合规率——这些有明确计算公式、不需要主观判断的硬指标。

Agent背不了的KPI：客户满意度、谈判成效、创新产出、团队协作——这些需要情商、经验、直觉和”拍桌子”的软指标。

想清楚这一点，你就不会像钉钉那样翻车了。也不会像某些企业一样，花了几百万上了个Agent系统，最后发现还得雇人盯着它干活——等于花钱请了个需要保姆的保姆。

别让Agent去做它不擅长的事。让它拧螺丝，让人去炒回锅肉。各司其职，才是正经KPI。