施耐德电气的供应链团队曾经有个噩梦级日常:每天几百条供应链异常告警,每条都要人工判断、分级、派单、跟进。一个异常从发现到处理完毕,平均48小时。两天。在供应链的世界里,两天够一批货从深圳烂在仓库里了。

后来他们上了AI Agent。不是那种花哨的聊天机器人,而是一个死死盯着ERP系统的”数字值班员”——告警进来,自动分类,自动匹配历史处理方案,自动派单,自动跟进。响应时间从48小时压到了15分钟。

同一时期,森马服饰把Agent塞进了库存管理。上千个SKU,每个SKU在不同区域、不同季节、不同渠道的销售节奏完全不同。以前靠人盯Excel表格,预测准确率也就那样。Agent接手后,库存预测准确率提升了30%,过季滞销库存减少了近四分之一——对服装行业来说,少压一批货就是少亏几百万。

听起来是不是很美好?再来看第三个案例。

钉钉把Agent塞进了企业审批流。想法很好——让Agent自动审批那些”显然应该通过”的申请,减少管理层的审批负担。结果呢?一个月下来,业务部门怨声载道:Agent把一堆该加急的申请按常规流程处理了,把几个需要特殊审批的项目直接放行了,甚至有个采购申请因为金额刚好卡在阈值边上,Agent反复在”通过”和”退回”之间来回弹。

最后钉钉不得不给Agent配了个”人类监工”,专门盯着它的审批结果做二次复核。本来是想省人力的,结果多花了20%的人力来”看管”这个不省心的新同事。

三个企业的Agent实战成绩单

所以,Agent到底能不能背KPI?

答案是:看你让它背的是什么KPI。

你以为的Agent vs 真实的Agent

大多数人一听”AI Agent”,脑子里蹦出来的画面是:一个特别聪明的客服机器人,能理解人话,能解决问题,说不定还能讲笑话。

错得离谱。

真正在企业里跑起来的Agent,干的根本不是聊天。它们干的是那些人类不愿意做、但又不得不做的脏活累活——扫描几千条告警日志找异常,在十几个系统之间搬运数据做对账,按照一本200页的规则手册逐条检查合规性,把散落在邮件、IM、工单系统里的信息汇总成一份报告。

这些活有什么共同点?规则明确,重复度高,容错空间大,但极其消耗人的时间和注意力。

换句话说,Agent干的不是”聪明人的活”,而是”聪明人不想干的活”。

搞清楚这一点,你就理解了为什么有的企业用Agent用得飞起,有的企业用Agent用成了灾难。

成功和翻车,差别就一个字:选

这里有一组对比很刺眼。企业部署AI Agent的ROI差异大到离谱。做对了的企业,流程成本砍掉30%到50%;做错了的,反而多花20%的人力来收拾Agent捅的娄子。

差别在哪?跟技术先不先进没关系,跟模型参数量没关系,跟砸了多少预算也没关系。就一个字:选。选对了场景,Agent如鱼得水;选错了,它就是个添乱的。

施耐德为什么成功?因为他们的供应链异常处理绝大多数是标准流程。告警来了→查历史→匹配方案→派单→跟进,每一步都有清晰的规则。Agent不需要”理解”供应链,它只需要比人更快地查表和派单。

森马为什么成功?因为库存预测本质上是个数学题。历史销售数据、季节因子、渠道权重、促销日历——全是结构化数据,全是可以量化的变量。Agent不需要”懂时尚”,它只需要比人更快地跑回归模型。

钉钉为什么翻车?因为审批决策有大量场景需要”看人下菜碟”——这个申请人上次承诺的交付日期兑现了吗?那个部门最近预算吃紧,这笔采购是不是可以缓缓?老板昨天刚发了邮件说要控制差旅支出,这个出差申请还批不批?

这些判断需要上下文、需要人际感知、需要”读空气”。Agent读不了空气,它连空气是什么都不知道。

一个好用的类比:机械臂和大厨

想理解Agent的能力边界,最好的类比不是”人工智能”,而是工厂里的机械臂。

机械臂最擅长什么?标准化动作的高速重复。拧螺丝、焊接点、搬箱子——给它一个明确的指令和固定的工位,它能7×24小时不停地干,不抱怨不请假不划水。速度是人的10倍,出错率是人的百分之一。

但你让机械臂去炒一盘回锅肉试试?

大厨炒菜靠的是什么?火候——这个不是温度计能量化的,是手掌悬在锅上方感受热浪的经验。调味——”盐少许”这个”少许”不是克数,是根据今天的肉质、湿度、甚至食客的口味偏好做的实时判断。翻勺的时机、出锅的瞬间——全是模糊决策,全是经验直觉。

Agent就是机械臂。它不是大厨。

回到企业场景:你的业务流程里,哪些环节是”拧螺丝”,哪些环节是”炒回锅肉”?前者交给Agent,后者留给人。就这么简单。

机械臂vs大厨:Agent的能力边界

三步判断你的业务适不适合上Agent

别急着找供应商,先花半天时间做这三步自检。

第一步:画出你团队耗时最多的前5个流程。 不是拍脑袋,是真的掐表计时。很多管理者以为”我们团队最耗时的是方案设计”,实际一统计,60%的时间花在了数据整理、报告汇总、跨系统对账这些事上。Agent的菜,恰恰是这些你觉得”不重要但很花时间”的活。

第二步:判断每个流程中”规则化操作”占多少比例。 如果一个流程70%以上的步骤都有明确的规则——”如果A则做B,如果C则做D”——那它就是Agent的菜。如果超过30%的步骤需要”具体情况具体分析”“这个得看是谁”“要考虑一下上下文”——那它就不是Agent的菜,至少现在不是。

第三步:评估出错成本。 出错了能轻松回滚的流程先上——比如数据报表生成错了,重跑一遍就行。出错了会丢客户的流程最后上——比如客户投诉处理,Agent要是给客户发了一封态度冰冷的模板回复,你这个客户就没了。

算笔账再决定。 把这个流程目前每月消耗的人力成本算出来(人数×工时×时薪),再估算Agent能替代多少比例的工时。一般来说,如果Agent能替代的工时价值超过部署和维护成本的2倍,这事儿就值得干。达不到2倍?先放放,等技术更成熟再说。

还有一条铁律:先让Agent当助手,不要一上来就让它当执行者。 什么意思?先让Agent做完一件事,人来复核确认,再放行。跑一个月,统计它的准确率和出错模式。等你摸清了它的脾气,知道它在什么地方会犯傻,再逐步放开权限让它自主执行。

这就跟带新人一样——你不会Day 1就把核心客户的项目交给一个刚入职的应届生吧?

三步判断你的业务适不适合上Agent

Agent能背的KPI,得是那种”不需要拍桌子”的KPI

回到开头的问题。

施耐德的Agent每天处理上千条供应链告警,从不抱怨加班,从不要求调薪,周末节假日照常在岗。它的KPI是”告警响应时间”和”处理完成率”——这些KPI不需要谈判,不需要协调,不需要拍桌子。

但你要是让同一个Agent去跟供应商谈判降价——它大概会直接同意对方的报价。因为”接受对方提出的条件”是最符合”快速达成一致”这条规则的做法。它不懂什么叫博弈,不懂什么叫”先压一压看对方底牌”,更不懂什么叫”这个供应商虽然贵但质量稳定,那个便宜但上次交期延了两周”。

Agent能背的KPI:响应速度、处理量、准确率、合规率——这些有明确计算公式、不需要主观判断的硬指标。

Agent背不了的KPI:客户满意度、谈判成效、创新产出、团队协作——这些需要情商、经验、直觉和”拍桌子”的软指标。

想清楚这一点,你就不会像钉钉那样翻车了。也不会像某些企业一样,花了几百万上了个Agent系统,最后发现还得雇人盯着它干活——等于花钱请了个需要保姆的保姆。

别让Agent去做它不擅长的事。让它拧螺丝,让人去炒回锅肉。各司其职,才是正经KPI。