当DeepSeek宣布免费，我想起了MongoDB涨价那年

DeepSeek-V4-Flash 宣布 API 免费那天，掘金社区炸了。评论区清一色”良心企业”“国产之光”“OpenAI该慌了”。

作为一个经历过 MongoDB 免费→SSPL收费、Docker Desktop 突然对企业收费、Heroku 砍掉免费tier 这一整套剧本的老开发者，我对”免费”这个词有条件反射式的警觉。

不是说 DeepSeek 不好。恰恰相反，正因为它好到你想接入生产系统，你才更需要想清楚一件事：免费的代价，可能比付费更高。

免费从来不是慈善，而是一种获客手段

先说一个toB领域的铁律：免费永远是最贵的定价策略。

不是因为产品不好，恰恰相反，是因为产品太好了，好到你用着用着就离不开了。而”离不开”这三个字，才是免费策略的终极目标。

这套剧本在toB领域已经上演了无数次：

MongoDB（2018年）：开源免费养了多年生态，等云厂商深度依赖后，改协议为SSPL，逼你要么付费要么自己fork。
Docker（2022年）：Docker Desktop突然对250人以上的企业收费，$21/人/年。你的CI/CD全在Docker上，你付不付？
Heroku（2022年）：免费tier用了十年，一纸公告砍掉。数十万小应用一夜之间需要迁移。

这不是阴谋论，这是被验证过无数次的商业逻辑：用免费买你的迁移成本，等你动不了的时候，开始报价。

DeepSeek的免费，到底在补贴多少钱？

我们算一笔粗账。

根据行业公开数据推算，DeepSeek-V4-Flash 的单次推理成本大约在 $0.001/1K tokens 这个量级（具体数字取决于硬件和优化程度，但数量级不会差太多）。

听起来很便宜？架不住量大。一个免费开放的热门模型，日均调用量达到百亿 tokens 级别并不夸张。这意味着每天约 $10万 的推理成本，一个月下来就是数千万美元量级的补贴。

没有任何一家公司会无限期做这种亏本生意。它在等的，是一个叫做”锁定效应”的东西成熟。

剃须刀与刀片：你才是那个”刀片”

剃须刀-刀片模型

理解免费策略最经典的模型是吉列的”剃须刀-刀片”模型：剃须刀免费送（或者低价卖），真正赚钱的是你持续购买的刀片。

映射到AI API领域：

剃须刀 = 免费的模型API。DeepSeek免费给你用，获客成本为零。
刀片 = 你围绕这个API写的所有东西。你的业务代码、你调优的prompt、你积累的评测数据、你团队踩坑总结的最佳实践。

关键在于：剃须刀可以随时换，但刀片只能配特定的刀架。

当你的prompt针对DeepSeek的输出风格做了大量微调，当你的代码里硬编码了DeepSeek的API格式和特殊参数，当你的评测基准线全部基于DeepSeek的表现——你就被”锁定”了。

这时候如果DeepSeek开始收费，你的选择是：

A. 付费继续用。 因为迁移成本太高。

B. 花几周甚至几个月迁移到其他模型。 重新调prompt、重新做评测、重新处理各种边界case。

大部分团队会选A。这就是免费策略的利润来源。

“免费→锁定→涨价”的三阶段模型

免费→锁定→涨价三阶段模型

把这套逻辑抽象一下，你会发现一个清晰的三阶段模式：

第一阶段：免费获客。 低门槛吸引大量开发者和企业试用。技术社区自发传播，获客成本极低。

第二阶段：深度锁定。 用户在使用过程中自然积累迁移成本——代码耦合、prompt适配、数据依赖、团队知识。这个过程是无声的，大多数团队甚至没意识到自己已经被锁定。

第三阶段：开始收费（或涨价）。 当用户基数和锁定深度达到临界点，推出付费计划。定价刚好卡在”比迁移成本便宜一点”的甜蜜点上——你算算迁移要花多少人力和时间，再看看这个月费，咬咬牙就续了。

我不是说DeepSeek一定会走这条路。也许它会走”免费基础版+收费高级版”的分层路线，也许它有其他变现逻辑。但作为技术决策者，你的职责不是猜对方的战略，而是确保无论对方怎么出牌，你都不至于被动。

三个防套牢策略：像租房一样用免费API

三个防套牢策略

既然免费的午餐值得吃，那就吃——但要吃得聪明。核心原则是：像租房一样用它，别像买房一样装修它。

策略一：用抽象层封装API调用

别让业务代码直接耦合某家API。中间加一层适配器，把模型调用抽象成统一接口。伪代码示意：

class LLMClient:
    def chat(self, messages, **kwargs):
        # 底层可以切换 DeepSeek / OpenAI / Claude
        return self.provider.chat(messages, **kwargs)

切换模型时只需要改适配器实现，业务代码一行不动。这不是过度设计，这是基本的风险管理。

策略二：prompt做模型无关设计

不要在prompt里利用某个模型的特殊癖好（比如某个模型对特定格式的指令响应更好）。尽量用标准的、在多个模型上都能工作的prompt写法。

具体做法：每写一个核心prompt，至少在两个不同模型上测试。如果一个prompt只在DeepSeek上效果好，在GPT-4o上完全不行，那这个prompt就有”模型锁定”风险。

策略三：定期benchmark，保持可切换性

每个季度花半天时间，拿你的核心场景在2-3个备选模型上跑一遍benchmark。记录下效果、延迟、成本。

这不是为了马上切换，而是为了保持切换的能力。等到真需要切换的那天，你手里有数据、有对比、有信心，而不是两眼一黑从头开始。

结论：免费值得用，但别被免费绑架

回到最初的问题：DeepSeek-V4-Flash免费，该不该用？

当然该用。 不用才是傻。

但请记住：你不是在”占便宜”，你是在一个精心设计的商业漏斗里走第一步。 每一行绑定特定模型的代码，都是你未来的负债。

所以，享受免费，但保持随时能走的姿态。

就像租房：住着舒服就多住几年，但别砸墙、别做固定柜、别把户口迁过去。因为房东涨租那天，你要能拎包就走。

在技术选型的世界里，自由从来不是别人免费给你的——它是你自己架构出来的。