过去两年里,我置身于企业级AI基础设施领域,追踪着行业的发展走向。在此期间,我注意到同一个问题在反复出现:我们应该构建自己的大语言模型吗?我理解这种本能反应。模型给人的感觉就像是那个核心、引擎、大脑,是值得拥有的资产,然而,在AI领域的客户体验和数据落地基础设施两方面担任了多年产品经理后,我得出的结论往往会让全场陷入不安:模型其实是你AI战略中最不具持久性的部分。
我这么说并非为了博人眼球,而是因为在过去几年里,我们看到许多企业将最稀缺的资源——高管的注意力、工程人才、资金——倾注到了技术栈中商品化速度最快的那一层。与此同时,决定其AI是否值得信赖、准确且具防御性的那一层,却被当作了无足轻重的“管道工程”。根据我的经验,这种倒置正是目前企业在AI上所犯的代价最高昂的错误。
模型正在成为商品
让我们来看看经济学,Gartner预测,到2030年,提供商对万亿参数模型进行推理的成本将比2025年下降90%以上,其成本效益将比同等规模的早期版本提高多达100倍。当下层能力的成本出现如此幅度的暴跌时,它就不再是一个差异化因素了。任何贬值如此之快、成本下降如此之迅速的东西,都不会是竞争优势的所在。
那些让人觉得具有创新性的模型,往往在几个月内就会被更便宜、更好的东西所超越。如果你的优势绑定在某个特定模型上,那么当行业前沿发生转移时——而这必定会发生——你的优势就会瞬间化为乌有,相反,如果企业投资于如何稳定地为任何模型喂送其专有上下文,这种投资就能保值,这部分投入可以从一代模型沿用到下一代模型。当更好的模型出现时,企业只需将其接入,就能立即享受红利,因为那项艰巨且具持久性的工作已经在下一层完成了。
我希望更多的领导者在做出承诺之前能看清这种模式,模型层的进步如此之快,以至于你在其中构建的任何优势半衰期都很短。落地层则恰恰相反:你对数据质量、检索逻辑和治理所做的每一次改进都会产生复利,并且无论上面承载的是哪个模型,这些改进都会延续下去。
这就是为什么关于“自研LLM”的争论常常偏离靶心。训练甚至是对基座模型进行有实质意义的微调都是极其昂贵的,而当你完成的那一刻,开源和商业的前沿往往已经超越了你,因此,从技术上讲,你花了一笔巨资买下了一个正在贬值的资产。你真正应该关注的能力——一个了解你业务的AI——本来就无法通过模型的权重获得,它来自于你展现在它面前的内容。
为什么数据落地才是真正的护城河
数据落地是一门将通用模型连接到企业当前权威信息的学科,最常见的方式是通过检索增强生成。你不再寄希望于模型在训练期间记住了某些有用的东西,而是在用户查询的当下,实时从你自己的系统中检索相关事实,并为模型提供正确回答所需的上下文。
对于任何思考竞争优势的人来说,真正重要的一点是:你的竞争对手可以租到和你完全一样的模型,但他们租不到你的数据、你的机构知识、你的业务流程,以及在正确时刻精准呈现这一切的流水线质量。这条流水线是真正的专有财产,真正难以复制,并且随着时间的推移其价值会不断叠加。这就是教科书般完美的“护城河”定义,而它几乎与你选择哪个模型无关。
行业已经开始意识到这一点,Gartner预测,到2027年,企业使用小型、特定任务模型的频率将至少是通用大语言模型的三倍,这恰恰是因为实际业务工作流中的准确性取决于领域上下文,而非纯粹的模型规模,然而,小型模型在设计上其参数中存储的信息较少,这意味着它更加依赖检索来实时提供最新的权威上下文。模型变得更小且更易替换,而落地部分则成了承担重量的核心。在同一份分析中,Gartner从数据层面提出了相同的观点:让企业脱颖而出的是他们准备、检查、版本控制和管理自身数据的水平。请再读一遍这句话:差异化因素是数据纪律,而不是模型。
这与我的直接观察相吻合,获取一个优秀的模型从来都不是难事,也极少是出问题的地方。我所见过的失败案例,都源于未能将模型高效地连接到正确的数据源,或者未能很好地编排检索。这些模式不断重复:缺失的数据导致总结不完整,被截断的文档让答案缺失关键细节,而杂乱的上下文则带来无关或让人困惑的回复。
缺乏落地时,不同客户得到的答案会变得不一致;当检索结果为空时,模型就会用幻觉或无用的内容来填补空白。陈旧的数据会产生言之凿凿却已过时的答案,检索鸿沟表现为形式主义的废话,而低质量的数据则会同时拖慢速度和输出质量。这些都不是模型的问题,而是落地的问题。当系统向高管递交了一个错误的答案时,董事会里没有人会关心这个模型有多先进。他们在乎的是答案错了,而解决方案永远留在落地层。
有一个例子让我记忆犹新,在真实的企业场景中,每当无法进行数据落地时,AI助手在不同环境下对同一个查询会返回不一致的答案,其中一些答案甚至完全相互矛盾。事后看来,原因很简单。由于没有落地,系统只能依赖自身内部的知识,而不是共享的、落地的单一真理源,因此其响应随着每次配置和上下文的变化而发生漂移,这种损害不仅是技术上的,用户不再信任一个无法对同一个问题给出两次相同答案的助手,这就是弱落地的实际代价,也是为什么生产环境中的一致性和可靠性远比其上的模型更依赖于数据层的原因,任何模型升级都无法解决这个问题。
领导者应该把投资聚焦在哪里
如果你承认落地是积累优势的地方,那么几个优先事项就会发生转移,从而改变你分配预算和注意力的方式。
首先,将组织的数据基础视为一等AI投资,而不是行色匆匆应付过去的先决条件。那些并不光鲜的工作——清洗、结构化、治理和对你的知识进行版本控制——才是决定AI质量的工作。每一次,我都宁愿接手一个拥有极佳检索流水线的平庸模型,也不愿要一个相反的组合。
其次,从第一天起就为模型的可移植性进行设计。假设你今天使用的模型在一年内就会被替换,因为事实必然如此。如果更换模型过程痛苦,说明你的架构已经与错误的层级发生了强耦合。你的落地基础设施、评估框架和数据契约应该是稳定的核心;模型应该是一个你可以用最小震动进行更换的组件。
第三,投资于检索的可观测性和评估,而不仅仅是针对模型。这一新兴学科至关重要:Gartner预计,到2028年,LLM可观测性投资将达到生成式AI部署的50%,高于现在的15%,因为对信任的要求已经超过了技术本身。了解系统为何检索特定的上下文,以及该上下文是否正确,是让AI输出具备可抗辩性和可审计性的关键。对于任何在严格监管或名誉审视下运营的组织来说,这都不是可选的,而是必选项。
这一切并不意味着模型无关紧要,你仍然需要一个能力出众的模型,并且做好选择至关重要,但选择模型现在是一个采购决策,有几个极好的选项,而不是持久差异化的来源,持久的差异化在于你围绕它所包裹的一切。
我认为,理解了这一点的企业在几年后将会明显领先于那些仍在争论是否要训练自己模型的企业,这并不是因为他们做出了更开阔的赌注,而是因为他们做出了更具持久性的赌注,他们明白,在一个每个人都能用上相同卓越模型的世界上,优势属于那些最能将这些模型落地于自身业务现实的人。模型是租来的,落地才是自己的,依此构建你的体系吧。


