
大家好,我是人月聊IT。
这些年我写了大量关于数字化、企业架构、数据治理、云原生和微服务的文章。今天我把这些散落在不同时间点的思考做一次系统的归纳整理,从最底层的概念逻辑讲起,一直谈到战略规划、架构设计与最终的落地实施。我希望它不是知识的简单堆砌,而是一条完整的、层层递进的认知链条。
如果要给这篇长文找一条贯穿始终的主线,那就是数字化转型的规划。我习惯把规划分成两层来看:上层是以企业架构为核心的顶层规划,它解决的是业务战略如何分解、业务与数据应用技术四层如何贯通的问题;下层是以云原生为核心的平台技术架构规划,它解决的是顶层蓝图如何真正落到一个可建设、可运行、可演进的技术底座上。前面讲概念、讲战略,是为这两层规划做铺垫;后面讲数据、讲架构、讲微服务和落地工具,则是这两层规划的展开和深化。
另外要先点明的是,无论顶层规划还是技术落地,数字化最核心的内核始终是数据驱动;而在AI大模型时代,数据驱动又会进一步演进为智能驱动。所以本文也会专门用篇幅,把数据驱动和AI赋能这两条线讲清楚。
要谈清楚数字化,必须先把信息化讲明白。传统的业务协作,全部依靠"人工传递媒介"来完成,这个媒介可以是电话、纸面单据、凭证等一切能传递信息的工具。人和人之间通过纸面媒介交换信息,物和物之间则通过人来建立连接,整个世界的运转高度依赖人的中转。
信息化做的事情其实很简单,就是把人与人之间进行信息交换的纸面媒介,转换为电脑里的电子表单。原来的纸面单据变成了IT系统里的电子表单,原来真实的业务流程,也变成了系统里的审批流和信息流转。所以信息化阶段,不是人和人在直接交换信息,而是人和IT系统在交换信息,IT系统成了信息交换的关键中介。
但信息化有它的天花板。它从来没有想过去构建一个完全模拟现实世界的虚拟世界,它只关心怎么把现实世界里的少量信息媒介搬进系统。所以在信息化阶段,整个世界等于"现实中的人事物加上IT系统中的信息",物和人没法搬进系统,大量纸面材料也搬不进去。
数字化则是完全不同的关注点。狭义的数字化,是把现实世界中所有的人、事、物,包括行为和时间,都用二进制编码进行表示,这叫数字转换;再把编码解析回一个你在电脑里能看到、听到的抽象对应,这叫数字映射。它追求的是用一个独立的数字世界,去完整地模拟和映射现实世界。
而智能化,严格来讲跟数字化本身没有太大关系。只是广义的数字化我们把信息化和智能化全部纳入进来罢了。更准确的表述是:传统的信息化系统,通过数字化进行了能力扩展和增强,进而强化了智能化的能力。这三个阶段不是简单的取代关系,而是融合叠加的关系。

如果让我用一句话来概括数字化最核心的底层逻辑,那就是:数字化的核心,是通过各种数字化技术和工具,来解决现实世界和抽象世界的时空统一。这是我反复强调、也最看重的一个观点。
为什么要强调这一点?因为传统信息化建设里,现实世界和信息世界本身是完全割裂的。一批货物可能上午十点就进了仓库摆上了货架,但在ERP系统里,这批货的入库单要等到下午三点甚至第二天才由库管员手工录入。现实世界里事物在时间和空间上的位移,和你系统里记录的二进制数据并不一致,完全是两张皮。
这种割裂带来两个致命问题。一是延时性,信息的录入总是滞后,系统数据永远无法实时反映真实状况。二是不一致性,只要有人介入,就难免录错、漏录,甚至为了应对考核而人为篡改数据。这种一致性,传统上完全靠人和审批流程来保障,可靠性极低。
数字化要做的,就是让时空信息本身附属在事物身上,而不是被人为分割。事物的空间和时间位移信息应该是自动采集、自动记录的,而不是靠人去录入中转。我们今天谈5G、谈物联网、谈传感器、谈边缘计算,根本目的不是炫技,而是让"物"本身具备说话的能力。
只有做到这一点,IT系统里那个"虚拟工厂"或"虚拟企业",才是现实世界的一面精准的镜子。这其实就是数字孪生的真正含义,静态核心是模型,动态核心是仿真和模拟。在这个过程中,人在信息中转、转录中的作用越来越小,信息的记录和一致性校验都由技术手段自动完成。

无论数字化的概念被泛化成多少种说法,我始终认为可以收敛到三大核心要素:连接、数据、智能。由连接实现业务的横向协同和纵向协同,这是支撑企业核心价值链的基础;连接本身产生数据,数据通过运营和分析推动业务发展;大量数据的积累最终用于大数据分析和人工智能,推动业务的自动化和智能化。
连接是数字化的基础。它不是简单的业务协同,而是人和人、物和物、人和物之间的万物互联。连接也不局限在企业内部,而是打破传统企业边界,向上连接供应商,向下直接触达最终客户,构建端到端的全产业链协同。这里有一个重点是"直接触达",减少中间环节,连接才能真正为价值创造服务。
数据是数字化的血液,也是数字化与信息化最本质的区别所在。在信息化阶段,数据只是业务运作的副产品,主要用于事后记录和统计分析。而在数字化阶段,数据成为核心生产要素,直接参与价值创造的全过程,从"业务驱动IT、人执行产生数据",反转为"数据实时采集、算法分析、形成指令、驱动执行"。
智能是数字化的大脑,是量变到质变的结果。当连接密度达到临界点、数据积累突破阈值时,系统会自发涌现出新的智能特性,这种非线性跃迁正是数字化转型最显著的特征。这三个要素绝不是孤立的,连接为数据产生提供通道,数据为智能提供学习素材,智能反过来优化连接、挖掘数据,三者协同的价值远超单一要素的简单叠加。
谈数据驱动,还必须把数据这个概念本身拆解清楚。我习惯把它分成四个层次:数字、数据、信息、知识。数字就是孤立的阿拉伯数字,比如单独一个"100";数据是有了上下文语境的数字化表达,比如"今天采购进货了100箱电脑";信息是事实的陈述,有主谓宾;而知识,是人们认识和改造世界形成的规律的显性化表达。
"天下雨了"是信息,只是事实的描述;"下雨出门要带伞"就是知识,是一种具有普遍适用性的规律。知识本身也是信息,但它是基础信息加逻辑加工后形成的复合性规律信息,是可以指导我们后续理解世界和改造世界的。这个层次划分,对理解数据驱动至关重要。
我特别想强调的是:数据不能直接驱动智能。数据要通过人工介入进行处理加工,把经验规律提取出来,将数据转化为知识,这个知识层才能真正驱动智能。从数据时代到智能时代,缺的不是底层的AI和大模型技术,也不是统一的数据存储,缺的恰恰是数据到知识这个层面的转变,这一步单靠AI很难完成,需要人介入处理。
到了AI大模型时代,这个判断有了新的变化。大模型解决了一个关键问题,它可以基于已有信息和数据自己产生新知识,自己完成知识的加工整理和经验提取,形成智能化能力。但要意识到,大模型本身不是智能,智能是结果而不是过程。我们看到的智能,恰好是大模型基于已有数据进行知识整理、推理、生成的过程,而这一切都要在"知识层"完成。企业AI应用的水平高低,关键就在这个知识层。
我见过太多企业,花大价钱请技术团队、买新系统、找咨询公司,几年下来业务部门抱怨系统难用,管理层觉得投入产出不对等,基层员工觉得越改越麻烦。我的结论很明确:数字化转型失败的根本原因,往往不是技术不行,而是企业内部三大顽疾,即组织基因、利益博弈和成本考量。
组织基因是看不见的紧箍咒。它由战略定力、执行惯性和文化土壤构成。有的企业把在天猫京东开个店就当成数字化的全部,有的企业把钱全花在炫酷的可视化大屏上,误以为看报表就是数字化管理。更深层的问题是,传统企业的汇报流程、会议制度、决策机制早就成了肌肉记忆,数字化要求打破部门墙、共享数据,很多人却在背后给系统使绊子。
我印象很深的一个案例,某制造企业老板花三千万建数据中台要求实时看业务数据,结果每个车间主任私下都准备了两套账本,一套手工台账记真实数据,一套往系统里编假数据。这种"系统外留后门"的行为,就是企业对数字化的天然排异反应,把它当成入侵肌体的异物想尽办法排出去。
如果说组织基因是先天不足,那利益博弈就是后天杀手。企业每次变革本质上都是资源的重新分配,而数字化转型更是把利益分配的矛盾直接摆到台面上。ERP系统把采购审批权收归总部,数据中台让灰色地带全曝光,AI客服取代了大部分接线员岗位,这些触动的不仅是岗位,更是整个生存逻辑。
于是就出现了一种典型现象:会议上高喊支持转型,私下里却授意下属对数据填报处处设限。财务部门想在共享平台上管好上百家子公司的账目,但子公司宁可手工合并上百张Excel表,也不开放数据接口。原因很简单,数据透明了,总部就能随时查出那些小金库。这种总部和分支的博弈从古至今没停过,只是从军权、财权转移到了数据权。
成本考量则是耐不住性子的赌徒困境。很多企业得了"重硬轻软"的短视病,买服务器、签云服务毫不手软,可到了人才培养、流程改造、组织适配这些关键环节,却像守财奴一样捂紧钱包。有的企业花两百万买智能补货系统,要求三个月提升库存周转率,完全不顾系统对接需要八个月适配期,季度财报不达标立刻把项目打入冷宫。这就像种下树苗第二天就扒土看是否生根。
破局之道没有一招鲜,但成功的企业有共同特质:掌舵者在转型路线上十年不动摇,执行层能把每个KPI拆解成十张流程图,财务敢把转型投入算进五年战略预算而不是当期损益。说到底,打败企业的从来不是竞争对手的技术迭代,而是自己困在基因里的思维牢笼、败在人性里的利益算计、死在短视里的成本焦虑。
数字化转型是一把手工程,这话没错,但我想补充一个更关键的观点:真正决定数字化转型成败的,是起到承上启下作用的二把手。一把手的支持是必要条件,但数字化从规划到建设到落地是极其复杂的系统工程,不是有了高层支持就能自动成功的。
这个二把手,就是能够全程参与数字化转型规划和建设的数字化负责人,无论他是从业务部门出来的,还是从IT部门的CIO挂职过来的。这个人身上必须体现两个关键特点。第一个叫专业性,他一定要对业务、技术、管理三方面知识都具备,没有明显短板。尤其是CIO挂职的,更要补上业务这一课,要真正了解企业核心价值链、商业模式和运营模式。
第二个叫有魄力。有魄力首先是勇于担责、勇于背锅,敢拍胸脯说这事就按这个方式做、出了问题我扛。其次是敢于触碰企业内部原有的利益关系,没有去触碰组织间利益关系的数字化转型,都不能叫真正的转型。最后是愿意和合作伙伴、供应商打成一片,数字化是大系统工程,需要甲乙方共同努力才能真正建好。一个企业能不能找到并授权这样一个二把手,往往就决定了转型的成败。

剥离掉那些高大上的技术名词,我认为数字化转型对企业的作用,集中体现在对"连接、数据、智能、组织、架构、价值"这六个维度的重构与升级上,这就是我常说的六维重构框架。前三个维度是数字化的核心要素,后三个维度则是支撑要素的落地保障。
组织维度,是推动组织从"科层制机械体"向"去中心化生物体"进化。我喜欢用章鱼来比喻:大脑是后台和中台,负责定战略、建标准、提供共享能力;触角是前台业务单元,高度自治、直接面对市场。打破部门墙,内部协作不再靠行政命令,而是靠服务调用,这正好解决了大企业"一管就死、一放就乱"的顽疾。
架构维度,是用企业架构这副骨骼,确保战略能够精准落地,避免业务与IT两张皮。价值维度,则是所有动作的终点,数字化转型不是为了数字化而数字化,而是为了降本增效、体验升级、模式创新,最终在数字经济时代重构企业的生存能力和增长引擎。
把这套框架收敛成一句行动纲领,就是"战略先行、数据驱动、技术为底"。战略先行,意味着要从企业经营全局视角出发,而非从技术出发;数据驱动,意味着把数据当成核心生产要素去经营;技术为底,意味着以云原生为代表的技术平台是底座而非主角。要真正成功,需要从理念认知、架构规划、组织保障到技术落地形成完整的闭环。
讲完了宏观方法论,必须落到可操作的小方法论上。我始终反对企业数字化转型搞推倒重来、从零到一。对已有IT基础的企业,正确的姿势是充分评估已有业务和IT能力,把已有能力下沉为平台层,再重新规划上层应用,而不是全盘否定过去的积累。
落地的关键抓手是垂直场景驱动。把虚的战略愿景,分解为一个个松耦合、可独立实现和交付的关键垂直业务场景。然后围绕单个场景,先分析它要经过哪些业务流程和关键业务活动,再判断哪些是已有能力能支撑的、哪些是需要补充的,最后判断技术层面哪些已具备、哪些欠缺。这是一个从场景和流程驱动、逐步分解、从业务到技术的过程。
为什么强调价值驱动?因为只有以业务价值为锚点,转型才不会走偏。选择一个切口小、见效快、又有改革意愿的业务场景作为突破口,快速交付价值,用看得见的成果去赢得业务方的信任和持续投入。这种小步快跑、敏捷迭代的模式,远比一开始就追求大而全的"完美方案"靠谱得多。数字化转型不是给企业插上翅膀,而是逼着企业长出新的骨骼。

企业架构是数字化转型规划的顶层,它要回答的核心问题,是如何把抽象的业务战略一步步分解、映射、落地为可建设的IT系统。但我必须先纠正一个普遍的误区:很多人把完整的数字化规划等同于企业架构规划,这会导致最终的架构输出很难落地。数字化规划的范畴,其实是大于企业架构规划的,这一点我会在本章最后专门展开。

数字化转型的规划,必须以企业架构为核心展开。企业架构是对企业关键业务、信息、应用、技术战略的全局整体表现方式,以及这些战略映射到的业务功能和流程。TOGAF是被广泛认可的企业架构参考框架,为架构的规划、设计、实施和治理提供了一套全面方法论。
但我要特别提醒一点:不能简单地认为TOGAF就是完整的数字化转型方法论。数字化转型的方法论范畴远大于企业架构,它涉及现状分析、差距分析、架构蓝图规划、解决方案规划以及最终的落地项目建设等一系列内容。企业架构是其中至关重要的核心环节,但绝不是全部。
新版的TOGAF更加强调业务能力的核心地位和承上启下的作用。企业核心战略和业务目标由业务能力支撑,而业务能力本身又通过流程、组织、IT三方面来支撑。这个变化非常契合当前数字化转型对敏捷架构的要求,让架构规划从过去偏静态的蓝图,转向更能响应业务变化的动态能力视角。
我做了十多年大型集团IT咨询规划和SOA规划项目,深知方法论在实践中从来不是教条。我们总是根据实际情况对TOGAF或IBM的CBM组件化业务模型进行优化和裁剪。重要的不是死守某个框架的元模型,而是真正理解从业务战略到技术实现这条核心逻辑链条。
4A架构指业务架构、应用架构、数据架构和技术架构。理解它们之间的集成关系,核心要参考企业架构的元模型。我对这个元模型做过调整和优化,关键在于厘清四者之间的映射和驱动关系。
业务架构里有三个核心内容:价值流、业务能力、业务流程。价值流往往是顶端流程,业务能力分解到二到四级,详细业务流程则分解到五到七级直至具体业务活动。在详细业务建模时,会识别出业务对象、业务活动、业务规则、业务角色四个关键要素。其中业务对象会导入数据架构,成为概念模型;四个要素整体则映射到应用架构的应用功能。
这里有一个我特别强调的关键点。应用功能向上聚合成应用组件、应用系统后,二到四级的业务能力和端到端流程该如何映射?任何一个端到端流程都不是单个应用系统能实现的,它需要多个应用功能之间集成协同。所以必须引入应用集成架构和服务架构,通过应用编排或服务编排来映射业务架构中的端到端流程。这两块灰色部分,是构建业务与IT的V模型完整性和闭环的关键。
数据架构作为承上启下的关键线条,向下落地到技术架构的物理模型和数据库设计。应用功能最终部署到技术架构的运行时,可能是容器,也可能是中间件环境。通过这样一张完整的映射图,业务、数据、应用、技术四层架构就被串成了一个有机整体,每一层的产出都能向上追溯到业务目标、向下落地到技术实现。

企业架构的梳理,首先从业务战略和业务目标出发。战略制定后,核心业务价值就会浮现,这时回到价值链分析模型,梳理研发、生产、物流、营销等核心过程域,以及HR、财务等支撑过程域。接着思考每个业务域应该对外提供什么业务能力,形成粗粒度的业务能力地图,这是一个从顶朝下的黑盒过程。
第二步是把业务域这个黑盒打开。要确定一个业务域内究竟有哪些业务功能,简单头脑风暴容易遗漏,必须回到传统的业务流程梳理,做二级、三级直至四级的EPC流程分析,找到每个业务活动、业务功能和操作步骤。再通过CRUD矩阵分析,分析功能和数据之间的增删改查关系,按高内聚松耦合原则把功能聚合成业务模块。这是一个从底朝上的详细实现过程。
从业务架构过渡到应用架构时,要注意映射粒度的差异。业务架构里的"供应链管理",在应用架构里可能拆成合同、采购、物流三个系统,也可能反过来合并成一个大供应链系统。同时实现一个业务能力,往往既需要ERP核心模块,也需要外挂的费控、预算、资金等系统。完整的应用架构包括应用功能架构、应用集成架构和服务架构,其中服务架构的规划在当下尤其重要,它体现的正是SOA的核心思想。
数据架构最核心的主线是:数据主题域分析、概念模型、逻辑模型、物理模型。副线则包括数据聚合与Owner识别、主数据规划建设、从OLTP到OLAP的过渡。每一个数据对象都必须找到它真正的Owner,这是数据架构梳理后必须完成的工作。技术架构则从传统的烟囱式IAAS部署,演进到以PAAS技术中台和云原生为核心的"平台加应用"模式。所有这些架构必须融合成一个完整整体,才能支撑上层业务目标的实现。
我一直强调数字化规划要以企业架构思维为核心,但它绝不等同于企业架构规划本身。如果只是套用TOGAF产出一套4A架构图,甲方拿到后往往不知道怎么用、怎么建、怎么落地,这样的规划价值有限。真正可落地的数字化规划,要在企业架构方法论之上做五个关键扩展。
第一,现状分析和调研必须前置。TOGAF的ADM把现状调研主要放在了中间的需求管理里,但做数字化规划时,愿景目标一旦明确,就必须立刻对业务、数据、应用、技术四个层面的现状做全面调研。只有摸清现状,才谈得上后面的差距分析和问题识别。
第二,业务架构规划要重视端到端流程梳理。有了业务价值流和业务能力地图,细化到三四级之后,一定要落到详细的端到端流程分析。我强烈建议参考ARIS的流程建模思路,因为只有把流程拉通,才容易发现端到端协同中的断点和数据不一致问题,这些问题才是后续应用架构要解决的。
第三,业务解决方案要先行。我习惯把业务视角和IT视角拆开,先基于差距分析输出业务解决方案,再谈IT解决方案。这沿用的是IBM常用的"现状AS-IS、差距分析、目标TO-BE"思路,任何改进点都不能照搬最佳实践,必须从企业自身的业务目标和流程现状出发。
第四,应用架构要体现组件化和服务化。参考CBM组件化业务地图、SOA横向分层、云计算平台加应用的思路,基于业务能力组件化、组件能力服务化来拆分应用组件。这里要接受一个事实:应用组件和业务组件往往无法一一映射,一个业务能力常常是多个应用组件组装编排出来的。
第五,落地实施要结合项目管理方法论。可以参考IPD集成产品研发和项目组合管理思路,从规划蓝图中筛选出优先级最高的建设项目,再校验项目组合包对业务问题的解决度和对企业战略的匹配度。把这五点叠加到企业架构之上,才算得上一套真正可落地的数字化顶层规划,而不只是一张甲方看不懂如何使用的架构图。

在展开数据治理和主数据这些话题之前,我必须先把数字化里最核心的一个概念讲透,那就是数据驱动。数据治理、主数据、数据中台这些建设,本质上都是为了让数据能够真正驱动业务而服务的手段,脱离了数据驱动这个目的,它们就失去了意义。

理解数据驱动,一定要分成两个层面。第一个层面是数据驱动决策,这是传统BI做的事,把企业全局或业务域的KPI指标算出来,配上各种维度分析工具,方便管理层发现问题、改进流程,它是事后的、非实时的。第二个层面是数据驱动业务,这是数字化更强调的重点,数据经过加工建模后形成数据服务能力,要在每一笔、每一次业务交易中实时使用。
这两者最大的区别就在于实时性和使用方式。数据驱动业务的数据服务,是嵌在业务协同里的关键卡点或关键数据提供方,必须实时调用、实时返回。把这一点想清楚,你才能理解为什么数字化时代要把数据从OLAP的辅助决策位置,拉回到OLTP业务运作的主战场上来。
数据驱动业务有几类典型场景。一类是模型支撑类,比如生产缺陷预测、电商推荐引擎、客户信用评级、保单费率计算,它们的输入输出都很简单,但底层是大量数据融合加上算法预测模型,以数据服务接口的方式被业务实时调用。一类是数据支撑类,比如微服务拆分后的跨库组合查询、宽表计算字段、端到端业务监控,它不做复杂模型,只把多系统的数据整合后实时提供。还有一类是规则管控类,比如预算卡点,底层数据加工后形成业务规则校验服务,决定一笔业务能否继续向下流转。
而数据驱动的终极目标,是数据驱动业务流程的自动执行。在信息化时代,线条是先定流程标准、人去执行、执行产生信息流、信息流再沉淀为数据,整个过程是流程和人驱动的。但到了数字化时代,这条线整个反过来了:数字世界里先形成规范和数据,通过数据加上调度规则自动产生信息流,再由信息流反向推动人去执行。
最典型的例子就是网约车平台,司机更多是被动接受平台派给他的调度任务,照着执行就行。传统供应链也一样,过去货到了你要自己录入库单再提交审批,未来很可能是数字世界已经帮你生成好单据,你只需按单据执行操作。所以严格讲,数据驱动在这个阶段更准确的说法是数字驱动,是数字世界驱动了现实中人的作业。
把这个逻辑拉到企业架构层面看就更清楚了:信息化阶段是业务驱动IT,数据是流程执行后的附属品;数字化阶段4A架构本身没大变,但增加了数据驱动业务这条关键的线,数据不再被动,多个相关数据组合后形成新能力反向驱动业务。这就是数据从生产副产品转变为核心生产要素的根本反转,也是后面所有数据治理、主数据、数据中台工作真正的出发点。
简单来理解,数据治理就是为了让我们更好地用数据、管数据,让数据进一步发挥价值,所进行的一系列管理活动和制定的一系列管控规范流程体系。在数字化浪潮中,数据规模爆炸式增长,多源分散,若缺乏有效治理,将直接导致决策失误和运营低效。
很多企业的数据治理还停留在"数据资源化"阶段,存在缺数据、缺管控、缺共享、弱应用的问题,无法实现从资源化到资产化、资本化的递进。企业IT系统数据量激增,分散的数据导致无法从统一业务视角概览信息,数据要素难以协同、复用与融合,这就是启动数据治理最直接的诉求。
我对数据治理有一个早年就提出的简化框架,把它从下到上分为支撑体系、管理体系和价值体系三大部分。其中管理体系不仅是数据质量、安全、合规的管理,更重要的是数据全生命周期管理,既包括从元数据到概念、逻辑、物理模型的静态数据架构,也包括数据从产生到消亡的动态生命周期。
我特别要强调的是,数据治理一定要从数据管理向数据价值运营发展。广义的数据治理应该包括数据运营、数据流通和交易。随着国家提出数据作为生产要素、建立国家数据局、构建数据统一大市场、推动数据资产入表,数据治理的范畴正在被进一步扩展。数据治理的最终目标,是支撑业务、赋能业务、驱动智能。
数据价值的释放,要经历"数据资源化、数据资产化、数据资本化"三个阶段。数据资源化是识别有潜在价值的数据资源,做好标准化和规范化;数据资产化是把数据作为资产管理,如果仅在内部使用往往作为无形资产入表,如果发生交易则可按存货方式入表;数据资本化则是让数据真正在市场上流通交易、产生收益。
但这里有一个关键的价值载体常被忽略,那就是数据产品。不是所有数据资源都能变成数据产品,更不是所有数据资源都能资产化,中间必须有数据产品作为价值承载点。数据资源往往只解决了数据简单的标准化问题,但这个数据对我有没有价值并没有解决。
数据价值的发现,往往涉及多个数据的关联组合,涉及基于规则或算法对数据进行统计分析和聚合,最终形成的才是能发挥价值的数据产品。所以数据产品一方面完成了数据建模工作,一方面完成了数据价值发现工作,它才是数据资本化的真正基础。我一直反对把ETL工具划入数据产品,因为它既不能体现数据是生产要素,也不能体现创造价值的核心是数据。
我推崇精益数据方法论,核心是场景加价值驱动。从企业的业务战略和数据战略出发,找到关键速赢的数据价值场景,规划业务场景蓝图、数据资产蓝图和数字化技术蓝图,再基于数据资产卡片来设计数据产品。每一张数据资产卡片,核心要说清两件事:数据目标和数据场景,业务用户必须精确描述清楚在什么业务场景下需要什么数据,然后才轮到技术层面去做采集、清洗和建模。
业界常把数据治理和数据架构拆成两块,我想厘清它们的关系。数据治理更偏向通用的组织、管控、安全、质量、标准等体系规范和流程建设;数据架构则更偏向基于业务需求深刻理解后的数据建模,既包括OLTP的概念、逻辑、物理模型,也包括OLAP的贴源层、明细层、宽表层、维度模型层。
两者有一个本质区别:数据治理更通用化,不熟悉行业和业务的人也能做;但数据架构绝对离不开业务,定义到物理模型时每个字段都蕴含特定的业务含义和业务规则,不清楚业务寸步难行。数据模型是数据架构的关键输出,也是衔接数据采集集成和后续数据能力开放的桥梁,大量数据治理工作的最终标准化落地都要体现在数据模型上。
所以我的核心判断是:数据治理项目,数据架构才是核心。这个核心又必须根植于业务对象模型。不理解客户、订单、产品之间的关系,就不可能设计出有意义的主数据和数据标准。参考华为数据之道,数据架构包括四方面内容:数据分类与数据目录、数据标准、数据模型、数据分布和数据链。
在云原生和微服务背景下,数据架构的要求进一步提高。一是基础主数据和共享数据的设计变得更重要,新的TOGAF标准专门有分册讲述基础主数据及治理管控。二是应用微服务化后,不仅是上层应用组件的拆分,更关键的是底层数据库的拆分,而数据库怎么拆,依然要回到领域建模思路或CRUD矩阵分析,找到高内聚松耦合的点,这没有公式化的标准答案,更多依赖不断实践。
如果让我对数据治理下一个最尖锐的判断,那就是:任何不懂业务、不从业务痛点出发的数据治理,都不是在夯实基础,而是在构建空中楼阁,其失败或夭折是注定的。那些投资几百万最终烂尾的数据治理和数据中台项目,根源几乎都在这里。
纯技术视角的数据治理有几种典型的错误模式。一是"为治理而治理",由IT部门主导,目标是完善技术框架、统一数据标准,却没有挂钩任何具体业务问题,产出一堆无人问津的标准文档。二是"工具先行论",优先采购昂贵的治理平台或主数据系统,期望工具一键解决所有问题,结果团队陷入无休止的配置集成,业务团队毫无感觉。三是"指标驱动的误区",把数据完整性、准确性这些技术指标当成终极目标,但数据完整度从百分之八十提升到九十五,没有转化为成本降低或收入增加,在业务部门看来就是自娱自乐。
真正的业务驱动型数据治理,必须始于一个具体的业务场景或痛点,以解决该问题、创造可衡量的业务价值为最终目标。它的起点是业务部门提出的具体问题,比如无法精准用户画像导致营销费用浪费,或者供应链各环节数据不一致导致库存积压。治理工作紧密围绕高价值的业务应用场景展开,治理成功与否最终由业务价值衡量,而非技术指标。
实现路径其实很清晰:先与业务部门共同识别价值最高的痛点场景,找到一个既有痛感又有改革意愿的业务部门做盟友;再解构业务对象模型,梳理核心业务对象及其关系;然后以业务对象模型为蓝图设计核心数据架构;最后小步快跑、敏捷迭代,选一个垂直场景短周期验证价值。数据治理的终极目标,是构建"业务数据化"和"数据业务化"的双向闭环,让数据来源于业务又反哺业务。归根结底,数据治理本质上不是纯技术项目,而是一个深刻的业务变革项目。

数据中台如果用一句话定义,就是把数据变成资产并服务于业务的机制,数据来源于业务又反哺业务,不断迭代循环。它的本质是实现业务核心共享数据的跨域整合,再通过加工后提供整合后的数据服务能力。这里有两个重点:第一数据要跨域整合,第二数据要加工处理后再提供增值服务能力。
数据中台和传统BI、大数据平台既有重合也有差异。相同的部分是数据采集集成、存储、建模、开发分析这些都需要;差异点在于,数据中台必须有一个统一的数据服务能力开放层,能够把ODS层或数仓层的能力以接口服务方式直接提供给业务系统使用,为业务提供实时或准实时的增值服务,而弱化了传统BI的报表展现层。这条数据服务开放层,正是区分数据中台和传统BI的关键。
我对中台概念有一个基本判断:中台更偏向业务概念,包括业务中台和数据中台,但尽量不要说技术中台,技术中台叫技术平台更合适。业务中台重点是业务数据化,自己产生业务数据;数据中台重点是数据业务化,采集业务数据再加工。业务中台是核心业务支撑必须要有,数据中台是增值能力支撑,刚开始没有也不影响业务运作。
我对从零构建业务中台一直持否定态度,因为业务能力不是天生具备的,需要通过业务实践逐渐积累才能形成可复用资产。但对数据中台我相对乐观,因为它更多是采集整合业务系统的数据,集成后形成可对外开放的数据资产和数据服务,这件事的可行性是更高的。
但现实是,实际落地的数据中台效果往往不理想,最近这几年数据中台的热度明显下降了。我见过太多投入数百万、规划一年多却无法验收的数据中台项目,问题不在技术平台,而在于最终只交付了几张传统BI报表,根本没实现数据资产库、数据服务对外开放这些核心能力。我把原因归结为三点。
第一,有些问题原本只需建个小型BI系统就能解决,却被规划成了复杂的数据中台大项目,整体规划、平台建设、技术架构都变得极其复杂,最终还是只能提供些辅助决策的报表,那建数据中台的意义何在。第二,本应通过ESB总线或服务共享平台解决的数据服务集成共享问题,却硬塞进数据中台,结果数据多了一次落地存储,反而影响了数据的及时性,导致数据不一致。
第三,也是最关键的,数据中台的核心是提供共享数据服务并实时反哺业务,要实现这一点,技术平台不是唯一关键,更重要的是数据治理专家或数据咨询顾问的角色,而这个角色在许多项目中严重缺失。有懂数据治理的人,但他们往往不懂业务,尤其不懂端到端跨多个业务域的业务,于是搞不清该采集什么数据、如何整合、整合后如何反哺业务。
所以我的结论是,问题不在数据中台思想本身,而在于它与企业发展阶段、业务和IT成熟度水平密切相关。企业在规划数据中台时必须先问自己三个问题:我是否真正需要数据中台?数据中台能为我带来什么价值?我的业务和IT成熟度是否支撑得起?想不清楚这三个问题,盲目上马,烂尾几乎是必然结局。
主数据是描述核心业务实体(如客户、供应商、地点、产品、库存)的一个或多个属性,本质上就是企业业务架构分析中发现的核心业务对象。它有三个特征:是静态基础数据、变化不频繁、跨多个业务流程或系统使用。基础数据要上升到主数据,关键条件是它产生在一个源系统中,但会在多个其他系统中被使用。
主数据管理解决两个层面的问题。一是主数据本身的申请、创建、变更、废弃等内容管理和审批流程管理;二是形成统一的数据视图,对外提供统一的数据服务能力。建设方式有集中式和共享式两种,集中式把主数据全生命周期纳入MDM系统管理,共享式则源头还在业务系统,MDM只负责抽取清洗形成统一视图后分发。
主数据和数据中台不在一个比较层面,主数据不属于数据中台的建设范畴。在中台微服务架构下,原来MDM管理的物料、供应商、人员,会被拆分为物料中心、供应商中心、人员中心等多个微服务,这些属于业务中台的内容而非数据中台。需要特别注意的是,新微服务架构倡导数据不落地、不多点同步,这与传统主数据的采集、分发、多点落地有很大不同。主数据中提供全局视图查询的那部分能力,可以转移到数据中台的数据服务层;但主数据的申请、变更、审批流程管理,是数据中台无法提供的,仍需在业务系统或业务中台的微服务中解决。
两者其实可以共存。数据中台底层是一个分布式ODS库,既包括基础静态主数据,也包括订单、合同等共享动态数据。当存在MDM系统时,数据中台可以直接对接MDM,通过采集集成MDM的数据来形成自己ODS库的基础数据能力。至于先建主数据还是先建数据中台,要看具体问题:如果你的问题是缺统一的数据服务能力,又要做微服务转型,可以直接建数据中台;但如果你连数据内容管理都没做好,短期又不需要大的架构转型,那就老老实实先建好MDM系统。

如果说企业架构是数字化转型规划的顶层蓝图,那云原生平台架构就是这份蓝图落地的技术底座。顶层规划解决的是业务、数据、应用、技术该是什么样子,而云原生回答的是这一切到底跑在一个什么样的平台上、怎么建、怎么演进。这是数字化转型规划两层中不可或缺的第二层,没有这个技术底座,再完美的顶层架构也只是停留在纸面上的图。
要理解云原生,得从云计算服务本身的发展讲起。当云厂商只提供虚拟机和存储这种资源池能力时,能变的花样不多,竞争最终沦为价格战,规模上不来就很难盈利。这就好比电信运营商提供网络是资源层,真正赚钱的是基于网络开发出来的各种移动互联网应用。
云厂商要更好地挣钱,就必须从提供资源池能力转向提供多样化的服务层能力,从IAAS的资源不断朝PAAS的服务抽象,提供数据库、消息、缓存、对象存储等增值服务。为了让这些服务更快速、灵活、可扩展地提供,就出现了比虚拟机更轻量的容器资源池。而要把应用托管到容器上,传统几百兆的大单体显然不合适,于是衍生出了微服务,要求应用拆小、独立自治。
应用拆成微服务后,云厂商还要解决从开发到部署交付的衔接问题,于是引入了DevOps持续集成和持续交付。所以云原生的核心驱动力,是云服务商从资源到服务层能力的不断抽象,在这个过程中自然出现了容器云、微服务、DevOps这三大要素。
那么如何理解"原生"二字?原生就是这个东西从一出生就属于我,就像原生家庭。华为提出云原生应该从"长在云上"发展到"生在云上"。传统方式是应用在内部开发测试完成,打包后再寄养到云上,这类似抱养一个长大的孩子;而云原生是让应用从一开始的设计、框架、技术选型就把云服务能力作为核心输入,从诞生的第一个版本就生长在云上。所以不是简单用了微服务、DevOps和容器就叫云原生,关键是应用从设计之初就是为生在云上而设计的。
云原生本质上是一系列云计算技术和企业管理方法的集合,既包含微服务、敏捷基础设施等技术,也包含DevOps、持续交付、康威定律等管理实践。要实现"应用为云而生"这个目标,需要从静态的技术视角和动态的过程视角两方面来支撑。
技术视角上,从应用开发全生命周期看,分为开发态、运行态和管控治理态。微服务开发框架是开发态能力,容器云资源池是运行态能力,服务网格、不可变基础设施则是管控治理态能力。过程视角上,要实现应用开发全生命周期管理,既有需求驱动的端到端管理流程,也有技术驱动的持续集成、持续部署、持续交付过程,核心是敏捷研发管理和DevOps支撑。
完整的云原生技术中台可以拆分成几个关键子系统:敏捷研发管理子系统、DevOps支撑平台、容器化PAAS平台、监控运维平台、技术服务平台、API服务网关、门户和4A平台、服务运营平台。这套架构和我多年前做私有云PAAS平台的架构高度类似,只是PAAS换成了容器化PAAS,ESB总线换成了轻量API网关,并引入了DevOps方法论。
这就是我一直主张的"厚PAAS"理念。技术平台层要承载共性的技术服务能力、共享的业务服务能力,以及应用托管能力,把这些共性能力都下沉到平台层,上层应用才能真正实现快速构建。我特别要强调,云原生平台建设的核心重点,不是单个技术组件能力的构建,而是如何实现各技术组件之间的集成与协同。低代码平台怎么和微服务框架融合、开发的应用是否基于DevOps流程、能否平滑部署到容器底座,这些问题必须从系统整体视角来规划。

云原生的技术演进还在继续,从微服务进一步走向Serverless无服务器架构是一个重要方向。Serverless的思路是底层提供完整的BaaS层能力,开发者只需聚焦业务逻辑,把弹性、安全、可观测性等非业务功能完全交给云平台接管,通过服务网格、Sidecar等机制实现业务代码与中间件的彻底解耦。这其实和我谈PBC组件、谈SaaS应用平台时的低代码开发思路是相通的。
在落地层面,混合云和多云策略是企业级规划绕不开的内容。要确保私有云平台具备向公有云迁移的技术兼容性,支持跨公有云、私有云、边缘云的统一资源调度。同时制定开发框架、容器规范、API标准等一致性要求,降低跨环境适配成本。对很多大型企业而言,稳态业务保留传统架构、敏态业务全面云原生的双模IT策略,是更务实的过渡方案。
云原生架构的落地,我建议走渐进式的三阶段演进路径。第一阶段是基础能力建设,统一技术栈、搭建容器云底座、引入DevOps基础能力,选一两个非核心系统做容器化试点。第二阶段是能力提升,深化微服务治理、引入服务网格、完善集中日志和监控体系、建设统一门户。第三阶段是能力融合,实现全链路智能化运维、高级发布策略、技术组件资产库和能力开放平台。
云原生绝不只是技术实践,它同样深刻地依赖管理实践,二者缺一不可。技术实践层面,核心是微服务、DevOps和容器云这三大基石,以及围绕它们构建的服务治理、可观测性、安全合规等能力体系。管理实践层面,最关键的是组织变革和流程变革。
康威定律告诉我们,系统架构会反映组织结构,所以微服务化必然要求组织重组。我建议按业务域组建业务、运营、IT的"铁三角"敏捷团队,建立云原生卓越中心负责技术标准制定和知识传递。这种组织适配如果跟不上,再好的技术架构也会水土不服。治理体系要从技术、组织、流程三个维度立体化构建,形成监控、分析、决策、执行的自动化闭环。
风险控制和投资回报管理也是管理实践的重要内容。我建议优先选择高价值、低风险的场景作为突破口,比如数字化营销、电商这类高敏捷性业务,通过短周期价值验证循环,确保投资快速产生可衡量的回报。每个季度要对技术栈一致性进行审计,避免技术债务累积,同时定期评估组织架构与技术架构的匹配度。
对CIO、CTO和架构师来说,做云原生决策的第一要务是战略对齐,要区分"资源上云"和"服务上云",推动从以资源为中心的IAAS模式转向以应用为中心的PAAS模式,并确保云原生转型与企业数字化转型战略完全对齐。云原生转型必须是一个涵盖战略、架构、运营的系统性工程,而不是单纯的技术升级,这样才能真正实现应用"生在云上"的战略目标。
太多的基础概念被混用,导致大家理解偏差,我有必要把它们一次性澄清。SOA是一种架构思想,核心是找到服务、组装编排服务。面对企业遗留系统,SOA做两件事:找到各个遗留系统共性的可复用业务能力,以及在构建上层流程时通过服务组装和编排来完成。这个思想和中台思想完全一致。
ESB企业服务总线只是实现SOA的一个技术平台,用于统一管理和治理服务。但不要简单认为用了ESB就是SOA,如果接入的是一堆没有标准化、不可复用的混乱接口,那ESB就只是个接口平台,没实现任何SOA思想。同样,用了SpringCloud框架也不等于实现了微服务,必须考虑轻量交互、松耦合这些核心思想是否真正落地。
微服务的本质是单体大拆小,所以它应该和单体应用做对比,而不是和SOA放在一个层面。微服务强调业务系统彻底组件化服务化,单体拆分为多个可独立开发、运行、运维的小应用,从前端到逻辑层到数据库完全独立,模块间通过轻量的Http Rest接口交互。一句话说SOA和微服务的区别:微服务不再强调重的ESB总线,同时把SOA思想引入到单个系统内部实现真正的组件化。
中台则是SOA思想和微服务的融合。共性可复用业务能力下沉并提供给前台使用,这是SOA思想;共性能力构建时尽量大拆小、可扩展、松耦合,这是微服务思想。所以中台是业务层面概念,微服务是技术层面概念,采用了微服务离实现中台还十万八千里,不采用微服务也可以实现中台。这些概念厘清了,后面的架构判断才不会乱。
微服务架构听起来很美好,但落到实践,前期的微服务拆分已经成为整个微服务架构设计中最关键、也最让人头疼的内容。大家都在找一种通用的、公式化的拆分方法,但我必须说清楚:没有通用的公式化精确方法进行微服务拆分,更多的是拆分原则。
很多人以为学精了领域驱动设计就能搞定微服务拆分,这是误解。领域驱动设计通过事件风暴识别领域对象,但你不可能把每个领域对象都拆成一个微服务,那粒度太细了。一个传统供应链系统有采购单、订单、物料、供应商、库存等几十个聚合点,难道要拆成几十个微服务?显然不合理。正确的做法是把多个相关聚合归并到一起划分限界上下文,而限界上下文怎么划,领域建模依然只给原则,即高内聚松耦合,没有公式。
我把微服务拆分原则总结为两条:纵向上要满足组件拆分的高内聚松耦合原则,横向上要满足能力复用和共享原则。经过这么多年咨询和系统建设,我反而觉得当前切实有效的方式是传统结构化分析的CRUD矩阵分析。因为这个矩阵图里既有业务功能又有数据,可以同时从业务和数据两个维度考虑聚合性,比纯粹的领域建模更接地气。

IT应用一般有两种类型,拆分思路完全不同。一种是工单流程驱动型,比如OA系统、IT运维系统,这种系统微服务拆得再细也没关系,因为不同工单流程落地的数据对象之间没有太多关联。另一种是强数据驱动型,比如资产管理、库存管理系统,所有功能都围绕底层的库存对象运转,这种系统如果把数据库也拆开,往往是灾难性的,会导致大量跨库查询和分布式事务问题。
正因如此,我提出微服务拆分要有全局视角,从整个企业的应用架构和数据架构出发,把数据拆分和应用拆分进行分离。传统烟囱式建设下,各应用对应的数据库之间存在大量冗余,比如SRM和采购系统都有供应商、物料数据,这种冗余通过不同入口录入或后期集成同步产生。
我的双维度拆分方法是这样的。对于数据的拆分,从数据架构视角分析原有系统的数据沉淀和分布,找到跨系统共享的数据,把这些共享数据抽取出来形成共享数据能力中心,提供共享数据服务,核心目的是减少后期的数据集成和同步。对于后端服务的拆分,则基于业务和流程驱动,按松耦合思想进行,颗粒度可以更细,而且后端服务和共享库不再是严格一一对应,一个后端服务可以访问多个共享库。
总结起来就是:能力中心按数据驱动拆分,应用按业务驱动拆分。先从数据共享视角拆出后端共享数据库,再基于业务流程视角拆出上层应用微服务,最后考虑应用微服务和共享数据库之间如何集成协同。需要注意的是,后端微服务除了访问共享库,也可以挂一个小的私有数据库,存放那些不需要跨系统协同的数据。这种方式既结合了纵向组件化,又结合了SOA横向分层,更符合企业整体的应用架构和数据架构规划。
微服务终究是个技术词汇,面向技术人员,谈的是怎么拆分、提供哪些粗粒度API。但企业数字化转型的趋势是从面向技术转向面向业务,于是有了PBC可打包业务能力组件的概念。这背后是金蝶联合Gartner提出的EBC企业级业务能力构建,核心思想就两个:平台化复用、敏捷化组装。
PBC组件是面向业务用户的、业务可以感知的业务功能,比如一个供应商查询组件,它聚合了底层微服务API能力加上前端展现界面。PBC和微服务有两个关键区别:微服务谈API接口层面的复用,PBC谈面向业务的功能层面的复用;PBC的颗粒度比微服务更小,往往一个领域对象就可以独立构建一个PBC,而微服务通常按业务子域聚合多个领域对象。
PBC组件以业务对象建模为核心进行能力聚合,有自己的流程、规则、数据和文档,可以有界面展现形成独立可复用的小应用。它的识别方法和微服务不同,更多是基于横向思路,把业务能力不断拆到细颗粒度的应用功能单元,每个单元自带逻辑、自带界面,有明确的输入输出标准,整个过程不涉及底层技术实现。
这里我要区分编排和组装两个概念。对微服务我们谈编排,面向技术人员,涉及API、规则、流程的编排。对PBC我们谈组装,面向业务用户,业务用户不用关心组件内部实现,就能把多个组件按规则组装成完整应用。这种组装就像古代建筑的榫卯结构,各个木块就是独立的PBC组件,可以长短不同形状不同,但连接点的接口规则一定是提前约定好的标准,确保严丝合缝。这套思路可以延伸到SaaS应用平台生态的构建,关键是平台服务商要提前制定好集成、接口、协同、数据传递的标准,自顶向下驱动后续小组件的开发,最终拼装出真正能支撑端到端业务协同的完整应用。

DevOps起源于二零零九年,主要针对敏态业务。它没有发明任何技术,但所有技术都为它所用,它从技术上升到业务层,会推动组织结构变革。国内的研发运营一体化能力成熟度模型,涵盖了敏捷开发管理、持续交付、技术运营、应用设计、安全风险管理、组织结构及工具等部分,融入了研发项目管理、软件工程、IT管控治理三方面内容。
敏捷开发管理的核心,是基于业务场景和用户故事驱动的短周期迭代,以实现快速的业务价值交付。我特别看重用户故事地图这个工具,它用业务活动和迭代版本两个坐标,把用户故事呈现在二维视图里,形成"业务活动、一级用户故事、最小化用户故事点"的层次结构。可视化看板、站立会议、燃尽图这些都只是实现价值交付目标的工具,不要本末倒置。
持续集成是团队成员每天至少集成一次代码,每次集成都通过自动化构建和测试来验证。而DevOps更强调持续交付,它的生命周期更长,面向最终客户和生产环境,不是集成成功就完事,而是要保证向生产环境的交付是成功的、可持续的。这是持续集成和持续交付最大的区别。
完整的持续交付涉及配置管理、构建与持续集成、测试管理、部署和发布管理、环境管理、数据管理、度量和反馈等多个过程域。这里要区分部署和发布:部署偏技术实践,是把代码、配置、数据库变更到环境的过程;发布偏业务实践,是把功能正式对用户可见的过程。理解了这一点,灰度发布的概念就好理解了。微服务和容器云是实践DevOps的另一个关键要素,前后端分离、厚中台薄前台的架构越彻底,自动化测试就越容易实现。
我必须强调一个被广泛误解的观点:应用了DevOps,不等于就做好了研发效能管理,没有这么简单。很多企业以为搭了CI/CD流水线、用了容器云,研发效能就上去了,这是把工具等同于了效能。
DevOps解决的主要是从代码到交付这一段的自动化和持续性问题,它确实能提升构建部署的效率、缩短交付周期。但研发效能是一个更大的范畴,它从需求源头就开始了。如果需求本身没有细粒度化、没有体现业务价值,前端的用户故事拆分混乱,那后端流水线跑得再快,交付的也可能是没有价值的功能,这叫做正确地做错误的事。
真正的研发效能管理,需要在持续交付的每一个环节建立有效的度量和反馈机制。度量指标要遵循合理性和有效性,既要有过程指标也要有结果指标,通过可视化的度量数据客观反映研发过程状态,以全局视角分析系统约束点。这是精益思想中持续改进理念的体现,没有度量和反馈闭环,就谈不上真正的效能提升。
而且研发效能还涉及组织和团队结构。DevOps对团队结构是有要求的,比如拆分为两个独立微服务模块,那两个模块的前端、设计、数据库人员就应该是分离的,能够独立管理协同。所以研发效能是技术实践、过程管理、组织协同、度量反馈的综合体,单靠引入DevOps工具链,只是迈出了第一步而已。

我自己带团队做了多年低代码开发平台,并在多个产品和项目中使用,所以对它的价值和局限有切身体会。低代码平台的核心,是通过可视化界面和预设模板减少编码工作量,通过内置规则引擎实现对象建模和数据库设计的自动化,通过可视化工具配置业务流程。它最大的价值,其实是把大量软件工程实践的经验模式做了标准化、模板化和预置。
但低代码平台有它绕不开的局限。它是强模板化、强既有规则约束的,一旦需求超出模板范围,开发效率会大幅下降。它定制化能力不足,难以应对大型复杂项目。更要命的是它具有很强的排他性,一旦使用很容易被平台绑定,通常无法生成通用的原生代码,后续的可扩展性和可维护性都会面临很大问题。
在企业级低代码平台的规划上,我的建议是想清楚它的定位。它适合的是简单应用的快速搭建、非专业开发者的快速上手,以及作为SaaS应用平台生态里支撑合作伙伴快速开发的工具。但要注意它不是零代码,真正有价值的是基于数字化底座的、可编排的低代码开发,API能力可编排、流程可编排、规则可编排、界面可视化设计,这样才能让合作伙伴基于统一的技术底座和规范快速开发应用。
随着AI大模型和AI编程能力的爆发,我对低代码的判断发生了变化。我现在的观点很明确:低代码和AI编程是两种相互排斥的东西,对于未来的快速开发,最适合的路径是AI编程,而不是低代码平台,哪怕低代码简单适配了AI能力。所以我们团队的一个重要决定,就是尽早过渡到AI编程的项目级实践,不再投入更多精力在低代码平台的研发上。
我用一个比喻来说明。低代码平台就像给一部性能不佳的手机外挂的加速器,确实能提升速度。但随着手机芯片本身性能大幅提升,即使裸奔也能达到极致性能,你还会选择挂一个携带不便、需要维护的加速器吗?当AI编程足够强大时,我们完全没必要再依赖低代码这样的加速器。低代码为了配置化开发定制了大量模板和脚本语言,既不便维护,又因为要解析而消耗性能,既然如此,为什么不直接用通用的源代码呢?
AI大模型对RPA产品也有巨大冲击,尤其是随着MCP模型上下文协议的出现。原来需要RPA或专门AI智能体才能完成的爬取网页、生成文档这类任务,现在大模型借助丰富的MCP Server生态就能直接完成,因为大模型本身就具备访问本地资源、爬取网页、任务规划分解的能力,等于具备了传统RPA的编排能力,而且更智能化。短期看RPA在跨系统多次人机交互、结构化界面的严格数据录入等场景还有优势,但长期趋势是以AI大模型为主体,RPA仅作为能力组件接入。
那低代码和RPA还有没有出路?有,但不是被动适配AI,而是反过来。更好的方式是把多年做低代码、做工程实践积累的隐性经验和规约模板化,作为AI编程工具的关键输入,去调优AI编程,形成特有的领域知识模块融入到AI里面去。核心是以AI编程工具为主体,融入原有的私有工程经验实践。这其实也呼应了我反复强调的观点:真正稀缺的,永远是数据到知识层面的转化能力,而不是底层的工具本身。
谈完了从概念到规划、从架构到落地的完整链条,绕不开当下最热的话题:AI大模型时代,数字化转型该怎么走,AI又该如何赋能数字化转型。我的基本判断是,AI不是要颠覆前面讲的一切,而是在数字化已有的骨架上做增强,把数字化从数据驱动推向更高阶的智能驱动。

先说一个我高度认同的观点:在4A架构之外再加一个所谓的AI架构,是不合理的。企业架构从业务、数据、应用、技术四个维度展开,是经过大量实践抽象出来的,自有其道理。AI的内容,应该拆解到已有的4A架构里去,而不是另起炉灶。
具体怎么拆?AI大模型部署所需的算力资源,本身属于底层的技术架构;AI大模型技术底座和算法平台,应该归到应用架构的平台层能力里;而对数据架构,最大的变化是概念要扩展,要纳入更多的非结构化数据、多模态数据。结构化数据加上非结构化数据,才能为AI提供足够强大的底层知识支撑。
把这个逻辑放到信息化、数字化、智能化三个阶段看会非常清晰。信息化阶段是业务驱动IT,流程驱动系统,数据是流程执行后的附属品。数字化阶段4A架构没有大变,但增加了数据驱动业务这条线,数据从被动变为主动。到了智能化阶段,则进一步演进为模型驱动。
模型驱动的本质,是数据加算法的驱动。数据来源于数据架构,算法处在应用架构的AI平台层,两者结合底层大模型能力,就能衍生出AI智能体这类全新的应用形态,去满足新的业务场景。这也解释了为什么企业的智能时代必须遵循信息化、数字化、智能化这条演进路线,很难跳级。
更关键的一点我反复强调过:数据本身不能产生智能,知识才能。信息化完成最基本的数据积累,数字化实现数据驱动业务,而到了智能化,我们需要的不只是数据,而是通过大模型把数据转化为知识,知识是企业大量最佳实践的高度浓缩。所以AI时代你优先要解决的,是如何把隐性经验结合已有数据、借助大模型转化为知识,有了知识才谈得上智能。
AI赋能数据治理,我认为最有价值的突破点,是解决一个困扰了IT建设很多年的老问题:OLTP业务系统和OLAP分析系统之间的割裂。这个割裂的根子,在于传统数据模型天然丢失了业务语义。
什么意思?分析决策类系统依托底层标准数据模型按数仓分层建设,但这个模型是偏静态的,只有数据对象、属性和对象间的关系,它不会告诉你数据形成的来龙去脉,也不会告诉你某个关键属性状态变化该触发什么业务行为。所以BI看板发现库存周转率异常,系统只能把信息通知给业务主管,再由人去计划、供应链、采购系统里逐个排查。
最近流行的本体论,给了一个新解法,核心是一个叫"回写"的动作。回写很简单:在数据侧发现的问题和决策,能够动态地变更或写回到业务系统里去。要实现回写,底层需要本体模型和AI大模型的支撑。
我常举供应链的例子。看板发现某关键物料因供应商延期一两个月而预警,在传统模式下要靠供应链主管自己调整。但在本体模型下,这个延期会触发一个事件进入消息管道,底层那个融合了供应商、物料、合同、订单、交期、约束规则的供应链优化调度模型会自动计算出最优决策,可能是延后某客户订单,也可能是引入新供应商,然后通过回写接口把决策写回业务系统,业务主管只需审核确认即可生效。
这样,数据分析决策和业务运作就实现了完整的双向闭环。支撑这个闭环的本体模型,不是单纯的传统数据模型,而是在数据模型基础上补回了缺失的业务语义、行为和规则。所以我一直强调,本体模型的核心是"对象、关系、行为、规则",再加上事件,它们天然形成一个相互影响、相互约束的语义网络。
但有一点必须泼盆冷水:AI和本体模型再强大,数据治理依然要业务驱动。再先进的技术,也要从一个具体的业务场景切入,比如预算管控一体化、研发全生命周期管理,去解决端到端流程中由数据不一致、颗粒度不一致造成的业务断点。否则又会回到产出一堆没人用的标准和模型的老路上去。

在AI热度高涨的当下,我特别想提醒一句:做企业数字化,千万不要为了人工智能而走火入魔。我见过不少地方,把一个对话框集成进原有业务系统、或者建个小知识库,就对外宣告自己接入了大模型、数字化成熟度很高,这些其实都属于AI最初级的应用。
要厘清一个概念:人工智能不等于AIGC生成式AI。传统的智能化也属于AI范畴,MES里的智能排班、CRM里的销售预测、APS里基于约束理论的计划排程、乃至传统BI商业智能,都是智能化的体现。企业不是非要自建私有大模型、做生成式AI才叫用了人工智能。从这两年看,生成式AI在企业大面积商用落地并没有想象中快,真正成熟的场景集中在智能知识库、智能客服、质量缺陷预测、供应链计划优化等有限几类。
对中小企业更要谨慎。大中型企业的数字化重在集成协同、业务敏捷和数据驱动,而大量中小企业连基础ERP都没建好,它们的数字化要花小钱办大事,先把信息化做扎实,做到人财物的三流或四流合一,远比追逐AI概念实在。企业信息化数字化永远是为战略和业务目标服务的,不是用了先进技术就代表水平高。
那AI到底该以什么姿态进入企业?我的答案是AI原生,而AI原生的本质是知识原生。所谓原生,是指一项能力从一开始就伴随企业核心业务和价值链共同成长、共同进化,而不是长大了再抱养回来。所以AI原生不是新创的AI公司专属,我们真正关心的,是传统企业如何进化为AI原生企业。
这里的关键不是底层技术和工具,而是数据和知识。买一个大模型、上一个智能体,并不等于AI原生。技术、工具、大模型可以是舶来品,可以拿来主义,但企业私有化的知识不能生搬硬套别人的经验,必须结合自身的商业模式和价值主张,在内部大量实践中不断浓缩沉淀。技术是为知识创造服务的。这其实又回到了我贯穿全文的那句话:真正稀缺的,永远是数据到知识的转化能力,而不是底层的工具本身。
把这九大块内容串起来,你会发现我反复强调的几个核心思想其实贯穿始终。数字化的底层逻辑是现实世界和抽象世界的时空统一;三大核心要素是连接、数据、智能;数字化的核心内核是数据驱动,并在AI时代进一步走向智能驱动;规划层面分两层,上层以企业架构为骨架让业务、数据、应用、技术四层融合贯通,下层以云原生为技术底座支撑蓝图落地;战略层面要价值驱动、业务驱动、垂直场景切入;数据层面要从资源到产品到资产层层递进,且没有业务驱动的治理必然失败。
无论是数据治理、数据中台,还是云原生、微服务、DevOps、低代码,乃至当下最火的AI大模型,这些技术和工具从来都不是目的,它们都是为了支撑业务价值实现的手段。一旦脱离了业务驱动和价值驱动,再宏大的框架、再先进的工具,都会变成一潭死水。这是我做了这么多年数字化和企业架构咨询,最深的体会。AI时代真正稀缺的,也从来不是工具本身,而是把数据沉淀为知识、再由知识驱动智能的那份能力。
数字化转型不是给企业插上翅膀,而是逼着企业长出新的骨骼。它考验的从来不只是技术能力,更是组织的认知、变革的魄力和长期的定力。希望这篇系统化的梳理,能为正走在转型路上的同行提供一些可参考的思路。以上即个人多年实践的思考精华,供大家参考。
最后再次推荐下我前面专门视频导读过的一本新书,AI驱动的数据管理。该书给出了一个完整的7+1本体建模框架规范体系,可以重点参考。