用一个面点加工厂来类比理解什么是数据中台

用一个面点加工厂来类比理解什么是数据中台

 

数据中台的概念比较抽象,不同的公司不同的业务,各自说的数据中台,在具体业务呈现上,差异很大。

这就导致我们在理解和沟通数据中台的时候,互相之间不容易沟通明白对方说的是什么。

我试图用类比的方法,对数据中台,就我自己的理解,做一个梳理。也许有很多对的地方,敬请拍砖,感谢。

一个公司的数据中台是和公司的业务紧密整合和联系的系统,数据中台首先面要向公司内部的业务部门,产品部门,技术部门等去使用。

我用类比的方法,来辅助理解一下什么是数据中台。我把数据中台理解为一个面点加工厂。

 

面点加工厂(类比:数据中台)
  面点加工厂需要进货,进的货可能有面粉,玉米粉,红薯粉,奶粉,奶油,甚至包括更多的其他的已知的和未知的原料。
  面点加工厂根据进来的货物,分类进行存储和管理。
  面单加工厂根据业务部门(销售部门,产品部门等)的需求,在技术部门的协助下,生产符合业务部门需求的新产品。

 

原材料(类比:数据)
  对应的我们品泰而言,我们可以把这些原材料理解为数据中台中的各种数据。
  这些数据可能包括来自his的数据,来自体检中心的数据,来自卫健委公卫系统的数据,甚至更多来自其他外部系统的数据。
  这里,那么我们可以把his数据可以理解为面粉,体检中心的数据理解为玉米粉,公卫系统数据理解位奶粉。

 

管道系统(类比:数据管道)
  这些数据原料,怎么进入我们的数据中台呢?
  通过我们的管道系统,导入到我们的数据中台里面来。那么这个管道系统就是我们的数据总线(datatrans暂且这么称呼)。
  目前而言,我们的datatrans只是实现了对部分his系统的连接和数据导入,可以理解为这个管道系统中的其中一个管道已经通了。
  但是对公卫系统的管道还没通(没有建设),对体检中心的管道也还没有建设。这些异构系统的管道,需要单独建设和开发。

原料清洗(数据清洗和归纳存储)
  有可能对接进来的原材料含有杂质,那么就需要数据中台具备能力,对新进入的各种类型的数据,可以进行数据清洗,并且合理的归纳存储。

业务部门的需求(类比:业务需求)
  业务部门的需求,肯定会跟随市场的需求的变化而变化。
  业务部门可能知道市场上目前现有的主要市场需求是什么,但是也可能并不知道某个其他市场主体的个性化需求是什么。
  举例来说:
  业务一部知道,现在市场上大部分的客户主体,都需要馒头这种面点,而且所需要的馒头是圆形的直径10cm,重量为100克的馒头。
  但是业务二部是新成立的部门,面向的客户群假设是某企业。但是业务部门在和这个企业沟通后,发现企业需要的产品是:奶香味的玉米粉方形50克的馒头。可是这种馒头,面点加工厂中并没有,甚至生产这种馒头的生产线都没有建设起来。
  同样的,假设有个业务三部,而业务三部的新客户的需求更加奇葩。他要的是绿豆粉做的奶香味的麻辣味的绿豆糕(怪味绿豆糕)。可是这种东西,原材料在当前面点加工厂中都还不具备。

面点加工厂(类比:数据中台)生产产品
  对于业务一部,他们通知面点加工厂,你给我生产这种规格的圆形的直径10cm,重量为100克的馒头。。馒头加工厂就到原料中去获取面粉和水,来生产这种规格的馒头。然后交给市场部门去销售。
  对于业务二部,他们告诉面点加工厂这个需求后,面点加工厂的生产运营部门在其内部,在技术部门的协助下,很快迅速的搭建起一条生产线(新的产品生产模块),把奶粉,玉米粉,水等揉和到一起, 迅速的产出了奶香味的玉米粉方形50克的馒头。并快速的交付给业务二部。从而迅速的满足业务部门和客户的实际需求。
  对于业务三部,这时候,面点加工厂就需要和管道系统迅速沟通,管道系统迅速的和绿豆粉的厂家进行管道对接,和麻辣粉的厂家进行对接。迅速的将这些新的原料导入到面点加工厂中来,并且按规则存 放好位置。然后面点加工厂的运营生产部门,通过面点加工厂中现有的设备(系统的功能),迅速的整合原材料和加工需求,生产出业务三部所需要的新产品,怪味绿豆糕,迅速的交付给新客户。

小结:数据中台的能力
1、具备快速对接外部数据来源的能力
2、具备快速的准确的数据清洗和数据归纳整理的能力。
3、具备快速响应业务部门需求,灵活组建出各种类型数据输出,以及完整数据业务流程的能力。
4、具备快速的定制全新业务数据或者全新业务流程的能力。

对应到我们公司的数据中台,则初步可以理解为,我们的数据中台应具备下列能力:
1、可以快速的实现对外部数据来源系统的对接。对接的主体是datatrans,具体对接形式,可以有jdbc直连,webservice对接,remote-json-api对接等等形式。
2、可在数据中台内部,可以定义各种数据的清洗规则,存放规则,存放位置等等。
3、可在数据中台内部,自定义各种新的数据报表,自定义全新的基于已有数据的业务流程。所有这些自定义的过程,应该尽可能是在界面上鼠标及键盘操作就能满足和实现。
4、可以讲数据中台中,自定义的各种数据输出,可以轻松的提供给外部系统进行访问。并且具备严格的访问权限限制。
5、基于数据中台,还能实现更多现有思考范围之外的能力,数据中台具备超强的数据和功能扩展的能力。所有这些能力的实现,是基于数据中台软件系统的开发。

 

 

一点心得,敬请拍砖,欢迎指正。

Alex([email protected])