对比数字化转型和数据中台的百度搜索指数,数据中台从2019年4月份起,已经超越了数字化转型的趋势,并且还在不断上升。
01 数据中台的愿景和使命
数据中台成为了数字化转型的下一个趋势,那么数据中台的愿景和使命是什么呢?
数据中台的终极愿景是:数据中台的愿景是打造数据驱动的智能企业。
数据中台的使命是:赋能业务以数据智能的能力,让业务更智慧,为企业创造业务价值
02 数据中台的本质
行业里有众多数据中台的体系。
阿里的数据中台分为五个模块,包括:
数据产品:阿里数据,数据大屏,生意参谋;
数据资产管理:从资产地图,到资产运营;
数据开发管理:从数据采集到应用开发;
智能数据研发:从数仓规划到监控告警;
计算和存储:包括离线计算和实时计算。
广义数据中台的本质
广义数据中台的本质,就是企业数据产品工厂,而这里的数据产品,主要指数据服务。
狭义数据中台的本质
广义数据中台是庞大的,它的构建需要一个演进的过程。但是,如果企业从哪里开始,如何能够尽快的从数据中获取价值呢?
狭义数据中台的本质:ThoughtWorks认为,狭义数据中台的核心是Data API。
数据中台的核心是为前台提供数据服务,哪怕这个服务的后台没有系统支撑,是一个Excel表或者是一个手工填报,只要能让前台从数据服务中获取数据洞察,这就是一个最简单的数据中台的服务。
所以,数据中台是为了前台的业务敏捷提供数据API的中间层。
03 数据中台的六大核心能力
1、数据资产的规划和治理
数据资产的规划和治理,是数据中台的基础功能,它的目的是为了在构建数据服务,数据产品,数据应用之前,先画出企业的数据资产蓝图,尽可能的涵盖企业所有的可能产生和使用的数据,不论是企业内部数据还是外部数据。
数据资产的规划和治理体系,是企业数据战略的体现,承载系统是企业级数据资产目录(Data Asset Catalog)。
并且,ThoughtWorks认为,企业的数据资产不仅包括Raw Data,所有的能够带来价值的,从数据中衍生出来的数据产品,数据服务都是数据资产的一部分,企业都要将它们规划和管理起来。
2、数据资源的获取和存储
围绕战略的数据资源管理,在企业梳理了构建了自己的数据资产蓝图后,就需要将这些数据资产对应的数据资源进行存储和存储,也就是很多企业常说的,“数据入湖”。
数据资源的获取和存储,在广义数据中台体系里是数据平台的一部分,不同的企业在不同的阶段,可以采用的技术手段是不一样的,关系型数据库,大数据平台,数据湖,乃至最简单的文件存储都可以作为数据资源存储获取的方式,并不一定要拘泥于一种形式。
这个模块的核心是数据资源是能够被按需获取到的,这也就意味着,哪怕我们不构建独立的数据存储,让数据留在源系统中,只要能够在需要的时候获取到,也是可以的。
3、数据资产的共享和协作
构建企业级数据资产协作体系。如何能够让企业的业务更智慧,这里最重要的事情就是跨域数据的组合和分析,不同领域的数据的挖掘,整合才能产生人的经验所不能够具备的洞察。
数据中台区别于传统数据仓库的一个重要的特点,就是数据中台是企业的数据服务的协作生产平台,他是一个能够让业务需求人员,数据分析人员这样的数据使用方和数据工程师,数据管理员这样的数据提供方在一个平台上去共同使用同一套企业的数据资产的协作平台。这里很重要的功能就是企业数据门户,企业数据目录和数据版本管理,数据沙箱(Sandbox),数据分级权限体系。
4、业务价值的探索和分析
构建业务价值的探索体系。数据中台是一个数据服务工厂,那么这个工厂应该生产什么服务呢?
就像传统的工厂都会有一个研发中心一样,数据中台需要一个数据实验室平台,能够让业务人员,数据分析人员,数据科学家们在数据协作平台上,利用同一套数据进行业务价值的探索和分析,从而识别有价值的数据集,然后在批量生产,形成数据产品和服务。
5、数据服务的构建和治理
构建快速发布和利用数据服务的体系。当有价值的数据服务在实验室(研发中心)中被识别出来,并且通过协作平台被验证,那么这个过程就要被工业化,形成一个数据服务的生产线(Data Pipeline),从而能够被自动,批量的生产出来,为业务提供按需的服务,这就是数据服务的构建部分。
数据中台会生产非常多的数据服务,所以,数据中台同时要提供这么多数据服务的治理功能,从而保证数据服务的全生命周期体系化管理,优化有价值的数据服务,下线过时的数据服务。
6、数据服务的度量和运营
数据服务的价值度量和运营体系。传统的数据仓库系统往往只关注系统的稳定性,但是并不关注提供的数据报表的使用情况,被应用的如何,是否为业务产生了价值。
转载自-网易新闻