袁文泽博客带你用大白话理解什么是数字化转型,为了方便阅读,请关注@袁文泽博客
数字化转型的关键在于数据,也就是把数据用好、用活,为企业创造新的价值。可以说,数字化转型的成败就在于转型的决策者对数据的认知。决策者如果能准确判断出数据里面有没有“金子”,同时知道怎么把“金子”挖出来,转型就会有可观的收益结果。
任何企业的经营都离不开数据,但是在大多数企业的日常工作中,对待数据的态度并不一定都是“端正”的。就好比我们都会刷牙,但是刷牙的方式并不一定都对,我们对数据的理解也经常是在“想当然”的层面上,怎么方便怎么来,怎么能应急怎么来,而忽略了数据本身在开放性、价值性、逻辑性、规范性、安全性等方面一系列重要的属性。
因此,要有效地开展数字化转型的工作,首先要构建科学的数据管理和数据使用方法,让数字化转型有章可循、兼顾全面。其中,数据的管理也叫作数据治理,为数字化转型提供重要的制度规范保障,数字化转型不只是上系统、上应用,更是组织中人在和数据打交道时工作方式的转变;数据使用方法,则包括了数据产生、数据分析、数据应用3个重要环节,任何数字化的核心过程,都是按照“三步走”在执行,有了这个思路,就不会在转型的过程中迷失。
下面再从通俗的角度讨论一下数据的价值是如何产生的,这样有利于我们快速分辨什么是重要的数据,以及应该沿着什么思路构建有价值的“数据金矿”。数据的价值在于关联,更多的数据关联会带来更大的数据价值。总之,从转型中产生效益的关键就在于想方设法地创建和挖掘数据之间的联系。
最后我们介绍一下“元数据”的概念,也就是如何定义数据。元数据包括业务元数据和技术元数据,二者侧重点不同,彼此之间有着紧密的内容上的衔接。元数据可以把业务上人用自然语言表达出来的数据需求转换成机器可以理解的程序语言。利用业务元数据,管理者或决策者可以毫无歧义地表达“我想要什么数据”;利用技术元数据,数据工程师也能快速知道如何准确地用代码实现这个“数据需求”。元数据为业务人员和技术人员提供了讨论数据的语言基础,保证了转型过程中数据创新的效率。
根据前面的讨论可知,大企业有数据,但是管不好、用不好,所以需要进行数据管理和系统建设;而小企业呢,数据本来也不多,对数据的管理就更不重视了,要么根本意识不到自己有数据,要么急于拓展业务,根本不在乎数据管理的问题。然而,在数字化转型中,数据是处于非常关键的地位的,所有的业务创新和效率提升,都得围绕数据“琢磨”产生,企业价值的来源,也是数据。因此,只有把数据管好了,后面在转型创新的时候,才能把数据用好,让数据充分地发挥作用。在很多企业里,数据管理也有个更加正式的名字,叫作数据治理。本节中我们就来介绍一下数字化转型中对数据的管理问题,并深入探讨数据治理给企业的数字化创新带来的具体好处。
数据不光要管,还要管得全
要想做好数据管理的工作,首先要能识别什么是数据,并且知道管理的“边界”和范围在哪里。很多企业管理者问:“我连数据都没有,怎么做数字化转型?”然而真的是这样吗?
因为所在行业不同,发展阶段不同,企业能够接触到的数据规模也有差异。但是,任何经营中的企业都是有数据的,很多时候,是管理者没有对这些“隐藏”的数据予以足够的重视,误以为没有数据或缺少数据。如果管理者没有一个全面的“数据观”,就会错失很多有价值的“信息资源”。
数据不是互联网行业的专利,无论是传统企业还是创新企业,都拥有大量有价值的数据。只要企业在运转,就无时无刻地不在产生新数据,区别在于有的数据比较明显,而有的数据看起来不太像数据。
数据,代表一家企业经营的“痕迹”。因此,我们也可以认为,通过分析数据,可以了解企业的前世今生,如企业是怎么运转的,企业的经营环境发生了什么变化,企业遇到了什么危机,企业面临着什么机会……
那么,数据到底是什么呢?一切有业务意义的,可以被存储并被理解的信息都可以称为数据。数据可不只是“工资条”上的那几个数字,数据有着更广泛的意义。对于企业来说,数据可以是所有客户的电话号码,可以是消费者的订单记录,可以是电商平台上用户的留言建议,可以是秘书拿来的一张报销单据,可以是业务主管第N次修订好的业务手册,可以是实习生呕心沥血完成的分析报告,也可以是机房系统里面飞速“刷屏”的符号编码……
有的数据是数字,有的数据是文字,有的数据是音频、视频、图像,还有的数据可能只是一堆原始的0、1字符。
数据有那么多的表现形式和内涵,这些数据散落在企业的不同部门、团队和人员的手中,也藏匿在不同的系统、计算机、硬盘和文件夹里面。对于大企业来说,数据的体系十分庞杂,在数字化转型中,要想用好数据,实现有价值的业务创新,就得先把这些乱七八糟的数据分门别类地整理好,对这些数据进行科学规范的管理。只有这样,后面在用到这些数据的时候,才能轻松地找到它们,最大化地利用这些宝贵的数据资源。
经过调研发现,在业内,数据管理混乱可以说是大企业的通病了,几乎所有大企业在进行数字化转型时,都绕不开对自身数据管理工作进行“整顿”的这个步骤。大企业每年都会投入大量的资金对人员、库存及设备耗材进行管理,可是为什么就偏偏管不好数据呢?大多数的大企业,对数据的管理不够彻底且不全面,这是需要不断强化和规范的。
在企业进行数字化转型之前,数据管理的目的是把业务顺畅地完成,只要保证不影响具体业务的开展就行,比如对购买交易的支撑、对产品加工流程的支撑、对信息服务提供的支撑。
凡是在核心业务流程中的数据,都有被精心管理;而不在核心业务流程中的数据,也都会被有意无意地忽视。与核心业务无关的、不重要的数据,因为访问得少,平时用不到,所以就会被随意存储,甚至不存储。
正因如此,企业中关心数据的人,一般只有业务系统的维护人员,可能还包括财务人员和市场销售人员。企业中真正关心数据怎么用的人并不多,哪怕他们会接触到或手中有很多有价值的数据。
这种数据管理的思想,的确是非常“狭隘的”。
在数字经济时代,数据管理更多的应该是面向未来的,一切业务的开展都需要考虑企业未来的发展方向。数据应当被当作能够创造价值的资产来对待,这个价值不仅应该体现在对现有业务的支撑上,也应该考虑到数据对未来业务创新拓展的巨大帮助。
很多数据虽然没有在当下的业务中被用到,但是数据中蕴含的重要产品信息、用户信息、市场信息,都有可能会支撑新的业务的开展,也会促进现有的业务优化。
所以说,不管这个数据眼下在不在业务主流程的“必经之路”上,只要是在企业的任何经营活动中产生了,就应该被予以应有的重视,被规规矩矩地存储和管理起来。在数字化转型中,对数据应该持有开放的心态,眼光放宽、放长远,要具备发掘有价值数据的能力,除了关注业务主流程的数据,也要“注意到”任何在未来可能会对企业发展发挥重要业务价值的数据,如市场调研数据、用户反馈数据、研发试验数据、故障统计数据、新闻媒体数据、政府公告数据、股票波动数据、竞品参数数据、社交互动数据、网页访问数据、行研报告数据、场景活动数据、产品体验数据……
当然,任何事情都有两面性,一些企业对数据的态度,有时候也存在“过犹不及”的情况。这些企业不分轻重缓急地“囤积”数据,只存储不管理,觉得数据就是越多越好,但是完全不知道当初为什么采集这些数据,以及这些数据要怎么用。不理解数字化的内核,不了解怎么从数据中挖掘价值,不厘清业务底层逻辑和数据的关系,只是想当然地把一切数据尽可能地堆积起来,这样就有安全感了吗?
数据要想用好,不仅要存储,而且要管理,给数据赋予业务含义。只存储不管理,相当于没有存储。这就好比担心没有衣服穿,就在“双11”买了一堆衣服,但是新买的衣服还是像以前一样乱堆乱放,临出门的时候还是会跟往常一样面对“没衣服穿”的烦恼。
另外,我们还要充分认识到企业的数据存储资源是有限的,有些数据的获得也是要采购花钱的,不能什么数据都一概而论地加以存储,要存储那些真正有价值的数据。数据不是悬浮在空气中飘着的,而是要放到“硬盘”里的,如果不加甄别什么数据都存,硬盘空间很快就满了。
总之,不好好对数据进行管理,硬盘里的数据就是“死”数据。这些数据白白占着坑位,浪费资源,不但发挥不了任何价值,反而会拖累企业自身系统的工作效率,最后数据就跟计算机病毒一样,增加隐形的运营成本。
集中管理,打破信息之间的屏障
目前,很多企业对数据的管理不是集中化的,而不集中化导致的结果就是数据不标准、不透明、不易懂,以及不会用等一系列问题。
在一个企业里,每一项数据从产生到存储,再到使用,不管是以什么样的形态,按照什么样的流程,一定有一些人是了解其中的情况的。这个人可能是部门经理,可能是核心业务骨干,可能是新来的实习生,也可能只是一个普通的数据库维护人员。
当一个企业只是一个初创小企业时,整个公司就那么几个人,想要获取一些数据,不知道在哪里,互相问问就知道了。但是当一个企业的经营体量庞大了,建设的系统变多了,业务线变复杂了,要想搞清楚数据在哪里就变得非常困难了。一个大企业动辄几千人,总不能一个一个地问过来吧,为了得到数据,给“全体人员”发送邮件,在整个集团里面折腾,恐怕谁也不想以这种方式工作。
数据管理不集中,会给数据的使用带来特别多的麻烦,让数据本身的价值发挥不出来。下面是一个在开展数据分析时,因为找不到数据而产生困惑的典型故事场景。
小张要对企业某个关联机构的业务数据进行分析,以支撑部门的一些市场判断和决策。尽管通过企业的数据平台,可以下载到一些粗粒度的报表数据,但是对于更加详细的数据,数据平台并没有进行展现,数据平台的数据主要面向总体决策,对某个“业务专题”的支撑还是远远不够的。
因此,小张就得考虑从原始数据入手,准备在一手资料上面进行分析,找到数据在哪儿,构成了一个“破案”谜题。小张先问了他所在团队的一个前辈,通过前辈的关系,打听到某个团队的工作可能涉及这个机构的相关业务。然后小张通过企业OA通讯录,电话联系到了这个团队的主管A,跟他交涉了需求,然后A把他的一个下属执行人员B的信息给了小张。
接下来,小张又和B进行了沟通,但B说他在休假,让小张联系C,虽然C不是他们团队的,但是C比他更懂。C告诉小张,这个业务的数据他只掌握了一部分,可以解答,但其他方面他也不清楚,提示小张和技术开发部门联系,开发部门的D和他对接比较多,可以去问问。现在,把D挖出来了,这个信息很有价值,看来小张马上就可以接触到一手信息了。
联系到D了。没错,D了解这里的细节,但是D很忙,抽不出时间答复小张,业务分析不是他的工作,人家着急修改Bug呢,毕竟马上就要开展“营销活动”了,几个版本的功能急着上线。小张跟D“磨”了好长一段时间,最后D终于同意提供一些那个核心机构的业务数据资料了,前提是必须要走企业级的流程。从小张到小张的主管,到小张的部门经理,到D的部门经理,到D的主管,再到D,等流程全部走完,又过去两天加一个周末了。好了,终于要到资料了!
这一大圈,事情不大,热闹不小。一个数据在哪儿,谁负责,谁明白,这么简单的事情,在没有数据管理的情况下变得如此复杂。小张不知道为什么一个做分析的人员要亲自去找数据,也不知道开发人员和业务人员谁更清楚数据在哪儿。整个寻找数据的流程,难道不能自助查询解决吗?
由此可以看出,对数据进行集中管理有多么重要!不管是分析人员,还是企业外部使用数据的用户,都应该可以轻松地找到有用的数据资源。数据集中管理就是要破除企业里的“信息迷雾”,保证数据和信息的充分公开。
任何想用数据做点事情的人,在规定的权限范围内,都应该很容易地做到对相应数据资源的访问和获取,而不应该把精力浪费在寻找数据的线索上。毕竟市场竞争已经很激烈了,常规业务都做不完,就更不应该再因为“管理问题”内耗了。
不管什么事情,企业内部得先管理好、配合好,才能达到“系统”整体性能的最优。只有这样,才能集中企业里所有的“智慧”,以共享的方式挖掘数据中的业务价值,一起形成合力,加快推动企业数字化业务创新的步伐。
统一标准,让数据都说“普通话”
对数据除了要进行全面管理、集中管理,更要进行规范管理。数据是企业的重要资产,就跟“钱”是一样的,可以为企业带来价值。财务部门会对“钱”进行规范的管理,会制定很多的财务制度,规范企业内部“钱”的使用,比如付款、出纳、报销、核销、对账、借款。类似地,企业也要设置数据的管理部门或专项团队,比如大数据部,对数据的一系列使用行为进行规范。
进行数据治理工作,首先要对数据进行标准化和规范化定义。
企业内部存储着很多数据,以不同的格式存储在不同的位置,那么这些数据应如何定义呢?这就需要有人给出一个清晰的、统一的定义。如果不了解数据的意思,就没法使用数据,更谈不上数字化创新。尤其是结构化的数据,通常就是一堆数字加一个“表头”,若没有定义,理解起来就会极度困难。数据定义就是用于理解和交流数据的。
那么数据用什么来定义呢?答案还是数据。没错,用数据来定义数据,这个特殊的数据叫作元数据。
元数据相当于字典,告诉我们什么数据是什么意思,它的作用就是翻译,实现业务数据描述语言和技术数据描述语言之间的相互转化,让企业里所有的员工,不管是领导、业务人员,还是工程师,都能没有歧义地顺畅理解数据和交流数据。
元数据又进一步划分为业务元数据和技术元数据。
企业里面的业务术语很多,比如常见的有业务统计指标、用户群组分类、业务分类、产品分类、主题分类等,业务术语有很多约定俗成的说法,对于内行们来说,这方便了交流,却给数据分析人员、技术人员、服务外包人员,包括企业“新人”都带来很大的困惑和很高的学习成本。
业务元数据可以用来描述业务术语背后的具体含义,说明其与企业核心业务概念的关系。业务元数据可以帮助业务人员之间进行无障碍的交流,也可以帮助业务人员清楚地表达自己对数据方面的需求。
而技术元数据则更多的是被开发人员拿来使用的,用来解释在软件开发环境中的一些技术术语,比如程序变量,以及数据表的表头是怎么支撑企业核心业务的数据交互实现的。
于是,企业的核心业务概念就成了中间的“枢纽”,一边是业务术语,一边是技术术语,成为企业内不同人员交流的桥梁语言。
当业务人员提出一个数据方面的需求时,先用业务元数据将数据需求定义清楚,用企业核心业务概念的逻辑关系进行解释。然后用技术元数据翻译成具体的开发环境语言,告诉程序员应该怎么在系统的开发实现中记录这些数据,或者在数据分析环节获取相应的数据。
除此以外,技术元数据还可以实现不同信息系统之间的互联互通,在不同系统之间要进行“数据交换”的时候,比如把一个系统中的数据加载到另一个系统中进行汇总分析时,就得用技术元数据来讲清楚不同系统中哪项数据对应哪项,保证数据在置换位置的时候,业务含义不发生变化。
有了业务元数据和技术元数据,业务人员之间、技术人员之间,更主要的是业务人员和技术人员之间,才能好好说话,避免互相扯皮,减少“我说了你不做”,或者“我做了你不懂”之类的各种误会。
在数据管理活动中,对数据的定义是非常核心的一项“硬工作”,耗时又耗力,但一旦这件事情做好,后面的数字化创新工作就会事半功倍,效果明显。
除了数据定义,还要规范数据全生命周期管理中的各种人的行为,这样做的目的,是让企业里的人,能够“有责任心”地对待数据,同时保证尽可能地“安全生产”,不出问题。这就涉及很多细节了。
在数据的产生环节,要规范:数据谁来引进,怎么引进,引进数据的费用怎么核算支出,怎么存储,在哪儿存储,数据存储时应该满足的数据质量条件,存储之前的校对程序,以及数据怎么更新。
在数据的运营环节,要规范:数据的变动谁来维护,当存在多个数据源的情况时以哪个版本的数据为准,数据出了问题由谁来负责,数据应该怎么备份,数据的使用记录如何审计。
在数据的使用环节,要规范:数据谁可以使用,每个人的使用权限和修改权限,数据应该以什么方式使用,使用数据应该征求谁的审核批准,对外数据“赋能”应该采取什么方式,对内数据调用“获取”应该遵循什么流程,如何保障数据安全,如何保证数据主体的隐私,使用数据的利益应该怎么分配。
在数据的销毁环节,要规范:数据销毁的流程,数据销毁的条件,以及误删数据怎么恢复。
总而言之,数据治理是一个“耐心活儿”,就像管理其他企业资产一样,需要考虑方方面面,要出台一系列的制度、条例、规范、准则,然后要求企业成员按照规范的要求使用数据和操作数据。随着业务的不断增加,数据应用场景越来越丰富,数据治理工作也要同步、持续来做,把它当作一个常态性的工作坚持下去。
尤其对于大企业来说,有时候需要几年甚至十几年来做数据治理的工作。数据治理是数字化转型的“先锋官”,是做好数字化转型系统建设的基础。“磨刀不误砍柴工”,数据治理虽然麻烦,但是既然下定决心要进行数字化转型,这个过程就不能省,也省不了。
图片来自网络
数据安全一直是企业数字化转型中人们特别关注的话题,尤其是大型企业,涉及许多敏感的核心业务数据。具备保障数据安全的成熟制度和技术能力,是全面开展数字化应用的重要基础性工作。
数字化转型的核心是数据,对于一个企业来说,数据到底是怎么产生的,存储在哪里,又有什么用,这些事情要弄明白。理解一个企业有很多角度,想用好数据,通过数据进行业务创新,增强企业的价值,就得明白企业的数据生态,也就是企业中的数据是怎么组织的,在哪里会用到,以及怎么用。
关于数字化的基本环节,就是数据的生产、数据的分析及数据的应用,所以本节就以动态视角,从这3个基本环节,深入且系统地了解一下,数据从哪里来,到哪里去,数据在企业的信息流中发挥了什么作用,以及是如何支撑企业的日常经营、运转的。
业务系统,数据的“造矿机”
数据是怎么产生的?在过去,很多数据是由人工记录的,比如通过记录员直接手写在纸上,稍微高级点的方式,就是把数据录入Excel表格中。过去的几十年中,随着各行业争先恐后地进行了信息化改造,企业的很多业务活动由机器代劳,自动地把该记录的数据都记录了下来。这些代替人的机器,也就是我们所说的业务系统。
例如电商平台,主要的功能是通过互联网卖货,但是当平台把线下的销售活动搬到线上的时候,用户的一举一动也就都被记录下来了,包括用户把哪个心仪的货物放到了购物车,以及给哪个商品好评了等;又如医疗行业,以前很多地方看病都得把信息记录在纸上,医疗信息系统出现之后,方便了医生对患者提供全流程诊疗服务,同时,系统也把患者每次的就诊详情都存储在计算机里,方便对患者病情的跟踪和管理;再如餐厅场景,用手机App代替餐馆服务员的人力投入,让食客自己便捷地“点菜”,而App同时也记录了每个食客的就餐时间和口味喜好。
在特定的行业场景里进行信息化升级改造的时候,这些业务系统提高了业务流程的自动化水平,也“顺便”解决了数据产生的问题。业务系统可以是电商平台、医疗服务系统、点餐平台,这些都是负责实现企业核心业务活动的。在企业中,业务系统有时也会被称作生产环境或前台系统。为什么叫前台系统呢?因为业务系统“冲”在企业生产经营活动的最前面,直接面对着激烈的市场竞争环境,所谓“听得到炮声的地方”。
这些系统直接面向企业的最终用户,不管用户是C端的还是B端的,这些系统都随着企业的经营活动源源不断地产生着数据,不停“造矿”。
技术方面,在每个业务系统里,都需要有一些数据库,而每个数据库又包含很多承载具体业务数据的数据表。业务系统通过代码自动控制数据表中的数据,通过对特定数据的增、删、改、查等逻辑操作,实现某个原先由人实现的业务操作流程。
要特别强调的是,在业务系统数据表中的数据通常比较难理解,表头中的名字,都比较抽象,甚至有些表头似乎没有什么用。这些表是没有人会去读的,这里的数据,也没法直接使用。为什么呢?因为业务系统中的数据表,不是给人读的,是给机器读的。这些表中的数据用于让机器明白怎么把各个业务环节打通,以支撑某个特定的线上业务活动。
业务系统中的数据是“原始”的,就和原矿石一样,没法直接使用。但是没关系,这些数据表中的数据只要经过加工,就可以马上被转换为方便理解的数据了。业务系统中的数据,其实就是技术人员视角的数据,只要通过元数据的翻译转换,就马上能变成业务人员容易看明白的内容了。
在消费领域场景中,用户的每个应用操作,都会让业务系统产生一系列的数据。而这些自动生成的数据,其实具有很大的分析价值,可以帮助企业“深刻”地了解其用户。以前想了解一个用户,需要发问卷进行调查,但是在问卷的形式下,用户可能会嫌烦乱填,得到的数据可能是无效数据。相较而言,业务系统自动产生的数据才是真正的数据。
业务系统产生的数据包括两类,一类是主业务数据,另一类是行为数据。
主业务数据是核心业务相关用户操作产生的关键数据,比如用户对商品收藏、购买、支付、添加收货地址、使用优惠券等的行为信息。没有这些信息记录,交易就完不成,用户体验效果也就达不到。
而行为数据,则不一定支撑业务中的关键流程,但是这些行为数据里蕴含了用户的个性化信息,如用户喜欢什么,关注什么,为什么使用这个网站或应用,想得到什么。典型的用户行为数据形式,就是用户的网站操作记录,如进入哪个页面,从哪个链接跳转到哪个链接,有没有打开广告,播放了几秒动画,等等。
对用户行为数据的采集,应该有意为之,这些数据的产生不一定在业务流程上,所以要采集哪些、忽略哪些,就得靠数据分析师的洞察力了。当收到分析师提出的数据采集要求时,软件开发人员就需要根据指示,在特定的网页中添加一行指定代码,让这行代码默默地采集用户的操作行为数据。这个用特定代码采集用户行为数据的技术,也叫埋点技术。
业务系统不只支撑业务,更是生产数据的“造矿机”,谁负责业务实现,谁运营业务系统,谁就掌握了数据的生产。很多大企业的业务场景综合信息化水平较高。因此,这些企业能够自动制造出来的数据也十分丰富,有非常好的数字化变革基础。对于规模较小的企业,由于业务少,场景单一,就很难通过业务系统积累数据,数字化创新的难度自然也就比较大了。
探索数据背后的规律
数据产生后,需要对数据进行分析。其实,任何企业都对数据分析存在巨大的需求,而这些需求最开始来源于管理者的经营决策。比方说,一家销售企业,管理者自然关心卖出了多少货,和上个月比较怎么样,哪个品种卖得好,哪个货卖贵了,等等。在企业配置了信息化设备之后,获取这些数据并不难。通过引入一系列的业务分析系统,可以很好地对这些数据进行业务分析,发现生产经营规律,然后根据市场因素及时地调整经营策略。
业务分析系统可以很好地帮助企业内部的管理者对经营数据进行分析,发现管理问题,让管理者进行“聪明”的决策。业务分析系统有不同的类型,比较正式的分析系统可以是集成了各种复杂数据查询和分析功能的大数据分析平台,也有一些是只针对特定管理部门的专项办公管理系统,而更为朴素的可能是Excel。
分析系统属于离线系统,与生产系统互相独立,在企业的大后方。生产系统在前方打仗,分析系统在后面指挥,二者各司其职。
分析系统的数据组织形式与生产系统的不同,虽然数据都是存储在数据库中的,但是数据表的定义是不一样的。毕竟,生产系统是执行端的系统,而分析系统是决策端的系统。与业务系统不同,分析系统的数据是需要被人阅读和理解的,所以在数据的定义和规范上就得更加人性化,人们口中一直念叨的数据表,其实指的就是分析系统中的数据表。
需要特别说明的是,大数据分析平台作为后台系统,在系统层面有时会和前台系统自动关联起来。业务系统中的“机器表”,可以通过某种“元数据”规定好的方式,自动汇集整合,形成多维度的服务于人的“业务表”。接下来,分析人员和管理人员就可以按需自助取数,然后进行决策,这也就是我们经常听到的商务智能的概念。
其实,无论一个企业是否进行数字化转型,是否开展数字化业务,都会用到后台的分析系统。在传统模式下,分析系统是离线工作的,通过数据分析得出的业务结论,以及业务结论可能产生的经营活动的改变,大多会停留在原有的业务逻辑中,不会对业务流程本身产生“深刻”的影响。此时,分析系统只是辅助,本质上决策还是人作出的。人看了数据,知道怎么回事了,然后要么维持现状,要么提出意见,人为制定一些经营策略,调整一下业务布局,原有的业务模式不发生显著变化。
而在数字化的场景下,数据分析是直接支撑业务过程的,本身也是业务的一部分。数据分析挖掘出来的宝贵业务知识,可以通过规则、模型、函数等计算机可以理解的信息表示方式,被融合在系统代码里,通过自动执行代码为用户提供自动化、智能化的高级服务。
在这个过程中,数据分析不只帮助人了解情况,还帮助人发现更多的商业机会,计算机把这些“机会”直接嵌套在业务流程中,让更高级的业务过程自主执行,创造更大的价值。
在数字化的业务模式里,传统的大数据分析平台作为总体的经营决策工具仍然存在,但是对数据的应用,更多的则是强调精细的算法和模型,也就是用数据里的知识优化业务,或者基于原有的模式创造新的业务,服务更多的用户。数据分析虽然在后台进行,但最终还是会回归前台。
创新即将实现,运用知识再出发
通过数据分析获得有价值的业务信息后,数字化就又回到了前台的业务应用。而此时的前台应用和最开始的前台应用相比,已经有了本质上的不同,即业务模式发生了根本的变化。数据给业务带来了新的改变。
在新的业务中,用到了从之前的数据中挖掘出来的知识,这些知识会成为新业务系统的一部分。这些业务知识可以告诉我们由不同业务场景可以得到什么结论,从而能提供什么技术服务,在软件系统层面,就是指在不同的给定条件下应该输出什么信息给用户。
例如,某个短视频平台积累了很多用户对视频的浏览、收藏和关注等行为数据。通过数据分析,平台方搭建了一个智能的技术模型,这个模型可以自动判断指定视频的主题类型。
当某个用户上传一个新的视频时,这个模型就可以“机智”地给视频打上主题标签,比如旅游、美食、健身、交友等。构建这个模型的过程,就属于数据分析工作的一部分。
但是,与传统的离线分析不太一样的地方在于,这个“打标签”功能的实现不是为了写报告,也不是为了做PPT,而是要把这个数据分析能力“反哺”给前端用户,为他们提供更好的技术服务。
有了这个“打标签”的技术模型,开发者可以在App的升级改版中,加入新的功能,当用户上传自己的短视频作品时,App能够自动给视频打上精准的业务标签,这样短视频就能很容易地被其他人搜索并访问到,用户上传内容的传播效果也就更好了。
在一些大企业里,很多小而精的数据团队钻研这些数字化的技术模型,设计能够给企业带来有效价值的新的服务模式。以前,这些技术团队只是给领导们打打下手,找点数据来验证领导的想法。而在数字化时代,数据团队变成了冲锋陷阵的得力干将,团队成员们富有激情地在数据上进行实验,把数据当作原料,设计自己的技术作品。在获得了足够聪明可靠的技术模型后,这些模型就会被选出来,更新到业务平台,发挥更大的商业价值。
在数字化企业中,每隔一段时间就会有新的、有趣的模型被发现,然后这些模型就会像“产品”一样,被上架消费。模型背后对应的业务逻辑和服务流程,自然也会对用户体验和市场环境产生影响,于是模型的“上架”就应该经过企业管理人员及产品经理的论证、把关和审核才可以被应用。毕竟,数据人员有时候和“市场”还是会存在一些距离的,容易犯一些“想当然”的错误,导致技术模型本身存在误导性,把业务带偏了。
对于数字化企业来说,在大多数情况下,一个业务系统或平台会同时支撑很多个技术模型的运转,用户在不同的功能场景下,会用到不同的智能服务模型。因此,数字化企业应该对技术模型提供统一、规范的管理,比如维护一个“模型清单”。
这个“模型清单”会记录哪个模型被用到了,从什么时间开始“上线服役”,什么时候“下线维修”,模型是哪个团队开发出来的,模型占用的硬件资源情况怎么样,模型有几个版本,现在用的是哪个版本,各个版本之间的功能有什么不一样,以及模型的运行状态是否正常。
数据的应用是数据资源在数字化过程中的“最后一棒”,也是真正创造价值的一个环节,要贴近业务应用,好用,并且能解决实际问题。数字化时代,数据的应用形式很多,有的仅靠软件应用就可以实现,而有的应用还得结合线下的“智能终端”设备作为物理载体,比如智能音箱、智能售卖机、智能生产线、智能汽车等。
物理世界中的商业活动产生的信息,以数据的形式进入虚拟世界,在虚拟世界中进行分析、加工,挖掘世界的本质规律,这个规律就是业务知识,然后这些知识再回到物理世界,改变物理世界。本质上看,所有的数据应用其实也就是这么一回事。
图片来自网络
大数据分析平台可以为企业的经营决策提供多维度、多视角的自动化数据查询功能和综合信息挖掘功能,并且以丰富的大数据可视化功能,提供更好的信息展示,帮助管理人员更加方便地跟踪业务状态,快速定位经营产出变动的复杂因素。
前面讲述了数据的生态,本节则主要介绍数据的价值到底来自哪里,以及如何看待数据和数据背后业务知识之间的关系。我们现在已经很清楚,数字化转型的核心思想,就是从数据中挖掘出有业务价值的知识,然后用这些知识来指导业务实践。那么,这里所说的知识,到底是什么呢?
知识的本质:万物之间的联系
单纯的业务概念不是知识,知识是事物之间的联系。例如那个经典的大数据例子——啤酒和尿布的故事,讲的就是消费者对啤酒和尿布两种产品的消费行为之间的联系。通过数据分析,企业的管理者可以发现很多经营活动中的业务规律,然后就知道该如何改进自身的业务了。例如:
“某个商品的销量和价格之间的联系是什么?”
“消费者关注的某个话题和对某个产品的消费意愿之间的联系是什么?”
“某人在某个区域内工作活动和这个人对周边美食兴趣之间的联系是什么?”
“某个生产环境的参数变化和某个零件出故障之间的联系是什么?”
“某个金融产品的历史表现与相关公司的基本信息和这个金融产品未来的价格走势之间的联系是什么?”
知识,具体来说,就是一件事情发生后能够告诉我们的关于另一件事情发生的信息。
例如,我发现了A事件的发生与B事件的发生有很大程度上的联系,这个B事件恰好就是我们关心的关键业务事件,包括“某个消费者是否购买某件产品”“某个手机用户是否会关注某个特定主题的短视频”“某个线上广告是否会被点击”等。当我下次遇到A事件的时候,我就知道可能B事件将会发生,于是就可以提前采取一些措施为B事件的发生作好准备。相应地,如果我希望B事件能够更多地发生,那么我可以努力创造作为前提条件的A事件。
这些关键事物之间的规律,是蕴含在企业的业务大数据中的,是可以通过总结分析发现的,比较“学术”的说法也叫作统计规律。我们要想总结获得这些规律,背后需要使用一些基于数学计算的统计分析方法,也就是我们常说的数据分析技术。
从纯技术的角度来说,数据分析又分为很多细分方法。
例如,以机器分析为主的方法,包括机器学习、深度学习、模式识别等;人和机器协同分析的方法,比如机器先根据数据绘制出统计图,分析人员再通过观察统计图的形状和趋势推理出数据背后的业务故事。
掌握了上面的这些数据之间的联系,企业的业务活动也就变得更有确定性、更加可控了,从而可以起到提升企业经营效率的作用。这些联系,也就是我们所说的有价值的业务知识,如果被人掌握了,那么这个人就可以把工作做得很“通透”。类似地,如果被机器掌握了,机器自然也会和人一样的聪明,知道什么时候该做什么,能自主地把某项工作完成得很好。
在数字化的模式中,这些知识很多会以“规则”的形式固定下来,类似于格式“如果……那么……”。这些规则会通过计算机程序进行编码,或者以某种特殊结构的数据存储在机器数据库中,通过信息编码的方式让机器掌握这个知识,然后计算机就知道在各种场景下如何把事情做得好,并且做得对。
现实中,人们通过长期的生产实践其实已经掌握了很多业务知识,但是更多的知识,人们还没有掌握。要么是这个行业比较新,业务人员接触到的情况还不够多,要么是业务逻辑太复杂,难以归纳出来。前者是事实的、显性的、已知的知识,而后者是蕴含在数据中的、隐性的、未知的知识。
前者的知识形态只需要专家人工梳理总结就可以了,这些知识本来就有,应该尽快地、全面地、彻底地利用起来。我们有时候也把这种数据叫作高价值密度的“知识型数据”。后者呢,则需要通过数据分析的技术手段来发现了,也就是用计算机算法自动或半自动地从海量大规模数据中提取、挖掘有价值的信息,探索有用的统计规律。
不管是现成的知识,还是通过数据分析发现的知识,都是数字化业务设计及业务实践落地的重要基础。知识就是力量,要把这些知识用好、用活,让企业充分掌握业务规律、产品规律、市场规律,以获得更强的竞争力。
既然知识就是数据中的规律,那么从发现知识的目的来看,应该如何判断数据是否有价值呢?为了更好地回答这个问题,这里需要抛出两个概念,一个是数据维度,另一个是数据规模。
数据维度决定知识量
先来说说数据维度,数据维度就是指数据所描述的事物的方面,数据维度反映数据的全面性和丰富性。不妨用某个电商平台消费者的产品购买记录举个例子,假设有两种表格可以存储数据。
第一种表格的表头项目包括消费者ID、消费者昵称、消费者购买产品类别、消费者购买产品数量,第二种表格的表头项目包括消费者ID、消费者昵称、消费者购买产品类别、消费者购买产品数量、消费者购买时间、支付方式、是否参与优惠活动、优惠价格、送货地址、是否有加购行为。
第一种表格的表头项目包括4方面内容,第二种表格的表头项目包括10方面内容,第二种表格的表头项目更加丰富,并且涵盖了第一种表格的全部表头项目。可以说,第一种表格的数据维度是4,第二种表格的数据维度是10,第二种表格的数据维度大于第一种表格的数据维度。虽然两种表格都描述用户的购物行为数据,但是第二种表格的内容比第一种表格的内容更加丰富。
更高的数据维度,意味着更多数据关联的可能性。
在第一种表格中,我们可以分析不同消费者购买产品类型的关联关系,也可以分析每种产品类型和其销量之间的关联关系,但是在第二种表格中,除了这些关联关系,我们还能考虑支付方式和支付金额之间的关系,以及用户购买产品类型与数量和用户是否参加优惠活动之间的关系。在第二种表格中,我们可以挖掘出更多潜在的事物之间的关联关系。
从理论上来说,如果我们只考虑单个数据维度之间的相关性,那么在第一种表格中,有6(4×3÷2)种可能的业务关联知识,而在第二种表格中,有45(10×9÷2)种可能的业务关联知识。
通过数学估算可以发现,从数据中发现的潜在业务关联知识的个数与数据维度成正比。所以,高维度的数据所蕴含的知识内容,有着十分丰富的扩展空间。一般来说,数据的维度越大,知识含量就越高!
在企业的数字化实践中,为了有效地提高数据的维度,一种非常有效的技术手段,就是对数据进行融合。数据融合其实就是把多张数据表,关联成同一张数据表,目的就是把表变“宽”。
在对数据进行融合时,需要确定一个“锚点”,即数据的组织维度——应该按照什么业务主体进行融合。在实践中,业务主体可以是用户、产品、服务、场景、机构、平台或者地理区域等。因此,相应地,我们可以采用以用户为中心、以产品为中心或者以场景为中心的数据融合策略……
在以用户为中心的数据融合策略中,可以把用户的账号作为枢纽,将其交易数据、社交数据、活动数据、评论数据和客服咨询记录数据都融合到一起。通过这种方式,原先的6张小表被整合成一张大的“宽”表,数据的维度扩大了6倍,数字化的业务机会也因此大大增加。
另外,关于被融合的业务主体的核心数据,在企业里面也被称作主数据。由于业务主体的核心数据会与多张表进行关联,因此业务主体的核心数据就得保证相对稳定可靠,尽量不出问题,否则就会对很多业务数据的质量产生影响。
为了融合更多的数据,一方面需要对企业内的数据进行整合,找到不同场景下数据表之间基于业务主体的关联关系;另一方面也需要想办法“吸纳”更多的外部数据资源,以丰富业务主体的数据维度。
在“吸纳”外部数据资源方面,一种方法是采用网络爬虫技术,通过使用一些机器代码自动地“抓取”互联网上的公开信息;另一种方法是寻找其他的企业进行数据方面的合作,哪些企业有自己关心的业务主体的数据,就去哪些企业购买数据服务。在未来的数字化场景中,将会有越来越多的数据方面的合作,因此数据交易市场将会在数字经济时代非常繁荣。
数据规模就是“说服力”
接下来,我们聊一聊数据规模的问题,数据规模的大小又与我们获得的业务知识有什么关系呢?
其实数据规模的概念很好理解,接着前面讲的例子,如果把数据存储在数据表中,那么数据规模就对应于数据表的行数。数据规模越大,一般来说数据的多样性也就越丰富,这是一个非常直接的好处。以购物的场景来解释的话,数据多样性是指,有人购买水果,有人购买家具,有人购买书籍……各种交易情景都会发生。
而如果所有人都购买家具,没有人购买其他类型的商品,就是数据多样性比较差的表现。在这种情况下,没有办法了解消费者购买其他类型商品的信息,通过数据分析得到的业务规律也就不太全面。
数据规模可以保证知识结论更加全面和完整,还可以保证得到的数据结论是更加可靠的。基于大量观测数据得到的统计规律,比只通过一两条相关信息得到的统计规律更加令人信服。
很多有价值的经验都是基于大量的观察总结出来的。相反,如果一个数据规律的背后没有一定规模的数据来支撑,那么这个规律就没有什么说服力,也许只是“偶然”因素导致的。
例如,通过一些特殊的经历,我发现只要气温升高,某只股票就会涨,这样的情况遇到过3次,于是我就“坚定地”认为气温和某只股票的价格存在正相关性。但实际上,我的观测样本非常少,从科学原理上来说,这两件事之间也许并没有什么关系。我如果相信了这个规律,天气一热就大胆地买入这只股票,结局可想而知。
很多数据分析技术,都会把数据规模当作分析结论可靠性的非常重要的评价因素。很多算法模型,包括机器学习模型和现在非常火爆的深度学习模型,只有从大规模数据中去获得,才能触及真正有价值的业务规律,这些模型也才能在真实的业务场景中表现得特别优秀。
为什么很多互联网大厂的数字化创新能力那么强呢?其实就是因为这些企业通过数据挖掘出来的业务知识足够可靠,然后这些业务知识支撑的服务质量也非常高,进而形成业务上的良性循环:更多的数据,更高的服务质量,更多的业务,然后是更多的数据……
在数据规模方面,企业的内部数据比外部数据更难获得。外部数据可以通过购买获得,而内部数据如果不足,就只能先增加业务量了。在这种情况下,企业不得不先发展业务,积累数据,然后才能开展有效的数字化创新,毕竟在数据量非常少的时候,即便强行推出一些模型,使用效果也可能会令人沮丧。
在数字经济模式下,大的平台型企业容易形成良性循环,而初创的小企业如果没有找准合适的发展路线,就有可能“陷入”冷启动困境,也就是陷入所谓的越没有数据,就越没有业务的“怪圈”。
为了突破初期的冷启动困境,小企业应该采取一些技巧策略,鼓励用户多参与系统的应用,通过在线活动提供更多有价值的业务数据,比如可以引入游戏策略、经济奖励策略,以及社交驱动策略等。
结合上面的讨论,可以这样讲,数据的维度和规模,同时决定了我们挖掘业务知识的潜力,数据的维度决定知识的可能性,数据的规模决定知识的质量。对于大数据的准确理解,其实就是指数据在维度和规模两方面双重的丰富性。数据只是维度多,或者只是规模大,都不是真正意义上的大数据。只有以获得有价值的业务知识为目标,我们才会知道应该追求什么样的优质数据内容。
知识图谱是用来展示知识之间各种复杂关系的一种非常主流的信息表示形式,通过图检索和图计算可以支撑丰富的上层智能化应用,上图为COVID-19的知识图谱可视化展示效果。
我们知道,数据是企业的核心资产,能够给企业带来价值。既然是资产,我们就要好好地对数据进行管理,这样才能更好地使用数据。在数据的管理工作中,最重要的一项就是对数据进行规范的定义和描述,说白了,就是弄清楚企业里所有重要数据的意思,做到“看得懂”“用得好”。
元数据,就是承担企业中数据管理和定义责任的最好角色。元数据又包括业务元数据和技术元数据。通过业务元数据,业务人员能够高效率地用好数据;通过技术元数据,开发人员知道怎么生产数据。
技术元数据:机器交流的“转换器”
在《DAMA数据管理知识体系指南》中,是这么解释元数据的:“元数据与数据的关系就像数据与自然界的关系,数据反映了真实世界的交易、事件、对象和关系,而元数据则反映了数据的交易、事件、对象和关系等。”
这么解释似乎有点晦涩难懂,其实简单讲,元数据就是描述数据的数据,好比字典,帮助人们解读数据到底是什么意思。其中,技术元数据就是给技术人员解释数据是什么意思的“字典”。
那么,技术人员在什么场合下会接触到数据呢?自然就是在系统开发的过程中了。几乎任何信息系统的开发,从技术方案上看,都会涉及数据存储的问题,而数据既可以存储到文件中,也可以存储到数据表中。不管数据以什么方式进行存储,都需要规定格式,也就是按照特定结构来组织信息,并且这个结构需要被计算机程序准确地识别和解读。
这个特殊结构就是我们所说的技术元数据。
信息系统的技术开发人员需要对数据结构进行定义,然后按照这个定义来设计并开发应用程序。这个结构能够让机器读懂存储在文件或数据表里的数据,而这个结构背后蕴含着的重要业务含义,则能够让应用程序很好地实现业务的自动化。
当数据存储到数据表中时,技术元数据是表头及表头的含义;而当数据存储到文件中时,技术元数据是文件中字符串的取值规范和排列结构。
开发人员在建设信息系统的时候,一般来说都会留有技术文档,并在技术文档中定义技术元数据。这样,当以后系统中的数据存储功能出现问题的时候,就知道应该怎么去排查和维护了。
技术元数据的另一个好处就是支持不同系统之间的互联互通,这个需求在系统建设过程中也很常见。例如,某企业有两个系统1和2,系统1负责对交易订单进行管理,系统2负责对物流进行管理,用户如果想通过系统1查询货物的运输情况,系统1就需要发送一个物流信息查询的指令给系统2,让系统2根据订单号对货物的位置信息进行查询,将结果返回给系统1,再通过系统1反馈给用户。
在实践中,因为不同信息系统是由不同开发团队构建的,所以各系统在进行数据格式的定义时,也会形成不同的标准和风格。有了技术元数据,就知道系统1中数据表的表头与系统2中数据表的表头的对应关系了。
有了技术元数据,不同系统之间就能“读懂”对方生产出来的数据了。技术元数据很好地充当了不同系统之间的“转换器”,使信息在不同系统之间的传播畅通无阻。
技术元数据在定义数据“结构”的时候,要考虑支撑业务应用。因此,技术元数据是和具体业务概念的内涵“挂钩”的,换句话说,技术元数据本身反映了业务概念的基本信息。程序员开发一个程序,要和产品经理,甚至业务需求方去“撕扯”一番,不能胡乱设计。先有业务模型,然后基于业务模型设计数据存储的结构,并在数据存储结构中梳理清楚与业务流程的对应关系。
一般在分析业务数据的时候,我们通常只想分析Excel表,并不想分析系统后台数据库中那些看起来奇奇怪怪的数据表。
我们需要一种“机制”把系统中的技术数据表,转化为面向业务的Excel表,二者之间的对应得靠技术元数据实现。但是技术元数据的定义非常抽象,不好消化,这些难啃的骨头就得相对“固定”下来,比如构建可以让分析人员自助获取业务数据表的业务分析系统。
既然技术元数据定义了数据的业务含义,那么是不是可以说,有了技术元数据,我们就能用好数据,从数据中挖掘知识了呢?非也!
技术元数据本质上还是给开发人员编写代码用的,或者说,是帮助机器阅读数据的,而不是帮助业务人员理解数据的。
技术元数据更多的是描述计算机关心的数据信息,比如表名称、数据库目录、字段的数据类型、字段数据长度、字段是不是主键、字段是否为空、数据清洗规则、数据源信息、数据加密规则、数据嵌套规则等。老实说,这些可以帮助我们把软件开发好,但对数据分析的作用不大。
通过技术元数据,我们能获得业务流程中细粒度、基础的数据信息,但是对于更高层次、更复杂的业务概念的理解,并不在技术元数据的能力范围内。
技术元数据对数据描述的粒度过细,属于系统底层操作级别的,它并不关心数据之间的业务逻辑到底是怎样的。基于技术元数据,只能实现一些常用的基础业务数据的自动获取。
一般企业对技术元数据的应用和管理会更成熟一些,毕竟技术元数据最早是从“开发人员”圈子里流行起来的,而开发人员本身也对数据的规范意识更强一些。技术元数据解决了信息系统开发和基础数据需求的问题,而对于更高层次的数据需求,就得靠业务元数据来定义描述了。
业务元数据:数据需求的“翻译官”
相比技术元数据,业务元数据在数字化转型中具有更高级的作用。如果说技术元数据描述的是数据与信息的关系,则业务元数据描述的是信息与知识的关系。业务元数据包含了企业核心业务的知识体系,让我们可以更好地知道数据能够给我们带来什么有用的业务知识。
一般来说,业务元数据定义了3方面的内容:业务数据模型、业务指标、业务标签。
随着企业信息化建设的深入,系统越来越多,业务概念也越来越多,企业内部的员工在交流业务问题的时候,需要对业务概念有一致的理解,否则沟通就很容易出现偏差。想必我们经常会遇到这样的场景,领导下达一个任务,大家都说懂了,但是最后做出来的却与领导的预期不符。背后的原因就是,虽然大家口头上说的是一个业务概念,但是理解的却完全不是一个东西。
在企业内部需要有一个统一的业务模型,这样大家才能在一个标准上展开沟通。对业务概念理解的不一致,会导致对数据理解的不一致,然后导致对同样的数据得出不一样的分析结论。很多企业的管理之所以混乱,就是这么来的:员工之间无法有效地相互交流,彼此产生误会,降低沟通效率,管理者容易对业务的发展情况判断错误,绩效考核的结果也会引发诸多的不满。
业务元数据的首要功能就是确定一个标准的业务模型,这个模型定义了各种重要的业务概念,以及业务概念之间的关系。对每个业务概念,业务元数据也规范了它的属性及属性的取值范围。这里的属性,其实就是技术元数据帮助我们从机器数据表中获得的最细粒度的业务数据。
技术元数据告诉我们如何根据数据表的结构获得最细粒度的业务属性数据,而业务元数据则告诉我们这些细粒度的业务属性数据之间是什么关系,以及业务属性数据彼此之间是怎么组织起来的。
例如,对于电商平台,业务元数据会告诉我们这里面有用户和产品两个业务概念,二者是通过消费关系联系在一起的。其中,用户是消费的主体,我们关心的用户属性信息有年龄、性别、昵称、注册时间、收货地址等;产品是消费的客体,我们关心的产品属性信息有类别、价格、优惠信息、质量、尺寸等;关于用户和产品之间的消费关系,也有很多核心属性,比如消费时间、消费数量、支付方式、支付金额等,这个消费关系其实也正是电商平台关心的核心业务活动。
除了消费活动,一个电商平台可能还有很多其他核心业务活动,比如预定、退货、投诉、评论、关注、收藏,以及成为会员等,而这些核心业务活动也会涉及很多其他的业务概念,包括商户、评论内容、订单、会员卡等。
通过设计多个业务概念,并定义业务概念之间的业务关系,就可以把这个电商活动的业务模型建立起来了。这个业务模型,是企业内部的业务规划和决策的基础,同时也是企业中数据组织和数据应用的基础。
其实业务模型也是信息系统开发的基础,技术元数据是基于业务模型定义的,只是很多企业在早期忙于系统的开发迭代,虽然在系统需求分析与设计的时候充分融入了业务模型的思想,但是并没有把不同系统背后的业务模型集中地整合起来。业务元数据实现了业务模型的整合,从信息层次上看,业务模型源于系统级的数据组织结构,并支撑上层的业务级数据应用。
基于业务元数据,企业内部还会定义一些具体的业务指标,这些业务指标可以帮助我们更好地分析业务现状,提供有价值的业务信息,同时也支持企业内部人员考核方面的工作。
业务指标是更高级的数据形态,这些指标通常是业务专家基于历史经验总结的,能够对企业的各种业务起到管理跟踪的作用。企业在开展业务的时候,通常都会用到很多的业务指标,但是对业务指标的使用可能并不规范。
对于同一个业务活动或业务状态,不同部门、团队,以及分析人员,可能会用不同的业务指标来描述,这就很容易导致高级的管理层对业务现状的理解产生迷惑。于是,有必要采用元数据对业务指标进行规范管理,统一定义每个业务指标的计算方法和适用的应用场景。
每个业务指标背后都有一个计算标准,袁文泽博客www.yuanwze.cn也就是指标数据的计算公式。业务指标提供了数据标准化的使用规范,在一些企业里面,业务指标的计算方法,有时候也叫作业务统计口径。
例如消费力就是一个经典的业务指标,我们可以将其定义为一个用户在最近一年内购买的全部产品的总金额。基于这个公式,只要我们有每个用户的全部历史消费记录,就可以自动计算出他的消费力水平。这个定义背后当然是有一套合理的业务逻辑的,或者是被企业内部证明过具有足够的可靠性的。
此外,业务指标之间也是有逻辑关系的。例如,指标之间可能存在主题分组的关系,也可能存在层次关系,企业内部的业务指标共同构成了指标体系。基于这个指标体系,企业内部人员能够更好地共享业务知识,全面理解企业的核心业务活动,充分“盘活”企业内部的数据资产,促进企业内部数据的准确应用和数字化业务的创新。
指标体系在用于业务分析,指导企业经营决策的场景中比较常见,而如果面向数字化服务设计,则更多地依赖于业务标签。
例如,我们在对消费者进行细分管理的时候,结合消费者的购物偏好、收入水平、职业、性别,以及年龄等综合信息,可以构建“爱打扮”“学生党”“高端人士”“宅男”“商务人士”之类的个性化用户标签。每个标签背后都有具体、统一的业务含义,代表某类人群可能感兴趣的产品和服务。通过给消费者打上这些标签,可以准确地向消费者进行购物内容推送。
针对每个特定的业务需求,都可以构建一系列的标签来支持。于是类似地,我们其实也需要一套能够描述、定义、规范业务标签的业务元数据。这些业务元数据可以告诉我们标签的含义、主题类型、适用范围、修饰对象、建立者、业务上线状态,以及给数据打标签的规则。
图片来自网络
淘宝精准的商品推荐背后是大量信息的挖掘与分析,实现了对用户的精准画像,每个画像标签都依赖于围绕元数据的规范化定义。基于这些标签信息定点投放广告和宣传页,可极大地提高客户的购买率和复购率。
对企业转型有疑虑可以评论!
原文来自:https://www.yuanwze.cn/zhuanxing/144.html
*您提交的问题,我们会在24小时内安排律师与您联系。