迷信与理性——如何抵抗“伪数据主义者”的毒鸡汤
资讯

迷信与理性——如何抵抗“伪数据主义者”的毒鸡汤

【摘要】数据攸关企业性命,死生之大,不可不察。

来源:网站分析在中国

作者:数字营销、数据分析专家宋星


今年2月底,我发表了【“数据主义者”们的毒鸡汤】,这篇相当有“反省”意味的文章,很快便刷了屏。


文章有很多留言,但其中一个留言(来自“孙铭徽”)引起了我的注意,就一句话:“说了半天也没有说how啊!”


这十个字的留言让我意识到,仅仅只是告诉大家什么是有害的、什么是真实的还不够,我们更需要知道什么才是“打开”数据的正确的姿势。


但,数据领域,做到正确相当困难,因为最大的障碍不是技巧、技术,而是错误的观念和逻辑。


关于这个话题,我与我的好朋友——在大数据治理方面有资深经验的专家Grace(黄晓南,品友互动创始人兼CEO)进行了两个多小时的讨论。这篇文章,基于我们的谈话,来讲讲什么样的观念和逻辑是“我们自认为”正确的。所以,跟我过去的文章一个人“自说自话”不同,这篇文章同时包含了我和Grace两个人的观点。


市场过于神话了数据


当然,没有绝对的正确,适合自己的才是更好的。


目前市场对于数据和技术这两个概念会“神化”或者叫简单化,以为有了数据就可以做到自己所期望的。或者以为找一家IT公司帮他们搭了一个系统,这个系统就应该能施展魔法帮助业务,但其实真实的情况要比这样的想法复杂太多。


企业在开始琢磨如何使用数据的过程中(例如考虑搭建DMP或是CDP),碰到最多的问题就是数据收集和清理的问题。问题的根源在于:


1、企业不知道自己数据在哪,哪些地方可以收集数据;

2、收集回来的数据要做哪些处理,怎么处理。


企业往往认为拥有了DMP或者CDP这样“高端”的工具,这些数据问题就应该能够自动解决,这是一种典型的神话数据的表现。


举个例子,以DMP为例,DMP的代码埋好了以后,需要在媒体端做宏替换,如果不做宏替换的话,进来的数据就是脏数据,用这种数据分析模型出来的结果一定存在问题。有时,即使做了宏替换,也有可能会加错,或者媒体端出现重复传送——数据收集端的专业性其实很高,对于数据运营的要求也很高。我们看到的成功案例背后,其实都需要投入大量的这种数据运营。如果这个问题没有处理好,那整个系统也就没有办法释放价值,甚至都无法正常运行。


不仅获取数据需要运营能力,处理数据同样如此。例如,利用第三方监测公司采集活动数据,但是发现在campaign初被执行之时,字段标号可能是随意的,一个campaign下好多不同的字段,所以仅是字段对齐这件事情就非常耗时;如果要把历史campaign数据也接入进来的话,会更复杂,因为历史数据字段的对齐的耗时更加恐怖,类似这种工作经常要花上好几个礼拜。


这些例子说明,获取数据本身并不简单,但即使获取了数据,离真正让数据发挥价值,还有十万八千里。发挥数据的价值,很多时候完全不在数据本身,而是一个从获取到处理到应用的每一个环节都需要专业的过程。


从“源头”开始设计


从获取到处理到应用数据的每一个环节都需要专业,而达到这个专业的前提,是必须从“源头”开始设计。


所谓从源头开始设计,是从业务端发轫,且把数据的产生和获取一同考虑在内有机结合的规划。


例如,很多学员或者客户都曾问过我,如何衡量他们的品牌营销的效果。对于这个问题,正确的解法是,从你的品牌campaign开始策划设计的时候,就必须把衡量效果,尤其是用数据来衡量效果考虑进去,而不仅仅只是设计campaign本身。或者说,campaign设计本身就应该包括为衡量效果而做出的安排,以及数据获取上的设计。


举个例子,你说我要做利用KOL传播的campaign,这个没问题。但是怎么衡量KOL投放的效果呢?如果你不做任何设计,那么只能最终用KOL给你发的软文的阅读量来评判效果,但仅以阅读量来作为评判是非常可笑的,因为实在没有任何参考意义——KOL给自己刷阅读量极为普遍。


因此,在设计这个campaign的时候,你需要增加一些“行为点”甚至“转化点”作为campaign的执行环节,比如在KOL的软文中唤起读者/粉丝进行某个可被数据监测到的行为。


“行为点”和“转化点”会为你衡量campaign实际的效果提供相当有细节和过程的数据,从而获取主动权。


这只是一个很小的例子。


但考虑一下,在整个营销和运营的过程中,实际上充满着数量庞大的这样的小例子、各种各样的流程安排,以及真正在这些细节执行的角度上安排数据的监测和获取,这就足以完全颠覆企业现有的“数据文化”。更何况,上CDP或者DMP这样的“大杀器”,更需要从源头开始设计,否则,它们根本无法帮助你起到应有的作用。


完善数据能力 而不是仅仅考虑拥有数据本身


“伪数据主义者”的毒鸡汤鼓吹系统的作用,鼓吹数据的价值,但很少真正强调更基础且更重要的工作——完善企业自身的数据能力。


完善数据能力,包括如下四个方面必须要做的功课:


1、建立以终为始的场景意识。


这就是我们前面所讲的从“源头”开始设计的意义。如果一开始并没把应用场景想明白,等系统搭建完了再想,就会发现收集什么数据,在哪里收集的问题会令人手足无措。


最佳实践只有一条,在任何数据项目的初期先做咨询和调研。比如为了上线DMP而把历史购买人群或是广告受众提取出来做在线用户调研,来了解用户的爱好,确定投放场景,以及针对市场和线上营销部门的业务需求进行调研,后面建设DMP的需求就比较清晰。


又如,采用会员制的企业,需要把所有会员打通管理起来,然后通过定向不同的人群包来做会员运营的实验,这个场景需求也很明确。这样的场景必须在建立系统之前就想清楚,本质上就是一个“我要什么”的问题。而如果一开始并不真正清楚知道我要什么,也不知道“要什么”背后包含什么细节,风险就会很大。


以终为始是一个基本的工作方法,在任何企业搭建数据管理系统,例如DMP/CDP的过程中都应该是最基本的要求。


2、接受数据所有权和使用权分离的现实并加以应对。


将外部数据纳为己有的做法,今天已经没有太大必要性,可能性更是大大降低。很多企业今天还在买数据买标签,但其实效率和准确性都已经大大降低。企业应该转变思路,考虑利用第三方的数据能力,而不是拥有数据本身。不管是出于对数据安全的保护,还是出于业务的实质效率,这都是投入产出比最高的一种方法,也是最大化数据能力的一种方法。


今天,最大化调动数据的能力,以及连接各方的数据能力,对企业发挥数据的价值尤为重要。


3、商业理解与数据运营能力的结合。


如同我们的DMP/CDP的企业调研所呈现的:一个DMP项目,需要以业务咨询为贯穿始终的核心,如果让纯IT的部门来负责运营,失败的可能性就比较大。


那么怎样更容易获得成功?成功的模式应该是业务部门来牵头,IT部门技术控制与支持。


数据的运营能力,和场景的判断问题,相关的都是业务。但很多企业中,都是业务部门作为用户对IT部门提需求,IT部门统一处理,这种组合容易失败,无论业务部门提出多么细节的需求,本质上都不是IT部门能够真正理解的需求。这并非是贬低IT部门,而是因为IT部门并不从事业务,必然跟天天与业务打交道的人在业务理解上有区别。


Grace谈到了她的一个非常成功的客户。这个客户为建立DMP系统,参与的部门非常多,从市场部、媒介部、战略部、调研部、电商部、IT部,在内部形成联合小组,然后再由一个管业务的高管来直接负责,所以最终的DMP不仅成功落地,更直接能够嵌入业务。这是一个很正面的例子。


4、不要过度强调定制化。


定制化的价值毫无疑问,但是完善数据能力不能矫枉过正。一种矫枉过正的倾向是凡事都要追求定制化。很多时候企业会认为找第三方的IT公司来定制数据管理系统,就一定能满足业务需求。这个乍听起来好像很有道理,但风险在于极端追求定制化往往意味着大量没有被验证的模型和产品。


现在的很多数据管理系统(即使是DMP还是CDP,也无论是国内的解决方案还是国外),所用的底层技术方法和技术手段都已经比较成熟,完全可以直接在这些成熟的方案基础上进行标准和参数定制。


无论什么样的企业,在数据管理系统的需求中,基础的功能模块和场景还原、解决方式和手段其实并没有太大不同,又何必要在这些基础的领域完全定制化浪费时间和人力物力呢?更何况,从零开始的失败风险,比直接“站在巨人肩膀上”的风险,不知道要大了多少。


定制化仍然重要,定制的部分往往是参数、配置及模型,以及数据输入输出等。比如对KPI的定制,什么是有效人群,又如归因里面到底应该看什么节点,或者人群标签应该如何设置,企业自有数据如何引入如何标准化等等。以及,那些确实不能满足的功能,再进行二次开发不迟。


所以如果将失败的原因归咎于系统定制化程度不够高,这个就很麻烦。任何公司要做数据系统(如DMP/CDP)的话,建议他们一定要弄清楚供应商是不是已经有成熟的产品和解决方案实践案例,而不是让类似于IT公司或者软件外包公司来直接进行定制化开发。深度定制化对大部分企业而言并非好事,因为真正能够驾驭定制化数据系统的企业其实屈指可数。


考虑更加现实的成本规划


企业应该避免另外一个倾向,即用最少的钱建最牛的数据系统,或者是走一步算一步,先花点小钱试一下,这种心态对于数据管理系统这种战略项目而言很容易失败。


尽管迷信一分钱一分货在定价并不完全透明的数据市场并没有太大道理,但我仍然认为,企业的数据问题,本质上还是一个价值认知的问题。


如同我们前面所讲的“以终为始”的意识,如果一个企业把需要数据实现的“终”想明白了,比如企业把数据系统定位为消费者互动管理平台或者用户增长管理平台,就会将数据和数据系统的价值上升到业务战略的层次。如果真正意识到数据系统是把整个用户生命周期管理起来的平台,这个系统的重要性就会是战略级别的,对价值和成本的衡量就会更加理性。


所以对于一个企业建立自己的数据体系和数据系统,Grace很有发言权,她强调有三件事情一定要提前想清楚:


1、最“终”的商业应用场景是什么?


进而就会确定谁来负责这个事情以及如何设计和验证,以及愿意为实现这个场景的优化付出多少的成本,甚至能够计算出大概的ROI。


2、企业有没有私域数据以及有多少?


有些企业说想做CDP或者DMP,但一研究发现没有多少数据,既没有自己的APP,微信上也只有几千个粉丝,这样建立一个上百万甚至更贵的系统意义就很小了。


3、在数据运营上有没有做好准备?


有没有好的员工或者合作伙伴来能让数据和系统真正有效运行起来。这不仅是我们前面所讲的要从“源头”设计,还需要在每个业务环节考虑数据获取、利用和反馈。例如,DMP常见的场景,是在各类触点上捕获数据,为此,媒体的沟通、代码的添加、数据的质量控制、不同数据的打通等等,都需要人去做切实的运营工作。没有这些细致工作,企业很难真正从数据中获得价值。


一个普遍的迷信,认为多花钱就一定能有好系统。事实上,系统二字不是指开发的软件系统本身,而是软件、数据、人才与组织四者的有机结合。当这个有机结合的任何一方缺失或者能力欠佳,企业的数据体系就会面临巨大的困难。这样的困难,其实完全不是由一个数据软件系统本身的好坏来决定的。但企业总是倾向于让软件系统承担所有的责任,这反而阻塞了企业的真正改进与提升。


因此,企业对于数据系统的成本规划,不仅仅是数据软件系统本身,而必须包含企业内外人才(外部人才如咨询顾问)的成本规划,以及为获取数据而付出的成本的规划。


关于选择供应商


尽管不同的公司情况非常不同,从而很大程度上影响供应商的选择,但我觉得有至少有四点可以是作为选择数据系统供应商(尤其是CDP/DMP类型的数据系统)的标准:


1、有丰富处理多重复杂的大量企业内部数据(私域数据)和企业外部数据(公域数据)的实践经验和能力。


这个很重要,当数据维度非常多,很多字段都要去打通时,供应商的真正水平就将显示出来。没有处理过这些需求的供应商会遇到很困难的情况,因为这个领域有太多技术和业务并发的挑战,因此处理起来非常复杂,需要真正有经验的供应商,尤其是对企业业务有深刻理解的供应商才可能解决。


2、有整合外部数据能力的丰富经验,且对国内的数据生态有充分的理解。


这一点不难理解。数据系统的根本价值在于利用数据,而利用数据背后,有相当多的场景实际上是利用了企业之外的第三方的数据能力。供应商必须具有能够帮助企业打通第三方数据生态的能力。


3、具有通过运营数据和数据系统产生商业结果的经验。


要有真正为企业带来了正向变化的案例。关于正向变化,我需要啰嗦几句,这并非一定是在KPI上立竿见影的提升,由于数据化的再造和转型是战略性的改变,因此任何企业在KPI、组织优化、效率、资源获取等任何一种或多种进步,都算正向变化。


4、不仅要有技术能力,更要有产品能力。


即要有被验证的数据系统的架构与落地能力(包括系统的稳定性、数据处理的能力、数据挖掘和建模的能力以及数据安全的治理等),还要能做出真正实用易用的产品,二者缺一不可。当然,真正衡量一个供应商的技术能力和产品能力还包括很多方面,这里不再赘言。


另一个值得关注的事情,是国家对数据的安全和隐私数据保护肯定会越来越强。对于企业来说,数据治理和数据使用的合规性变得很重要,典型如搭建了DMP的企业,如果通过DMP提取的数据提供给外部第三方,在这个过程中,如何做到数据合规、操作合规,如何保护个人信息,都成为涉及到企业自身安全的极为重要的领域。


这些方面如果不加以重视和管理,很可能数据还没有用上,高管就被请去喝茶了。数据攸关企业性命,死生之大,不可不察。这虽然增加了企业利用数据的门槛,但从更长远的角度看,又是所有规模企业都必须跨过的门槛。更早主动面对与解决,很可能在未来成为重要的竞争优势,企业必须寻求在这一领域真正有方法和实践的供应商的帮助。


最后,希望这些“零碎”但发自肺腑的观点,能够对大家有一点点帮助。也欢迎大家继续讨论。谢谢。

品友互动投稿,申请转载请联系原作者。

已有0人收藏

已有0人点赞

发表评论

请先注册/登录后参与评论

已有0