硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._人工智能 点击“蓝字”关注我们

硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._大数据_02

硅谷不仅是世界高科技中心,也是新时代的灵魂,作为全球创新的聚集地,无论是基础的技术创新,还是下一代的技术应用创新,都有一批又一批的技术与应用来自“硅谷创新”。在硅谷我们不仅能看到专注于技术本身的创新科技,同时也能够看到一些真正好的技术与市场化的应用。我们希望大家有机会可以多去硅谷看一看,但是如果不能身临其境到硅谷,那么来到【硅谷速递】就是你最省时、最省力地获取硅谷最新科技动态的不二选择。

在这里我们将为大家速递美国硅谷最精彩、时效性最强的科技文章和学习资料,简约不简单是本栏目的最大特点,3篇短小精悍的文章,助你快速精准Get一项最新技术点!把握技术风向标,了解行业应用与实践,就交给【硅谷速递】吧~

速递先知

本期三篇超实用文章,带领大家走进“数据驱动”的硅谷世界:

  • 数据驱动到底是什么?它能驱动什么?
  • 数据驱动决策的5种思维方式
  • 建立数据驱动型企业的经验教训 

数据驱动到底是什么?它能驱动什么?


有一次我从机场航站楼叫了一辆网约车回家,事后看到账单居然显示80多元,里程20多公里。但实际上,机场距离我家不过7-8公里的路程平时只要40多元,显然司机是绕路了。但好在网约车APP上同时也显示了一条信息,大致意思是:车费异常,是否需要申诉?


于是,点击“需要申诉”,APP立刻弹出一个界面:您有很好的信誉记录,接受您的申诉,此次收费按42元计算。


如此良好的体验,试想一下,在出租车上发生类似的状况,则会有完全不同的场景:首先,你可能根本不知道司机绕路了,倘若事后发现司机绕路了,但下车时忘了要票据,则无法举证。又或者你当时就发现司机绕路了且要了票据,但票据上只有里程和时间,没有出发地点、目的地和行车路线,也无法证明司机绕了路。


而网约车则彻底改变了这一状况:主动提醒你是否需要投诉,你提出申诉后,立刻做出了令你满意的处理。这样的投诉处理如此贴心而智能,它是怎么做到的呢?如果我们对数据,以及数据与信息、知识和人工智能的关系有一些基本的了解,就能理解这种投诉处理的运作机制。


数据金字塔可以帮助我们理解数据与信息、知识和人工智能的关系,如果数据不能化为信息和知识的话,数据本身是没有意义的。但如果没有数据,或者数据匮乏,信息和知识的产生也就成了无水之源。


如果你经历了某件事,把它记录下来;如果你记录了某件事,把它上传;如果你上传了某件事,分享它,这意味着每个人都成为了数据的采集、处理和分享者。


一个数据驱动的组织会以一种及时的方式获取、处理和使用数据来创造效益,不断迭代并开发新产品,以及在数据中探索。

        硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._大数据_03        

数据驱动技术可以将用户把关注点放在对测试数据的构建和维护上,而不是直接维护脚本,可以利用同样的过程对不同的数据输入进行测试,其实现要依赖参数化的技术。


有很多方式可以评估一个组织是否为数据驱动的,如:产生的数据量;使用数据的程度;内化数据的过程。其中,有效地使用数据最为关键。


数据驱动的特点表现在,数据驱动本身不是一个工业级标准的概念,因此在不同的公司都会有不同的解释,可以把数据驱动理解为一种模式或者一种思想。


数据驱动决策的5种思维方式


1、矩阵思维


分类思维的发展之一是矩阵思维,矩阵思维不再局限于用量化指标来进行分类。许多时候,我们没有数据做为支持,只能通过经验做主观的推断时,是可以把某些重要因素组合成矩阵,大致定义出好坏的方向,然后进行分析。大家可以搜索经典的管理分析方法“波士顿矩阵”模型。

       硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._大数据_04       

2、队列分析思维


随着计算机运算能力的提高,队列分析这一方式逐渐展露头脚。从经验上看,队列分析就是按一定的规则,在时间颗粒度上将观察对象切片,组成一个观察样本,然后观察这个样本的某些指标随着时间的演进而产生的变化。目前使用得最多的场景就是留存分析。

        硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._python_05       

队列分析中,指标其实就是时间序列,不同的是衡量样本。队列分析中的衡量样本是在时间颗粒上变化的,而时间序列的样本则相对固定。


3、管道/漏斗思维


这种思维方式已经比较普及了,漏斗分析分为长漏斗和短漏斗。长漏斗的特征是涉及环节较多,时间周期较长,常用的长漏斗有渠道归因模型,AARRR模型,用户生命周期模型等等;短漏斗是有明确的目的,时间短,如订单化漏斗和注册漏斗。

        硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._大数据_06        

但是,看上去越是普适越是容易理解的模型,它的应用越得谨慎和小心。在漏斗思维当中,我们尤其要注意漏斗的长度。


漏斗从哪里开始到哪里结束?漏斗的环节不该超过5个,漏斗中各环节的百分比数值,量级不要超过100倍(漏斗第一环节100%开始,到最后一个环节的化率数值不要低于1%)。若超过了这两个数值标准,建议分为多个漏斗进行观察。


4、相关思维


我们观察指标,不仅要看单个指标的变化,还需要观察指标间的相互关系。有正相关关系(图中红色实线)和负相关关系(蓝色虚线)。最好能时常计算指标间的相关系数,定期观察变化。

        硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._大数据_07       

相关思维的应用非常广泛,往往是被大家忽略的。现在的很多企业管理层,面对的问题并不是没有数据,而是数据太多,却太少有有用的数据。相关思维的其中一个应用,就是能够帮助我们找到最重要的数据,排除掉过多杂乱数据的干扰。


如何执行呢?你可以计算能收集到的多个指标间的相互关系,挑出与其他指标相关系数都相对较高的数据指标,分析它的产生逻辑,对应的问题,若都满足标准,这个指标就能定位为核心指标。


5、逻辑树思维


一般说明逻辑树的分叉时,都会提到“分解”和“汇总”的概念。我这里把它变一变,使其更贴近数据分析,称为“下钻”和“上卷”。

       硅谷速递 | 人人都在谈的 “数据驱动” 到底是什么?如何才算实现数据驱动?..._编程语言_08      

下钻,就是在分析指标的变化时,按一定的维度不断的分解;而上卷是反方向的汇总。


下钻和上卷并不是局限于一个维度的,往往是多维组合的节点,进行分叉。逻辑树引申到算法领域就是决策树。有个关键便是何时做出决策。当进行分叉时,我们往往会选择差别最大的一个维度进行拆分,若差别不够大,则这个枝桠就不在细分。能够产生显著差别的节点会被保留,并继续细分,直到分不出差别为止。经过这个过程,我们就能找出影响指标变化的因素。


建立数据驱动型企业的经验教训    


我于2019年10月加入DataStax,担任董事长兼首席执行官。这个职位的好处之一是我可以去结识来自全球企业的一些最聪明的技术领导者。


建设数据驱动型企业处于创新的最前沿,无论何时扩大数十亿美元的业务都是一项不小的壮举,而2020年尤其如此。当我思考与全球CIO和技术领导者的互动时,我学到了一些知识。


1、从现在开始成为数据驱动的企业


建立创新和可扩展的业务模型并不容易。在数据和数字战略方面,许多在2020年取得成功的人已经领先。话虽如此,2020年已迫使每位领导者评估他们的方法,创新并加速其数字和数据换。


最近我在采访中,被美国联邦快递CIO Rob Carter问道:“在这个互联的世界中,以及随之而来的所有可能性,我们如何在更宏观的层面上激活数据?” 


这里的教训是,无论他们身在哪个行业,将要起主导作用的公司都将基于数据创建新的业务模型和价值主张。尽快进行创新、执行和推动,以成为数据驱动型企业。


2、准备周到且迅速地执行


世界随时都可以改变。企业需要准备好周到、迅速地执行。这意味着快速的决策,愿意失败和反复迭代,并采用了强大的开发过程。为了实现这些行为,拥有敏捷的基础技术至关重要,这意味着API驱动,基于云并基于现代技术构建。


当Covid-19(新冠肺炎)要求Home Depot加速其移动,路边和交付功能时,Home Depot已经在数字化型过程中表现的相当出色。正如信息技术高级副总裁Fahim Siddiqui 说的那样: “当Covid-19的挑战袭来时,我们看到了在线业务的巨大增长。我们开始看到黑色星期五的交易量,与人员、流程和技术基础的扩展有关,并真正提供了无与伦比的服务。”


快速作出反应取决于人员、过程和技术,它不仅可以简化决策过程,也需要企业愿意测试和学习,尤其是从一个敏捷周期到下一个敏捷周期的执行,这些要素加在一起,可以使企业迅速扩展并做出响应。


3、使第一线的人成为客户的声音


成功的领导者始终专注于客户,但是,有时他们也会出错。例如,T-Mobile的首席信息官Cody Sanford在我们的《加速》系列中解释说,尽管领导层一味地关注发起人的前线数据,但有时他们还是不了解消费者真正认为重要的东西。为了解决这个问题,该公司在其客户服务和产品开发团队中建立了一支专业团队。通过这种方法,该公司能够捕捉客户趋势和问题,同时还有时间影响决策。


对于组织中的每个人来说,与客户合作至关重要。当每个人都对用户和企业(客户)着迷时,他们能够共同做出战略决策并创建有意义的产品,这些产品可以不断扩展使其成功。


4、开源软件将继续存在


开源软件既推动了技术创新,也推动了商业创新,并已成为推动发展的飞轮。随着更多开发人员和贡献者的参与,开源软件可以启用和鼓励协作,使用开放代码来提高采用率并提高可靠性。


可观察的联合创始人兼首席执行官Melody Meckfessel指出,当今的软件要么是开源的,要么是建立在开源之上的,并补充说:“开源的开发方式将继续存在……这意味着我们正在更依赖其他人编写的代码,我们也更有可能共享我们编写的代码。”


如果你还没有迈向开源的步伐,我相信现在是时候了。它不仅可以提高你的企业效率,还可以开拓新的机会来扩展你的人才库。


5、请记住数据换是一个连续的过程


无论你身在何处,都肩负着改变世界的使命。你必须每天都享有这项权利并为之努力:


  • 痴迷于你的客户并与之合作
  • 保留你自己产品的用户
  • 不懈地训练
  • 专注于推动行动的指标


Banco Santander首席平台官Aiaz Kazi提到,他和他的团队从传统的内部部署过渡到云原生,移动优先和支持AI的平台时,关键在于小规模交付,以此尽可能地减轻风险,让“快速失败”的概念被允许。


我们生活在一个数据驱动的世界中,采用数据和云技术对于维持生存至关重要。

- FIN -