华为5G横空出世的时候,任正非难得接受了一次公开的央视采访,他在里面分享了一个经历。任正非去中国科技大学做演讲的时候,他对校长建议到:这个学科后面加上统计学,那个学科后面加上统计学。
“我们进入到大数据时代,什么是大数据,就是统计学嘛。”
统计学是什么,就是收集、处理、分析、解释数据并从数据中得出结论的科学。生活中的我们时时刻刻都在接触各种各样的数据。淘宝看你日常浏览记录,给你推荐你可能喜欢的衣服,抖音算法记录你最喜欢看什么视频,然后不断地推送给你同类型的短视频。甚至可以这么说,你在网络上,就是一串数据构成的。
不管是做PPT还是看新闻,人们潜意识里,有了数据支撑更容易让对方信服,但是,数据也是会骗人的,如果不懂得数据思维,在大数据时代很容易被数据迷昏了眼。
举个例子,人们通常会误将相关性等同于因果关系。在很多心理学教科书上会谈及到一个问题:为什么冰淇淋的销售量和溺水死亡率成正比。
如果用因果关系看这个问题,那么就成了因为冰淇淋销量越高人们溺水死亡率就越高。这难道是冰淇淋对人们游泳造成伤害了吗?
如果用相关性来看,冰淇淋销量上升代表着天气越来越热,所以出门有用的人也越来越多。所以才会出现溺水人数上升的情况。很多文章会用具有相似性的两对关系用因果关系来吸人眼球。如果你没有一些基础的数据思维,就很容易听信了作者的胡言乱语。
所以,在大数据时代,数据思维已成了每个人的必备品。
下面,我们就来了解一下,什么是数据思维。
要想弄懂什么是数据思维,首先来打破大家对数据的错误认知,数据不仅仅指数字。
百度百科对数据的定义是这样的:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。它不仅指狭义上的数字,还可以是具有一定意义的文字、字母、数字符号的组合、图形、图像、视频、音频等,也是客观事物的属性、数量、位置及其相互关系的抽象表示。
简单理解一下,数据包括数字、图片、视频、音频等。不是说分析数字就是分析数据,你即便分析100张图片,那也算分析数据。总得来说,我们无时无刻都处在数据分析的世界。你要分析公司的运营数据,你要分析网络上对于疫情的数据统计,在淘宝中,我们也在做分析。
那么数据思维是什么呢?
现代教学理论指出,数据分析能力由数据认知能力、数据收集能力、数据整理能力、数据表述能力及数据探究能力构成。
用大白话讲,数据思维就是你能对数据进行挖掘、分析,从数据中发现价值的能力。
人要学的能力有这么多,为什么偏偏要学习数据思维?
一、 提高沟通效率
沟通不是靠嘴吗,怎么还要靠数据了?在当今社会,人们要么因为数据相信你的话,要么因为相信你。数据是真实的代表。
《事实》中说道:如果你想要真正地说服某人他的观念是错误的,那么最有效的方法就是能够用数据来测试他们的观念。
工作中最需要用到数据进行沟通的,就是PPT。要想你的观点能够被甲方同意,首先得拿出说服他的证据。数据就是最好的武器,通过你对数据的解读,让甲方心中有了落地感,不至于显得太空洞。
数据本身,并不能变成人们的认知。
数据和数据的解释密不可分,单纯的一个“9”,能够代表的意义太多了,那么我们就要对这个数据进行解释。数据思维在其中的作用就是为了和不懂数据的人建立起沟通的桥梁。经过你的思维方式,将数据进行转化成能够被对方接受的信息。
二、理性看待世界
大多数情况下,我们都用的是直线思维思考问题做事情。直线思维是指:我们的本能会假设所有事情都是按照直线规律来发展的。
比如说,渴了就喝水,感冒了就吃感冒药一样。绝大多数的工作都要我们用到直线思维,吧简单、方便、见效快。但是,直线思维也有它无法适用的地方。你想要加薪,直线思维就会推动你去老板办公室谈薪资。那加薪成功率就指不定有多高了。
《事实》里还有一句话:当我们对另外一件事情不够熟悉的时候,我们将很容易假设它是按照直线发展的,而忘了考虑这种假设很可能是愚蠢的。
比如新加坡疫情。我之前关注过新加坡疫情,新加坡感染人数在全球第三的情况下还出现了万人宴的情况,政府也宣传健康人无需戴口罩。在我看来,这不就是胡闹吗?新冠肺炎生存能力很强,即使摸到门把手也有被感染的可能性,更何况出现了和武汉类似的万人宴。这可是多么大的危险存在。
于是我预言,新加坡后面的疫情一定不会明朗。没想到过了将近半个月,新加坡的疫情增速非常低,从数据中就能知道新加坡管控十分得当。后来我想了想,我并没有真正了解过新加坡政府的防御措施,为什么建议正常人无需戴口罩,发现新馆肺炎病人又是如何处理的,社区内如何进行消毒等等。
无知会带来盲目自信,你以为你以为就是你以为的,殊不知,你才了解到了冰山一角。
数据思维就是为了警惕自己的直线思维,避免只看到一部分事实就妄下断论,用理性去看待世界,而不是凭着自己的直觉。网上的数据那么多,真假还需靠自己分辨,对一切事物抱着怀疑的态度,除非找到数据能够证明观念正确,否则就不要轻易被别人的观点带偏。
在数据思维中,有一个定量分析方法论,定量分析是依据数据展开,所以使用定量分析能够降低决策风险,而且大多数专业数据分析师直到现在都还在使用定量分析来帮助公司分析数据做决策。在《数据分析师》这本书中,作者让非专业数据分析师也能够学会如何做一个简单的数据分析。
那么定量分析该如何进行呢?
一、 识别问题
充分理解问题是什么以及这个问题为什么重要。
《黑客帝国》中有句台词这样说:也许我们根本就问错了问题。
搞清楚问题是什么是解决问题的开始。是什么代表着未来该如何解决问题的方向,手段等等,如果一开始就问错了,那么你将在错的路上做了无用功,吃力不讨好。
比如我问朋友,为什么我这么没用?这个问题问出来大概也就自己能够明白为什么吧。没用还能继续往下分,在哪方面没用,是因为不擅长,还是不愿意做好,还是自己拖延?我们要问出关键的问题。
问答类的解谜游戏中,最重要的就是问出关键问题。关键问题找到后,事情的推进就快了很多,同样,解决办法也浮出水面。
所以,你要清楚的描述,自己要解决的问题是什么。在这里,可以用上“WHY假设模型”来推导你真正需要问的关键性问题。
“WHY假设模型”简单的来说就是做假设,假设造成这种结果的原因。拿文章举例,大的问题是:为什么我的文章变现能力差?
做假设是为了提前做预判,那么你问的关键问题就藏在你的众多假设中。你的问题就不仅仅是宽泛的该如何实现文章变现,而是针对文章某个具体位置做突击。
二、 回顾之前的发现
选择一条正确的路比找到一条正确的路要简单得多。同理,我们解决问题也应当如此。大概率情况下,你遇到过的问题,一定有人遇到并且解决过。所以,你即将要走的弯路,别人已经帮你走过了,别人找到的解决办法的套路,也帮你试验过了。
而且,回顾之前的发现,也是在做对比和创新。通过回顾以前的案例,你更可能了解什么样的数据更重要,前人失败和成功的原因在哪里,什么问题是最关键的。
《成为数据分析师》中说:你的问题不像你像的那样特殊,并且你正打算做的工作,有许多前人可能已经做过了。不要被费力气做所谓的重复性劳动,你所需要做的是搜索、搜索、再搜索。
比如说你要做一个关于中秋节的活动策划,网上肯定有很多成功的中秋节活动方案供你参考,如果你只靠自己去想活动创意的话,可能花费一天时间,你想到的是别人已经做过的活动。而且,问做活动有经验的同事,是不错的选择。他能告诉你一个活动的创意可以从什么地方去找,做活动需要注意什么问题。就像你准备做旅游攻略,最巧妙的办法就是找去玩过的人询问经验。
三、选择变量
变量就是那些影响你做判断的因素。比如你想要养一只猫,那么你要考虑的变量包括日常猫粮开销、我是否拥有养育好猫的责任心、是否对养猫有一定了解、能否一个人承担养猫的重任……
影响一件事情的变量有很多,但不是每个都那么重要。变量也遵循着二八定律,着重关注重要的20%变量,简化掉所有非必须和无关紧要的细节,关注重要变量才不至于迷失方向。这就需要你在最开头识别问题中发现关键问题,同时也可以通过对原因做假设,找到那些重要的变量。
四、收集数据
数据是分析的基石,没有适合做分析的数据,就做不出好的决定。
NBA休斯顿火箭队总经理是职业篮球中最具分析性思维的管理者,他认为:真正的优势来源于与众不同的数据。
搜索数据最重要的是耐心,再加上一些搜索技巧,就能够事半功倍。如果一开始不知道如何搜索,可以采取广泛搜索的方式,即通过百度、谷歌、360搜索引擎去搜索。
在搜索过程中你对问题就有了大致的方向,顺藤摸瓜,去各大专业网站找资料。科技相关的就找36氪、创业邦、新浪科技等网站,找娱乐相关的就去新浪微博、豆瓣、公众号等。还有很多报告网站有着大量的数据。对每个网站属性特质把握好,什么网站拥有你想要的数据,减少在其他页面搜索浪费时间。
五、 分析数据
《成为数据分析师》:数据分析需要找到恒定的模式;换言之,就是蕴含在数据中的变量之间的关系。
在专业的数据分析师分析时,他们会采用专业的分析模型进行分析,针对不同变量采取不同的分析模型,直方图、相关系数、协方差、各种概率分布、抽样与动态模拟、总体均值判断,均值推断、线性、非线性回归、多元回归分析、移动平均等内容。大多都能够在excel表格中根据模型进行数据分析。掌握数据模型并不是多难的事,重点在于我们分析数据时要用到的思维方法。
在分析数据时,可以用上以下6种比较简单但使用范围很广的分析思维。
①对比思维
对比也分纵向和横向。比如说一个人今天称是100斤,纵向即时间上的对比来看,在半年里。这是她最瘦的体重,这里的横向就是和她身高差不多,性别相同的人做对比,她已经算是很苗条了。
对比思维随处可见,通过对比才能知道这到底出于什么水平。
②细分思维
一个app的下载量有这么多,那么用户是通过各种各样的渠道下载的。通过细分渠道下载量,你就能知道什么方向投放广告可以预算再多点,什么方向投放广告在做无用功。
你的目标需要细分,你的任务也能够细分,就连现在的职业都被细分成不止360行。细分的目的就在于将大问题切割成不同的小问题,麦肯锡著名的MECE方法本质上也运用了细分思维,它将 一个重大的议题,能够做到不重叠、不遗漏的分类,做到“相互独立,完全穷尽”。
③溯源思维
有时候数据表面并没有办法透露真相,你需要从数据产生的源头出发。一份2019年度人民健康报告由一家名气不怎么大,而且还是民营公司发表,那么报告上面的数据就有待参考。
有很多公众号她们会关注用户是通过什么渠道知道公众号的,比如将近20%的用户都是通过书上的二维码才关注了这个公众号,那么就可以去分析为什么这个渠道有这么多关注量,是因为书卖得好,还是什么文案引导了用户关注。
④相关思维
相关性不等于因果关系。冰淇淋销量上升的同时,溺水死亡人数也在上升,显然易见,冰淇淋和溺水一定不会是因果关系,所以,我们就要考虑到相关性。冰淇淋销量上升,是因为天气越来越热,所以,游泳人数也在上升,因此,冰淇淋销量和溺水死亡人数呈正相关,但不像一元方程:y=x这样的因果关系。
⑤假设思维
如果你对于数据和结论没有头绪,可以先做假设,就像我们一开始用到的“WHY假设模型”,先做假设,然后用你掌握的数据验证假设是否成立。
比如你看这组数据和其他数据可能有关系,但是脑子里又没有一个清晰的思路,不如根据想法来先作出假设,假设数据是因为某事件才产生联系,有了联动效应,然后反复验证,继续做假设,再继续验证。
⑥逆向思维
有时候我们用直线思维思考问题思考了很久就会走入死胡同。脑筋急转弯就需要你用逆向思维解决问题。1911年,伦敦举办了一个“吹尘器”的表演,这个机器是这么操作的,将尘土吹起,然后将尘土收入到容器中。后来,有一个设计师反过来想,为什么不能是吸尘呢?于是,吸尘器就产生了。
逆向思维不一定能够获得正确答案,但是能让走进死胡同的你拽到一条新的大道上,启发思考。
六、 传达结果并基于行动
斯蒂芬·菲尔德说:只要你为数字提供清晰、服众的展现方式,数字可以告诉我们很重要的信息。
在向别人展现数据分析的结果时,可以采用结论先行的方式。
在《金字塔原理》中关于结论先行的作用做这样的描述:如果作者传达给读者的思想已经实现进行了归类和概括,并且按自上而下的顺序呈现,读者就能更容易理解作者表达的思想。
结论先行的方式能够先让听众明白你要讲述的观点是什么,在你接下来的论述过程中能够顺着你的思路来,更容易记住你的观点和接受。
打个比方。在汇报你的分析结果时,先抛出最终的分析结果即你的观点:我认为我们应该多增加在抖音上的投放广告……然后,再开始分析为什么你得出了这个结论。
数据如何展现也是非常重要的。一张数据图做的再好看都不如直接更有用。什么样的数据适用于什么样的图表类型,饼图、曲线图、表格等等,数据说明中又该放什么数据进去。数据支撑是为了证明你的证据,如何布置数据的标准就是能否说服对方。
这六大步骤,数据分析并不是最重要的,是每一环都不可缺少,相辅相成,缺一不可。有一部分没做到位,这一个决策闭环就得从头再来一遍。
讲了这么多分析数据的方法,最重要的是要培养自己的数据思维,思维决定最终的效果。在日常生活中,多注意以下几点情况,数据思维就会在脑子里生根发芽。
首先,不要害怕看见数据。我的大学专业不用学习数学,导致我现在只要看到密密麻麻的数字,我都想直接忽略不计,划过直接看到结论。没有经过自己对数据的分析就会遵从了作者的结论,这很容易失去对事情的思考能力。所以,当你看到数据的时候,先别想着略过,不如静下来仔细看看,或许能发现数据之间神奇的事情。
疫情期间,正是有网友发现武汉红十字会的数据出现严重出入,然后引发了一连串的事件。任何数据的出现都是有原因的。
其次,怀疑数据。数据最容易骗人,因为人们也足够相信数据。如果有人拿2010年的数据告诉你,某某行业趋势十分良好啊,根本不用担心失业。过时的数据值得令人怀疑是否还具有参考作用。
相信我们都听说过听莫扎特音乐能够提升智力这样的话,为了证明正确,还会搬出科学家的研究成果。在《看不见的大猩猩》这本书中介绍了有关莫扎特音乐的研究成果。
很多科学家都做过证明莫扎特音乐能够提升智力的实验,有证明成功的,也有证明无效的。证明成功的那些科学家都出自同门,同一个老师的手下。其他的科学家复制实验方法,结果依然无法证明莫扎特音乐能够提升智力。
“在实验科学领域,如果某一实验结果只能被某一人成功操作或只能出现在某一实验室,就有理由怀疑这个实验结果本身。”
所以,数据都能造假,凭什么相信他的真实性呢?要学会怀疑数据来源,数据是如何产生的,即使是人统计的数据,都有出错的可能。
最后,保持好奇心。保持好奇心说来简单,但是也不容易。凡事多问一句“为什么”,为什么她们的分析结果是这样的,这些数据又是从何而来,如果是我自己,我从这些数据中又能够得到什么结论呢?
哈佛大学校长陆登庭在“世界著名大学校长论坛”上所说:“如果没有好奇心和纯粹的求知欲为动力,就不可能产生那些对人类和社会具有巨大价值的发明创造。”虽然我们不至于要像发明家一样创造,保持好奇心其实是一种成长型思维,拥有求知欲,不断用外界的知识来补充自己。
总结一下,用数据思维做理性决策时要经历六大步骤:识别问题、回顾之前的发现、选择变量、搜集数据、分析数据、传达结果并采取行动。生活中如果想要养成数据思维,首先不要逃避数据,最重要的是保持对数据的怀疑,还要拥有一颗好奇的心。
在Python语言中有如下3种方法: 成员方法 类方法(classmethod) 静态方法(staticm...
摘要 元旦期间 订单业务线 告知 推送系统 无法正常收发消息,作为推送系统维护者...
前提条件 请您在购买前确保已完成注册和充值。详细操作请参见 如何注册公有云管...
信息化2.0时代提出开展智慧教育创新发展行动。2019年2月,中共中央、国务院印发...
建站 什么 虚拟主机 够用?这要看搭建的是什么类型的网站。比如个人博客类型的网...
2021年3月24日,主题为《数据的世界,世界的数据》的星环科技2021春季新品发布会...
【51CTO.com快译】 数据可视化工具不断发展,提供更强大的功能,同时改善可访问...
Docker生成新镜像版本的两种方式 There are two ways Docker can generate new m...
本文整理自直播《Hologres 数据导入/导出实践-王华峰(继儒)》 视频链接: https:/...
从 10.0.0 版开始,异步迭代器就出现在 Node 中了,在本文中,我们将讨论异步迭...