背景:为什么孤立的数据没有意义?
上一讲,我们介绍了如何提高数据的敏感度,就是强迫我们的大脑从定性方式的思考转变成定量方式的思考,强迫我们从数量的维度理解现实世界。
完成了这个任务之后,我们进入下一步——怎么通过寻找数据的背景来理解数据的意义?
背景不同,意义不同
为什么要寻找数据的背景呢?原因很简单,因为不考虑背景,你就不能准确理解数据的意义。
我们先看一个案例:2016年,我国出生人口性别比是108.27。那么,怎么理解108.27这个数据的意义呢?
出生人口性别比是指在自然状态下,活产男婴的数量除以活产女婴的数量,然后再乘以100之后的值。之所以乘以100,是为了方便理解。假如2016年出生了10000个女婴的话,对应的男婴就是10827个。
上面说的是这个数据本身的含义,但一个孤立的数据能说明什么呢?很明显,它的意义指向并不清楚。也就是说,只有给这个数据一个背景,才能明确它的意义。
我们先找找标准。出生人口性别比,有没有正常范围呢?人口学家说:我们研究很久了,这个数值是由生物学规律决定的,相对稳定在一个范围,联合国也给了范围的标准——103到107之间。
这就明确了。108.27比107大,说明我国的出生人口性别比不在正常范围内,偏高。
但这只是背景之一,如果纵向比较一下呢?也就是说,与我国近些年出生人口性别比的历史情况相比,它又说明了什么呢?
查阅资料,数据是这样的:1982年,我国的出生性别比是108;2004年是121,为近年来的高值。之后逐年下降,到2016年,出生人口性别比已经连续下降了12年,回到了1982年,也就是计划生育政策开始时的水平。这就说明,出生人口性别比虽然还是不正常,但是有一个逐渐好转的趋势,而且非常接近正常范围了。
你看,单看2016年这一个数据,只会感觉出生人口性别比这个指标不正常。但是加上历史演化的背景,感觉一下子就变了,数据指向的意义也变了。所以,背景不同,意义不同。
在不同的视角下,数据可以有无限多的背景,也就有无限多的意义。那么,怎么通过背景来理解数据的意义呢?
我们讨论数据的意义,大致有三个方向。一是涉及理解事情的属性,也就是“是什么”这类问题。二是涉及理解事情的相对情况,比如上下、左右、快慢、轻重、大小、远近,这类事情都是相对的。三是涉及理解当事人的真实意图。
这三类方向基本覆盖了日常生活绝大部分的情况。我们一一来说。
方向一:理解事情的属性
理解事情的属性,也就是“是什么”这类问题,或者说是分类问题、定性问题。
一件事情,是健康的,还是病态的;是合法的,还是非法的;是雄性的,还是雌性的等。这类问题都指向一个确定的基准,比如一个临界点、一个里程碑、一个正常范围、一个关键门槛等。
举个例子,体脂率,指脂肪重量在总体重中所占的比例,反映了人体内脂肪含量的多少。如果你的体脂率是21%,这是正常还是不正常呢?
首先要看性别和年龄。成年人的体脂率正常范围,你在网上一搜就能搜到结果——女性为20%-25%,男性为15%-18%。所以,21%的体脂率,你要是女性就是正常的,是男性就超过正常范围了。
但如果换一个基准,这个数据的意义就会跟着改变。比如,如果你是搞体操的、搞健美的,21%的体脂率肯定就超标了。
有些问题的基准相对容易找,比如体脂率这样的科学问题,已经研究得很深入了。而有些问题没有现成的基准,就需要你创制一个,只要你的理由可以让大家接受就行。当然,也有些前人的经验可以借鉴。
在日本的水俣这个地方,因为化学污染,大量的民众汞中毒,当地把这个病叫“水俣病”。事情被揭露出来后,肇事公司一次性赔偿给水俣渔业协会2000万日元。那么,2000万日元是多是少呢?
这个没有参照,没有现成的基准,只能创制一个。一般来说,把总量转换成人均,可以更准确地理解这个数量是多还是少。所以,我们就计算一下人均可以获得的赔偿额。对于损害这么严重的水俣病,一个受害者能分到多少钱呢?人均12500日元。
当时,12500日元正好等于一盎司黄金,用金价折算的话,相当于今天的人民币11600元。这样,你对这笔赔偿是多还是少,就有了自己的判断吧。
除了用人均寻找基准,水俣病案例还使用了另一种常见的确定基准的方法。你可能也注意到了,就是把钱数转化成黄金价格,以此为中介来了解赔偿额大致价值多少。
这个方法非常常见,比如你经常会听到“以1980年不变价格计算”“扣除通货膨胀因素”“同比如何如何”“环比如何如何”,都是使用的寻找基准点的方法。
方向二:理解事情的相对情况
你注意到没有,一件事情是快是慢、是轻是重、是大是小、是远是近,都是相对的。所以,理解这类问题,就要找参照系、找对比值。
比如中国的老龄化程度,2019年的数据是15.37%。那问题来了,15.37%这个数据怎么样呢?中国的老龄化问题严重不严重呢?
要问答这个问题,咱们就得看看其他国家。日本的情况怎么样呢?60岁以上的比例是32.79%,高出中国好多,是世界各国人口老龄化排行榜的第一名。第二名是意大利,28.59%。第三名是德国,27.35%。中国排多少呢?第65位。所以在世界范围内,中国的老龄化程度不是最严重的。
但这是不是就说明中国的老龄化问题不严重呢?这就不是一个排行榜的数据能回答的了。
方向三:理解当事人的意图
虽然说人心是最难理解的,但是数据会泄露线索。好的数据思维,可以帮助我们快速提出正确问题,接近正确答案。
1994年,四个年轻人筹集8000块钱开了一家火锅店,各占25%的股权。后来,四个年轻人成了两对夫妇,每家占50%的股权。这就是著名的海底捞。两对夫妇分别是张勇夫妇和施永宏夫妇。刚开始,四个老板有活一起干。慢慢的,就由领导力最强的张勇掌控全局了。到2007年,海底捞已经发展成了国内很大的餐饮公司。这时候,张勇很强势地提出,让施永宏夫妇转让给自己18%的股权。
问题来了,为什么张勇要夺走的股权不多不少,正好是18个点呢?
《公司法》规定,不同比例的股权之下,股东拥有的权限是不同的。如果你拥有三分之二以上的股权,就有了对公司的绝对控制权,公司所有的重大事项你都可以表决通过。张勇原来有50个点,现在又要走18个点,这样一共是68个点,正好比三分之二,也就是66.7%多一点点,他就拥有了公司的绝对控制权。
你看,知道了公司治理的制度背景,就能准确理解18%这个数据,也就更能准确理解当事人的行动依据。
再举一个例子,《假如迪士尼运营医院》这本书里讲过一个故事:
作者来到迪士尼乐园的后台,发现墙上有大大的海报,写着好几个顾客满意度。作者注意到,所有的满意率都在75%到80%之间。这让作者很诧异。因为每一个人肯定都有感觉,很少有人对迪士尼乐园不满意,怎么满意率这么低呢?
我们得看看这个满意度调查是怎么做的。顾客是在“很满意、比较满意、满意、比较不满意和很不满意”这5种选项中选择,那么,满意率是不是既包括选择很满意的,也包括选择比较满意的和满意的呢?
其实不是。
迪士尼的管理者告诉作者:我们只计算很满意的那部分。如果三种满意都计算,数字会特别好看,都是99%以上,这会让员工觉得没有提升空间,没有什么可以做得更好。为什么要只计算很满意呢?因为我们发现,选择很满意的顾客的忠诚度是选择比较满意的顾客的6倍。
重点来了,你以为迪士尼调查的是顾客满意度,其实人家调查的顾客忠诚度,也就是来了一次之后还会再回来玩儿的那些人,而不是来了一次下次就不来了的那些人。
知道了如何通过背景来理解数据的意义,下一讲我们再前进一步,看看在面对一个数据时,怎么挖掘它背后隐藏的信息。
划重点
1. 背景不同,数据代表的意义就不同。只有确定了数据的背景,才能准确理解数据的意义。
2. 掌握数据的背景可以帮助我们理解什么信息呢?第一,理解事物的属性;第二,理解事物的相对情况;第三,理解当事人的意图。
【免责声明】
1、个别文章内容来源于网络善意转载,版权归原作者所有,如侵权,请联系删除;
2、所有图片来源于网络,版权归原作者所有。如有侵权问题请告知,我们会立即处理。

