这事儿说白了,就是找规律,看两个量儿是不是绑在一起。别整那些虚头巴脑的术语,我就拿最好办的例子跟你唠唠,比如咱们买东西,买鞋和买衣服。

一般情况下去街上转转,发现买的鞋子多的人,大约率也会买衣服;要么买东西多的人,也多半会买鞋。

这就叫正相关,就是两个东西一起往上涨,要么一起往下掉。 再换个角度,比如身高和体重。胖子的身高和瘦子的身高能一样高,这个本来就不叫相关,出于身高跟胖不胖没啥必然联系。但要是换个场景,比如你身高 180 并且体重 90 公斤,这俩事儿绑得特别紧。高个子的哥们儿,大约率会胖;矮个子的哥们儿,大约率会瘦。

这时候,只要看到一个,你就能猜大约是哪位。

这种关系,就是正相关。 再比如下雨和感冒。正常情况下,下雨天你不出门,那感冒的概率就低,这是负相关。但要是你出门不戴口罩,要么出门工夫不对,那雨大你感冒的概率就高,这又是另一种关系。数学上这叫负相关,就是两个量儿你往上面去,下脸就往下陷。 还有一种情况,比如你每天喝多少水,跟你的尿液量。你水喝多了,尿就多;水少,尿就少。

这个也是典型的正相关,一个升,一个就降。

这种关系,不管你是喝水还是吃菜,只要数据正着来,就是正相关;反之,就是负相关。 说到正相关,最典型的就是收入跟花。你有钱了,自然更愿意花钱买东西。你收入越高,手里能拿出的钱也越多,花自然就高了。但这里有个细节,不是钱越多花就一定越响,还得看钱够不够花。

要是一个人穷得叮当响,他花钱也就随随意便,随意如何花都差不多;只有当他手里有钱,花钱才更有目标,就连可能出现为了省钱而过度节俭,这时候收入高了,花反而可能低,这就叫负相关,是典型的“有钱不花”的怪圈。 再说说负相关,比如身高和体重。越胖的人,身高往往越低。出于体重多了,腿就变粗了,身高自然就缩水。

反过来,体重轻的人,一般身高比较高。体重下降的时候,身高也会跟着长高。

这种反着来的,就是负相关。 不过,除了正相关和负相关,还有一种有点意思的,叫不相关

比如身高和体重之间,别看大家心里都清楚胖矮有联系,但你随意摸三个数据,可能高个子的既胖又瘦,矮个子也胖又瘦。

这时候,身高和体重之间就是没啥明显关系的,就是不相关。 那如何判断是不是确实相关呢?得看数据点散不散。散得开,就不相关;散得开,就正相关;散得开,就负相关

要是数据点都挤在一堆,那就根本不相关。 举个具体的例子。假设咱们随机选了一些大学男生和高大女生。我们用他们的身高和体重画个图,会发现那些点分散得特别开。

你看,有的男生挺高,但挺瘦;有的女生挺矮,但挺壮。

这证明他们之间没啥联系,彻底就是不相关。 再比如,看看不同年龄段的吸烟量和肺癌发病率。

要是算出来,年龄越大,吸烟量越多,肺癌发病率越高,那这就是个正相关

反之,要是年龄变大,吸烟量反而变少,那这就是负相关。 有时候,数据会有点“假”的情况。

比如你买了两本不同的数学书,一本《高等数学》一本《线性代数》。

这两本书,你认定肯定是相关吧?

如何可能?

要不就你对这两本书特别了解,否则它们之间没啥逻辑联系。

故此,数据散不开,说明这两件事是相关的。 再深入一点,这种关系在统计学上有个名字叫相关系数。好办来说,就是那个分数,范围是 -1 到 1 之间。1 代表彻底正相关,-1 代表彻底负相关,0 代表彻底不相关。 还有,要想是真正的相关,还得看数据点是否都散开了,没有那种两点就把所有点都绑死的情况。

要是只有两个点,就算散的再好,也只有一个相关性的视角,不够全面。要更多数据点,才能看出全貌。 最终说句大实话,生活中大量看起来相关的东西,最终发现是扯皮的。

比如你买了大量股票,结局第二天全体跌停;你买了大量零食,结局第二天肚子疼得下不了床。

这时候,看似强相关,实际上是彻底没关联,纯属巧合。

故此,别一听认定相关系,就先别急着下结论,得先凑够 30 个点,看看是不是散开的,真得看相关的程度。 总而言之,相关这事儿,核心就两个字:散。散得开,就是相关;不散,就是无涉。明白这个,你就明白大约了。