网上摘了两个不错的图。

但是依然需要说明一下。 我们从不同的视角。


1. 英文。 哈哈

1)The basic problem that we study in probability is: Given a data generating process, what are the properities of the outcomes?

2)The basic problem of statistical inference is the inverse of probability: Given the outcomes, what can we say about the process that generated the data?

来自 Lary Wasserman 的 《All of Statistics》


2. 中文

概率和统计其实从相反的角度解决不同的问题。

概率是基于已知的模型/分布,来预测数据(预测某个事件发生的可能性,或者称之为随机变量在不同值得可能性,也即概率密度函数。其自变量是随机变量,而y则是可能性)

而统计,解决的是已知了数据(部分数据,或者称之为样本,或者称之为已知了事件的概率,或者称之为已知了随机变量的值)反过来推导出完整的模型(包括分布模型和参数)

3. 理念

概率论永远认为小概率事件是会发生的,只要重复次数足够多。
而统计永远认为小概率事件不会发生,直接忽略,进而典型的基于最大似然来拟合模型和参数

4. 数学思想

概率论是基于推理,演绎的思想。
而统计则基于归纳的思想

5. 哲学

概率论是由因到果,探讨天命
而统计则是由果回因,反思本原。

6. 随机过程:

随机过程太复杂,基本是研究生课程里的老大难了。
简单而言,确定过程,就是普通的基于时间t的函数,给定时间t,可以确定的得到y的值,而且该过程可以无限重复而得到一致的结果。 比如,宏观物理的定律。 如自由落体 s=gt^2/2, 在任意时刻t,我可以确切的知道s。而且不管在地球何处,也不管是重复做几次,都是这个结果。

而随机过程,由于是过程,所以依然是时间t的函数,但是,现在其应变量y,则给出的是概率,是分布,而不再是确定的值了。也就是说,随机过程研究的,是持续的,连续的概率问题。 如果拿高大上的量子力学来做例子,其波函数就可以一定程度上近似理解为随机过程,给出时间t时粒子在空间不同位置的概率分布。