随机过程 第一章 预备知识(1)

数学 92 2026-02-02 00:56

1、看图重识条件概率:P(XY)=P(X,Y)P(Y)P(X|Y)=\frac{P(X,Y)}{P(Y)}

P(Y)=PY(Y=y)P(Y)= P_{\cdot Y}(Y=y)对应图上Y=y的直线,因直线的连续性,用连续随机变量的写法进行分析。(P(Y)是离散随机变量的记法)

P(Y)=PY(Y=y)P(Y[y,y+dy])=fY(y)dyP(Y)=P_{\cdot Y}(Y=y)\approx P(Y\in[y,y+dy])=f_{Y}(y)dy:即线的边缘概率密度乘上此线条在一个极小(无穷小)的宽度的值。

概率密度f(x)f(x):描述单位长度的“概率浓度”, 而单个点勒贝格测度(长度)为0,所以单点的概率都是0。因此给一个极小的距离代表此点的长度,因此概率=概率密度*长度(面积),相对应于物理中,也就有概率质量之说。

P(Y)=PY(Y=y)P(Y)=P_{\cdot Y}(Y=y)因在二维空间内,在图中是一条直线,所以其概率密度是包含了所有的x情况下,称为边缘概率密度:fY(y)=+fX,Y(x,y)dxf_{Y}\left(y\right)=\int_{-\infty}^{+\infty}f_{X,Y}\left(x,y\right) dx,此fX,Y(x,y)f_{X,Y}\left(x,y\right)对应是图上(x,y)\left(x,y\right)点的概率密度,把所有的x都加上后,x变量不再存在,剩下的就是y的一个函数fY(y)f_{Y}\left(y\right)

所以条件概率P(X,Y)P(Y)\frac{P(X,Y)}{P(Y)}对应图中是已知出现在Y=y线上时,出现在X=x的点概率,很自然是出现在Y=y线的值(概率)分之出现在X=x点的值(概率)

++fX,Y(x,y)dxdy=1\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f_{X,Y}\left(x,y\right)dxdy=1,图中全部点的概率之和等于1


为此我们自己可以出题,如图中,中间的全部PX,Y(xi,yj)P_{X,Y}\left(x_{i},y_{j}\right)概率之和需等于1,

那假设:X设为出行是骑车还是坐车,Y设为天气是天晴或是下雨;

则边缘概率有:X为坐车情况的边缘概率(包含下雨和天晴的之和),骑车情况同理;Y为天晴的边缘概率(包含骑车和坐车的之和),下雨情况同理。


2、条件期望的期望等于期望:E[E(XY)]=EXE\left\lbrack E\left(X\left|Y\right.\right)\right\rbrack=EX

期望等于变量取值的平均值,即全部取值乘以其对应概率的和:+xf(x)dx\int_{-\infty}^{+\infty}xf\left(x\right)d x或离散形式XxP(X=x)\sum_{X}xP\left(X=x\right)

E(XY)=XxP(XY)E\left(X\left|Y\right.\right)=\sum_{X}xP\left(X\left|Y\right|\right),其中条件期望中变量取值:已知在发生条件Y的情况下取x值的情况,那变量取值就是x了;再乘上条件概率即是条件期望的公式。此表达式运算完,x全部的取值都计算过了,不再是变量;E[E(XY)]E\left\lbrack E\left(X\left|Y\right.\right)\right\rbrack则是对E(XY)E\left(X\left|Y\right.\right)的值在Y为变量下取期望,即

=YE(XY=y)P(Y=y)=YXxP(XY=y)P(Y=y)\begin{align*} & =\sum_{Y}E\left(X\left|Y=y\right.\right)P\left(Y=y\right)\\ & =\sum_{Y}\sum_{X}xP\left(X\left|Y=y\right|\right)P\left(Y=y\right)\end{align*}后面两个概率的乘积获得是联合概率P(X,Y)P\left(X,Y\right),

=YXxP(X,Y)=\sum_{Y}\sum_{X}xP\left(X,Y\right)更换求和位置,

=XxYP(X,Y)=\sum_{X}x\sum_{Y}P\left(X,Y\right) 后面的求和即是边缘概率P(X)P\left(X\right)

=XxP(X)=EX=\sum_{X}xP\left(X\right)=EX

利用此方式,对于单独求X期望比较难时,通过给定一些条件下,去把原来的情况做具体划分,然后统计每个划分下的概率,反而较容易求得。

把比较笼统的事件通过划分具体化,从而更好求得

如上面举例情况,需要求一段时间消耗的卡路里,如果不划分,则千头万绪;而通过划分,比如上面骑车消耗100卡路里、坐车消耗10卡路里情况下去求;当然上面的例子比较简单,划分越细则结果越准确。


3、协方差

Cov(X,Y)=E[(XEX)(YEY)]Cov(X,Y)=E[(X-EX)(Y-EY)]

通过上面的介绍,协方差为(XEX)(YEY)(X-EX)(Y-EY)取值的期望,为好理解,可假设Z=(XEX)(YEY)Z=(X-EX)(Y-EY),因此是Z与Z出现的概率之积再求和,Z出现的概率为同时出现X=x,Y=yX=x, Y=y的联合概率。以连续变量为例:Cov(X,Y)=++(xμx)(yμy)f(x,y)dxdyCov(X,Y)=∫_{−∞}^{+∞}∫_{−∞}^{+∞}(x−μ_x )(y−μ_y )f(x,y)dxdy

再看当x=xix=x_i时(简单起见,假设均值都为0),+xiyf(xi,y)dy∫_{−∞}^{+∞}x_iyf(x_i,y)dy可看出,即是xix_i与全部的y的积取其概率贡献值再求和,因此当某个yjy_j出现的概率大时,值就会偏向其。如上面的例子,假设天晴为1,下雨为-1,则在骑车情况下,天晴出现的概率大,因此在天晴时消耗的卡路里大,整体值是偏大。而在坐车情况下,下雨时的概率大,整体就是把小的往更小的方向偏(下雨为-1,所以负数往更小方向)。在此时就一定要出现均值EX,EYEX,EY进行计算了,不然像上面例子消耗卡路里骑车100、坐车消耗10,加上后并不能直观看出什么。而xiμxx_{i}-\mu_x后,骑车情况45,坐车是-45,骑车在天晴情况下概率大,所以是正数,而坐车-45在下雨时的概率大,与-1相乘负负得正,也是正数,两者相加变得更大。这就说明天气和卡路里消耗是有关系的,而且是正相关。而把条件改一下,不是消耗卡路里,而是体重增加,则骑车肯定是增加的少,坐车增加的多,减均值就是骑车是负数,坐车是正数,计算后,就是一个负的值,此即为负相关。如果条件改成是另一个和你无关的人的消耗卡路里,当数据量很多时,计算结果将趋向于0,也即两个变量是相互独立的,不受影响。


4、相关系数:表示X、Y之间线性相关程度的大小

ϱXY=Cov(X,Y)DXDY\varrho_{XY}=\frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}}

因为协方差计算会受到量纲影响,方差大的比方差小的协方差大,比如以元为单位就比以万元为单位的协方差大。而通过把变量标准化为均值为0,方差为1的变量,如:U=ZEZσZU=\frac{Z-EZ}{\sigma_Z},则可消除量纲的影响。

而相关系数能限定值在[-1,1]:由柯西-施瓦茨不等式可知:

柯西-施瓦茨不等式:两个变量乘积的期望的平方,必然小于或等于这两个变量各自期望平方的乘积。

证明方法:令U=XE(X)V=YE(Y)U=X-E(X),V=Y-E(Y)。此时,U 和 V 的期望均为 0。构造函数E[(U+tV)2]0E[(U+tV) ^2]≥0

EU2+2tE(UV)+t2EV20\Rightarrow EU^2+2tE(UV)+t^2EV^2\ge0 ,此式恒大于0则: [2E(UV)]2(4EV2EU2)0[E(UV)]2EV2EU2[2E(UV)]^2-(4EV^2EU^2)\le0 \Rightarrow [E(UV)]^2 \le EV^2EU^2

移项后,即Cov(X,Y)DXDY=ϱXY1\frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}}=\varrho_{XY} \le 1

此时,相关系数反映的不再是原始数值的共变大小,而是两个变量在变化趋势上的形状相似度。它衡量的是两个变量每单位变化时的协同程度,而非受各自波动剧烈程度的影响。 通过除以标准差进行标准化,相关系数的取值被固定在-1到1之间。 1:表示完全正(线性)相关,即一个变量增加多少,另一个变量也按固定比例增加;如y=ax+b,a>0y=ax+b,a>0。 -1:表示完全负相关,即一个变量增加,另一个按固定比例减少。 0:表示无线性相关关系。


喜欢 | 0 收藏 | 0
提示:如果图片无法显示,请检查网页地址前缀是否被改成https://,请使用http://访问
文章评论