5、特征函数
特征函数是为了更方便研究随机变量的数字特征,而引入的数学工具--傅里叶变换
F(ω)=∫−∞+∞f(t)e−iωtdt
通过对傅里叶公式进行求导,积分后是关于变量ω的函数:F′(ω)=−i∫−∞+∞e−iωttf(t)dt,当ω=0时,积分就对应了期望的公式,因此如果能求出F′(ω)的值,那通过EX=iF′(0)就能得到期望值,或者计算后的表达式i可提取出来,那剩余的项就是EX。因为是引入的工具,为了简单,我们直接去掉复数i,则给它取个名字为矩母函数。同理方差就是二阶导:F′′(ω)=(−i)2∫−∞+∞e−iωtt2f(t)dt⇒DX=i2F′′(ω)。
因为傅里叶变换的反变换f(t)=2π1∫−∞+∞F(ω)eiωtdω形式相同,所以去掉负号同理可证。对于离散变量的特征函数,相应的修改即可:∑teiwtP(X=t)。
定义:设随机变量的分布函数为F(x),称g(t)=E[eitX]=∫−∞∞eitxdF(x),−∞<t<∞,为X的特征函数
- 二项分布B(n,p),特征函数为:g(w)=t=0∑neiwtCntptqn−t=t=0∑nCnt(peiw)tqn−t=(peiw+q)n则期望通过取一阶导:g′(w)=[(peiw+q)n]′=i∗n(peiw+q)n−1peiw
取w=0,则g′(0)=i∗n(peiw+q)n−1peiw=i∗np,对应的EX=np
- 正态分布X∼N(μ,σ2),特征函数为:∫−∞+∞eitx2πσ1e−2σ2(x−μ)2dx,因为∫−∞+∞2πσ1e−2σ2(x−μ)2dx=1。
特别是标准正态分布X∼N(0,1),∫−∞+∞2π1e−2x2dx=1,从而可知∫−∞+∞e−2x2dx=2π,特征函数为:g(t)=∫−∞+∞eitx2π1e−2x2dx=2π1∫−∞+∞eitx−2x2dx=2π1∫−∞+∞e−21[(x−it)2−(it)2]dx=2πe21(it)2∫−∞+∞e−21(x−it)2dx=2πe21(it)2∫−∞+∞e−21y2dy=e2(it)2=e−2t2其中积分换元:y=x−it,由围道积分证明dy=dx。
则非标准正态分布通过标准化Z=σx−μ,X的特征函数即:∫−∞+∞eitx2πσ1e−2σ2(x−μ)2dx=∫−∞+∞eit(σz+μ)2πσ1e−2σ2(σz)2dσz=eitμ∫−∞+∞eitσz2π1e−2z2dz=eitμ∫−∞+∞ei(tσ)z2π1e−2z2dz=eitμe−2(σt)2从上可知,当已知X的特征函数g(t)=∫−∞+∞e−itxf(x)dx,则当Y=aX+b时,Y的特征函数∫−∞+∞e−ityu(y)dy。
Y的概率密度u(y)需通过分布来求:FX(x)=P(X≤x)=∫−∞xf(x)dx,用X=aY−b代入,P(aY−b≤x)=P(Y≤ax+b)=∫−∞xf(x)dx,
对Y求导:(P(Y≤ax+b))′=FY′(y)=u(y)=(∫−∞ay−bf(x)dx)′,
- 通过莱布尼茨定理:G(x)=∫−∞v(x)h(t)dt,
G′(x)=Δx→0limΔxG(x+Δx)−G(x)=Δx→0limΔx∫−∞v(x+Δx)h(t)dt−∫−∞v(x)h(t)dt=Δx→0limΔx∫v(x)v(x+Δx)h(t)dt
中值定理,对于积分存在一个ξ使得h(ξ)[v(x+Δx)−v(x)]=∫v(x)v(x+Δx)h(t)dt,所以:G′(x)=limΔx→0Δxh(ξ)[v(x+Δx)−v(x)],由Δx→0,ξ→v(x),G′(x)=h(v(x))v′(x)
- 或通过换元:(∫−∞ay−bf(x)dx)′=(∫−∞zf(z)day−b)′=(∫−∞za1f(ay−b)dy)′=a1f(ay−b)
代入Y的特征函数:∫−∞+∞e−itya1f(ay−b)dy=∫−∞+∞e−it(ax+b)a1f(x)d(ax+b)=e−itbg(at)
6、母函数
傅里叶变换如果积分结果发散则无法积出结果,因此保证变换后的傅里叶积分收敛、有意义,需要求被积函数绝对可积。
F(ω)=∫−∞+∞f(t)cosωtdt−i∫−∞+∞f(t)sinωtdt(欧拉公式:e−iωt=cosωt−isinωt),这样避免正负抵消的 “假象收敛”,保证变换稳定性。
但对不能绝对可积的函数,则加入抑制因子e−βx得:∫−∞+∞e−βxe−itxf(x)dx,因抑制因子是一个急剧下压至0的函数,所以控制函数不发散,但负轴方向却是发散的,所以积分区域改成正半轴,以保证积分收敛:∫0+∞e−(β+it)xf(x)dx,也就是拉普拉斯变换
令S=β+iw则表达式为:∫0+∞e−sxf(x)dx,和上面介绍一样,此函数仅是借用的工具,为了简单,去掉负号为:∫0+∞esxf(x)dx。
因为ex=x0+x1+21x2+...,通过截断就能分析ex的值,同理,了解了xn的性质,也就可以了解ex,为此也可以改成(n是0,1,2...,所以用离散形式):∑n=0∞SnP(X=n),也就是母函数,记为:E[sX]=∑k=0∞pksk。所以母函数可研究非负整数值随机变量。
- 性质:
1、独立随机变量之和的母函数等于母函数之积
2、若X1,X2,…是相互独立且同分布的非负整数值随机变量,N是X1,X2,…独立的非负整数随机变量,则Y=∑k=1NXk的母函数H(s)=G(Q(s)),其中G(s),Q(s)分别是N,X1的母函数
证:H(s)=∫0∞syf(y)dy,y出现的概率是随机变量N取某个值为l时,X1,…Xl之和为y的概率,即fN(l)fY∣N=l(y)。
某一组取值时的概率f(y,X1,X2,...Xl−1)(y,x1,x2,...xl−1)等于:f(X1,X2,...Xl)(x1,x2,...y−x1−x2...−xl−1)=fX1(x1)fX2(x2)...fXl(y−x1−x2...−xl−1)而取Y=y时,X1,…Xl每个取值都可以是任意,因此:fY∣N=l(y)=∫0∞∫0∞...∫0∞fX1(x1)fX2(x2)...fXl(y−x1−x2...−xl−1)dx1dx2...dxl−1
上面公式即是卷积(fX1∗fX2)(y)。如:两个独立随机变量和Y=X1+X2的概率密度公式:fY(y)=∫−∞∞fX1(x1)fX2(y−x1)dx1
sy=sX1sX2...sXl;且y=∑k=1lxk,当x1,…xl−1同时出现的概率就决定了xl,反过来xl出现的概率也就是y出现的概率,所以dy=dxl。则
H(s)=∫0∞sx1...sxl∫1∞fN(l)∫0∞...∫0∞fX1(x1)...fXl−1(xl−1)fXl(y−x1−x2...−xl−1)dx1...dxl−1dxl=∫1∞fN(l)∫0∞sx1fX1(x1)...∫0∞sxlfXl(xl)dx1...dxl
因为X1,X2,…相互独立,所以x1,...xl−1,xl前l−1个变量是不相互影响的,仅xl=y−∑k=1l−1xk受限。所以:
H(s)=∫1∞fN(l)∫0∞sx1fX1(x1)dx1...∫0∞sxlfXl(xl)dxl
至于xl,dxl不受限制了,可以移项组合,是因为l也是随机变量了。
又因为独立同分布,所以:H(s)=∫1∞fN(l)(∫0∞sxfX(x)dx)l=∫1∞fN(l)(Q(s))l=G(Q(s))
7、n维正态分布
n维随机变量X=(X1,X2,...Xn)T的联合概率密度为:f(x)=f(x1,x2,...xn)=(2π)n/2∣Σ∣1/21exp{−21(x−a)TΣ−1(x−a)}
推导:对于一元标准正态X∼N(0,1)的概率密度:2π1e−2x2,拓展到n元标准正态:(2π1)ne−21(x12+x22+...+xn2)=(2π1)ne−21(XTX)
对于n元非标准正态Y=AX+μ⇒X=A−1(Y−μ),Y的概率密度(由上面的推导可知):fY(y)=fX(x)∣det(∂y∂x)∣,(因为多维y的变化,导致x的变化是x的概率密度乘上面积,即雅可比行列式)。代入:=(2π1)ne−21[A−1(Y−μ)]T[A−1(Y−μ)]∣A−1∣n。
设AAT=Σ,则[A−1]TA−1=Σ−1。det(Σ)=det(AA⊤)=(detA)2。
(AB)(B−1A−1)=E⇒(B−1A−1)=(AB)−1
∣AB∣=∣A∣∣B∣:矩阵乘相当于拉伸和旋转,对面积的放大/缩小系数是固定的。B放大一次,A在B的基础上再放大,系数都是矩阵的面积(行列式),所以先连续变形后再看放大系数与独立放大系数乘相同
注:如果X=(X1,X2,...Xn),表示行向量的话:f(x)=(2π)n/2∣Σ∣1/21exp{−21(x−a)Σ−1(x−a)T}