中国科学技术大学-812概率论与数理统计-2022年

一、(15分) 构造一个二维随机变量 (X,Y)(X,Y) 的联合p.d.f, 使得 XX 的边际密度函数为

fX(x)=2π(b2a2)[(b2x2)+(a2x2)+]f_X\left( x \right) =\frac{2}{\pi \left( b^2-a^2 \right)}\left[ \sqrt{\left( b^2-x^2 \right) _+}-\sqrt{\left( a^2-x^2 \right) _+} \right]

其中 ()+\left( \cdot \right) _+ 表示 \cdot 的正部.

Solution:

f(x,y)=2π(b2a2),a<x2+y2<b2,y>0f\left( x,y \right) =\frac{2}{\pi \left( b^2-a^2 \right)},a<x^2+y^2<b^2,y>0

二、(20分) 现有I+,II^+,I^-两种信号, 向后依次传播, 传播出错的概率是 pp. 设初始信号为 I+I^+, 求

(1) 传播两次后, 信号还是 I+I^+ 的概率;

(2) 传播 nn 次后, 信号是 II^- 的概率.

Solution:
(1) 直接计算即可, 变了 22 次或没变, 概率是 p2+(1p)2p^2+\left( 1-p \right) ^2,

(2) 这题类似茆书中"第一天晴天, 求第nn天也是晴天的概率", 可以用递推法给出答案. 除了递推法, 我们还可以设 nn 次中的传播出错的次数 XB(n,p)X \sim B(n,p), 则目标即为求 XX 是奇数的概率, 我们考虑其对应的母函数

ψX(s)=E[sX]=k=0nskCnkpkqnk=(ps+q)n.\psi_X(s) = E[s^X] = \sum \limits_{k=0}^n s^k C_n^k p^kq^{n-k} = (ps+q)^n.

1=ψX(1)=E[1X]=P(X取奇)+P(X取偶),1=\psi _X\left( 1 \right) =E\left[ 1^X \right] =P\left( X\text{取奇} \right) +P\left( X\text{取偶} \right) ,

(qp)n=ψX(1)=E[(1)X]=1P(X取偶)1P(X取奇),\left( q-p \right) ^n=\psi _X\left( -1 \right) =E\left[ \left( -1 \right) ^X \right] =1\cdot P\left( X\text{取偶} \right) -1\cdot P\left( X\text{取奇} \right) ,

因此我们有

P(X取奇)=1(qp)n2=1(12p)n2.P\left( X\text{取奇} \right) =\frac{1-\left( q-p \right) ^n}{2}=\frac{1-\left( 1-2p \right) ^n}{2}.

三、(15分) (X,Y)(X,Y) 有联合密度函数

f(x,y)=2(n+1)!(2y+x)ne2yx,x>0,y>0f\left( x,y \right) =\frac{2}{\left( n+1 \right) !}\left( 2y+x \right) ^ne^{-2y-x},x>0,y>0

U=2Y+X,V=3X+8YU = 2Y+X,V=3X+8Y.

(1) 求 (U,V)(U,V) 的联合分布以及 UU 的边缘分布;

(2) 求 VU=uV\mid U=u 的条件分布;

(3) 求 E(XU=u)E(X\mid U = u) 以及E(YU=u)E(Y\mid U = u).

Solution: (1)

fU,V(u,v)=uneu(n+1)!,3u<v<4uf_{U,V}\left( u,v \right) =\frac{u^ne^{-u}}{\left( n+1 \right) !},3u<v<4u

fU(u)=un+1eu(n+1)!,u>0f_U\left( u \right) =\frac{u^{n+1}e^{-u}}{\left( n+1 \right) !},u>0

(2) (3u,4u)(3u,4u) 上的均匀分布;

(3)

E(XU=u)=E(4UVU=u)=4u72u=12uE\left( X\mid U=u \right) =E\left( 4U-V\mid U=u \right) =4u-\frac{7}{2}u=\frac{1}{2}u

E(YU=u)=E(32U+12VU=u)=32u+74u=14uE\left( Y\mid U=u \right) =E\left( -\frac{3}{2}U+\frac{1}{2}V\mid U=u \right) =-\frac{3}{2}u+\frac{7}{4}u=\frac{1}{4}u

四、(20分) X,Y,Z,W,V,QX,Y,Z,W,V,Q 服从独立标准正态分布, 求 T=(XW+YV+ZQ)2W2+V2+Q2T=\frac{\left( XW+YV+ZQ \right) ^2}{W^2+V^2+Q^2} 的分布.

Solution: 先考虑 U=XW+YV+ZQW2+V2+Q2U=\frac{XW+YV+ZQ}{\sqrt{W^2+V^2+Q^2}} 关于 W,V,QW,V,Q 的条件分布, 有

P(UtW=w,V=v,Q=q)=Φ(t)P\left( U \le t\mid W=w,V=v,Q=q \right) =\Phi \left( t \right)

不依赖于 w,v,qw,v,q, 这里 Φ(t)\Phi(t) 是标准正态c.d.f, 而又注意到上式左侧是关于 t,w,v,qt,w,v,q 的函数, 故记其为 G(t,w,u,q)G\left( t,w,u,q \right), UU 的无条件分布即

P(Ut)=E[G(t,W,U,Q)]=E[Φ(t)]=Φ(t)P\left( U \le t \right) =E\left[ G\left( t,W,U,Q \right) \right] =E\left[ \Phi \left( t \right) \right] =\Phi \left( t \right)

所以 UN(0,1)U\sim N(0,1), T=U2χ12T = U^2 \sim \chi_1^2.

五、(15分) 已知 XnpXX_n\rightarrow _pX, 试证 Xn2pX2X_{n}^{2}\rightarrow _pX^2.

Solution: 按定义即可, 茆书上便有.

六、(30分) X1,X2,,XnX_1,X_2,\cdots,X_n 是来自泊松分布总体 P(θ)\mathcal{P}\left( \theta \right) 的简单随机样本. 以 Tn=(11n)i=1nXiT_n=\left( 1-\frac{1}{n} \right) ^{\sum_{i=1}^n{X_i}} 作为 eθe^{-\theta} 的估计. 试问

(1) TnT_n 是否是无偏估计?

(2) TnT_n 是否是UMVUE?

(3) TnT_n 是否是有效估计?

Solution: (1) 注意到 Y=i=1nXiP(nθ)Y=\sum_{i=1}^n{X_i}\sim \mathcal{P}\left( n\theta \right), 则有

E(Tn)=E[(11n)Y]=k=0+(11n)k(nθ)kk!enθ=enθe(n1)θk=0+[(n1)θ]kk!e(n1)θ=eθ\begin{aligned} E\left( T_n \right) =E\left[ \left( 1-\frac{1}{n} \right) ^Y \right] &=\sum_{k=0}^{+\infty}{\left( 1-\frac{1}{n} \right) ^k\frac{\left( n\theta \right) ^k}{k!}e^{-n\theta}} \\ &=e^{-n\theta}e^{\left( n-1 \right) \theta}\sum_{k=0}^{+\infty}{\frac{\left[ \left( n-1 \right) \theta \right] ^k}{k!}e^{-\left( n-1 \right) \theta}} \\ &=e^{-\theta} \end{aligned}

TnT_n 是无偏估计.

(2) 根据完备指数族的性质, Y=i=1nXiP(nθ)Y=\sum_{i=1}^n{X_i}\sim \mathcal{P}\left( n\theta \right)θ\theta 的充分完备统计量, 而 TnT_n 是基于其构造的 eθe^{-\theta} 的无偏估计, 因此根据Lehamnn-Scheffe定理, 它是UMVUE.

(3) 先计算C-R下界, Fisher信息量是

I(θ)=E[2f(X;θ)θ]=E[Xθ2]=1θI\left( \theta \right) =-E\left[ \frac{\partial ^2f\left( X;\theta \right)}{\partial \theta} \right] =-E\left[ -\frac{X}{\theta ^2} \right] =\frac{1}{\theta}

g(θ)=eθg(\theta) = e^{-\theta}无偏估计方差的C-R下界是 [g(θ)]2nI(θ)=θne2θ\frac{\left[ g'\left( \theta \right) \right] ^2}{nI\left( \theta \right)}=\frac{\theta}{n}e^{-2\theta}.

再计算TnT_n的方差, 首先有

E(Tn2)=k=0+(11n)2k(nθ)kk!enθ=k=0+[(n2+1n)θ]kk!enθ=enθe(n2+1n)θk=0+[(n2+1n)θ]kk!e(n2+1n)θ=e(1n2)θ\begin{aligned} E\left( T_{n}^{2} \right) &=\sum_{k=0}^{+\infty}{\left( 1-\frac{1}{n} \right) ^{2k}\frac{\left( n\theta \right) ^k}{k!}e^{-n\theta}} \\ &=\sum_{k=0}^{+\infty}{\frac{\left[ \left( n-2+\frac{1}{n} \right) \theta \right] ^k}{k!}e^{-n\theta}} \\ &=e^{-n\theta}e^{\left( n-2+\frac{1}{n} \right) \theta}\sum_{k=0}^{+\infty}{\frac{\left[ \left( n-2+\frac{1}{n} \right) \theta \right] ^k}{k!}e^{-\left( n-2+\frac{1}{n} \right) \theta}} \\ &=e^{\left( \frac{1}{n}-2 \right) \theta} \end{aligned}

Var(Tn)=E(Tn2)(ETn)2=e(1n2)θe2θ=e2θ(eθn1)>θne2θVar\left( T_n \right) =E\left( T_{n}^{2} \right) -\left( ET_n \right) ^2=e^{\left( \frac{1}{n}-2 \right) \theta}-e^{-2\theta}=e^{-2\theta}\left( e^{\frac{\theta}{n}}-1 \right) >\frac{\theta}{n}e^{-2\theta}

因此它不是有效估计.

注: 虽然此处 TnT_n 不是有效估计, 但它是渐近有效的.

七、(10分) 现有正态分布 N(μ,1)\mathcal{N}\left( \mu ,1 \right)nn 个样本 x1,x2,,xnx_1,x_2,\cdots,x_n, 取值小于 00 时记为 11, 否则记为 00, 求 μ\mu 的MLE.

Solution: P(x1=1)=P(X<0)=Φ(μ)P\left( x_1=1 \right) =P\left( X<0 \right) =\Phi \left( -\mu \right), 故 xib(1,Φ(μ))x_i\sim b\left( 1,\Phi \left( -\mu \right) \right). 于是 Φ(μ)\Phi \left( -\mu \right) 的MLE是 xˉ\bar{x}, 根据MLE的不变性有 μ^=Φ1(xˉ)\hat{\mu}=-\Phi ^{-1}\left( \bar{x} \right).

八、(25分) 回归结果解读.