复旦大学861-861概率论与数理统计-2019年

一 (20 分) 已知甲、乙两厂生产一等品概率分别为 p1,p2p_{1}, p_{2}. 某商店有 10 件商品, 其中 3 件来自甲厂, 7 件来自乙厂. 试求以下事件的概率

(1) 在该商店中抽取一件商品, 抽中的是一等品;

(2) 已知在该商店抽取一件商品为一等品, 该产品是来自甲厂的.

Solution:(1) 设事件 A\mathrm{A} 表示抽中的商品是甲生产的, 事件 B\mathrm{B} 表示抽中的是一等品, 根据题 意有 P(A)=0.3,P(Aˉ)=0.7,P(BA)=p1,P(BAˉ)=p2P(A)=0.3, P(\bar{A})=0.7, P(B \mid A)=p_{1}, P(B \mid \bar{A})=p_{2} 因此所以在该商店抽一间商 店是一等品的概率为

P(B)=P(A)P(BA)+P(Aˉ)P(BAˉ)=0.3p1+0.7p2.\begin{aligned} P(B) &=P(A) P(B \mid A)+P(\bar{A}) P(B \mid \bar{A}) \\ &=0.3 p_{1}+0.7 p_{2} . \end{aligned}

(2) 根据贝叶斯公式, 有

P(AB)=P(AB)P(B)=P(A)P(BA)P(B)=0.3p10.3p1+0.7p2=3p13p1+7p2.P(A \mid B)=\frac{P(A B)}{P(B)}=\frac{P(A) P(B \mid A)}{P(B)}=\frac{0.3 p_{1}}{0.3 p_{1}+0.7 p_{2}}=\frac{3 p_{1}}{3 p_{1}+7 p_{2}} .

二、 (20 分) 随机变量 X,YX, Y 相互独立, 均服从 (0,1)(0,1) 上的均匀分布, 解决以下问题

(1) 试求 P(X<Y)P(X<Y);

(2) 求 Z=XYZ=X-Y 的分布.

Solution: (1) 根据对称性, 有 P(X<Y)=P(Y<X)P(X<Y)=P(Y<X), 而由于

P(X<Y)+P(Y<X)=1P(X=Y)=1P(X<Y)+P(Y<X)=1-P(X=Y)=1 \text {, }

因此有 P(X<Y)=12P(X<Y)=\frac{1}{2}.
(2) 令 Z=XY,V=YZ=X-Y, V=Y, 有反函数

{X=Z+V, 对应 Y=V,x=z+vy=v\left\{\begin{array}{l} X=Z+V, \quad \text { 对应 } \\ Y=V, \end{array} \Rightarrow \begin{array}{l} x=z+v \\ y=v \end{array}\right.

雅可比行列式为 1 , 故有

fZ,V(z,v)=fX,Y(z+v,v)=1,0<z+v<1,0<v<1,f_{Z, V}(z, v)=f_{X, Y}(z+v, v)=1,0<z+v<1,0<v<1,

1<z<0-1<z<0, 有 fZ(z)=z1dv=1+zf_{Z}(z)=\int_{-z}^{1} d v=1+z, 当 0z<10 \leq z<1, 有 fZ(z)=01zdv=1zf_{Z}(z)=\int_{0}^{1-z} d v=1-z, 因此有 fZ(z)=1z,1<z<1f_{Z}(z)=1-|z|,-1<z<1.

三、(30 分) 将 kk 个不同的球随机放人 nn 个盒子中 (kn)(k \geq n), 用 XX 表示空盒的个 数, 试求 EXE XDXD X.

Solution: 令 Xi={1, 第 i 个盒子为空盒, 0, 第 i 个盒子不为空盒, 则有 X1,,Xn 同服从 B(1,(11n)k)X_{i}= \begin{cases}1, & \text { 第 } i \text { 个盒子为空盒, } \\ 0, & \text { 第 } i \text { 个盒子不为空盒, 则有 } X_{1}, \cdots, X_{n} \text { 同服从 } B\left(1,\left(1-\frac{1}{n}\right)^{k}\right) \text {, }\end{cases} 但不独立. 设 Y=k=1nXkY=\sum_{k=1}^{n} X_{k} 是总的空盒数, 有 EY=nEX1=n(11n)k=(n1)knk1E Y=n E X_{1}=n\left(1-\frac{1}{n}\right)^{k}=\frac{(n-1)^{k}}{n^{k-1}}.
至于方差,由于

E(Y2)=E(i=1nj=1nXiXj)=nE(X12)+n(n1)E(X1X2)E\left(Y^{2}\right)=E\left(\sum_{i=1}^{n} \sum_{j=1}^{n} X_{i} X_{j}\right)=n E\left(X_{1}^{2}\right)+n(n-1) E\left(X_{1} X_{2}\right)

其中 E(X12)=(n1)knkE\left(X_{1}^{2}\right)=\frac{(n-1)^{k}}{n^{k}}, 而 E(X1X2)=P(X1=1,X2=1)=(n2n)kE\left(X_{1} X_{2}\right)=P\left(X_{1}=1, X_{2}=1\right)=\left(\frac{n-2}{n}\right)^{k}, 故有

E(Y2)=(n1)knk1+(n1)(n2)knk1E\left(Y^{2}\right)=\frac{(n-1)^{k}}{n^{k-1}}+\frac{(n-1)(n-2)^{k}}{n^{k-1}}

因此有

D(Y)=E(Y2)(EY)2=(n1)knk1+(n1)(n2)knk1(n1)2kn2k2\begin{aligned} D(Y) &=E\left(Y^{2}\right)-(E Y)^{2} \\ &=\frac{(n-1)^{k}}{n^{k-1}}+\frac{(n-1)(n-2)^{k}}{n^{k-1}}-\frac{(n-1)^{2 k}}{n^{2 k-2}} \end{aligned}

四、 (40 分) 设 {Xi}\left\{X_{i}\right\} 是来自均匀分布 U(θ1,θ2)U\left(\theta_{1}, \theta_{2}\right) 的简单随机样本, 尝试解决以下问题

(1) 求 θ1,θ2\theta_{1}, \theta_{2} 的极大似然估计;

(2) (1) 中求出的估计是无偏的吗? 如果不是, 尝试将其修正为无偏估计;

(3) (2) 中得到的修正无偏估计是否是 UMVUE? 说明理由;

(4) 求位置与尺度参数 (θ1+θ22,θ2θ1)\left(\frac{\theta_{1}+\theta_{2}}{2}, \theta_{2}-\theta_{1}\right) 的 UMVUE.

Solution: (1)样本对应的似然函数是

L(θ1,θ2)=1(θ2θ1)nI{θ1<X(1)<X(n)<θ2}L\left(\theta_{1}, \theta_{2}\right)=\frac{1}{\left(\theta_{2}-\theta_{1}\right)^{n}} I_{\left\{\theta_{1}<X_{(1)}<X_{(n)}<\theta_{2}\right\}}

发现要使似然函数尽可能大, 需要使得 (θ2θ1)\left(\theta_{2}-\theta_{1}\right) 在定义域内尽可能小, 因此有

θ^1=X(1),θ^2=X(n).\hat{\theta}_{1}=X_{(1)}, \hat{\theta}_{2}=X_{(n)} .

(2) 作总体变换, 令 Yi=Xiθ1θ2θ1U(0,1)Y_{i}=\frac{X_{i}-\theta_{1}}{\theta_{2}-\theta_{1}} \sim U(0,1), 因此 Y1,Y2,YnY_{1}, Y_{2}, \cdots Y_{n} 是 i.i.d. 的来自均匀分布的 随机变量, 故有 Y(1)Be(1,n),Y(n)Be(n,1)Y_{(1)} \sim \operatorname{Be}(1, n), \quad Y_{(n)} \sim \operatorname{Be}(n, 1), 故有

E(Y(1))=1n+1,E(Y(n))=nn+1,E\left(Y_{(1)}\right)=\frac{1}{n+1}, E\left(Y_{(n)}\right)=\frac{n}{n+1},

对应可以求出

E(X(1))=(θ2θ1)E(Y(1))+θ1=nn+1θ1+1n+1θ2E(X(n))=(θ2θ1)E(Y(n))+θ1=nn+1θ2+1n+1θ1\begin{aligned} &E\left(X_{(1)}\right)=\left(\theta_{2}-\theta_{1}\right) E\left(Y_{(1)}\right)+\theta_{1}=\frac{n}{n+1} \theta_{1}+\frac{1}{n+1} \theta_{2} \\ &E\left(X_{(n)}\right)=\left(\theta_{2}-\theta_{1}\right) E\left(Y_{(n)}\right)+\theta_{1}=\frac{n}{n+1} \theta_{2}+\frac{1}{n+1} \theta_{1} \end{aligned}

故它们不是无偏的, 我们可以将其修正为无偏估计, 即令

θ^1=nX(1)X(n)n1,θ^2=nX(n)X(1)n1.\hat{\theta}_{1}^{\prime}=\frac{n X_{(1)}-X_{(n)}}{n-1}, \hat{\theta}_{2}^{\prime}=\frac{n X_{(n)}-X_{(1)}}{n-1} .

(3) 由因子分解定理知 (X(1),X(n))\left(X_{(1)}, X_{(n)}\right) 是充分统计量, 下证其完备: (X(1),X(n))\left(X_{(1)}, X_{(n)}\right) 的概率密度函数 是

f(x1,xn)=n(n1)f(x1)f(xn)[F(xn)F(x1)]n2=n(n1)(xnx1)n2(θ2θ1)n,θ1<x1<xn<θ2,\begin{aligned} f\left(x_{1}, x_{n}\right) &=n(n-1) f\left(x_{1}\right) f\left(x_{n}\right)\left[F\left(x_{n}\right)-F\left(x_{1}\right)\right]^{n-2} \\ &=\frac{n(n-1)\left(x_{n}-x_{1}\right)^{n-2}}{\left(\theta_{2}-\theta_{1}\right)^{n}}, \quad \theta_{1}<x_{1}<x_{n}<\theta_{2}, \end{aligned}

φ(X(1),X(n))\forall \varphi\left(X_{(1)}, X_{(n)}\right) 满足 E[φ(X(1),X(n))]=0E\left[\varphi\left(X_{(1)}, X_{(n)}\right)\right]=0, 有

θ2θ2[θ1xnφ(x1,xn)n(n1)(xnx1)n2(θ2θ1)ndx1]dxn=0,\int_{\theta_{2}}^{\theta_{2}}\left[\int_{\theta_{1}}^{x_{n}} \varphi\left(x_{1}, x_{n}\right) \frac{n(n-1)\left(x_{n}-x_{1}\right)^{n-2}}{\left(\theta_{2}-\theta_{1}\right)^{n}} d x_{1}\right] d x_{n}=0,

θ1θ2[θ1xnφ(x1,xn)(x1xn)n2dx1]dxn=0\int_{\theta_{1}}^{\theta_{2}}\left[\int_{\theta_{1}}^{x_{n}} \varphi\left(x_{1}, x_{n}\right)\left(x_{1}-x_{n}\right)^{n-2} d x_{1}\right] d x_{n}=0, 两侧对 θ2\theta_{2} 求导, 有

θ1θ2φ(x1,θ2)(θ2x1)n2dx1=0,\int_{\theta_{1}}^{\theta_{2}} \varphi\left(x_{1}, \theta_{2}\right)\left(\theta_{2}-x_{1}\right)^{n-2} d x_{1}=0,

两侧再对 θ1\theta_{1} 求导有 φ(θ1,θ2)(θ2θ1)n2=0-\varphi\left(\theta_{1}, \theta_{2}\right)\left(\theta_{2}-\theta_{1}\right)^{n-2}=0, 因 θ2θ10\theta_{2}-\theta_{1} \neq 0, 故有

φ(θ1,θ2)0,0<θ1<θ2,\varphi\left(\theta_{1}, \theta_{2}\right) \equiv 0, \forall 0<\theta_{1}<\theta_{2},

这说明了 (X(1),X(n))\left(X_{(1)}, X_{(n)}\right) 是完备统计量. 由 Lehmann-Scheffe 定理可知, (2)中的修正无偏估计量 是 UMVUE.

[注]: 有的同学可能会想着分别说明 X(1)X_{(1)}X(n)X_{(n)} 完备来完成这题, 这是不行的. 这里要用二维函数说明它们完备, 因为: “任意 g1,g2g_1,g_2, 有 g1(X)=g2(Y)=0g_1(X)=g_2(Y)=0, a.s” 无法推出 “任意 gg, 有 g(X,Y)=0g(X,Y)=0, a.s”.

(4) 根据期望的线性性, 可以利用(2)中两个无偏估计来构造该题的无偏估计, 即

E(X(1)+X(n)2)=θ1+θ22,E((n+1)(X(n)X(1))n1)=θ2θ1,E\left(\frac{X_{(1)}+X_{(n)}}{2}\right)=\frac{\theta_{1}+\theta_{2}}{2}, \quad E\left(\frac{(n+1)\left(X_{(n)}-X_{(1)}\right)}{n-1}\right)=\theta_{2}-\theta_{1},

由 Lehmann-Scheffe 定理可知: (θ1+θ22,θ2θ1)\left(\frac{\theta_{1}+\theta_{2}}{2}, \theta_{2}-\theta_{1}\right) 的 UMVUE 为

(X(n)+X(1)2,n+1n1(X(n)X(1)))\left(\frac{X_{(n)}+X_{(1)}}{2}, \frac{n+1}{n-1}\left(X_{(n)}-X_{(1)}\right)\right)

五、 (20 分) 设 {Xi}\left\{X_{i}\right\} 是来自正态分布 N(μ,σ2)N\left(\mu, \sigma^{2}\right) 的简单随机样本, μ\muσ2\sigma^{2} 均未知, 若想对 μ+kσ\mu+k \sigma 进行区间估计 (这里 kk 是一个常数), 能否用

xˉ(μ+kσ)i=1n(xixˉ)2\frac{\bar{x}-(\mu+k \sigma)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}}

作为枢轴量? 请说明理由, 并求 μ+kσ\mu+k \sigma1α1-\alpha 置信水平的置信区间.

Solution:
根据正态分布的性质, 有 XˉμkσN(kσ,σ2n)\bar{X}-\mu-k \sigma \sim N\left(-k \sigma, \frac{\sigma^{2}}{n}\right), 故有

Xˉ(μ+kσ)σ2nN(kn,1),\frac{\bar{X}-(\mu+k \sigma)}{\sqrt{\frac{\sigma^{2}}{n}}} \sim N(-k \sqrt{n}, 1),

i=1n(XiXˉ)2σ2χ2(n1)\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}{\sigma^{2}} \sim \chi^{2}(n-1), 故有

T=Xˉ(μ+kσ)σ2n×σ2(n1)i=1n(XiXˉ)2=n(n1)Xˉ(μ+kσ)i=1n(XiXˉ)2T = \frac{\bar{X}-(\mu+k \sigma)}{\sqrt{\frac{\sigma^{2}}{n}}} \times \sqrt{\frac{\sigma^{2}(n-1)}{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}}=\sqrt{n(n-1)} \frac{\bar{X}-(\mu+k \sigma)}{\sqrt{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}}

的分布与未知参数无关, 是枢轴量, 可以用来构造置信区间. 而我们发现:

T=Xˉμσ/nkn1n1i=1n(XiXˉ)2σ2=N(kn,1)χ2(n1)n1t(n1,kn),T=\frac{\frac{\bar{X}-\mu}{\sigma /\sqrt{n}}-k\sqrt{n}}{\sqrt{\frac{1}{n-1}\frac{\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}}{\sigma ^2}}}=\frac{N\left( -k\sqrt{n},1 \right)}{\sqrt{\frac{\chi ^2\left( n-1 \right)}{n-1}}}\sim t\left( n-1,-k\sqrt{n} \right) ,

它是非中心 tt 分布, 自由度为 n1n-1, 非中心参数是 kn-k\sqrt{n}, 因此置信区间是

μ+kσ[Xˉsnt0.975,Xˉsnt0.025].\mu +k\sigma \in \left[ \bar{X}-\frac{s}{\sqrt{n}}t_{0.975},\bar{X}-\frac{s}{\sqrt{n}}t_{0.025} \right] .

六、 (20 分) X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n} 是来自均匀分布总体 U(0,θ)U(0, \theta) 的随机样本, 考虑如下的 假设检验问题

H0:θ12 vs H1:θ>12H_{0}: \theta \leq \frac{1}{2} \quad \text { vs } \quad H_1: \theta>\frac{1}{2}

现给出一个拒绝域为 W={x(n)>c}W=\left\{x_{(n)}>c\right\}, 其中 cc 是一个常数, 解决下述问题

(1) 求该检验的功效函数 ρW(θ)\rho_{W}(\theta);

(2) 证明 ρW(θ)\rho_{W}(\theta) 是关于 θ\theta 的不减函数.

Solution: (1) XiX_{i} 的概率密度函数是 fXi(x)={1θ0<x<θ0 其他 f_{X_{i}}(x)=\left\{\begin{array}{cc}\frac{1}{\theta} & 0<x<\theta \\ 0 & \text { 其他 }\end{array}\right., 故分布函数是

FXi(x)={0x<0xθ0x<θ1θxF_{X_{i}}(x)= \begin{cases}0 & x<0 \\ \frac{x}{\theta} & 0 \leqslant x<\theta \\ 1 & \theta \leqslant x\end{cases}

因此当 θc,ρW(θ)=0\theta \leqslant c, \rho_{W}(\theta)=0, 而当 θ>c\theta>c,

ρW(θ)=Pθ(X(n)>c)=1[FXi(c)]n=1cnθn,\rho_{W}(\theta)=P_{\theta}\left(X_{(n)}>c\right)=1-\left[F_{X_{i}}(c)\right]^{n}=1-\frac{c^{n}}{\theta^{n}},

所以功效函数是 ρW(θ)={1cnθn,θ>c,0,θc.\rho_{W}(\theta)= \begin{cases}1-\frac{c^{n}}{\theta^{n}}, & \theta>c, \\ 0, & \theta \leqslant c .\end{cases}
(2) 当 θ>c\theta>c 时, ρW(θ)=ncnθn+1>0\rho_{W}^{\prime}(\theta)=\frac{n c^{n}}{\theta^{n+1}}>0, 故 ρW(θ)\rho_{W}(\theta) 单调递增, 再考虑到当 θc\theta \leq c 时, ρW(θ)0\rho_{W}(\theta) \equiv 0, 因此 ρW(θ)\rho_{W}(\theta) 是单调不减函数.