南开大学-432统计学-2019年

一、选择题 (每题 4 分, 共 28 分)

  1. 4 对夫妇任意地排成一列, 每一位丈夫都排在他妻子后面的概率为( ).

A. 1/2;

B. 1/8;

C. 1/16;

D. 1/70.

Solution: C
用事件 AiA_{i} 表示第 ii 个丈夫排在其妻子后面, 则所求概率即 P(A1A2A3A4)P\left(A_{1} A_{2} A_{3} A_{4}\right), 利用乘法 公式知 P(A1A2A3A4)=P(A2A3A4A1)P(A1)P\left(A_{1} A_{2} A_{3} A_{4}\right)=P\left(A_{2} A_{3} A_{4} \mid A_{1}\right) P\left(A_{1}\right). 其中 P(A1)=12P\left(A_{1}\right)=\frac{1}{2}, 而 P(A2A3A4A1)P\left(A_{2} A_{3} A_{4} \mid A_{1}\right) 等同于求共有 3 对夫妇的情况下, 每一名丈夫都在其妻子后面的概率, 可再次使用乘法公式. 如此多次利用乘法公式可得

P(A1A2A3A4)=P(A4A1A2A3)P(A3A1A2)P(A2A1)P(A1)=(12)4=116\begin{aligned} P\left(A_{1} A_{2} A_{3} A_{4}\right) &=P\left(A_{4} \mid A_{1} A_{2} A_{3}\right) P\left(A_{3} \mid A_{1} A_{2}\right) P\left(A_{2} \mid A_{1}\right) P\left(A_{1}\right) \\ &=\left(\frac{1}{2}\right)^{4}=\frac{1}{16} \end{aligned}

  1. P(AB)=0P(AB) = 0, 则下列说法正确的是( ).

A. AABB 不相容;

B. AABB 相容;

C. ABAB 是不可能事件;

D. ABAB 不一定是不可能事件.

Solution: D
考虑 AB=ϕA B=\phi, 排除选项 A\mathrm{A}; 考虑 ABA B 是空集之外的零概率集, 则排除 BC\mathrm{BC} 选项.

  1. 学生在做一道有 4 个可选答案的单项选择题, 如果他不知道正确答案时就 随机猜测. 假设该学生知道正确答案的概率为 0.2. 现从卷面上看该题答 对了, 则在此情形下该学生确实知道正确答案的概率是( ).

A. 0.4;

B. 0.5;

C. 0.6;

D. 0.7.

Solution: B
用事件 AA 表示学生确实知道正确答案, 事件 BB 表示学生答对该题, 则由贝叶斯公式有

P(AB)=P(AB)P(B)=0.20.2+0.8×0.25=0.5P(A \mid B)=\frac{P(A B)}{P(B)}=\frac{0.2}{0.2+0.8 \times 0.25}=0.5

  1. X1,X2XnX_{1}, X_{2} \cdots X_{n} 为来自正态总体 N(μ,σ2)N\left(\mu, \sigma^{2}\right) 的简单随机样本, 其中 μ,σ2\mu, \sigma^{2} 均为未知, 则关于假设 H0:μ0H1:μ>0H_{0}: \mu \leq 0 \leftrightarrow H_{1}: \mu>0 的显著性检验为( ).

A. 单侧 tt 检验;

B. 单侧 μ\mu 检验;

C. 双侧tt 检验;

D. 双侧 μ\mu 检验.

Solution: A
方差末知, 备择检验是单侧, 因此采用单侧 t\mathrm{t} 检验.

  1. 设连续随机变量 XX 的密度函数是一个偶函数, F(x)F(x)XX 的分布函数,则对任意实数 a>0a>0, 下列结论不成立的是( ).

A. F(a)=1F(a)F(-a)=1-F(a);

B. P(X<a)=2F(a)1P(|X|<a)=2 F(a)-1;

C. P(X>a)=22F(a)P(|X|>a)=2-2 F(a);

D. E(aX)=E(Xa)E(a-X)=E(X-a).

Solution: D

显然不成立.

  1. X1,X2XnX_{1}, X_{2} \cdots X_{n} 为 来 自 正 态 总 体 N(0,σ2)N\left(0, \sigma^{2}\right) 的简单随机样本, 为使ci=1n1(Xi+1Xi)2c \sum_{i=1}^{n-1}\left(X_{i+1}-X_{i}\right)^{2}σ2\sigma^{2} 的无偏估计, 则c=c =( ).

A. 1n1\frac{1}{n-1};

B. 1n\frac{1}{n};

C. 12(n1)\frac{1}{2(n-1)};

D. 12n\frac{1}{2 n}.

Solution: C
由于 Xi+1XiN(0,2σ2)X_{i+1}-X_{i} \sim N\left(0,2 \sigma^{2}\right), 所以

ET=cEi=1n1(Xi+1Xi)2=c2(n1)σ2E T=c E \sum_{i=1}^{n-1}\left(X_{i+1}-X_{i}\right)^{2}=c 2(n-1) \sigma^{2}

于是 c=12(n1)c=\frac{1}{2(n-1)}.

  1. 如果 XnlcX_{n} \stackrel{l}{\longrightarrow} c 以及 YnlYY_{n} \stackrel{l}{\longrightarrow} Y, 其中cc 是一个常数, YY是一个随机变量, 那么以下说法不一定正确的是 ( ).

A. XnpcX_{n} \stackrel{p}{\longrightarrow} c;

B. YnpYY_{n} \stackrel{p}{\longrightarrow} Y;

C. Xn+Ynlc+YX_{n} + Y_{n} \stackrel{l}{\longrightarrow} c + Y;

D. XnYnlcYX_{n} Y_{n} \stackrel{l}{\longrightarrow} c Y.

Solution: B
按分布收敛弱于依概率收敛,当按分布收敛到退化分布时(此处常数可视为退化分布), 按分布收敛与依概率收敛等价, 因此B 错误.
选项 C,D 为 Slutsky 定理的推论.

二、填空题(每题4分, 共32分)

  1. 某地区居民的肝癌发病率为0.0004, 现用甲胎蛋白法进行普查.研究表明,化验结果是有错误的. 已知患有肝癌的人其化验结果99%呈阳性(有病),而没患肝癌的人其化验结果99.9%呈阴性(无病). 现某人的检查结果呈阳性,问他真的患有肝癌的概率为多少________.

Solution: 0.2840.284
用事件 AA 表示该人末患肝癌,用事件 BB 表示该人的检验呈阳性.
首先我们知道先验概率以及确诊率 P(A)=0.9996P(A)=0.9996, 根据贝叶斯公式, 有

P(AˉB)=P(AˉB)P(B)=0.99×0.00040.99×0.0004+0.9996×0.001=0.283749P(\bar{A} \mid B)=\frac{P(\bar{A} B)}{P(B)}=\frac{0.99 \times 0.0004}{0.99 \times 0.0004+0.9996 \times 0.001}=0.283749

  1. 二维随机变量 (X,Y)(X, Y) 服从区域 D={(x,y)0<x<1,0<x<y<1}D=\{(x, y) \mid 0<x<1,0<x<y<1\} 上的均匀分布,则 XXYY 的相关系数为________.

Solution: 12\frac{1}{2}
(X,Y)(X, Y) 的联合密度函数是 f(x,y)=2I{0<x<y<1}f(x, y)=2 I_{\{0<x<y<1\}}, 于是

EX=01dy0y2xdx=01y2dy=13,EX2=01dy0y2x2dx=2301y3dy=16EY=01dy0y2ydx=201y2dy=23,EY2=01dy0y2y2dx=201y3dy=12\begin{aligned} &E X=\int_{0}^{1} d y \int_{0}^{y} 2 x d x=\int_{0}^{1} y^{2} d y=\frac{1}{3}, E X^{2}=\int_{0}^{1} d y \int_{0}^{y} 2 x^{2} d x=\frac{2}{3} \int_{0}^{1} y^{3} d y=\frac{1}{6} \\ &E Y=\int_{0}^{1} d y \int_{0}^{y} 2 y d x=2 \int_{0}^{1} y^{2} d y=\frac{2}{3}, E Y^{2}=\int_{0}^{1} d y \int_{0}^{y} 2 y^{2} d x=2 \int_{0}^{1} y^{3} d y=\frac{1}{2} \end{aligned}

DX=16(13)2=118,DY=12(23)2=118D X=\frac{1}{6}-\left(\frac{1}{3}\right)^{2}=\frac{1}{18}, D Y=\frac{1}{2}-\left(\frac{2}{3}\right)^{2}=\frac{1}{18}.

EXY=01dy0y2xydx=01y3dy=14, 则 Cov(X,Y)=141323=136E X Y=\int_{0}^{1} d y \int_{0}^{y} 2 x y d x=\int_{0}^{1} y^{3} d y=\frac{1}{4} \text {, 则 } \operatorname{Cov}(X, Y)=\frac{1}{4}-\frac{1}{3} \cdot \frac{2}{3}=\frac{1}{36} \text {. }

所以 Corr(X,Y)=136/118=12\operatorname{Corr}(X, Y)=\frac{1}{36} / \frac{1}{18}=\frac{1}{2}.

  1. 设二维连续随机变量 ( X,YX, Y ) 的联合密度函数为

f(x,y)={214x2y,x2<y<1;0, 其他 .f(x, y)=\left\{\begin{array}{c} \frac{21}{4} x^{2} y, x^{2} < y < 1; \\ 0, \quad \text { 其他 }. \end{array}\right.

P(Y>0.75X=0.5)={P}(Y > 0.75 \mid X=0.5)=________.

Solution: 715\frac{7}{15}
XX 的边际密度函数是 fX(x)=x21f(x,y)dy=218x2(1x4),1<x<1f_{X}(x)=\int_{x^{2}}^{1} f(x, y) d y=\frac{21}{8} x^{2}\left(1-x^{4}\right),-1<x<1.
YY 关于 XX 的条件密度函数是 fYX(yx)=f(x,y)fX(x)=2y1x4,x2<y<1f_{Y \mid X}(y \mid x)=\frac{f(x, y)}{f_{X}(x)}=\frac{2 y}{1-x^{4}}, x^{2}<y<1.
因此 P(Y>0.75X=0.5)=0.7512y1(12)4dy=7/1615/16=715P(Y>0.75 \mid X=0.5)=\int_{0.75}^{1} \frac{2 y}{1-\left(\frac{1}{2}\right)^{4}} d y=\frac{7 / 16}{15 / 16}=\frac{7}{15}.

  1. 一份考卷由99 道题目组成, 并按由易到难的顺序排列. 某学生答对第一题的概率为0.99, 答对第二题的概率为0.98, 一般地, 他答对第ii道题的概率为1i100,(i=1,2,)1 - \frac{i}{100} , (i=1,2,\cdots).假如该学生回答各道题目是相互独立的, 并且要回答对60题及以上才算通过考试, 则该同学通过考试的概率为________.

Solution: 0.0050.005
Xi={1, 若学牛答对第 i 题, 0, 若学牛答错第 i 题. X_{i}= \begin{cases}1, & \text { 若学牛答对第 } i \text { 题, } \\ 0, & \text { 若学牛答错第 } i \text { 题. }\end{cases}
于是 XiX_{i} 相互独立, 且服从不同的二点分布:

P(Xi=1)=pi=1i100,P(Xi=0)=1pi=i100,i=1,2,,99P\left(X_{i}=1\right)=p_{i}=1-\frac{i}{100}, P\left(X_{i}=0\right)=1-p_{i}=\frac{i}{100}, i=1,2, \cdots, 99

而我们要求的是 P(i=199Xi60)P\left(\sum_{i=1}^{99} X_{i} \geqslant 60\right), 考虑使用中心极限定理.
为使用中心极限定理, 我们可以设想从 X100X_{100} 开始的随机变量都与 X99X_{99} 同分布, 且相互.
独立. 由于

Bn=i=1nVar(Xi)=i=1npi(1pi)+E(Xipi3)(1pi)3pi+pi3(1pi)pi(1pi)1Bn3i=1nE(Xipi3)1(i=1np(1pi))1/20\begin{aligned} &B_{n}=\sqrt{\sum_{i=1}^{n} \operatorname{Var}\left(X_{i}\right)}=\sqrt{\sum_{i=1}^{n} p_{i}\left(1-p_{i}\right)} \rightarrow+\infty \\ &E\left(\left|X_{i}-p_{i}\right|^{3}\right)\left(1-p_{i}\right)^{3} p_{i}+p_{i}^{3}\left(1-p_{i}\right) \leqslant p_{i}\left(1-p_{i}\right) \\ &\frac{1}{B_{n}^{3}} \sum_{i=1}^{n} E\left(\left|X_{i}-p_{i}\right|^{3}\right) \leqslant \frac{1}{\left(\sum_{i=1}^{n} p\left(1-p_{i}\right)\right)^{1 / 2}} \rightarrow 0 \end{aligned}

于是随机序列 {Xn}\left\{X_{n}\right\} 满足李雅普诺夫条件, 所以可以使用中心极限定理. 又

E(i=199Xi)=i=199pi=i=199(1i100)=49.5B992=i=199Var(Xi)=i=199(1i100)(i100)=16.665\begin{aligned} &E\left(\sum_{i=1}^{99} X_{i}\right)=\sum_{i=1}^{99} p_{i}=\sum_{i=1}^{99}\left(1-\frac{i}{100}\right)=49.5 \\ &B_{99}^{2}=\sum_{i=1}^{99} \operatorname{Var}\left(X_{i}\right)=\sum_{i=1}^{99}\left(1-\frac{i}{100}\right)\left(\frac{i}{100}\right)=16.665 \end{aligned}

所以该学生通过考试的可能性为

P(i=199Xi60)=P(i=199Xi49.516.6656049.516.665)1Φ(2.5735)=0.005\begin{aligned} P\left(\sum_{i=1}^{99} X_{i} \geqslant 60\right) &=P\left(\frac{\sum_{i=1}^{99} X_{i}-49.5}{\sqrt{16.665}} \geqslant \frac{60-49.5}{\sqrt{16.665}}\right) \\ & \approx 1-\Phi(2.5735)=0.005 \end{aligned}

注: 若记得这是茆书例题, 再结合该题是填空题的事实, 则无需验证李雅普诺夫条件直 接使用中心极限定理即可.

  1. 设总体服从韦布尔分布 Weibull(m,η)Weibull(m, \eta),其密度函数为

f(x;m,η)=mxm1ηmexp{(xη)m},x>0,m>0,η>0f(x ; m, \eta)=\frac{m x^{m-1}}{\eta^{m}} \exp \left\{-\left(\frac{x}{\eta}\right)^{m}\right\}, x>0, m>0, \eta>0

x(1)x_{(1)} 服从________.

Solution: X(1)Wei(m,ηn1m)X_{(1)} \sim W e i\left(m, \eta n^{-\frac{1}{m}}\right)
总体的分布函数是 F(x)=1exp{(xη)m}F(x)=1-\exp \left\{-\left(\frac{x}{\eta}\right)^{m}\right\}, 由最小值分布公式知

fX(1)(x)=n(1F(x))n1f(x)=mxm1(ηn1m)mexp{(xηn1m)m},x>0f_{X_{(1)}}(x)=n(1-F(x))^{n-1} f(x)=\frac{m x^{m-1}}{\left(\eta n^{-\frac{1}{m}}\right)^{m}} \exp \left\{-\left(\frac{x}{\eta n^{-\frac{1}{m}}}\right)^{m}\right\}, x>0

对比发现, 它就是 Wei(m,ηn1m)W e i\left(m, \eta n^{-\frac{1}{m}}\right) 的密度函数.

  1. limn(1+n+n22!++nnn!)en=\lim _{n \rightarrow \infty }\left(1+n+\frac{n^{2}}{2 !}+\cdots+\frac{n^{n}}{n !}\right) e^{-n} =________.

Solution: 12\frac{1}{2}
取独立同分布皆服从 P(1)\mathcal{P}(1) 的随机变量序列 {Xi}\left\{X_{i}\right\}, 则根据中心极限定理

P(i=1nXin)=P(i=1nXinn0)Φ(0)=12P\left(\sum_{i=1}^{n} X_{i} \leqslant n\right)=P\left(\frac{\sum_{i=1}^{n} X_{i}-n}{\sqrt{n}} \leqslant 0\right) \rightarrow \Phi(0)=\frac{1}{2}

另一方面, 由泊松分布的可加性, i=1nXiP(n)\sum_{i=1}^{n} X_{i} \sim \mathcal{P}(n), 所以

P(i=1nXin)=j=0nnjj!en=(1+n+n22!++nnn!)enP\left(\sum_{i=1}^{n} X_{i} \leqslant n\right)=\sum_{j=0}^{n} \frac{n^{j}}{j !} e^{-n}=\left(1+n+\frac{n^{2}}{2 !}+\cdots+\frac{n^{n}}{n !}\right) e^{-n}

综上所述, 该极限收敛到 12\frac{1}{2}.

  1. 设总体 XU(0,θ)X \sim U(0, \theta),现从该总体中抽取容量为 10 的样本,样本值为:

0.51.30.61.72.21.20.81.52.01.6\begin{array}{llllllllll} 0.5 & 1.3 & 0.6 & 1.7 & 2.2 & 1.2 & 0.8 & 1.5 & 2.0 & 1.6 \end{array}

则参数 θ\theta 的矩估计是________.

Solution: 2.682.68
EX=θ2E X=\frac{\theta}{2}, 所以 θ\theta 的矩估计是 2Xˉ=21.34=2.682 \bar{X}=2 \cdot 1.34=2.68.

  1. 设一组来自正态总体 N(μ,4)N(\mu, 4) 的简单随机样本 , 样本值为

121199.588.510.511.59.810.2\begin{array}{llllllllll} 12 & 11 & 9 & 9.5 & 8 & 8.5 & 10.5 & 11.5 & 9.8 & 10.2 \end{array}

则关于 μ\mu 的置信水平为 90%90 \% 的置信区间为________.

Solution: [8.96,11.04][8.96,11.04]
μ\mu90%90 \% 置信区间是

Xˉ±σnu1α2=Xˉ±2101.645=[8.96,11.04]\bar{X} \pm \frac{\sigma}{\sqrt{n}} u_{1-\frac{\alpha}{2}}=\bar{X} \pm \frac{2}{\sqrt{10}} \cdot 1.645=[8.96,11.04]

三、解答题(90分)

1.(10分)设随机变量 U1{U}_{1}U2{U}_{2} 相互独立, 且都服从 (0,1)(0,1) 上的均匀分布. Z1=2lnU1,Z2=2πU2{Z}_{1}=-2 \ln U_1, Z_2 = 2\pi U_2. 试证明:

(1) Z1Exp(12),Z2U(0,2π)Z_1 \sim Exp(\frac{1}{2}), Z_2 \sim U(0,2\pi);

(2) X=Z1cosZ2X=\sqrt{Z_{1}} \cos Z_{2}Y=Z1sinZ2Y=\sqrt{Z_{1}} \sin Z_{2} 是相互独立的标准正态分布随机变量.

Solution:
(1)
{Z1=2lnU1Z2=2πU2\left\{\begin{array}{l}Z_{1}=-2 \ln U_{1} \\ Z_{2}=2 \pi U_{2}\end{array}\right., 反解得到 {U1=e12Z1U2=Z22π\left\{\begin{array}{l}U_{1}=e^{-\frac{1}{2} Z_{1}} \\ U_{2}=\frac{Z_{2}}{2 \pi}\end{array}\right.. 所以 Z1Z_{1} 的密度函数是

fZ1(z1)=fU1(e12z1)de12z1dz1=12e12z1I{z1>0}f_{Z_{1}}\left(z_{1}\right)=f_{U_{1}}\left(e^{-\frac{1}{2} z_{1}}\right)\left|\frac{d e^{-\frac{1}{2} z_{1}}}{d z_{1}}\right|=\frac{1}{2} e^{-\frac{1}{2} z_{1}} I_{\left\{z_{1}>0\right\}}

所以 Z1Z_{1} 服从参数为 12\frac{1}{2} 的指数分布, 即自由度为 2 的卡方分布. Z2Z_{2} 的密度函数是

fZ2(z2)=fU2(z22π)12π=12πI{0<z2<2π}f_{Z_{2}}\left(z_{2}\right)=f_{U_{2}}\left(\frac{z_{2}}{2 \pi}\right)\left|\frac{1}{2 \pi}\right|=\frac{1}{2 \pi} I_{\left\{0<z_{2}<2 \pi\right\}}

所以 Z2U(0,2π)Z_{2} \sim U(0,2 \pi).
(2)
{Z1=X2+Y2Z2=arctan(YX),\left\{\begin{array}{l}Z_{1}=X^{2}+Y^{2} \\ Z_{2}=\arctan \left(\frac{Y}{X}\right),\end{array}\right. 但需要注意此时的变换并非是一一对应的关系, 一对 (Z1,Z2)\left(Z_{1}, Z_{2}\right) 对应着 (X,Y)(X, Y)(X,Y)(-X,-Y), 两种情况的雅各比行列式均为

J=2x2yyx21+(yx)21x1+(yx)2=2+2(yx)21+(yx)2=2J=\left|\begin{array}{cc} 2 x & 2 y \\ \frac{-\frac{y}{x^{2}}}{1+\left(\frac{y}{x}\right)^{2}} & \frac{\frac{1}{x}}{1+\left(\frac{y}{x}\right)^{2}} \end{array}\right|=\frac{2+2\left(\frac{y}{x}\right)^{2}}{1+\left(\frac{y}{x}\right)^{2}}=2

所以 (X,Y)(X, Y) 的联合密度函数是

fX,Y(x,y)=fZ1,Z2(x2+y2,arctan(yx))2I{x>0}+fZ1,Z2(x2+y2,arctan(yx))2I{x<0}=12ex2+y2212π2I{x>0}+12ex2+y2212π2I{x<0}=12πex2+y22,<x,y<+\begin{aligned} f_{X, Y}(x, y) &=f_{Z_{1}, Z_{2}}\left(x^{2}+y^{2}, \arctan \left(\frac{y}{x}\right)\right) 2 I_{\{x>0\}}+f_{Z_{1}, Z_{2}}\left(x^{2}+y^{2}, \arctan \left(\frac{y}{x}\right)\right) 2 I_{\{x<0\}} \\ &=\frac{1}{2} e^{-\frac{x^{2}+y^{2}}{2}} \frac{1}{2 \pi} \cdot 2 I_{\{x>0\}}+\frac{1}{2} e^{-\frac{x^{2}+y^{2}}{2}} \frac{1}{2 \pi} \cdot 2 I_{\{x<0\}} \\ &=\frac{1}{2 \pi} e^{-\frac{x^{2}+y^{2}}{2}},-\infty<x, y<+\infty \end{aligned}

最后一步补充了在 x=0x=0 处的定义. 可以看出 (X,Y)N(0,0;1,1;0)(X, Y) \sim N(0,0 ; 1,1 ; 0).

2.(15分)设 x1,,xnx_{1}, \cdots, x_{n} 是来自正态总体 N(μ,σ2)N\left(\mu, \sigma^{2}\right) 的样本,其样本均值和样本方差分别为

xˉ=1ni=1nxi, 和 s2=1n1i=1n(xixˉ)2,\bar{x}=\frac{1}{n} \sum_{i=1}^{n} x_i, \text { 和 } s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2},

试证明:

(1) xˉ\bar{x}s2s^{2} 相互独立;

(2) xˉN(μ,σ2/n)\bar{x} \sim N\left(\mu, \sigma^{2} / n\right);

(3) (n1)s2σ2χ2(n1)\frac{(n-1) s^{2}}{\sigma^{2}} \sim \chi^{2}(n-1).

Solution: 构造正交矩阵

A=(1n1n1n1n1211210013213223201n(n1)1n(n1)1n(n1)n1n(n1))\boldsymbol{A}=\left(\begin{array}{ccccc} \frac{1}{\sqrt{n}} & \frac{1}{\sqrt{n}} & \frac{1}{\sqrt{n}} & \cdots & \frac{1}{\sqrt{n}} \\ \frac{1}{\sqrt{2 \cdot 1}} & -\frac{1}{\sqrt{2 \cdot 1}} & 0 & \cdots & 0 \\ \frac{1}{\sqrt{3 \cdot 2}} & \frac{1}{\sqrt{3 \cdot 2}} & -\frac{2}{\sqrt{3 \cdot 2}} & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ \frac{1}{\sqrt{n(n-1)}} & \frac{1}{\sqrt{n(n-1)}} & \frac{1}{\sqrt{n(n-1)}} & \cdots & -\frac{n-1}{\sqrt{n(n-1)}} \end{array}\right)

记随机向量 X=(X1,X2,,Xn)T\boldsymbol{X}=\left(X_{1}, X_{2}, \cdots, X_{n}\right)^{T}, 则 X\boldsymbol{X} 服从 nn 维正态分布, 令 Y=AX\boldsymbol{Y}=A \boldsymbol{X}, 则由正 态分布性质知, Y\boldsymbol{Y} 也服从 nn 维正态分布,其均值向量为

EY=AEX=A(μμμ)=(nμ00)E \boldsymbol{Y}=A E \boldsymbol{X}=A\left(\begin{array}{c} \mu \\ \mu \\ \vdots \\ \mu \end{array}\right)=\left(\begin{array}{c} \sqrt{n} \mu \\ 0 \\ \vdots \\ 0 \end{array}\right)

协方差矩阵为 AT(σ2In)A=σ2InA^{T}\left(\sigma^{2} I_{n}\right) A=\sigma^{2} I_{n}. 同时注意到

Y1=1n(X1+X2++Xn)=nXˉi=1nXi2=i=1nYi2\begin{gathered} Y_{1}=\frac{1}{\sqrt{n}}\left(X_{1}+X_{2}+\cdots+X_{n}\right)=\sqrt{n} \bar{X} \\ \sum_{i=1}^{n} X_{i}{ }^{2}=\sum_{i=1}^{n} Y_{i}{ }^{2} \end{gathered}

其中第二点是由正交矩阵的性质得到的.
利用上述第一点可以得到 XˉY1nN(μ,σ2n)\bar{X} \sim \frac{Y_{1}}{\sqrt{n}} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right). 同时利用上述两点可以得到 (n1)S2=i=1nXi2nXˉ2=i=1nYi2Y12=Y22+Y32+Y42++Yn2(n-1) S^{2}=\sum_{i=1}^{n} X_{i}{ }^{2}-n \bar{X}^{2}=\sum_{i=1}^{n} Y_{i}{ }^{2}-Y_{1}^{2}=Y_{2}^{2}+Y_{3}{ }^{2}+Y_{4}{ }^{2}+\cdots+Y_{n}{ }^{2}
且对于 i=2,,ni=2, \cdots, n, 有 YiY_{i} i.i. dN(0,σ2)\mathrm{d} \sim N\left(0, \sigma^{2}\right), 所以 (n1)S2σ2χ2(n1)\frac{(n-1) S^{2}}{\sigma^{2}} \sim \chi^{2}(n-1). 并且 注意到 S2S^{2} 仅仅依赖于 Y2,Y3,,YnY_{2}, Y_{3}, \cdots, Y_{n}, 而 Xˉ\bar{X} 仅仅依赖于 Y1Y_{1}. 由正态分布独立与不相关等价的 性质知道, Y1Y_{1}Y2,Y3,,YnY_{2}, Y_{3}, \cdots, Y_{n} 是独立的, 所以 Xˉ\bar{X}S2S^{2} 也是相互独立的.

3.(10分)设总体 XU(θ12,θ+12),X1,X2XnX \sim {U}(\theta- \frac{1}{2}, \theta+ \frac{1}{2}), {X}_{1}, {X}_{2} \cdots {X}_{n} 为来自该总体的简单随机样本,证明 12(x(1)+x(n))\frac{1}{2}\left(x_{(1)}+x_{(n)}\right)θ\theta 的无偏估计.

Solution:
作总体变换, 令 Yi=Xiθ+12Y_{i}=X_{i}-\theta+\frac{1}{2} i.i.d U(0,1)\sim U(0,1), 则有

Y(1)=X(1)(θ12)Be(1,n),Y(n)=X(n)(θ12)Be(n,1)Y_{(1)}=X_{(1)}-\left(\theta-\frac{1}{2}\right) \sim B e(1, n), Y_{(n)}=X_{(n)}-\left(\theta-\frac{1}{2}\right) \sim B e(n, 1)

所以

E(X(1)+X(n)2)=θ12+E(Y(1)+Y(n))2=θ12+12(1n+1+nn+1)=θE\left(\frac{X_{(1)}+X_{(n)}}{2}\right)=\theta-\frac{1}{2}+\frac{E\left(Y_{(1)}+Y_{(n)}\right)}{2}=\theta-\frac{1}{2}+\frac{1}{2}\left(\frac{1}{n+1}+\frac{n}{n+1}\right)=\theta

X(1)+X(n)2\frac{X_{(1)}+X_{(n)}}{2}θ\theta 的无偏估计.

4.(10分)某电工器材厂生产一种保险丝, 测量其熔化时间, 依通常情况方差为 400, 今从某天产品中抽取容量为 25 的样本, 测量其熔化时间并计算 Xˉ=62.24\bar{X}=62.24,s2=404.77{s}^{2}=404.77, 问这天保险丝熔化时间的方差与通常有无显著性差异(取 α=0.05\alpha=0.05, 假定熔化时间服从正态分布).

Solution: 考虑假设检验问题 H0:σ2=400H_{0}: \sigma^{2}=400 vs H1:σ2400H_{1}: \sigma^{2} \neq 400, 检验统计量是

χ2=(n1)S2σ02=24404.77400=24.2862\chi^{2}=\frac{(n-1) S^{2}}{\sigma_{0}^{2}}=\frac{24 \cdot 404.77}{400}=24.2862

检验的拒绝域是

W={χ2χα22(n1)}{χ2χ1α22(n1)}={χ2χ0.0252(24)}{χ2χ0.9752(24)}={χ212.4012}{χ239.3641}\begin{aligned} W &=\left\{\chi^{2} \leqslant \chi_{\frac{\alpha}{2}}^{2}(n-1)\right\} \cup\left\{\chi^{2} \geqslant \chi_{1-\frac{\alpha}{2}}^{2}(n-1)\right\} \\ &=\left\{\chi^{2} \leqslant \chi_{0.025}^{2}(24)\right\} \cup\left\{\chi^{2} \geqslant \chi_{0.975}^{2}(24)\right\} \\ &=\left\{\chi^{2} \leqslant 12.4012\right\} \cup\left\{\chi^{2} \geqslant 39.3641\right\} \end{aligned}

由此 χ2W\chi^{2} \notin W, 在显著性水平 α=0.05\alpha=0.05 下不能拒绝原假设, 可以认为当天保险丝熔化 时间的方差与通常无差异.

5.(10分) 设总体 XX 的分布函数 F(x)F(x) 是连续的, x(1),,x(n)x_{(1)}, \cdots, x_{(n)} 为取自此总体的次序统计量, 设 ηi=F(x(i))\eta_{i}=F\left(x_{(i)}\right), 试证:

(1) η1η2ηn\eta _1 \le \eta _2 \le \cdots \le \eta _n, 且它们是来自于总体 U(0,1)U\left(0,1\right)的次序统计量;

(2) E(ηi)=in+1,Var(ηi)=i(n+1i)(n+1)2(n+2),1inE\left(\eta_{i}\right)=\frac{i}{n+1}, {Var}\left(\eta_{i}\right)=\frac{i(n+1-i)}{(n+1)^{2}(n+2)}, 1 \leqslant i \leqslant n.

Solution:
(1)
作总体变换 Y=F(X)U(0,1)Y=F(X) \sim U(0,1), 则 η1,η2,,ηn\eta_{1}, \eta_{2}, \cdots, \eta_{n} 是总体 YY 的次序统计量. 即 U(0,1)U(0,1) 的次序统计量.
(2)
根据前一问的结论知, η1,η2,,ηn\eta_{1}, \eta_{2}, \cdots, \eta_{n}U(0,1)U(0,1) 的次序统计量, 则

ηiBeta(i,ni+1)\eta_{i} \sim \operatorname{Beta}(i, n-i+1)

所以 Eηi=in+1,Dηi=i(ni+1)(n+1)2(n+2)E \eta_{i}=\frac{i}{n+1}, D \eta_{i}=\frac{i(n-i+1)}{(n+1)^{2}(n+2)}.

6.(15分) 设有随机变量 X,YX,Y, 且 X,YX,Y的方差均存在. 试证明:

(1) 相关系数 Corr(X,Y)Corr(X,Y)存在;

(2) 1Corr(X,Y)1-1 \leqslant {Corr}(X, Y) \leqslant 1;

(3) Corr(X,Y)=±1{Corr}({X}, {Y})=\pm 1 的充要条件为 X{X}Y{Y} 之间几乎处处有线性关系, 即存在a(a0)a(a \neq 0)bb 使得 P(Y=aX+b)=1,{P}(Y=a X+b)=1, 其中当 Corr(X,Y)=1{Corr}(X, Y)=1 时有 a>0a>0,当 Corr(X,Y)=1{Corr}(X, Y)=-1 时有 a<0a<0.

Solution:
首先证明协方差不等式成立, 记 g(t)=E[t(XEX)+(YEY)]2g(t)=E[t(X-E X)+(Y-E Y)]^{2}, 它始终是 非负的,则

g(t)=Var(X)t2+2Cov(X,Y)t+Var(Y)0g(t)=\operatorname{Var}(X) t^{2}+2 \operatorname{Cov}(X, Y) t+\operatorname{Var}(Y) \geqslant 0

是一定成立的, 即判别式非正

Δ2=4[Cov(X,Y)]24Var(X)Var(Y)0\Delta^{2}=4[\operatorname{Cov}(X, Y)]^{2}-4 \operatorname{Var}(X) \operatorname{Var}(Y) \leqslant 0

移项得到 [Cov(X,Y)]2Var(X)Var(Y)[\operatorname{Cov}(X, Y)]^{2} \leqslant \operatorname{Var}(X) \operatorname{Var}(Y).
(1)
根据协方差不等式, 即 [Cov(X,Y)]2Var(X)Var(Y)[\operatorname{Cov}(X, Y)]^{2} \leqslant \operatorname{Var}(X) \operatorname{Var}(Y), 知随机变量 XXYY 的协 方差一定存在, 同时它们的方差也存在, 所以它们的相关系数也一定存在.
(2)
对协方差不等式进行变形, 有

[Cov(X,Y)]2Var(X)Var(Y)[Cov(X,Y)]2Var(X)Var(Y)1[Corr(X,Y)]211Corr(X,Y)1\begin{aligned} &{[\operatorname{Cov}(X, Y)]^{2} \leqslant \operatorname{Var}(X) \operatorname{Var}(Y)} \\ &\frac{[\operatorname{Cov}(X, Y)]^{2}}{\operatorname{Var}(X) \operatorname{Var}(Y)} \leqslant 1 \\ &{[\operatorname{Corr}(X, Y)]^{2} \leqslant 1 \Rightarrow-1 \leqslant \operatorname{Corr}(X, Y) \leqslant 1} \end{aligned}

(3)
[充分性] 由于 P(Y=aX+b)=1(a0)P(Y=a X+b)=1(a \neq 0), 则

Var(Y)=a2Var(X),Cov(X,Y)=aCov(X,X)=aVar(X)\operatorname{Var}(Y)=a^{2} \operatorname{Var}(X), \operatorname{Cov}(X, Y)=a \operatorname{Cov}(X, X)=\operatorname{aVar}(X)

就有 Corr(X,Y)=aVar(X)aVar(X)={1,a>01,a<0\operatorname{Corr}(X, Y)=\frac{a \operatorname{Var}(X)}{|a| \operatorname{Var}(X)}=\left\{\begin{array}{ll}1, & a>0 \\ -1, & a<0\end{array}\right..

[必要性] 记 Var(X)=σX2,Var(Y)=σY2\operatorname{Var}(X)=\sigma_{X}^{2}, \operatorname{Var}(Y)=\sigma_{Y}^{2}, 则

Var(XσX±YσY)=2[1±Corr(X,Y)]\operatorname{Var}\left(\frac{X}{\sigma_{X}} \pm \frac{Y}{\sigma_{Y}}\right)=2[1 \pm \operatorname{Corr}(X, Y)]

所以当 Corr(X,Y)=1\operatorname{Corr}(X, Y)=1 时, Var(XσXYσY)=0\operatorname{Var}\left(\frac{X}{\sigma_{X}}-\frac{Y}{\sigma_{Y}}\right)=0, 所以

P(XσXYσY=c)=1P(Y=σYXσXσYc)=1P\left(\frac{X}{\sigma_{X}}-\frac{Y}{\sigma_{Y}}=c\right)=1 \Rightarrow P\left(Y=\frac{\sigma_{Y} X}{\sigma_{X}}-\sigma_{Y} c\right)=1

Corr(X,Y)=1\operatorname{Corr}(X, Y)=-1 时, Var(XσX+YσY)=0\operatorname{Var}\left(\frac{X}{\sigma_{X}}+\frac{Y}{\sigma_{Y}}\right)=0, 所以

P(XσX+YσY=c)=1P(Y=σYXσX+σYc)=1P\left(\frac{X}{\sigma_{X}}+\frac{Y}{\sigma_{Y}}=c\right)=1 \Rightarrow P\left(Y=-\frac{\sigma_{Y} X}{\sigma_{X}}+\sigma_{Y} c\right)=1

7.(10分) 设 x1,,xnx_{1}, \cdots, x_{n} i. i. d. N(μ,1)\sim N(\mu, 1), 求 μ2\mu^{2} 的 UMVUE. 证明此 UMVUE 达不到 CRC-R 下界,即它不是有效估计.

Solution: 样本的联合分布是

f(X,μ)=(2π)n2exp{12i=1n(xiμ)2}=(2π)n2exp{12[i=1nxi22μi=1nxi+nμ2]}\begin{aligned} f(\boldsymbol{X}, \mu) &=(2 \pi)^{-\frac{n}{2}} \exp \left\{-\frac{1}{2} \sum_{i=1}^{n}\left(x_{i}-\mu\right)^{2}\right\} \\ &=(2 \pi)^{-\frac{n}{2}} \exp \left\{-\frac{1}{2}\left[\sum_{i=1}^{n} x_{i}^{2}-2 \mu \sum_{i=1}^{n} x_{i}+n \mu^{2}\right]\right\} \end{aligned}

由因子分解定理可知, T=i=1nXiT=\sum_{i=1}^{n} X_{i}μ\mu 的充分统计量.而由正态分布的可加性知 TN(nμ,n)T \sim N(n \mu, n), 又正态分布是完全族分布, 所以 T=i=1nXiT=\sum_{i=1}^{n} X_{i}μ\mu 的充分完全统计量. 那 么 Xˉ=1nTN(μ,1n)\bar{X}=\frac{1}{n} T \sim N\left(\mu, \frac{1}{n}\right) 也是 μ\mu 的充分完全统计量.
注意到 E(Xˉ21n)=(μ2+1n)1n=μ2E\left(\bar{X}^{2}-\frac{1}{n}\right)=\left(\mu^{2}+\frac{1}{n}\right)-\frac{1}{n}=\mu^{2}, 所以 Xˉ21n\bar{X}^{2}-\frac{1}{n} 是基于充分完全统计 量而构造的 μ2\mu^{2} 的无偏估计, 根据 L-S 定理知它是 μ2\mu^{2} 的 UMVUE.

下面先求 μ\mu 的 Fisher 信息量, lnf(x,μ)=12ln(2π)12(xμ)2\ln f(x, \mu)=-\frac{1}{2} \ln (2 \pi)-\frac{1}{2}(x-\mu)^{2}, 则

I(μ)=E(lnf(X,μ)μ)2=E(μX)2=Var(X)=1I(\mu)=E\left(\frac{\partial \ln f(X, \mu)}{\partial \mu}\right)^{2}=E(\mu-X)^{2}=\operatorname{Var}(X)=1

所以 μ2\mu^{2} 的无偏估计的 C-R 下界是 (dμ2μ)2nI(μ)=4μ2n\frac{\left(\frac{d \mu^{2}}{\mu}\right)^{2}}{n I(\mu)}=\frac{4 \mu^{2}}{n}.
再计算 Xˉ21n\bar{X}^{2}-\frac{1}{n} 的方差, 即 Xˉ2\bar{X}^{2} 的方差, 首先有 EXˉ2=μ2+1nE \bar{X}^{2}=\mu^{2}+\frac{1}{n}, 下面计算 EXˉ4E \bar{X}^{4}, 由 于 XˉN(μ,1n)\bar{X} \sim N\left(\mu, \frac{1}{n}\right), 尝试利用 Stein 引理

EXˉ4=EXˉ3(Xˉμ+μ)=EXˉ3(Xˉμ)+μEXˉ3\begin{aligned} E \bar{X}^{4} &=E \bar{X}^{3}(\bar{X}-\mu+\mu) \\ &=E \bar{X}^{3}(\bar{X}-\mu)+\mu E \bar{X}^{3} \end{aligned}

其中根据 Stein 引理, EXˉ3(Xˉμ)=Var(Xˉ)E(3Xˉ2)=3n(μ2+1n)E \bar{X}^{3}(\bar{X}-\mu)=\operatorname{Var}(\bar{X}) E\left(3 \bar{X}^{2}\right)=\frac{3}{n}\left(\mu^{2}+\frac{1}{n}\right), 而对于 EXˉ3E \bar{X}^{3}, 再次作拆分

EXˉ3=EXˉ2(Xˉμ+μ)=EXˉ2(Xˉμ)+μEXˉ2\begin{aligned} E \bar{X}^{3} &=E \bar{X}^{2}(\bar{X}-\mu+\mu) \\ &=E \bar{X}^{2}(\bar{X}-\mu)+\mu E \bar{X}^{2} \end{aligned}

其中再根据 Stein 引理, EXˉ2(Xˉμ)=Var(X)E(2Xˉ)=2nμE \bar{X}^{2}(\bar{X}-\mu)=\operatorname{Var}(X) E(2 \bar{X})=\frac{2}{n} \mu, 所以

EXˉ3=2nμ+μ(μ2+1n)=μ3+3nμE \bar{X}^{3}=\frac{2}{n} \mu+\mu\left(\mu^{2}+\frac{1}{n}\right)=\mu^{3}+\frac{3}{n} \mu

全部代回 EXˉ4E \bar{X}^{4} 的式子, 有

EXˉ4=3n(μ2+1n)+μ(μ3+3nμ)=μ4+6nμ2+3n2\begin{aligned} E \bar{X}^{4} &=\frac{3}{n}\left(\mu^{2}+\frac{1}{n}\right)+\mu\left(\mu^{3}+\frac{3}{n} \mu\right) \\ &=\mu^{4}+\frac{6}{n} \mu^{2}+\frac{3}{n^{2}} \end{aligned}

所以

Var(Xˉ2)=μ4+6nμ2+3n2(μ2+1n)2=4μ2n+2n2>4μ2n\begin{aligned} \operatorname{Var}\left(\bar{X}^{2}\right) &=\mu^{4}+\frac{6}{n} \mu^{2}+\frac{3}{n^{2}}-\left(\mu^{2}+\frac{1}{n}\right)^2 \\ &=\frac{4 \mu^{2}}{n}+\frac{2}{n^{2}}>\frac{4 \mu^{2}}{n} \end{aligned}

所以 Xˉ21n\bar{X}^{2}-\frac{1}{n} 不是 μ2\mu^{2} 的有效估计.

注: 不使用Stein引理, 直接计算积分也可, 计算量也较大.

8.(10分) 设 X1,X2XnX_{1}, X_{2} \cdots X_{n} 为来自两点分布 b(1,p){b}(1, {p}) 的简单随机样本,其中 p(0,1)p \in(0,1), 记 n1,n2n_{1}, n_{2}为上述 n{n} 个样本中取值分别为1和0的个数 , 如 记q=1p,χ2=(n1np)2np+(n2nq)2nq{q}=1-{p}, \chi^{2}=\frac{\left(n_{1}-n p\right)^{2}}{n p}+\frac{\left(n_{2}-n q\right)^{2}}{n q}, 证明 χ2lχ2(1)\chi^{2} \stackrel{l}{\longrightarrow} \chi^{2}(1).

Solution: 由于 n2=nn1n_{2}=n-n_{1}, 所以

χ2=(1p)(n1np)2+p(n2nq)2np(1p)=(1p)(n1np)2+p(npn1)2np(1p)=(n1np)2np(1p)\begin{aligned} \chi^{2} &=\frac{(1-p)\left(n_{1}-n p\right)^{2}+p\left(n_{2}-n q\right)^{2}}{n p(1-p)} \\ &=\frac{(1-p)\left(n_{1}-n p\right)^{2}+p\left(n p-n_{1}\right)^{2}}{n p(1-p)}=\frac{\left(n_{1}-n p\right)^{2}}{n p(1-p)} \end{aligned}

n1=i=1nXiB(n,p)n_{1}=\sum_{i=1}^{n} X_{i} \sim B(n, p), 根据中心极限定理

n1npnp(1p)LN(0,1)\frac{n_{1}-n p}{\sqrt{n p(1-p)}} \stackrel{L}{\rightarrow} N(0,1)

于是 χ2=(n1np)2np(1p)Lχ2(1)\chi^{2}=\frac{\left(n_{1}-n p\right)^{2}}{n p(1-p)} \stackrel{L}{\rightarrow} \chi^{2}(1).