南开大学-432统计学-2016年

一、选择题 (每题 4 分, 共 28 分)

  1. 下列事件运算表示 “三个事件恰好一个发生”的是 ( ).
    A. ABCA \cup B \cup C;
    B. ABˉCˉA \bar{B} \bar{C}
    C. ΩAˉBˉCˉ\Omega-\bar{A} \bar{B} \bar{C}
    D. AˉBˉCˉ+ABˉCˉ+AˉBCˉ+AˉBˉC\bar{A} \bar{B} \bar{C}+A \bar{B} \bar{C}+\bar{A} B \bar{C}+\bar{A} \bar{B} C.

Solution: B
选项 A 表示至少有一个事件发生;
选项 B\mathrm{B} 表示只有事件 A\mathrm{A} 发生;
选项 C 与选项 A\mathrm{A} 等价, 表示至少有一个事件发生;
选项 D 表示不超过一个事件发生.

  1. 已知 XP(3)X \sim \mathcal{P}(3), 利用切比雪夫不等式估计 P(0<X<6)P(0<X<6) 的概率是 ( ).
    A. P(0<X<6)13P(0<X<6) \leq \frac{1}{3};
    B. P(0<X<6)13P(0<X<6) \geq \frac{1}{3}
    C. P(0<X<6)23P(0<X<6) \leq \frac{2}{3};
    D. P(0<X<6)23P(0<X<6) \geq \frac{2}{3}.

Solution: D\mathrm{D}
XP(3),EX=Var(X)=3X \sim P(3), E X=\operatorname{Var}(X)=3, 则根据切比雪夫不等式, 有:

P(0<X<6)=P(XEX<3)113=23P(0<X<6)=P(|X-E X|<3) \geqslant 1-\frac{1}{3}=\frac{2}{3}

  1. 桌上有 nn 个信封与 nn 封信, 现将它们随机匹配, 则匹配成功的信封数的期望 是 ( ).
    A. 1
    B. 2 ;
    C. 1+1/n1+1 / n
    D. n(11/e)n(1-1 / e).

Solution: A\mathrm{A}
如果匹配正确, 令 Xi=1X_{i}=1; 否则令 Xi=0X_{i}=0;
则有:

P(Xi=1)=1n,P(Xi=0)=n1nEX=E(i=1nXi)=n1n=1\begin{gathered} P\left(X_{i}=1\right)=\frac{1}{n}, P\left(X_{i}=0\right)=\frac{n-1}{n} \\ E X=E\left(\sum_{i=1}^{n} X_{i}\right)=n \cdot \frac{1}{n}=1 \end{gathered}

  1. 有来自二阶矩存在总体 XX 的随机样本 X1,,XnX_{1}, \cdots, X_{n}, 设 S2=1n1i=1n(XiS^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\right. Xˉ)2\bar{X})^{2}, 则 SS 一定是总体标准差 σ\sigma 的 ( ).
    A. UMVUE;
    B. 相合估计;
    C. 无偏估计;
    D. MLE.

Solution: B
如果 θ^\hat{\theta}θ\theta 的相合估计, g()g(\cdot) 为连续函数, 则 g(θ^)g(\hat{\theta})g(θ)g(\theta) 的相合估计; 由于 S2S^{2}σ2\sigma^{2} 的相合估计, 则 SSσ\sigma 的相合估计.

  1. 下列不具有可加性的分布是( ).
    A. 伽马分布;
    B. 泊松分布;
    C. 柯西分布;
    D. 麦克斯韦分布.

Solution: D\mathrm{D}
AB\mathrm{AB} 选项显然, 伽马分布和泊松分布均具有可加性;
C\mathrm{C} 选项也成立, 若有: XiX_{i} i.i.d Cau(γ,x0)\sim \operatorname{Cau}\left(\gamma, x_{0}\right), 则 Y=i=1nXiCau(nγ,nx0)Y=\sum_{i=1}^{n} X_{i} \sim \operatorname{Cau}\left(n \gamma, n x_{0}\right).

  1. 已知 (X,Y)N(3,6;1,4;0.5)(X, Y) \sim N(3,6 ; 1,4 ; 0.5), 则 P(XY<3)=( )P(X-Y<-3)=(~).
    A. 0.40.4
    B. 0.60.6
    C. 0.50.5;
    D. 0.6450.645.

Solution: C\mathrm{C}
XYX-Y 仍服从正态分布,其期望为 3-3, 则有

P(XY<3)=0.5P(X-Y<-3)=0.5

  1. 已知 X,Y,ZX, Y, Z 独立同服从标准差正态分布, 则下列说法正确的是 ( ).
    A. X2X2+Y2F(1,2)\frac{X^{2}}{X^{2}+Y^{2}} \sim F(1,2)
    B. 3X2X2+Y2+Z2F(1,3)\frac{3 X^{2}}{X^{2}+Y^{2}+Z^{2}} \sim F(1,3)
    C. 2XY2+Z2t(2)\frac{\sqrt{2} X}{\sqrt{Y^{2}+Z^{2}}} \sim t(2)
    D. X2+Y2Y2+Z2F(2,2)\frac{X^{2}+Y^{2}}{Y^{2}+Z^{2}} \sim F(2,2).

Solution: C
对于选项 ABC\mathrm{ABC} 的三个式子, 分子分母不相互独立;
对于选项 D, 有:

X12(Y2+Z2)=2XY2+Z2t(2)\frac{X}{\sqrt{\frac{1}{2}\left(Y^{2}+Z^{2}\right)}}=\frac{\sqrt{2} X}{\sqrt{Y^{2}+Z^{2}}} \sim t(2)

二、填空题(每题4分, 共32分)

  1. U(1,1)U(-1,1)的特征函数是________.

Solution: sintt\frac{\sin t}{t}

E(eitx)=1112eitx dx=1112(costx+isintx)dx=01costx dx=sinttE\left(e^{i t x}\right)=\int_{-1}^{1} \frac{1}{2} e^{i t x} \mathrm{~d} x=\int_{-1}^{1} \frac{1}{2}(\cos t x+i \sin t x) \mathrm{d} x=\int_{0}^{1} \cos t x \mathrm{~d} x=\frac{\sin t}{t}

  1. 设随机变量XN(μ,σ2)X\sim N(\mu,\sigma^2), 则EXμ=E|X-\mu|=________.

Solution: σ2π\sigma \sqrt{\frac{2}{\pi}}

EXμ=12πσ+xμe(xμ)22σ2 dx=σ2π0+et22 d(t22)=σ2π\begin{aligned} E|X-\mu| &=\frac{1}{\sqrt{2 \pi} \sigma} \int_{-\infty}^{+\infty}|x-\mu| e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}} \mathrm{~d} x \\ &=\sigma \sqrt{\frac{2}{\pi}} \int_{0}^{+\infty} e^{-\frac{t^{2}}{2}} \mathrm{~d}\left(\frac{t^{2}}{2}\right)=\sigma \sqrt{\frac{2}{\pi}} \end{aligned}

  1. 有2个五分硬币、3个二分硬币和5个一分硬币, 随机抽取5个, 总和大于一角的概率是________.

Solution: 0.50.5
可能情况为: 2 枚五分, 3 枚其他;
1 枚五分, 3 枚 2 分, 1 枚 1 分;
1 枚五分, 2 枚 3 分, 2 枚 1 分.
则所求概率为

C22C83+C21C33C51+C21C32C52C105=2142=12\frac{C_{2}^{2} C_{8}^{3}+C_{2}^{1} C_{3}^{3} C_{5}^{1}+C_{2}^{1} C_{3}^{2} C_{5}^{2}}{C_{10}^{5}}=\frac{21}{42}=\frac{1}{2}

  1. 已知在Y=yY=y的条件下, XN(y,y)X\sim N(y,y), 又YExp(1)Y\sim Exp(1), 则Var(X)=Var(X)=________.

Solution: 2
由方差恒等式

Var(X)=E[Var(XY)]+Var[E(XY)]=E(Y)+Var(Y)=2\begin{aligned} \operatorname{Var}(X) &=E[\operatorname{Var}(X \mid Y)]+\operatorname{Var}[E(X \mid Y)] \\ &=E(Y)+\operatorname{Var}(Y)=2 \end{aligned}

  1. 已知(X,Y)(X,Y)服从单位圆内的均匀分布, 则Corr(X,Y)=(X,Y)=________.

Solution: 0
因为 XXYY 的边际密度函数在对称区间上为偶函数, 则 XXYY 的期望为 0 ; 所以 Cov(X,Y)=EXY=1π111x21x2xy dx dy=0\operatorname{Cov}(X, Y)=E X Y=\frac{1}{\pi} \int_{-1}^{1} \int_{-\sqrt{1-x^{2}}}^{\sqrt{1-x^{2}}} x y \mathrm{~d} x \mathrm{~d} y=0. 即 XXYY 的相关系数为 0 .

  1. 已知双参数指数分布随机变量XX具有密度函数f(x)=λeλ(xa),f(x)=\lambda e^{-\lambda(x-a)}, 其中x>ax>a, 则EX=EX=, Var(X)=Var(X)=.

Solution: 1λ+a;1λ2\frac{1}{\lambda}+a ; \frac{1}{\lambda^{2}}
XaX-a 服从参数为 λ\lambda 的单参数指数分布, 由指数分布的性质有

EX=a+1λ,Var(X)=1λ2E X=a+\frac{1}{\lambda}, \operatorname{Var}(X)=\frac{1}{\lambda^{2}}

  1. X1,X2,,XnX_1,X_2,\cdots,X_n为来自均匀分布U(0,θ)U(0,\theta)的简单随机样本, 则参数θ\theta的充分统计量为________.

Solution: x(n)x_{(n)}
样本的联合密度函数是 f(x1,x2,xn;θ)=(1θ)nI{x(n)<θ}f\left(x_{1}, x_{2}, \cdots x_{n} ; \theta\right)=\left(\frac{1}{\theta}\right)^{n} \mathbf{I}_{\left\{x_{(n)}<\theta\right\}}. 由因子分解定理可知, x(n)x_{(n)}θ\theta 的充分统计量.

  1. 有来自N(μ,σ2)N(\mu,\sigma^2)nn个随机样本x1,,xnx_1,\cdots,x_n, μ,σ\mu, \sigma未知, xˉ\bar{x}s2s^2是样本均值和样本方差, 则μ\mu1α1-\alpha置信区间是________.

Solution: xˉ±snt1α2(n1)\bar{x} \pm \frac{s}{\sqrt{n}} t{ }_{1-\frac{\alpha}{2}}(n-1)

三、解答题(90分)

1.(10分)甲乙两个抽屉中各有3个白球、2个黑球, 从甲抽屉中抽取1个球放入乙抽屉中, 再从乙抽屉取4个球放入甲抽屉, XX表示4个球中黑球的个数, 求 XX 的分布律.

Solution:
3/53 / 5 的概率从甲中取出白球放入乙中, 此时乙中 4 白 2 黑;
2/52 / 5 的概率从甲中取出黑球放入乙中, 此时乙中 3 白 3 黑;
XX 的可能取值为 01230 、 1 、 2 、 3. 所以

P(X=0)=35C44C64+250=125P(X=1)=35C43C21C64+25C33C31C64=25P(X=2)=35C42C22C64+25C32C32C64=1225P(X=3)=350+25C33C31C64=225\begin{aligned} &P(X=0)=\frac{3}{5} \frac{C_{4}^{4}}{C_{6}^{4}}+\frac{2}{5} \cdot 0=\frac{1}{25} \\ &P(X=1)=\frac{3}{5} \frac{C_{4}^{3} C_{2}^{1}}{C_{6}^{4}}+\frac{2}{5} \frac{C_{3}^{3} C_{3}^{1}}{C_{6}^{4}}=\frac{2}{5} \\ &P(X=2)=\frac{3}{5} \frac{C_{4}^{2} C_{2}^{2}}{C_{6}^{4}}+\frac{2}{5} \frac{C_{3}^{2} C_{3}^{2}}{C_{6}^{4}}=\frac{12}{25} \\ &P(X=3)=\frac{3}{5} \cdot 0+\frac{2}{5} \frac{C_{3}^{3} C_{3}^{1}}{C_{6}^{4}}=\frac{2}{25} \end{aligned}

2.(15分)二维随机变量 (X,Y)(X,Y)独立同分布, XX1,0,1-1, 0, 1的概率分别为1/4,1/2,1/41/4, 1/2, 1/4.

U={1,XY,0,X<Y,U=\left\{ \begin{matrix}{} 1,& X\ge Y,\\ 0,& X<Y,\\ \end{matrix} \right.

(1) 求(X,Y)(X,Y)的联合分布;

(2) UUXX 是否独立, 说明理由;

(3) 求Z=X2+1Z=X^2+1的分布函数.

Solution:
(1)

Y    XY \ \ \ \ X -1 0 1
-1 1/16 1/8 1/16
0 1/8 1/4 1/8
1 1/16 1/8 1/16

(2)
X=1X=1 时, 有 P(YX)=1P(Y \leqslant X)=1, 则 P(U=1X=1)=1P(U=1 \mid X=1)=1.
X=1X=-1 时, 有 P(YX)=P(Y=1)=14P(Y \leqslant X)=P(Y=-1)=\frac{1}{4}, 则 P(U=1X=1)=14P(U=1 \mid X=-1)=\frac{1}{4}. P(U=1X=1)P(U=1X=1)P(U=1 \mid X=1) \neq P(U=1 \mid X=-1), 于是 XXUU 不独立.
(3)

P(Z=1)=P(Z=2)=12, 所以 FZ(z)={0,z<10.5,1z<21,z2\begin{gathered} P(Z=1)=P(Z=2)=\frac{1}{2}, \text { 所以 } \\ F_{Z}(z)= \begin{cases}0, & z<1 \\ 0.5, & 1 \leqslant z<2 \\ 1, & z \geqslant 2\end{cases} \end{gathered}

3.(15分) 设 X1,X2XnX_{1}, X_{2} \cdots X_{n} 为来自正态总体 N(0,σ2)N\left(0, \sigma^{2}\right) 的简单随机样本, 其中 σ2\sigma^{2} 为未知参数, 记 Xˉ=1ni=1nXi,Sn2=1n1i=1n(XiXˉ)2\bar{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i}, S_{n}^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}.

(1) 求σ2\sigma^{2} 的极大似然估计, 并记之为 σ^2\hat{\sigma}^{2};

(2) 你认为σ^2\hat{\sigma}^{2}Sn2S_{n}^{2} 哪个更好? 为什么.

Solution: (1) 似然函数为 L(σ2)=(2πσ2)n2exp{i=1nxi22σ2}L\left(\sigma^{2}\right)=\left(2 \pi \sigma^{2}\right)^{-\frac{n}{2}} \exp \left\{-\frac{\sum_{i=1}^{n} x_{i}^{2}}{2 \sigma^{2}}\right\}, 将其取对数, 关于 σ2\sigma^{2} 求导并置 0 , 得到似然方程

lnL(σ2)σ2=n2σ2+i=1nxi22σ4=0\frac{\partial \ln L\left(\sigma^{2}\right)}{\partial \sigma^{2}}=-\frac{n}{2 \sigma^{2}}+\frac{\sum_{i=1}^{n} x_{i}^{2}}{2 \sigma^{4}}=0

解得 σ^2=i=1nxi2n\hat{\sigma}^{2}=\frac{\sum_{i=1}^{n} x_{i}^{2}}{n}σ2\sigma^{2} 的 MLE.
(2) 容易验证 σ^2\hat{\sigma}^{2}Sn2S_{n}^{2} 都是 σ2\sigma^{2} 的无偏估计, 而

Var(σ^2)=σ2Var(i=1nxi2σ4)n2=2σ4nVar(Sn2)=σ2(n1)2Var((n1)Sn2σ2)=2σ4n1\begin{gathered} \operatorname{Var}\left(\hat{\sigma}^{2}\right)=\frac{\sigma^{2} \operatorname{Var}\left(\sum_{i=1}^{n} \frac{x_{i}^{2}}{\sigma^{4}}\right)}{n^{2}}=\frac{2 \sigma^{4}}{n} \\ \operatorname{Var}\left(S_{n}^{2}\right)=\frac{\sigma^{2}}{(n-1)^{2}} \operatorname{Var}\left(\frac{(n-1) S_{n}^{2}}{\sigma^{2}}\right)=\frac{2 \sigma^{4}}{n-1} \end{gathered}

Var(σ^2)<Var(Sn2)\operatorname{Var}\left(\hat{\sigma}^{2}\right)<\operatorname{Var}\left(S_{n}^{2}\right), 则 σ^2\hat{\sigma}^{2} 是更有效的, 可以认为它更好.

4.(15分) 设X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n} 为来自两点分布 B(1,p)B(1,p)的简单随机样本, 其中 p(0,1)p \in(0,1), 记 n1,n2n_{1}, n_{2}
为上述nn个样本中取值分别为1和0的个数, 如记

q=1p,χ2=(n1np)2np+(n2nq)2nq,q=1-p,\chi ^2=\frac{\left( n_1-np \right) ^2}{np}+\frac{\left( n_2-nq \right) ^2}{nq},

证明当 nn \rightarrow \infty 时, 有 χ2\chi^{2} 依分布收敛于 χ2(1)\chi^{2}(1).

Solution:
由于 n2=nn1n_{2}=n-n_{1}, 所以

χ2=(1p)(n1np)2+p(n2nq)2np(1p)=(1p)(n1np)2+p(npn1)2np(1p)=(n1np)2np(1p)\begin{aligned} \chi^{2} &=\frac{(1-p)\left(n_{1}-n p\right)^{2}+p\left(n_{2}-n q\right)^{2}}{n p(1-p)} \\ &=\frac{(1-p)\left(n_{1}-n p\right)^{2}+p\left(n p-n_{1}\right)^{2}}{n p(1-p)}=\frac{\left(n_{1}-n p\right)^{2}}{n p(1-p)} \end{aligned}

n1=i=1nXiB(n,p)n_{1}=\sum_{i=1}^{n} X_{i} \sim B(n, p), 根据中心极限定理

n1npnp(1p)LN(0,1)\frac{n_{1}-n p}{\sqrt{n p(1-p)}} \stackrel{L}{\rightarrow} N(0,1)

于是 χ2=(n1np)2np(1p)Lχ2(1)\chi^{2}=\frac{\left(n_{1}-n p\right)^{2}}{n p(1-p)} \stackrel{L}{\rightarrow} \chi^{2}(1).

5.(15分) 有来自总体XN(μ,σ2)X\sim N(\mu,\sigma^2)nn个随机样本, S2S^2是样本方差, 基于S2S^2构造的σ2\sigma^2的最短置信区间是

[(n1)S2a,(n1)S2b],\left[ \frac{(n-1)S^2}{a},\frac{(n-1)S^2}{b} \right],

试给出aabb的关系.

Solution: 以 T=(n1)S2σ2χ2(n1)T=\frac{(n-1) S^{2}}{\sigma^{2}} \sim \chi^{2}(n-1) 为枢轴量构建 σ2\sigma^{2}1α1-\alpha 水平的置信区间.
P(b<(n1)S2σ2<a)=1αP\left(b<\frac{(n-1) S^{2}}{\sigma^{2}}<a\right)=1-\alpha, 反解得 [(n1)S2a,(n1)S2b]\left[\frac{(n-1) S^{2}}{a}, \frac{(n-1) S^{2}}{b}\right]σ2\sigma^{2}1α1-\alpha水平的置信区间
想要令区间长度最短, 等价于寻找在 P(b<(n1)S2σ2<a)=1αP\left(b<\frac{(n-1) S^{2}}{\sigma^{2}}<a\right)=1-\alpha 条件下, 使得 1b1a\frac{1}{b}-\frac{1}{a} 达到最小值的 aabb, 可利用拉格朗日乘数法
T=(n1)S2σ2χ2(n1)T=\frac{(n-1) S^{2}}{\sigma^{2}} \sim \chi^{2}(n-1) 的密度函数为 fn1(t)f_{n-1}(t), 令F(a,b,λ)=1b1a+λ(bafn1(t)dt1+α)F(a, b, \lambda)=\frac{1}{b}-\frac{1}{a}+\lambda\left(\int_{b}^{a} f_{n-1}(t) \mathrm{d} t-1+\alpha\right)

{Fa=1a2+λfn1(a)Fb=1b2λfn1(b)Fλ=0\left\{\begin{array}{l}\frac{\partial F}{\partial a}=\frac{1}{a^{2}}+\lambda f_{n-1}(a) \\ \frac{\partial F}{\partial b}=-\frac{1}{b^{2}}-\lambda f_{n-1}(b) \\ \frac{\partial F}{\partial \lambda}=0\end{array}\right.

解得 {a2fn1(a)=b2fn1(b)bafn1(t)dt=1α\left\{\begin{array}{l}a^{2} f_{n-1}(a)=b^{2} f_{n-1}(b) \\ \int_{b}^{a} f_{n-1}(t) \mathrm{d} t=1-\alpha\end{array}\right., 其中 fn1(t)=12n12Γ(n12)tn32et2f_{n-1}(t)=\frac{1}{2^{\frac{n-1}{2}} \Gamma\left(\frac{n-1}{2}\right)} t^{\frac{n-3}{2}} e^{-\frac{t}{2}}, 于是有

{fn+3(a)=fn+3(b)bafn1(t)dt=1α\left\{\begin{array}{l} f_{n+3}(a)=f_{n+3}(b) \\ \int_{b}^{a} f_{n-1}(t) \mathrm{d} t=1-\alpha \end{array}\right.

6.(10分) 有来自总体XB(1,p)X\sim B(1,p)的随机样本X1,,XnX_1,\cdots,X_n, 给出一个p2p^2的无偏估计.

Solution: 由于 Exˉ=p{E \bar{x}}=p, 而

E(xˉ)2=Var(xˉ)+(Exˉ)2=p(1p)n+p2=pn+n1np2\begin{aligned} E (\bar{x})^{2} &=\operatorname{Var}(\bar{x})+({E \bar{x}})^{2} \\ &=\frac{p(1-p)}{n}+p^{2} \\ &=\frac{p}{n}+\frac{n-1}{n} p^{2} \end{aligned}

于是 E[nn1(xˉ2xˉn)]=p2E\left[\frac{n}{n-1}\left(\bar{x}^{2}-\frac{\bar{x}}{n}\right)\right]=p^{2}, 所以 p^2=nn1(xˉ2xˉn)\hat{p}^{2}=\frac{n}{n-1}\left(\bar{x}^{2}-\frac{\bar{x}}{n}\right)p2p^{2} 的无偏估计.

7.(10分) 有来自双参数指数分布总体XExp(a,λ)X\sim Exp(a,\lambda)的随机样本X1,,XnX_1,\cdots,X_n, 其密度函数是

f(x)=λeλ(xa),x>a,f(x)=\lambda e^{-\lambda(x-a)},x>a,

其中a,λa,\lambda是未知参数, 求(a,λ)(a,\lambda)的充分统计量.

Solution: 样本的联合密度函数是

f(x1,x2,,xn;λ,a)=λnexp{λi=1n(xia)}I{x(1)>a}=λnenλaenλxˉI{x(1)>a}\begin{aligned} f\left(x_{1}, x_{2}, \cdots, x_{n} ; \lambda, a\right) &=\lambda^{n} \exp \left\{-\lambda \sum_{i=1}^{n}\left(x_{i}-a\right)\right\} \mathbf{I}_{\left\{x_{(1)}>a\right\}} \\ &=\lambda^{n} e^{n \lambda a} e^{-n \lambda \bar{x}} \mathbf{I}_{\left\{x_{(1)}>a\right\}} \end{aligned}

根据因子分解定理, (x(1),xˉ)\left(x_{(1)}, \bar{x}\right)(a,λ)(a, \lambda) 的充分统计量.