中山大学-432统计学-2019年

一、选择题(每小题3分, 共60分)

  1. 将一个骰子独立地掷两次。引进事件 : A1={A_{1}=\{ 郑第一次出现奇数点 },A2=\}, A_{2}= {掷第二次出现偶数点 },A3={\}, A_{3}=\{ 奇数点、偶数点各出现一次 },A4={\}, A_{4}=\{ 奇数点出现两次 }\}, 则 ( )
    (A) A1,A2,A3A_{1}, A_{2}, A_{3} 两两独立
    (B) A1,A2,A3A_{1}, A_{2}, A_{3} 相互独立
    (C) A2,A3,A4A_{2}, A_{3}, A_{4} 两两独立
    (D) A2,A3,A4A_{2}, A_{3}, A_{4} 相互独立

Solution: A

P(A1)=12,P(A2)=12,P(A3)=12,P(A4)=14P\left(A_{1}\right)=\frac{1}{2}, P\left(A_{2}\right)=\frac{1}{2}, P\left(A_{3}\right)=\frac{1}{2}, P\left(A_{4}\right)=\frac{1}{4}

P(A2A4)=14P(A2)P(A4)P\left(A_{2} A_{4}\right)=\frac{1}{4} \neq P\left(A_{2}\right) P\left(A_{4}\right), 事件 A2,A4A_{2}, A_{4} 不独立, 选项 C, D 错误 对于事件 A1,A2,A3A_{1}, A_{2}, A_{3} 有:

P(A1A2)=P(A1)P(A2)=14P(A1A3)=P(A1)P(A3)=14P(A2A3)=P(A2)P(A3)=14P(A1A2A3)=14P(A1)P(A2)P(A3)\begin{aligned} &P\left(A_{1} A_{2}\right)=P\left(A_{1}\right) P\left(A_{2}\right)=\frac{1}{4} \\ &P\left(A_{1} A_{3}\right)=P\left(A_{1}\right) P\left(A_{3}\right)=\frac{1}{4} \\ &P\left(A_{2} A_{3}\right)=P\left(A_{2}\right) P\left(A_{3}\right)=\frac{1}{4} \\ &P\left(A_{1} A_{2} A_{3}\right)=\frac{1}{4} \neq P\left(A_{1}\right) P\left(A_{2}\right) P\left(A_{3}\right) \end{aligned}

所以事件 A1,A2,A3A_{1}, A_{2}, A_{3} 两两独立不相互独立. 选项 A 正确

  1. 下面的说法哪个是错误的? ( )
    (A) P(AB)P(A)+P(B)1\mathrm{P}(A B) \geq P(A)+\mathrm{P}(B)-1
    (B) P(AB)P(A)P(B)14|\mathrm{P}(A B)-\mathrm{P}(A) \mathrm{P}(B)| \leq \frac{1}{4}
    (C) P(AB)P(A)+P(B)\mathrm{P}(A \cup B) \leq \mathrm{P}(A)+\mathrm{P}(B)
    (D) 两个随机变量不相关不可能推出两个随机变量独立

Solution: D
对于选项 A\mathrm{A} :

P(A)+P(B)P(AB)=P(AB)1,P(A)+P(B)-P(A B)=P(A \cup B) \leqslant 1,

有: P(AB)P(A)+P(B)1P(A B) \geqslant P(A)+P(B)-1 \quad 选项 A 正确
对于选项 BB :
另只有事件 A\mathrm{A} 发生的概率为 a\mathrm{a}, 只有事件 B\mathrm{B} 发生的概率为 b\mathrm{b}, 事件 A B\mathrm{A} 、 \mathrm{~B} 同 时发生的概率为 c\mathrm{c}, 事件 A B\mathrm{A} 、 \mathrm{~B} 都不发生的概率为 d\mathrm{d} 有:

P(A)=a+cP(B)=b+cP(AB)P(A)P(B)=c(a+c)(b+c)=cabacbcc2=c(1abc)ab=cdab\begin{array}{rl} P(A)=a+c & P(B)=b+c \\ P(A B)-P(A) P(B) & =c-(a+c)(b+c) \\ = & c-a b-a c-b c-c^{2} \\ = & c(1-a-b-c)-a b \\ = & c d-a b \end{array}

因为: a+b+c+d=1a+b+c+d=1, 所以有

2ab<a+b1,ab12,ab14, 同理 cd1414cdab14,cdab14 选项 B 正确 \begin{gathered} 2 \sqrt{a b}<a+b \leqslant 1, \sqrt{a b} \leqslant \frac{1}{2}, a b \leqslant \frac{1}{4}, \text { 同理 } c d \leqslant \frac{1}{4} \\ -\frac{1}{4} \leqslant c d-a b \leqslant \frac{1}{4},|c d-a b| \leqslant \frac{1}{4} \quad \text { 选项 B 正确 } \end{gathered}

对于选项 CC :

P(AB)=P(A)+P(B)P(AB)P(A)+P(B) 正确 P(A \cup B)=P(A)+P(B)-P(A \cap B) \leqslant P(A)+P(B) \text { 正确 }

对于选项 DD :
若两个随机变量服从二维正态分布, 不相关与独立等价, 选项 D 错误.

  1. 某领导有 3 个顾问, 假定每个顾问贡献正确意见的概率是 0.5。现为某事可行与否而个别征求各 顾问意见, 并按多数人的意见做出决策, 则做出正确决策的概率是( )
    (A) 0.50.5
    (B) 0.60.6
    (C) 2/32 / 3
    (D) 0.70.7

Solution: A
当有两个以上的顾问做出正确决策的时候, 最终做出正确决策 P=0.53+C32×0.52×(10.5)=0.5P=0.5^{3}+C_{3}^{2} \times 0.5^{2} \times(1-0.5)=0.5 选项 A 正确

  1. 甲、乙两人轮流射击, 先击中目标者获胜。甲、乙击中目标的概率分别是 1/31 / 31/21 / 2, 甲先射, 甲 获胜的概率是( )
    (A) 1/31 / 3
    (B) 1/21 / 2
    (C) 2/32 / 3
    (D) 3/43 / 4

Solution: B
甲获胜的可能:第一局甲射中+第一局甲乙都没中、第二局甲射中+第一、

P( 甲获胜 )=13+23×12×13+(23×12)2×13+=13×(1+13+132)=13×32=12\begin{aligned} P(\text { 甲获胜 }) &=\frac{1}{3}+\frac{2}{3} \times \frac{1}{2} \times \frac{1}{3}+\left(\frac{2}{3} \times \frac{1}{2}\right)^{2} \times \frac{1}{3}+\cdots \\ &=\frac{1}{3} \times\left(1+\frac{1}{3}+\frac{1}{3^{2}} \cdots\right) \\ &=\frac{1}{3} \times \frac{3}{2}=\frac{1}{2} \end{aligned}

故选 B.

  1. 从数 12341 、 2 、 3 、 4 中任取一个数, 记为 XX; 再从 1,,X1, \ldots, X 中任取一个数, 记为 YY, 则 P(Y=3)\mathrm{P}(Y=3)P(X=3Y=3)\mathrm{P}(X=3 \mid Y=3) 分别等于 ( )
    (A) 1/41 / 41/31 / 3
    (B) 1/41 / 43/83 / 8
    (C) 7/487 / 484/74 / 7
    (D) 1/31 / 3 和4/7

Solution: C

P(Y=3)=P(Y=3X=3)×P(X=3)+P(Y=3X=4)×P(X=4)=13×14+14×14=748\begin{aligned} P(Y=3) &=P(Y=3 \mid X=3) \times P(X=3)+P(Y=3 \mid X=4) \times P(X=4) \\ &=\frac{1}{3} \times \frac{1}{4}+\frac{1}{4} \times \frac{1}{4}=\frac{7}{48} \end{aligned}

P(X=3Y=3)=P(X=3,Y=3)P(Y=3)=14×13748=47P(X=3 \mid Y=3)=\frac{P(X=3, Y=3)}{P(Y=3)}=\frac{\frac{1}{4} \times \frac{1}{3}}{\frac{7}{48}}=\frac{4}{7} \quad 选项 C 正确

  1. 若随机变量 XX 服从 N(a,σ2)N\left(a, \sigma^{2}\right), 则 EXaE|X-a| 等于( )
    (A) 2/πσ\sqrt{2 / \pi} \sigma
    (B) σ/2\sigma / 2
    (C) σ\sigma
    (D) 2σ2 \sigma

Solution: A. 考虑 Xa=σYX-a = \sigma Y, 其中 YN(0,1)Y\sim N(0,1)是标准正态, 有

EY=+y12πey22dy=2π0+yey22dy=2π0+ey22d(y22)=2π.E\left| Y \right|=\int_{-\infty}^{+\infty}{\left| y \right|\frac{1}{\sqrt{2\pi}}e^{-\frac{y^2}{2}}dy}=\sqrt{\frac{2}{\pi}}\int_0^{+\infty}{ye^{-\frac{y^2}{2}}dy}=\sqrt{\frac{2}{\pi}}\int_0^{+\infty}{e^{-\frac{y^2}{2}}d\left( \frac{y^2}{2} \right)}=\sqrt{\frac{2}{\pi}}.

因此 EXa=σEY=2/πσE|X-a|=\sigma E|Y|=\sqrt{2/\pi}\sigma.

  1. 随机变量 XX 的密度函数为 f(x)=2e2x,x>0f(x)=2 e^{-2 x}, x>0 。令 Y=min(X,4)Y=\min (X, 4), 则 P(Y=4)\mathrm{P}(Y=4) 等于( )
    (A) e2e^{-2}
    (B) e4e^{-4}
    (C) e8e^{-8}
    (D) 1e41-e^{-4}

Solution: C

P(Y=4)=P(X4)=4+2e2xdx=e8, 故选 C. P(Y=4)=P(X \geqslant 4)=\int_{4}^{+\infty} 2 e^{-2 x} d x=e^{-8} \text {, 故选 C. }

  1. 下面关于方差的叙述中, 不正确的是( )
    (A) 若 η1\eta_{1}η2\eta_{2} 独立, 则 D(η1+η2)=D(η1)+D(η2)\mathrm{D}\left(\eta_{1}+\eta_{2}\right)=\mathrm{D}\left(\eta_{1}\right)+\mathrm{D}\left(\eta_{2}\right)
    (B) 若 D(η1+η2)=D(η1)+D(η2)\mathrm{D}\left(\eta_{1}+\eta_{2}\right)=\mathrm{D}\left(\eta_{1}\right)+\mathrm{D}\left(\eta_{2}\right), 则 η1\eta_{1}η2\eta_{2} 不相关
    (C) 当 ε>0\varepsilon>0 时, P{ηEηε}D(η)εP\{|\eta-E \eta| \geq \varepsilon\} \leq \frac{D(\eta)}{\varepsilon}
    (D) 当 D(η)=0D(\eta)=0 时, P{η=Eη}=1P\{\eta=E \eta\}=1

Solution: C
对于选项 A: 根据 D(η1+η2)=D(η1)+D(η2)+2Cov(η1,η2)D\left(\eta_{1}+\eta_{2}\right)=D\left(\eta_{1}\right)+D\left(\eta_{2}\right)+2 \operatorname{Cov}\left(\eta_{1}, \eta_{2}\right), 若 η1,η2\eta_{1}, \eta_{2} 独立, 则协方差为 0 , 则等式成立, 选项 A\mathrm{A} 正确.
对于选项 B\mathrm{B} : 由选项可知, η1,η2\eta_{1}, \eta_{2} 的协方差为 0 , 所以 η1,η2\eta_{1}, \eta_{2} 不相关, 选项 B\mathrm{B} 正 确.
对于选项 C: 由切比雪夫不等式

P{ηEηε}D(ε)ε2,P\{|\eta-E \eta| \geqslant \varepsilon\} \leqslant \frac{D(\varepsilon)}{\varepsilon^{2}},

故选项 C\mathrm{C} 错误.
对于选项 D: 因为

P(ηEη)=limnP(k=n{ηE(η)>1k})limnk=nP{ηE(η)>1k}limnk=nk2D(η)=0\begin{aligned} P(\eta \neq E \eta) &=\lim _{n \rightarrow \infty} P\left(\bigcup_{k=n}^{\infty}\left\{|\eta-E(\eta)|>\frac{1}{k}\right\}\right) \\ & \leq \lim _{n \rightarrow \infty} \sum_{k=n}^{\infty} P\left\{|\eta-E(\eta)|>\frac{1}{k}\right\} \\ & \leq \lim _{n \rightarrow \infty} \sum_{k=n}^{\infty} k^{2} D(\eta)=0 \end{aligned}

故选项 D 正确.

  1. 设随机变量 XXYY 相互独立, 且都服从区间 [0,1][0,1] 上的均匀分布, 则 ()
    (A) Z=X+YZ=X+Y 服从 [0,2][0,2] 上的均匀分布
    (B) Z=XYZ=X-Y 服从 [1,1][-1,1] 上的均匀分布
    (C) Z=max{X,Y}Z=\max \{X, Y\} 服从 [0,1][0,1] 上的均匀分布
    (D) (X,Y)(X, Y) 服从区域 {(x,y):0x1,0y1}\{(x, y): 0 \leq x \leq 1,0 \leq y \leq 1\} 上的均匀分布

Solution: D
由于 X,YX, Y 是独立的, 因此 D 选项显然正确. A 选项显然错误,独立的均匀分 布不具有可加性, 其和并不服从均匀分布, B 选项同理. C 选项显然错误, 根据常 用结论,均匀分布的最大次序统计量应是 Beta 分布.

  1. 一本书在交付印刷前, 作家和出版社先后对其进行校正。该书有 300 页, 每页的错误数相互独 立且都服从参数为 6 的泊松分布。在作家的校对过程中, 每个错误相互独立地以概率 0.80.8 被订正。在出版社进行的第二次校正中, 前一稿的打印错误相互独立地以概率 0.90.9 被订正。出版后整本书的 错误数大于等于 30 的概率 (用标准正态分布函数 Φ(x)\Phi(x) 表示) 大约是( )
    (A) Φ(1)\Phi(1)
    (B) Φ(1.5)\Phi(1.5)
    (C) Φ(2)\Phi(2)
    (D) 2Φ(2)2-\Phi(2)

Solution: A.
设这本书的错误数为 NN, 则 NP(1800)N \sim \mathcal{P}(1800), 每个错误 X1,,XNX_1,\cdots,X_N 未被修正的概率是 0.020.02, 用 Xi=1X_i = 1 表示第 ii 个错误未被修正, 则有 XiB(1,0.02)X_i \sim B(1,0.02), 而最终的错误数是

Y=X1+X2++XN=k=1NXk,Y = X_1 +X_2+\cdots +X_N = \sum_{k=1}^N X_k,

这是经典的复合泊松变量, 也算茆一道原题, 与中山2017第6题一致, YP(36)N(36,36)Y\sim \mathcal{P}(36)\approx N(36,36), 因此

P(Y30)=P(Y36630366)=1Φ(1)=Φ(1).P(Y \geqslant 30)=P\left(\frac{Y-36}{6} \geqslant \frac{30-36}{6}\right)=1-\Phi(-1)=\Phi(1) .

  1. X1,,XnX_{1}, \ldots, X_{n} 为总体 XX 的简单随机样本。若 EX\mathrm{E} X 存在并记为 μ,Xˉ\mu, \bar{X} 为样本均值, 则 ()
    (A) Xˉ\bar{X}μ\mu 的相合(consistent)估计量
    (B) Xˉ\bar{X}μ\mu 的最大似然估计量
    (C) Xˉ\bar{X}μ\mu 的充分统计量
    (D) Xˉ|\bar{X}|μ|\mu| 的无偏估计量

Solution: A
由柯尔莫哥洛夫强大数定律知 xˉa.s.μ,xˉ\bar{x} \stackrel{a . s .}{\longrightarrow} \mu, \bar{x}μ\mu 的强相合估计, A 正确;
对于选项 BCB 、 C, 随机变量具体分布未知时无法得到选项所提到的结论; 对 于选项 D\mathrm{D}, 除非总体是不变号分布, 否则由 Jensen 不等式可推出其错误.

  1. X1,,XnX_{1}, \ldots, X_{n} 为标准正态分布 N(0,1)\mathrm{N}(0,1) 的简单随机样本。记 T1=i=1nXi2,T2=i=1n(XiXˉ)2T_{1}=\sum_{i=1}^{n} X_{i}^{2}, T_{2}=\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}, 则 ()
    (A) T2/(n1)T1/nF(n1,n)\frac{T_{2} /(n-1)}{T_{1} / n} \sim \mathrm{F}(n-1, n)
    (B) T2/(n1)T1/nBeta(n1,n)\frac{T_{2} /(n-1)}{T_{1} / n} \sim \operatorname{Beta}(n-1, n)
    (C) T2T1Beta(n1,n)\frac{T_{2}}{T_{1}} \sim \operatorname{Beta}(n-1, n)
    (D) T2T1Beta(n12,12)\frac{T_{2}}{T_{1}} \sim \operatorname{Beta}\left(\frac{n-1}{2}, \frac{1}{2}\right)

Solution: D

T2=i=1n(xixˉ)2=i=1nxi2nxˉ2=T1nxˉ2T_{2}=\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}=\sum_{i=1}^{n} x_{i}^{2}-n \bar{x}^{2}=T_{1}-n \bar{x}^{2}

根据 Fisher 引理有 xˉ\bar{x}i=1n(xixˉ)2\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} 独立, 则 T1T2=nxˉ2T_{1}-T_{2}=n \bar{x}^{2}T2T_{2} 相互独立;
又因为 nxˉ2χ2(1),i=1n(xixˉ)2χ2(n1)n \bar{x}^{2} \sim \chi^{2}(1), \sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sim \chi^{2}(n-1), 故

T2T1=T2T1T2+T2=i=1n(xixˉ)2nxˉ2+i=1n(xixˉ)2Beta(n12,12)\frac{T_{2}}{T_{1}}=\frac{T_{2}}{T_{1}-T_{2}+T_{2}}=\frac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}{n \bar{x}^{2}+\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}} \sim \operatorname{Beta}\left(\frac{n-1}{2}, \frac{1}{2}\right)

D 正确. (补充:若 XGa(α1,λ),YGa(α2,λ)X \sim G a\left(\alpha_{1}, \lambda\right), Y \sim G a\left(\alpha_{2}, \lambda\right), 且 X,YX, Y 相互独立, 则 XX+YBeta(α1,α2))\left.\frac{X}{X+Y} \sim \operatorname{Beta}\left(\alpha_{1}, \alpha_{2}\right)\right)

  1. X1,,XnX_{1}, \ldots, X_{n} 为正态分布 N(0,σ2)N\left(0, \sigma^{2}\right) 的简单随机样本。记 T1=i=1nXi2,T2=i=1n(XiXˉ)2T_{1}=\sum_{i=1}^{n} X_{i}^{2}, T_{2}=\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}, 则 ()
    (A) T1T_{1}T2T_{2} 相互独立
    (B) T1T_{1}T1T2T_{1}-T_{2} 相互独立
    (C) T1T_{1}T1/T2T_{1} / T_{2} 相互独立
    (D) T1+T2T_{1}+T_{2}T1T2T_{1}-T_{2} 相互独立

Solution: C
由指数族性质可知 T1T_{1}σ2\sigma^{2} 的充分完全统计量, 记 Yi=XiσY_{i}=\frac{X_{i}}{\sigma}, 其分布与参数 σ\sigma 无关,故 T1σ2=i=1nYi2\frac{T_{1}}{\sigma^{2}}=\sum_{i=1}^{n} Y_{i}^{2}T2σ2=i=1n(YiYˉ)2\frac{T_{2}}{\sigma^{2}}=\sum_{i=1}^{n}\left(Y_{i}-\bar{Y}\right)^{2} 分布与 σ\sigma 无关,则 T1T2=T1/σ2T2/σ2\frac{T_{1}}{T_{2}}=\frac{T_{1} / \sigma^{2}}{T_{2} / \sigma^{2}} 分 布也与 σ\sigma 无关,由 Basu 定理知 T1T_{1}T1T2\frac{T_{1}}{T_{2}} 独立, C\mathrm{C} 正确.

  1. X1,,XnX_{1}, \ldots, X_{n} 为泊松分布 Poisson (λ)(\lambda) 的简单随机样本, Xˉ\bar{X}S2=1n1i=1n(XiXˉ)2S^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2} 为样本均值及样 本方差。令 ZZ 为服从标准正态分布的随机变量, 则当 n+n \rightarrow+\infty 时, ()
    (A) nxˉs\frac{\sqrt{n} \bar{x}}{s} 依分布收敛到 ZZ
    (B) n(Xˉλ)Xˉ/S\frac{\sqrt{n}(\bar{X}-\lambda)}{\bar{X} / S} 依分布收敛到 ZZ
    (C) n(xˉλ)λ\frac{\sqrt{n}(\bar{x}-\lambda)}{\lambda} 依分布收敛到 ZZ
    (D) n(xˉλ)xˉ\frac{\sqrt{n}(\bar{x}-\lambda)}{\bar{x}} 依分布收敛到 ZZ

Solution: B
由矩估计的相合性知 xˉPλ,s2Pλ\bar{x} \stackrel{P}{\rightarrow} \lambda, s^{2} \stackrel{P}{\rightarrow} \lambda, 则 xˉsPλλ=λ\frac{\bar{x}}{s} \stackrel{P}{\rightarrow} \frac{\lambda}{\sqrt{\lambda}}=\sqrt{\lambda}; 由中心极限定 理知 n(xˉλ)λLZ\frac{\sqrt{n}(\bar{x}-\lambda)}{\sqrt{\lambda}} \stackrel{L}{\rightarrow} Z, 由 Slutsky 定理得

n(xˉλ)xˉ/s=n(xˉλ)λλxˉ/sLZ\frac{\sqrt{n}(\bar{x}-\lambda)}{\bar{x} / s}=\frac{\sqrt{n}(\bar{x}-\lambda)}{\sqrt{\lambda}} \cdot \frac{\sqrt{\lambda}}{\bar{x} / s} \stackrel{L}{\rightarrow} Z

B 正确.

  1. X1,,XnX_{1}, \ldots, X_{n} 为正态分布 N(μ,σ2)\mathrm{N}\left(\mu, \sigma^{2}\right) 的简单随机样本, 其中 μ\mu 已知而 σ2\sigma^{2} 未知, 则下列不是统计量的 是( )
    (A) i=1nXi/σ\sum_{i=1}^{n} X_{i} / \sigma
    (B) X1X_{1}
    (C) i=1nXi2/n\sum_{i=1}^{n} X_{i}^{2} / n
    (D) i=1nXinμ\sum_{i=1}^{n} X_{i}-n \mu

Solution: A
统计量不包含未知参数, 故选择 A.

  1. X1,,XnX_{1}, \ldots, X_{n} 为均匀分布 U(0,θ)\mathrm{U}(0, \theta) 的简单随机样本, 则 θ\theta 的最大似然估计量为( )
    (A) X(1)X_{(1)}
    (B) Xˉ\bar{X}
    (C) X(n)X_{(n)}
    (D) X1,,XnX_{1}, \cdots, X_{n} 的中位数

Solution: C
似然函数 L(θ)=i=1n1θI(0xiθ)=1θnI(x(0)θ)L(\theta)=\prod_{i=1}^{n} \frac{1}{\theta} I_{\left(0 \leqslant x_{i} \leqslant \theta\right)}=\frac{1}{\theta^{n}} I_{\left(x_{(0)} \leqslant \theta\right)}, 似然函数随 θ\theta 单调减, 故 θ^MLE=X(n)\hat{\theta}_{M L E}=X_{(n)}, C 正确.

  1. 下列关于统计学常用的分布的判断中, 错误的是( )
    (A) 若 ZF(n1,n2)Z \sim \mathrm{F}\left(n_{1}, n_{2}\right), 则 1/ZF(n2,n1)1 / Z \sim \mathrm{F}\left(n_{2}, n_{1}\right)
    (B) 若 Tt(n)T \sim t(n), 则 T2F(1,n)T^{2} \sim \mathrm{F}(1, n)
    (C) 若 XN(0,1)X \sim N(0,1), 则 X2χ2(1)X^{2} \sim \chi^{2}(1)
    (D) 若 XN(0,1),Yχ2(n)X \sim N(0,1), Y \sim \chi^{2}(n), 则 X/Yt(n)X / Y \sim t(n)

Solution: D
D\mathrm{D} 选项中, 当 XYX 、 Y 满足题干中要求且独立时, 随机变量 XY/nt(n),D\frac{X}{\sqrt{Y / n}} \sim t(n), \mathrm{D} 错误.

  1. X1,,XnX_{1}, \ldots, X_{n} 为正态分布 N(μ,1)\mathrm{N}(\mu, 1) 的简单样本, 则 μ\mu 的双侧 95%95 \% 置信区间为( )
    (A) (Xˉ1.64n,Xˉ+1.64n)\left(\bar{X}-\frac{1.64}{\sqrt{n}}, \bar{X}+\frac{1.64}{\sqrt{n}}\right)
    (B) (Xˉ1.64n,Xˉ+1.96n)\left(\bar{X}-\frac{1.64}{\sqrt{n}}, \bar{X}+\frac{1.96}{\sqrt{n}}\right)
    (C) (Xˉ1.96n,Xˉ+1.64n)\left(\bar{X}-\frac{1.96}{\sqrt{n}}, \bar{X}+\frac{1.64}{\sqrt{n}}\right)
    (D) (Xˉ1.96n,Xˉ+1.96n)\left(\bar{X}-\frac{1.96}{\sqrt{n}}, \bar{X}+\frac{1.96}{\sqrt{n}}\right)

Solution: D
n(xˉμ)N(0,1),P(u1α/2<n(xˉμ)<u1α/2)=1α\sqrt{n}(\bar{x}-\mu) \sim N(0,1), P\left(-u_{1-\alpha / 2}<\sqrt{n}(\bar{x}-\mu)<u_{1-\alpha / 2}\right)=1-\alpha, 即

P(xˉu1α/2n<μ<xˉ+u1α/2n)=1α,P\left(\bar{x}-\frac{u_{1-\alpha / 2}}{\sqrt{n}}<\mu<\bar{x}+\frac{u_{1-\alpha / 2}}{\sqrt{n}}\right)=1-\alpha,

代入 α=5%\alpha=5 \% 查表得 μ\mu 的双侧 95%95 \% 置信区间为 (xˉ1.96n,xˉ+1.96n)\left(\bar{x}-\frac{1.96}{\sqrt{n}}, \bar{x}+\frac{1.96}{\sqrt{n}}\right), D 正确.

  1. 假设其他条件不变,把置信度 α\alpha2.5%2.5 \% 升到 5%5 \%, 则总体均值 μ\mu 的置信程度为 1α1-\alpha 的置信区间的 宽度将()
    (A) 变长
    (B) 不变
    (C) 变短
    (D) 可能变长, 也可能变短

Solution: C
由 18 题解析可知,置信区间宽度为 2u1α/2n\frac{2 u_{1-\alpha / 2}}{\sqrt{n}}, 当 α\alpha2.5%2.5 \% 升到 5%5 \% 时, u1α/2u_{1-\alpha / 2} 减小, 故置信区间变短, C\mathrm{C} 正确.

  1. X1,,XnX_{1}, \ldots, X_{n} 为正态分布 N(μ1,σ2)\mathrm{N}\left(\mu_{1}, \sigma^{2}\right) 的简单随机样本, Y1,,YnY_{1}, \ldots, Y_{n} 为正态分布 N(μ2,σ2)\mathrm{N}\left(\mu_{2}, \sigma^{2}\right) 的简单随机样 本。若采用方差分析检验: H0:μ1=μ2,H1:μ1μ2\mathrm{H}_{0}: \mu_{1}=\mu_{2}, \mathrm{H}_{1}: \mu_{1} \neq \mu_{2}, 检验统计量为 F=MSBMSWF=\frac{\mathrm{MSB}}{\mathrm{MSW}}, 其中组间方差MSB为 ( )
    (A) n(XˉYˉ)22\frac{n(\bar{X}-\bar{Y})^{2}}{2}
    (B) (XˉYˉ)22\frac{(\bar{X}-\bar{Y})^{2}}{2}
    (C) (XˉYˉ)2(\bar{X}-\bar{Y})^{2}
    (D) i=1n[(XiXˉ)2+(YiYˉ)2]2n2\frac{\sum_{i=1}^{n}\left[\left(X_{i}-\bar{X}\right)^{2}+\left(Y_{i}-\bar{Y}\right)^{2}\right]}{2 n-2}

Solution: A

MSB=SSBr1=n(XˉXˉ+Yˉ2)2+n(YˉXˉ+Yˉ2)221=n(XˉYˉ)22\mathrm{MSB}=\frac{\mathrm{SSB}}{r-1}=\frac{n\left(\bar{X}-\frac{\bar{X}+\bar{Y}}{2}\right)^{2}+n\left(\bar{Y}-\frac{\bar{X}+\bar{Y}}{2}\right)^{2}}{2-1}=\frac{n(\bar{X}-\bar{Y})^{2}}{2}

故 A 正确.

二、(22 分) 已知样本空间 Ω={ω1,ω2},P({ω1})=13,P({ω2})=23\Omega=\left\{\omega_{1}, \omega_{2}\right\}, \mathrm{P}\left(\left\{\omega_{1}\right\}\right)=\frac{1}{3}, \mathrm{P}\left(\left\{\omega_{2}\right\}\right)=\frac{2}{3}. 随机变量 ξ(ω1)=0,ξ(ω2)=\xi\left(\omega_{1}\right)=0, \xi\left(\omega_{2}\right)= 1; 随机变量 η(ω1)=2,η(ω2)=1\eta\left(\omega_{1}\right)=2, \eta\left(\omega_{2}\right)=1.
(1) (6 分) 写出 (ξ,η)(\xi, \eta) 联合分布律.
(2) (6 分) 求随机变量 ξ,η\xi, \eta 相关系数.
(3) (4 分) 写出随机变量 ξ\xiη\eta 的关系.
(4) (6 分) 求 ξη\xi-\etaξη\xi \cdot \eta 的概率分布.

Solution:
(1)
(η,ξ)(\eta, \xi) 的联合分布律如下:

(η,ξ)(\eta, \xi) ξ=0\xi=0 ξ=1\xi=1
η=1\eta=1 00 2/32 / 3
η=2\eta=2 1/31 / 3 0

(2)
P(ξη=1)=23,P(ξη=0)=13,E(ξη)=23P(\xi \eta=1)=\frac{2}{3}, P(\xi \eta=0)=\frac{1}{3}, E(\xi \eta)=\frac{2}{3}
P(ξ=0)=13,P(ξ=1)=23,E(ξ)=23,E(ξ2)=23,D(ξ)=29P(\xi=0)=\frac{1}{3}, P(\xi=1)=\frac{2}{3}, E(\xi)=\frac{2}{3}, E\left(\xi^{2}\right)=\frac{2}{3}, D(\xi)=\frac{2}{9}
P(η=1)=23,P(η=2)=13,E(η)=43,E(η2)=2,D(η)=29P(\eta=1)=\frac{2}{3}, P(\eta=2)=\frac{1}{3}, E(\eta)=\frac{4}{3}, E\left(\eta^{2}\right)=2, D(\eta)=\frac{2}{9}
Cov(ξ,η)=E(ξη)E(ξ)E(η)=2323×43=29\operatorname{Cov}(\xi, \eta)=E(\xi \eta)-E(\xi) E(\eta)=\frac{2}{3}-\frac{2}{3} \times \frac{4}{3}=-\frac{2}{9}
ρξη=Cov(ξ,η)D(ξ)×D(η)=2929×29=1\rho_{\xi \eta}=\frac{\operatorname{Cov}(\xi, \eta)}{\sqrt{D(\xi) \times D(\eta)}}=\frac{-\frac{2}{9}}{\sqrt{\frac{2}{9}} \times \sqrt{\frac{2}{9}}}=-1

(3)
因为 ρξη=1\rho_{\xi \eta}=-1, 所以 a<0,bR,ξ=aη+b\exists a<0, b \in R, \xi=a \eta+b, 由(1)的分布列可以看出, ξ+η=2\xi+\eta=2.

(4)
P(ξη=2)=13,P(ξη=0)=23P(\xi-\eta=-2)=\frac{1}{3}, P(\xi-\eta=0)=\frac{2}{3}, 故 ξη\xi-\eta 的概率分布是

ξη\xi-\eta 2-2 00
pp 1/31 / 3 2/32 / 3

P(ξη=1)=23,P(ξη=0)=13P(\xi \eta=1)=\frac{2}{3}, P(\xi \eta=0)=\frac{1}{3}, 故 ξη\xi \eta 的概率分布是

ξη\xi \eta 00 11
pp 1/31 / 3 2/32 / 3

三、(26 分)设总体 XX 密度函数为 f(x;θ)=e(xθ),xθf(x ; \theta)=e^{-(x-\theta)}, x \geq \theta, 其中 θ(,+)\theta \in(-\infty,+\infty) 为未知参数. X1,X2,,XnX_{1}, X_{2}, \ldots, X_{n} 为取自该总体的简单随机样本.
(1) (6 分) 求 θ\theta 的矩法估计量 θ^1\hat{\theta}_{1}.
(2) (10 分) 求 θ\theta 的最大似然法估计量 θ^2\hat{\theta}_{2}; 并求该总体分布的中位数的最大似然估计量.
(3) (10 分) 基于 θ^2\hat{\theta}_{2} 的分布, 构造 θ\theta 的一个置信水平为 95%95 \% 的置信区间.

Solution:
(1)

E(X)=θ+xe(xθ)dx=θ+1,E(X)=\int_{\theta}^{+\infty} x \cdot e^{-(x-\theta)} d x=\theta+1,

由矩法估计, 由替换原理, 得到 θ\theta 的矩法估计量 θ^1=xˉ1\hat{\theta}_{1}=\bar{x}-1
(2) 样本对应的似然函数是

L(θ)=i=1ne(xiθ)I{θx(1))=enθi=1nxiI{θ<x(1)},L(\theta)=\prod_{i=1}^{n} e^{-\left(x_{i}-\theta\right)} I_{\left\{\theta \leqslant x_{(1)}\right)}=e^{n \theta-\sum_{i=1}^{n} x_{i}} I_{\left\{\theta<x_{(1)}\right\}},

它在 θ\theta 的定义域在单调递减, 所以 θ\theta 的最大似然估计是 θ^2=x(1)\hat{\theta}_{2}=x_{(1)}.
设总体分布的中位数为 MM, 有

θMe(xθ)dx=12,\int_{\theta}^{M} e^{-(x-\theta)} d x=\frac{1}{2},

这说明 M=θ+ln2M=\theta+\ln 2, 由 MLE的不变性, 该总体分布的中位数的最大似然估计是

M^=x(1)+ln2.\hat{M}=x_{(1)}+\ln 2 .

(3) 因为 θ^2=X(1)\hat{\theta}_{2}=X_{(1)}, 且 θX(1)\theta \leq X_{(1)}, 因此单侧区间更为合理, θ^2\hat{\theta}_{2} 的概率密度函数是

fθ˙2(x)={nen(xθ),θ^2θ0, 其他 f_{\dot{\theta}_{2}}(x)=\left\{\begin{array}{lc} n e^{-n(x-\theta)}, & \hat{\theta}_{2} \geqslant \theta \\ 0, & \text { 其他 } \end{array}\right.

aa 使得 θanen(xθ)dx=0.95\int_{\theta}^{a} n e^{-n(x-\theta)} d x=0.95, 解得 a=θ+ln20na=\theta+\frac{\ln 20}{n}. 因此

P(θ<θ^2<θ+ln20n)=0.95=P(θ^2ln20n<θ<θ^2)P\left(\theta<\hat{\theta}_{2}<\theta+\frac{\ln 20}{n}\right)=0.95=P\left(\hat{\theta}_{2}-\frac{\ln 20}{n}<\theta<\hat{\theta}_{2}\right)

得到 θ\theta 的 95%的置信区间是 [x(1)ln20n,x(1)]\left[x_{(1)}-\frac{\ln 20}{n}, x_{(1)}\right].

四、(18 分) 设 X1,,XnX_{1}, \ldots, X_{n} 为伯努利分布Bernoulli (p)(p) 的简单随机样本, P(Xi=1)=p,P(Xi=0)=\mathrm{P}\left(X_{i}=1\right)=p, \mathrm{P}\left(X_{i}=0\right)= 1p1-p
(1) (8 分) 求 pp 的 Fisher 信息 I(p)\mathrm{I}(p).
(2) (10 分) 证明: nn1Xˉ(1Xˉ)\frac{n}{n-1} \bar{X}(1-\bar{X})p(1p)p(1-p) 最优无偏估计量.

Solution:
(1)
总体的概率函数为 f(x)=px(1p)1xf(x)=p^{x}(1-p)^{1-x}, 故 Fisher 信息量

I(p)=E(2lnf(x)p2)=E(xp2+1x(1p)2)=1p(1p).\begin{aligned} I(p) &=-E\left(\frac{\partial^{2} \ln f(x)}{\partial p^{2}}\right) \\ &=E\left(\frac{x}{p^{2}}+\frac{1-x}{(1-p)^{2}}\right) \\ &=\frac{1}{p(1-p)} . \end{aligned}

(2) 由指数族性质可知 xˉ\bar{x} 是充分完全统计量, 而

E(xˉ)=E(X)=p,D(xˉ)=D(X)n=p(1p)n,E(\bar{x})=E(X)=p, D(\bar{x})=\frac{D(X)}{n}=\frac{p(1-p)}{n},

同时有

E(xˉ2)=D(xˉ)+E2(xˉ)=p+(n1)p2nE\left(\bar{x}^{2}\right)=D(\bar{x})+E^{2}(\bar{x})=\frac{p+(n-1) p^{2}}{n}

所以 E(nn1xˉ(1xˉ))=n1n(E(xˉ)E(xˉ2))=p(1p)E\left(\frac{n}{n-1} \bar{x}(1-\bar{x})\right)=\frac{n-1}{n}\left(E(\bar{x})-E\left(\bar{x}^{2}\right)\right)=p(1-p), 又因为 xˉ\bar{x} 是充分完全统计量, 由 Lehmann-Scheffe 定理, n1nxˉ(1xˉ)\frac{n-1}{n} \bar{x}(1-\bar{x})p(1p)p(1-p) 的 UMVUE.

五、(24 分) 设 X1,,X5X_{1}, \ldots, X_{5} 为来自正态分布 N(0,θ)N(0, \theta) 的简单随机样本, Y1,,Y5Y_{1}, \ldots, Y_{5} 为来自正态分布 N(1,θ)N(1, \theta) 的简单随机样本. θ>0\theta>0 为未知参数. 令 T=i=15[Xi2+(Yi1)2]T=\sum_{i=1}^{5}\left[X_{i}^{2}+\left(Y_{i}-1\right)^{2}\right].
(1) (8分) 证明: TTθ\theta 的充分统计量。
(2) (10分) 给定显著性水平 α=0.05\alpha=0.05, 针对假设 H0:θ=1,H1:θ1\mathrm{H}_{0}: \theta=1, \mathrm{H}_{1}: \theta \neq 1 构建似然比检验。(注: 拒绝域的界值用分布的分位数表示即可)
(3) (6分) 写出上述检验的势 (功效) 函数 (power function).

Solution:
(1)
样本联合密度函数为

f(x1,,x5,y1,y5)=(2πθ)52e12θi=15xi2(2πθ)52e12θi=15(yi1)2=(2πθ)5e12θi=15[xi2+(yi1)2]\begin{aligned} f\left(x_{1}, \cdots, x_{5}, y_{1}, \cdots y_{5}\right) &=(2 \pi \theta)^{-\frac{5}{2}} e^{-\frac{1}{2 \theta} \sum_{i=1}^{5} x_{i}^{2}}(2 \pi \theta)^{-\frac{5}{2}} e^{-\frac{1}{2 \theta} \sum_{i=1}^{5}\left(y_{i}-1\right)^{2}} \\ &=(2 \pi \theta)^{-5} e^{-\frac{1}{2 \theta} \sum_{i=1}^{5}\left[x_{i}^{2}+\left(y_{i}-1\right)^{2}\right]} \end{aligned}

由因子分解定理知 TTθ\theta 的充分统计量.

(2)
似然函数为 L(θ)=(2πθ)5e12θTL(\theta)=(2 \pi \theta)^{-5} e^{-\frac{1}{2 \theta} T}, 取对数有

lnL=5ln(2πθ)T2θ\ln L=-5 \ln (2 \pi \theta)-\frac{T}{2 \theta}

θ\theta 求导并置 0 得 θ\theta 最大似然估计 θ^=T10\hat{\theta}=\frac{T}{10}, 则似然比为

λ=supθΘL(θ)supθΘ0L(θ)=L(θ^)L(1)=(10T)5eT25,\lambda=\frac{\sup _{\theta \in \Theta} L(\theta)}{\sup _{\theta \in \Theta_{0}} L(\theta)}=\frac{L(\hat{\theta})}{L(1)}=\left(\frac{10}{T}\right)^{5} e^{\frac{T}{2}-5},

即似然比检验由 {λc}\{\lambda \geqslant c\} 给出, 而 λ=(10T)5eT25\lambda=\left(\frac{10}{T}\right)^{5} e^{\frac{T}{2}-5} 关于 TT 先减后增, 故

{λc}={Ta}{Tb},\{\lambda \geqslant c\}=\{T \leq a\} \cup\{T \geq b\},

其中应有 a5ea2=b5eb2a^{5} e^{-\frac{a}{2}}=b^{5} e^{-\frac{b}{2}} 满足上式成立,为满足水平为 α\alpha ,还应满足

abχ102(t)dt=1α,\int_{a}^{b} \chi_{10}^{2}(t) d t=1-\alpha,

其中, χ102(x)\chi_{10}^{2}(x) 表明自由度为 10 的卡方分布的密度函数. 为方便, 我们直接取等尾, 即

a=χ0.0252(10),b=χ0.9752(10),a=\chi_{0.025}^{2}(10), \quad b=\chi_{0.975}^{2}(10),

所以该似然比检验的拒绝域为

W={Tχ0.0252(10)}{Tχ0.9752(10)}W=\left\{T \leqslant \chi_{0.025}^{2}(10)\right\} \cup\left\{T \geqslant \chi_{0.975}^{2}(10)\right\}

(3)
该检验的功效函数为

g(θ)=Pθ(Tχ0.0252(10))+Pθ(Tχ0.9752(10))=Pθ(Tθχ0.0252(10)θ)+Pθ(Tθχ0.9752(10)θ)=1χ0.0252(10)θχ0.9752(10)θχ102(x)dx\begin{aligned} g(\theta) &=P_{\theta}\left(T \leqslant \chi_{0.025}^{2}(10)\right)+P_{\theta}\left(T \geqslant \chi_{0.975}^{2}(10)\right) \\ &=P_{\theta}\left(\frac{T}{\theta} \leqslant \frac{\chi_{0.025}^{2}(10)}{\theta}\right)+P_{\theta}\left(\frac{T}{\theta} \geqslant \frac{\chi_{0.975}^{2}(10)}{\theta}\right) \\ &=1-\int_{\frac{\chi_{0.025}^{2}(10)}{\theta}}^{\frac{\chi_{0.975}^{2}(10)}{\theta}} \chi_{10}^{2}(x) d x \end{aligned}

其中, χ102(x)\chi_{10}^{2}(x) 表明自由度为 10 的卡方分布的密度函数.