中山大学-432统计学-2017年

一、选择题(每小题3分, 共60分)

  1. 在概率的公理化结构中, 把概率所满足的条件中的可列可加性换成有限可加性, 则下列概率的 性质中不成立的是 ( )
    (A) P()=0P(\emptyset)=0
    (B) 对任何事件 A,P(Aˉ)=1P(A)A, \mathrm{P}(\bar{A})=1-\mathrm{P}(A)
    (C) SnS_{n} 是一个单调不减的集序列, limnP(Sn)=P(limnSn)\lim _{n \rightarrow \infty} \mathrm{P}\left(S_{n}\right)=\mathrm{P}\left(\lim _{n \rightarrow \infty} S_{n}\right)
    (D) P(AB)P(A)+P(B)1\mathrm{P}(A B) \geq \mathrm{P}(A)+\mathrm{P}(B)-1

Solution: C
选项 A: P(Ω)=P(Ω+)=P(Ω)+P()=1P(\Omega)=P(\Omega+\varnothing)=P(\Omega)+P(\varnothing)=1, 由概率正则性和非负性可 知, P()=1, AP(\varnothing)=1, \mathrm{~A} 正确.
选项 B: P(Ω)=P(A+Aˉ)=P(A)+P(Aˉ)=1P(\Omega)=P(A+\bar{A})=P(A)+P(\bar{A})=1, B 正确.
选项 C: C 选项表示下连续性,可列可加性的充要条件为: 1) 有限可加性; 2)
下连续性, 有限可加性不可推出可列可加性, C\mathrm{C} 错误.
选项 D: P(AB)=P(A)+P(B)P(AB)1P(A \cup B)=P(A)+P(B)-P(A B) \leqslant 1, D 正确.

  1. 对任意两个随机事件 AABB, 必有 P(ABˉ)=(\mathrm{P}(A \cap \bar{B})=( )
    (A) P(A)P(B)\mathrm{P}(A)-\mathrm{P}(B)
    (B) P(A)P(B)+P(AB)\mathrm{P}(A)-\mathrm{P}(B)+\mathrm{P}(A B)
    (C) P(A)+P(B)\mathrm{P}(A)+\mathrm{P}(B)
    (D) P(A)P(AB)\mathrm{P}(A)-\mathrm{P}(A B)

Solution: 2.D 由于 P(AB)+P(ABˉ)=P(A),DP(A \cap B)+P(A \cap \bar{B})=P(A), \mathrm{D} 正确.

  1. 从 5 双不同的鞋子中任取 4 只, 其中恰有一双配对的概率是()
    (A) 2/32 / 3
    (B) 4/74 / 7
    (C) 2/72 / 7
    (D) 1/31 / 3

Solution: B
总的取法为 C104\mathrm{C}_{10}^{4} ,要使恰有一双配对,则可以先从 5 双鞋子中选取一双,共 5 种取法; 然后从剩下的鞋子中任取两双,共有 C42C_{4}^{2} 种取法; 最后从取出的两双鞋 子中各取一只, 每一双鞋子有两种取法, 则总共有四种取法, 因此所求概率为

5×C42×4C104=47\frac{5 \times C_{4}^{2} \times 4}{C_{10}^{4}}=\frac{4}{7}

B 正确.

  1. 如果你的水平略高于对手, 为保证比赛的胜利,你最期望以下哪种比赛规则()
    (A) 一局定输赢
    (B)三局两胜
    (C)五局三胜
    (D)不能确定

Solution: C
pp 表示某一局赢的概率 p+q=1,p>qp+q=1, p>q;

P(B)=C32p2q+p3>p=P(A)P(C)=C53p3q2+C54p4q+p5>P(B)\begin{aligned} P(B)&=C_{3}^{2} p^{2} q+p^{3}>p=P(A) \\ P(C)&=C_{5}^{3} p^{3} q^{2}+C_{5}^{4} p^{4} q+p^{5}>P(B) \end{aligned}

故选 C.

  1. 随机变量 X,YX, Y 均只能取 0,1 两个值。下面哪个选项不是与 “它们的相关系数为 0 ” 等价 ()
    (A) 随机变量 X,YX, Y 相互独立
    (B) P(X=1,Y=0)=P(X=1)P(Y=0)\mathrm{P}(X=1, Y=0)=\mathrm{P}(X=1) \mathrm{P}(Y=0)
    (C) P(X=0,Y=0)=P(X=0)P(Y=0)\mathrm{P}(X=0, Y=0)=\mathrm{P}(X=0) \mathrm{P}(Y=0)
    (D) E(XY)=0\mathrm{E}(X Y)=0

Solution: D
易证明 BC\mathrm{BC} 两项等价于 X,Y\mathrm{X}, \mathrm{Y} 相互独立,一个重要结论:若 X\mathrm{X}Y\mathrm{Y} 都服从于 两点分布, 则 XXYY 不相关和独立等价. 故 ABCA B C 正确.
对于 D\mathrm{D} 选项, 若 E(XY)=0E(X Y)=0, 则 ρXY=E(X)E(Y)D(X)D(Y)\rho_{X Y}=-\frac{E(X) E(Y)}{\sqrt{D(X) D(Y)}}, 故 E(XY)=0E(X Y)=0ρXY=0\rho_{X Y}=0 不等价, D 错误.

  1. 有两条蚕, 每条蚕的产卵数相互独立并服从泊松分布, 参数分别为 λ1\lambda_{1}λ2\lambda_{2} 。每个卵孵化成小蚕的 概率为 p(0<p<1)p(0<p<1), 且 “每个卵能孵化为小蚕与否” 相互独立。记两条蚕养活的小蚕总数为 YY, 则 (1) YY 服从的分布; (2)两条蚕总共能孵化小蚕数的期望分别是()
    (A) 泊松分布, (λ1+λ2)p\left(\lambda_{1}+\lambda_{2}\right) p
    (B) 泊松分布, λ1+λ2\lambda_{1}+\lambda_{2}
    (C) 二项分布, (λ1+λ2)p\left(\lambda_{1}+\lambda_{2}\right) p
    (D) 二项分布, λ1+λ2\lambda_{1}+\lambda_{2}

Solution: A
XX 为总产卵数, Zib(1,p)Z_{i} \sim b(1, p) 且相互独立, 由泊松分布可加性知,总产卵数 XP(λ1+λ2)X \sim \mathcal{P}\left(\lambda_{1}+\lambda_{2}\right), 且有

Y=Z1+Z2++ZX,Y = Z_1+Z_2+\cdots + Z_X,

考虑矩母函数

ψZ(t)=E[etZ1]=pet+1p=1+p(et1),\psi _Z\left( t \right) =E\left[ e^{tZ_1} \right] =pe^t+1-p=1+p\left( e^t-1 \right) ,

λ=λ1+λ2\lambda = \lambda_1 +\lambda_2, 由全期望公式, 有

E[etY]=n=0P(X=n)E[eZ1++ZnX=n]=n=0λnn!eλ(1+p(et1))n=eλn=0[λ(1+p(et1))]nn!=eλeλ(1+p(et1))=eλp(et1).\begin{aligned} E\left[ e^{tY} \right] &=\sum_{n=0}^{\infty}{P\left( X=n \right) E\left[ e^{Z_1+\cdots +Z_n}|X=n \right]}=\sum_{n=0}^{\infty}{\frac{\lambda ^n}{n!}e^{-\lambda}\left( 1+p\left( e^t-1 \right) \right) ^n}\\ &=e^{-\lambda}\sum_{n=0}^{\infty}{\frac{\left[ \lambda \left( 1+p\left( e^t-1 \right) \right) \right] ^n}{n!}}=e^{-\lambda}e^{\lambda \left( 1+p\left( e^t-1 \right) \right)}=e^{\lambda p\left( e^t-1 \right)}.\\ \end{aligned}

这恰好是 P(λp)=P((λ1+λ2)p)\mathcal{P}(\lambda p) =\mathcal{P}((\lambda_1+\lambda_2)p)的矩母函数, 因此 YP((λ1+λ2)p)Y\sim \mathcal{P}((\lambda_1+\lambda_2)p). 服从泊松分布, 期望是 (λ1+λ2)p(\lambda_1+\lambda_2)p.

  1. 甲盒中有 4 个白球, 1 个黑球; 乙盒中有 4 个白球, 3 个黑球。从甲盒中任取一球放入乙盒, 然后 再从乙盒中任取一球。则(1)在乙盒中取到的是白球的概率; (2)如果已知在乙盒中取到的是白球, 从 甲盒中取出放入乙盒中的也是白球的概率分别是()
    (A) 1/2,5/61 / 2,5 / 6
    (B) 3/5,5/63 / 5,5 / 6
    (C) 1/2,4/51 / 2,4 / 5
    (D) 3/5,4/53 / 5,4 / 5

Solution: B
AiA_{i} 表示第 i\mathrm{i} 次摸到白球, 则

P(A2)=P(A2A1)P(A1)+P(A2A1)P(A1)=58×45+12×15=35\begin{aligned} P\left(A_{2}\right) &=P\left(A_{2} \mid A_{1}\right) P\left(A_{1}\right)+P\left(A_{2} \mid \overline{A_{1}}\right) P\left(\overline{A_{1}}\right) \\ &=\frac{5}{8} \times \frac{4}{5}+\frac{1}{2} \times \frac{1}{5} \\ &=\frac{3}{5} \end{aligned}

P(A1A2)=P(A1A2)P(A2)=58×4535=56P\left(A_{1} \mid A_{2}\right)=\frac{P\left(A_{1} A_{2}\right)}{P\left(A_{2}\right)}=\frac{\frac{5}{8} \times \frac{4}{5}}{\frac{3}{5}}=\frac{5}{6}

故选 B.

  1. 英国《观察家报》和 Opinium 公司 2016 年 6 月初进行的联合民意调查显示, 40%40 \% 英国民众支持留 在欧盟。考虑一个由 600 名英国民众组成的随机样本, 以 XX 表示这 600 人中支持留在欧盟的人数。记 Φ(x)\Phi(x) 是标准正态分布的分布函数, 则 222<X<258222<X<258 的概率大约是 ()
    (A) 2Φ(1.5)12 \Phi(1.5)-1
    (B) 2Φ(1.5)2 \Phi(1.5)
    (C) 2Φ(2)2 \Phi(2)
    (D) 2Φ(2)12 \Phi(2)-1

Solution: A
Xb(600,0.4)X \sim b(600,0.4), 根据二项分布的正态近似可知 X\mathrm{X} 近似服从于 N(240,144)N(240,144),

P(222<X<258)=P(222240144<X240144<258240144)=Φ(1.5)Φ(1.5)=2Φ(1.5)1\begin{aligned} P(222<X<258) &=P\left(\frac{222-240}{\sqrt{144}}<\frac{X-240}{\sqrt{144}}<\frac{258-240}{\sqrt{144}}\right) \\ &=\Phi(1.5)-\Phi(-1.5) \\ &=2 \Phi(1.5)-1 \end{aligned}

故选 A.

  1. 设随机变量序列 XnX_{n} 几 乎处处收敛到随机变量 XX, 则下列说法不正确的是 ()
    (A) XnX_{n} 依概率收敛到 XX
    (B) XnX_{n} 依分布收敛到 XX
    (C) XnX_{n} 二阶矩收敛到 XX
    (D) Xn2X_{n}^{2} 几乎处处收敛到 X2X^{2}

Solution: C
选项 A: 几乎处处收敛可以推出依概率收敛, A 正确.
选项 B: 依概率收敛可以推出依分布收玫, B 正确.
选项 C: r\mathrm{r} 阶收玫与几乎处处收玫之间一般无法相互推出, 可参考如下反例
独立随机变量序列 P(Xn=0)=11n2,P(Xn=n)=1n2P\left(X_{n}=0\right)=1-\frac{1}{n^{2}}, P\left(X_{n}=n\right)=\frac{1}{n^{2}}, 显然有 Xna.s.0X_{n} \stackrel{a . s .}{\longrightarrow} 0, 但 是 EXn2=10E X_{n}^{2}=1 \nrightarrow 0.
选项 D: 若 f(x)f(x) 是连续函数, Xna.s,XX_{n} \stackrel{a . s,}{\longrightarrow} X, 则 f(Xn)a.s,f(X)f\left(X_{n}\right) \stackrel{a . s,}{\longrightarrow} f(X), D 正确.

  1. XXYY 均服从标准正态分布, 则 ()
    (A) XYX-Y 服从正态分布
    (B) X2+Y2X^{2}+Y^{2} 服从卡方分布
    (C) YXY \mid X 服从正态分布
    (D) X2X^{2} 服从卡方分布

Solution: D
X=YX=Y 时, 易知 ABC\mathrm{ABC} 都不正确, 由卡方分布的定义可知, X2χ2(1),DX^{2} \sim \chi^{2}(1), \mathrm{D} 正确.

  1. Xχ2(1),Yχ2(n)X \sim \chi^{2}(1), Y \sim \chi^{2}(n), 则 F=nX/YF=n X / Y 的分布是 ()
    (A) t(n)t(n)
    (B) F(1,n)F(1, n)
    (C) F(n,1)F(n, 1)
    (D)不能确定

Solution: D
X,YX, Y 的独立性未知, 无法判断 nXY\frac{n X}{Y} 的分布, 因此本题选 D.

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自标准正态分布 N(0,1)N(0,1) 的简单随机样本。令 Xˉ=i=1nXi/n\bar{X}=\sum_{i=1}^{n} X_{i} / n 为样本均值, S2=i=1n(XiXˉ)2/(n1)S^{2}=\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2} /(n-1) 为样本方差, 则 ()
    (A) nXˉ2S2F(1,n1)\frac{n \bar{X}^{2}}{S^{2}} \sim F(1, n-1)
    (B) nXˉ2χ2(n)n \bar{X}^{2} \sim \chi^{2}(n)
    (C) nS2χ2(n1)n S^{2} \sim \chi^{2}(n-1)
    (D) (n1)S2χ2(n)(n-1) S^{2} \sim \chi^{2}(n)

Solution: A
因为诸 XiX_{i} 相互独立, 服从标准正态分布, 故 xˉ\bar{x}s2s^{2} 相互独立, XˉN(0,1n),nXˉN(0,1),nXˉ2χ2\bar{X} \sim N\left(0, \frac{1}{n}\right), \sqrt{n} \bar{X} \sim N(0,1), n \bar{X}^{2} \sim \chi^{2} (1), 选项 B 错误. (n1)S2χ2(n1)(n-1) S^{2} \sim \chi^{2}(n-1), 故选项 C、D 错误.

nXˉ2S2=nXˉ21(n1)S2n1=χ2(1)1χ2(n1)n1F(1,n1),A 正确. \frac{n \bar{X}^{2}}{S^{2}}=\frac{\frac{n \bar{X}^{2}}{1}}{\frac{(n-1) S^{2}}{n-1}}=\frac{\frac{\chi^{2}(1)}{1}}{\frac{\chi^{2}(n-1)}{n-1}} \sim F(1, n-1), \mathrm{A} \text { 正确. }

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自均匀分布 U(1θ,1+θ)U(1-\theta, 1+\theta) 的简单随机样本, 其顺序统计量记为 X(1),,X(n)X_{(1)}, \cdots, X_{(n)}, 则 θ\theta 的充分统计量为 ()
    (A) X(1)X_{(1)}
    (B) X(n)X_{(n)}
    (C) maxi{Xi1}\max _{i}\left\{\left|X_{i}-1\right|\right\}
    (D) X(n)X(1)X_{(n)}-X_{(1)}

Solution: C
样本的似然函数为

L(θ)=(12θ)nI{1θ<xi<1+θ}=(12θ)nI{θ>max{xi1}}L(\theta)=\left(\frac{1}{2 \theta}\right)^{n} \mathbf{I}_{\left\{1-\theta<x_{i}<1+\theta\right\}}=\left(\frac{1}{2 \theta}\right)^{n} \mathbf{I}_{\left\{\theta>\max \left\{\left|x_{i}-1\right|\right\}\right\}}

由因子分解定理知: θ\theta 的充分统计量为: max{xi1}\max \left\{\left|x_{i}-1\right|\right\}.

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自指数分布 Exp(λ)\operatorname{Exp}(\lambda) 的简单随机样本, 密度函数为 f(x;λ)=λeλx,x>0f(x ; \lambda)=\lambda e^{-\lambda x}, x>0 。令 T=i=1nXi,Q=i=1n(XiXˉ)2T=\sum_{i=1}^{n} X_{i}, Q=\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}, 则 ()
    (A) TTQ/T2Q / T^{2} 独立
    (B) TTQQ 独立
    (C) TT 服从参数为 nλn \lambda 的指数分布
    (D) TT 服从参数为 λ/n\lambda / n 的指数分布

Solution: A
XX 不服从正态分布, 其样本均值与样本方差不独立, 选项 B 错误.
E(T)=nλ,D(T)=nλ2E(T)=\frac{n}{\lambda}, D(T)=\frac{n}{\lambda^{2}}, 参数为 nλn \lambda 的指数分布的期望为 1nλ\frac{1}{n \lambda}, 参数为 λn\frac{\lambda}{n} 的指 数分布的方差为 n2λ2\frac{n^{2}}{\lambda^{2}}, 故选项 CD\mathrm{C} 、 \mathrm{D} 错误.
因为 QT2\frac{Q}{T^{2}}λ\lambda 的辅助统计量, TT 是关于 λ\lambda 的充分完备统计量, 根据 Basu 定理 可知两者独立, 故选项 A 正确.

  1. 设样本 X1,,Xn(n2)X_{1}, \cdots, X_{n}(n \geq 2) 来自参数为 θ(>0)\theta(>0) 的泊松 (Poisson) 分布, 概率分布列为 f(x;θ)=f(x ; \theta)= θxeθx!,x=0,1,2,\frac{\theta^{x} e^{-\theta}}{x !}, x=0,1,2, \ldots 。令 Xˉ=i=1nXi/n\bar{X}=\sum_{i=1}^{n} X_{i} / n 为样本均值, S2=i=1n(XiXˉ)2/(n1)S^{2}=\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2} /(n-1) 为样本方差, 若 Y=aXˉ+(1a)S2,0a1Y=a \bar{X}+(1-a) S^{2}, 0 \leq a \leq 1θ\theta 的无偏估计, 则 ()
    (A) a=0a=0
    (B) a=1a=1
    (C) a=0.5a=0.5
    (D) 以上皆可

Solution: D

E(Xˉ)=E(Xi)=θ,E(S2)=D(Xi)=θE(\bar{X})=E\left(X_{i}\right)=\theta, E\left(S^{2}\right)=D\left(X_{i}\right)=\theta \text {, }

E(Y)=aE(Xˉ)+(1a)E(S2)=aθ+(1a)θ=θE(Y)=a E(\bar{X})+(1-a) E\left(S^{2}\right)=a \theta+(1-a) \theta=\theta, 于是 YY 恒为 θ\theta 的无 偏估计, 与 aa 的取值无关, 所以选项 D 正确.

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自均值为 0 , 方差为 σ2\sigma^{2} 的总体的简单随机样本, 令 Y=i=1nXi2,Q=Y=\sum_{i=1}^{n} X_{i}^{2}, Q= i=1n(XiXˉ)2\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}, 则下列说法正确的是 ()
    (A) Q/nQ / nσ2\sigma^{2} 的最大似然估计
    (B) Y/nY / nσ2\sigma^{2} 的最大似然估计
    (C) Q/nQ / nσ2\sigma^{2} 的无偏估计
    (D) Y/nY / nσ2\sigma^{2} 的无偏估计

Solution: D
题目没有给出总体的概率密度函数, 无法求出 σ2\sigma^{2} 的最大似然估计, 选项 A\mathrm{A} 、 B 错误.
E(Qn)=n1nσ2E\left(\frac{Q}{n}\right)=\frac{n-1}{n} \sigma^{2}, 选项 C\mathrm{C} 错误.
E(Yn)=1nE(i=1nXi2)=1n[i=1nDXi+i=1n(EXi)2]=1n(nσ2)=σ2E\left(\frac{Y}{n}\right)=\frac{1}{n} E\left(\sum_{i=1}^{n} X_{i}^{2}\right)=\frac{1}{n}\left[\sum_{i=1}^{n} D X_{i}+\sum_{i=1}^{n}\left(E X_{i}\right)^{2}\right]=\frac{1}{n}\left(n \sigma^{2}\right)=\sigma^{2}, 故选项 D 正确.

  1. X1,X2,X3X_{1}, X_{2}, X_{3} 为来自均值为 μ\mu 的总体的简单随机样本, 则下列 μ\mu 的估计量中方差最小的是 ()
    (A) 14X1+12X2+14X3\frac{1}{4} X_{1}+\frac{1}{2} X_{2}+\frac{1}{4} X_{3}
    (B) 45X1+25X215X3\frac{4}{5} X_{1}+\frac{2}{5} X_{2}-\frac{1}{5} X_{3}
    (C) 23X113X2+23X3\frac{2}{3} X_{1}-\frac{1}{3} X_{2}+\frac{2}{3} X_{3}
    (D) 12X1+13X2+16X3\frac{1}{2} X_{1}+\frac{1}{3} X_{2}+\frac{1}{6} X_{3}

Solution: 假设 XiX_{i} 的方差为 σ2\sigma^{2}, 四个选项的方差分别为:

Var(A)=(142+122+142)σ2=38σ2Var(B)=(4252+2252+152)σ2=2125σ2Var(C)=(2232+132+132)σ2=σ2\begin{gathered} \operatorname{Var}(A)=\left(\frac{1}{4^{2}}+\frac{1}{2^{2}}+\frac{1}{4^{2}}\right) \sigma^{2}=\frac{3}{8} \sigma^{2} \\ \operatorname{Var}(B)=\left(\frac{4^{2}}{5^{2}}+\frac{2^{2}}{5^{2}}+\frac{1}{5^{2}}\right) \sigma^{2}=\frac{21}{25} \sigma^{2} \\ \operatorname{Var}(C)=\left(\frac{2^{2}}{3^{2}}+\frac{1}{3^{2}}+\frac{1}{3^{2}}\right) \sigma^{2}=\sigma^{2} \end{gathered}

Var(D)=(122+132+162)σ2=718σ2\operatorname{Var}(D)=\left(\frac{1}{2^{2}}+\frac{1}{3^{2}}+\frac{1}{6^{2}}\right) \sigma^{2}=\frac{7}{18} \sigma^{2}

比较所得 A\mathrm{A} 选项方差最小, 所以选项 A\mathrm{A} 正确.

  1. X1,,X5X_{1}, \cdots, X_{5} 为来自均匀分布 U(0,θ)U(0, \theta) 的简单随机样本, 令 Y1=min{Xi},Y5=max{Xi}Y_{1}=\min \left\{X_{i}\right\}, Y_{5}=\max \left\{X_{i}\right\}, 则 θ\theta90%90 \% 置信区间为()
    (A) (Y10.955,Y10.055)\left(\frac{Y_{1}}{\sqrt[5]{0.95}}, \frac{Y_{1}}{\sqrt[5]{0.05}}\right)
    (B) (Y50.955,Y50.055)\left(\frac{Y_{5}}{\sqrt[5]{0.95}}, \frac{Y_{5}}{\sqrt[5]{0.05}}\right)
    (C) (Y10.95,Y50.95)\left(\begin{array}{cc}\frac{Y_{1}}{\sqrt[5]{0.9}}, & \frac{Y_{5}}{\sqrt[5]{0.9}}\end{array}\right)
    (D) (Y110.15,Y50.15)\left(\frac{Y_{1}}{1-\sqrt[5]{0.1}}, \frac{Y_{5}}{\sqrt[5]{0.1}}\right)

Solution: B
XiX_{i} 的概率密度函数: f(xi)={1θx(0,θ)0 其他 f\left(x_{i}\right)= \begin{cases}\frac{1}{\theta} & x \in(0, \theta) \\ 0 & \text { 其他 }\end{cases} 所以 Y5Y_{5} 的概率密度函数: fY5(y)={5y4θ5y(0,θ)0 其他 f_{Y_{5}}(y)=\left\{\begin{array}{cc}\frac{5 y^{4}}{\theta^{5}} & y \in(0, \theta) \\ 0 & \text { 其他 }\end{array}\right. , 故 Y5θ\frac{Y_{5}}{\theta} 为枢轴量, 其概率密度函数:

fY5θ(y)={5y4y(0,1)0 其他 f_{\frac{Y_{5}}{\theta}}(y)=\left\{\begin{array}{cc} 5 y^{4} & y \in(0,1) \\ 0 & \text { 其他 } \end{array}\right.

于是有 P(0.055<Y5θ<0.955)=0.9P\left(\sqrt[5]{0.05}<\frac{Y_{5}}{\theta}<\sqrt[5]{0.95}\right)=0.9, 反解得到置信区间

(Y50.955,Y50.055)\left(\frac{Y_{5}}{\sqrt[5]{0.95}}, \frac{Y_{5}}{\sqrt[5]{0.05}}\right)

[注]: 于情于理, 这里是不该用等尾的.

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自正态总体 N(μ,1)N(\mu, 1) 的简单随机样本, 令 Xˉ=i=1nXi/n\bar{X}=\sum_{i=1}^{n} X_{i} / n 为样本均值。针对假设 H0:μ0\mathrm{H}_{0}: \mu \leq 0 v.s. H1:μ>0\mathrm{H}_{1}: \mu>0, 显著性水平 α=0.05\alpha=0.05, 拒绝域为( )
    (A) nXˉ<1.96\sqrt{n} \bar{X}<-1.96
    (B) nXˉ>1.96\sqrt{n} \bar{X}>1.96
    (C) nXˉ<1.64\sqrt{n} \bar{X}<-1.64
    (D) nXˉ>1.64\sqrt{n} \bar{X}>1.64

Solution: D
XˉN(μ,1n)\bar{X} \sim N\left(\mu, \frac{1}{n}\right), 在该假设下,拒绝域为: nXˉ>z0.95,z0.95=1.64\sqrt{n} \bar{X}>z_{0.95}, z_{0.95}=1.64.

  1. 线性模型 Yi=aXi+ei,i=1,,n,ei,i=1,,nY_{i}=a X_{i}+e_{i}, i=1, \ldots, n, e_{i}, i=1, \ldots, n 独立同分布于正态分布 N(0,σ2)N\left(0, \sigma^{2}\right) 。令 Xˉ=i=1nXi/n,Yˉ=i=1nYi/n\bar{X}=\sum_{i=1}^{n} X_{i} / n, \bar{Y}=\sum_{i=1}^{n} Y_{i} / naa 的最大似然估计是 ()
    (A) Xˉ\bar{X}
    (B) Yˉ\bar{Y}
    (C) i=1n(XiXˉ)(YiYˉ)i=1n(XiXˉ)2\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)\left(Y_{i}-\bar{Y}\right)}{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}
    (D) i=1nxiYii=1nxi2\frac{\sum_{i=1}^{n} x_{i} Y_{i}}{\sum_{i=1}^{n} x_{i}^{2}}

Solution: D
eiN(0,σ2)e_{i} \sim N\left(0, \sigma^{2}\right), 所以 YiN(axi,σ2)Y_{i} \sim N\left(a x_{i}, \sigma^{2}\right), 所以似然函数为:

L(y1yna)=i=1n12πσe(yiαxi)22σ2=(12πδ)nei=1n(yiaxi)22σ2L\left(y_{1} \ldots y_{n} \mid a\right)=\prod_{i=1}^{n} \frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{\left(y_{i}-\alpha x_{i}\right)^{2}}{2 \sigma^{2}}}=\left(\frac{1}{\sqrt{2 \pi} \delta}\right)^{n} e^{-\frac{\sum_{i=1}^{n}\left(y_{i}-a x_{i}\right)^{2}}{2 \sigma^{2}}}

取对数并关于 aa 求偏导置 0 , 解得

a^=i=1nXiYii=1nXi2\hat{a}=\frac{\sum_{i=1}^{n} X_{i} Y_{i}}{\sum_{i=1}^{n} X_{i}^{2}}

二、(24 分) 设随机向量 (X,Y)(X, Y) 的联合密度为

f(x,y)=12(x+y)e(x+y),x>0,y>0.f\left( x,y \right) =\frac{1}{2}\left( x+y \right) e^{-\left( x+y \right)},x>0,y>0.

(1) (8 分) 求 X=0.5X=0.5 时, YY 的条件密度 f(yx=0.5)f(y \mid x=0.5)
(2) (8 分) 求 XXYY 的相关系数 ρ\rho
(3) (8 分) 求 Z=X+YZ=X+Y 的密度函数。

Solution:
(1) 当 x>0x>0 时,

fX(x)=0+f(x,y)dy=0+12(x+y)e(x+y)dy=120+xe(x+y)dy+120+ye(x+y)dy=12xex+12ex\begin{aligned} f_{X}(x) &=\int_{0}^{+\infty} f(x, y) d y \\ &=\int_{0}^{+\infty} \frac{1}{2}(x+y) e^{-(x+y)} d y \\ &=\frac{1}{2} \int_{0}^{+\infty} x e^{-(x+y)} d y+\frac{1}{2} \int_{0}^{+\infty} y e^{-(x+y)} d y=\frac{1}{2} x e^{-x}+\frac{1}{2} e^{-x} \end{aligned}

同理,当 y>0y>0 时,

fY(y)=0+f(x,y)dx=12yey+12ey\begin{aligned} f_{Y}(y) &=\int_{0}^{+\infty} f(x, y) d x \\ &=\frac{1}{2} y e^{-y}+\frac{1}{2} e^{-y} \end{aligned}

于是 fYX(yx)=f(x,y)fX(x)=x+yx+1ey,x>0,y>0f_{Y \mid X}(y \mid x)=\frac{f(x, y)}{f_{X}(x)}=\frac{x+y}{x+1} e^{-y}, x>0, y>0, 代入 x=0.5x=0.5

fYX(yx=0.5)=1+2y3ey,y>0f_{Y \mid X}(y \mid x=0.5)=\frac{1+2 y}{3} e^{-y}, y>0

(2)

E(X)=0+12x(x+1)exdx=12Γ(3)+12Γ(2)=32E(X)=\int_{0}^{+\infty} \frac{1}{2} x(x+1) e^{-x} d x=\frac{1}{2} \Gamma(3)+\frac{1}{2} \Gamma(2)=\frac{3}{2}

E(X2)=0+12x2(x+1)exdx=12Γ(4)+12Γ(3)=4E\left(X^{2}\right)=\int_{0}^{+\infty} \frac{1}{2} x^{2}(x+1) e^{-x} d x=\frac{1}{2} \Gamma(4)+\frac{1}{2} \Gamma(3)=4

同理, E(Y)=32,E(Y2)=4E(Y)=\frac{3}{2}, E\left(Y^{2}\right)=4.
所以 D(X)=D(Y)=74D(X)=D(Y)=\frac{7}{4}

E(XY)=xyf(x,y)dxdy=120+yeydy0+(x2+xy)exdx=0+yeydy+120+y2eydy=2\begin{aligned} E(X Y) &=\iint x y f(x, y) d x d y \\ &=\frac{1}{2} \int_{0}^{+\infty} y e^{-y} d y \int_{0}^{+\infty}\left(x^{2}+x y\right) e^{-x} d x \\ &=\int_{0}^{+\infty} y e^{-y} d y+\frac{1}{2} \int_{0}^{+\infty} y^{2} e^{-y} d y \\ &=2 \end{aligned}

于是 Cov(X,Y)=E(XY)E(X)E(Y)=14\operatorname{Cov}(X, Y)=E(X Y)-E(X) E(Y)=-\frac{1}{4}, 从而

ρ=Cov(X,Y)D(X)D(Y)=17\rho=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X) D(Y)}}=-\frac{1}{7}

(3)
z0z \leqslant 0 时, f(z)=0f(z)=0
z>0z > 0 时,

f(z)=+f(x,zx)dx=0z12zezdx=12z2ez\begin{aligned} f(z) &=\int_{-\infty}^{+\infty} f(x, z-x) d x \\ &=\int_{0}^{z} \frac{1}{2} z e^{-z} d x \\ &=\frac{1}{2} z^{2} e^{-z} \end{aligned}

所以

f(z)={12z2ezz>00z0f(z)=\left\{\begin{array}{cc} \frac{1}{2} z^{2} e^{-z} & z>0 \\ 0 & z \leqslant 0 \end{array}\right.

三、 (24 分) 设 X1,,XnX_1, \cdots, X_n 来自以下总体, 其密度函数为

f(x;α,β)={αxα1βα,0<xβ,0, 其他. f(x ; \alpha, \beta)=\left\{\begin{array}{cc} \frac{\alpha x^{\alpha-1}}{\beta^\alpha}, & 0<x \leq \beta, \\ 0, & \text { 其他. } \end{array}\right.

其中 α(>0)\alpha(>0)β(>0)\beta(>0) 为末知参数。
(1) (6 分) 求总体的期望以及方差。
(2) (8 分) 写出 α\alphaβ\beta 的充分统计量。
(3) (10 分) 求 α\alphaβ\beta 的最大似然估计量。

Solution:
(1)

E(X)=0βαβαxαdx=αα+1βE(X2)=0βαβαxα+1dx=αα+2β2D(X)=E(X2)E2(X)=αβ2(α+1)2(α+2)\begin{gathered} E(X)=\int_{0}^{\beta} \frac{\alpha}{\beta^{\alpha}} x^{\alpha} d x=\frac{\alpha}{\alpha+1} \beta \\ E\left(X^{2}\right)=\int_{0}^{\beta} \frac{\alpha}{\beta^{\alpha}} x^{\alpha+1} d x=\frac{\alpha}{\alpha+2} \beta^{2} \\ D(X)=E\left(X^{2}\right)-E^{2}(X)=\frac{\alpha \beta^{2}}{(\alpha+1)^{2}(\alpha+2)} \end{gathered}

(2)

f(x1,x2xn;α,β)=i=1nαxiα1βαI(0<xiβ)=αnβnα(i=1nxi)α1I(x(w)β)\begin{aligned} f\left(x_{1}, x_{2} \cdots x_{n} ; \alpha, \beta\right) &=\prod_{i=1}^{n} \frac{\alpha x_{i}^{\alpha-1}}{\beta^{\alpha}} I_{\left(0<x_{i} \leqslant \beta\right)} \\ &=\frac{\alpha^{n}}{\beta^{n \alpha}}\left(\prod_{i=1}^{n} x_{i}\right)^{\alpha-1} I_{\left(x_{(w)} \leqslant \beta\right)} \end{aligned}

由因子分解定理得, α\alphaβ\beta 的充分统计量为 (i=1nXi,X(n))\left(\prod_{i=1}^{n} X_{i}, X_{(n)}\right).
(3)
似然函数

L(α,β)=i=1nαβαxiα1=αnβnα(i=1nxi)α1L(\alpha, \beta)=\prod_{i=1}^{n} \frac{\alpha}{\beta^{\alpha}} x_{i}^{\alpha-1}=\frac{\alpha^{n}}{\beta^{n \alpha}}\left(\prod_{i=1}^{n} x_{i}\right)^{\alpha-1}

取对数得

lnL=nlnαnαlnβ+(α1)i=1nlnxi\ln L=n \ln \alpha-n \alpha \ln \beta+(\alpha-1) \sum_{i=1}^{n} \ln x_{i}

关于两个参数求偏导

{lnLα=nαnlnβ+i=1nlnxi=0lnLβ=nαβ<0\left\{\begin{array}{l} \frac{\partial \ln L}{\partial \alpha}=\frac{n}{\alpha}-n \ln \beta+\sum_{i=1}^{n} \ln x_{i}=0 \\ \frac{\partial \ln L}{\partial \beta}=-\frac{n \alpha}{\beta}<0 \end{array}\right.

其中关于 β\beta 的偏导恒负, 而 βX(n)\beta \geqslant X_{(n)}, 所以 β^=X(n)\hat{\beta}=X_{(n)}β\beta 的最大似然估计. 而将关于 α\alpha 的偏导置零,再代入 β^=X(n)\hat{\beta}=X_{(n)}, 解得 α^=nnlnX(n)i=1nlnXi\hat{\alpha}=\frac{n}{n \ln X_{(n)}-\sum_{i=1}^{n} \ln X_{i}}α\alpha 的最大似然估计.

四、(24 分) 设样本 X1,,Xn(n2)X_1, \cdots, X_n(n \geq 2) 来自参数为 θ(>0)\theta(>0) 的泊松 (Poisson) 分布, 概率分布列为 f(x;θ)=θxeθx!,x=0,1,2,f(x ; \theta)=\frac{\theta^x e^{-\theta}}{x !}, x=0,1,2, \ldotsg(θ)=eθ,Y=I(X1=0)g(\theta)=e^{-\theta}, Y=\mathrm{I}\left(X_1=0\right), 其中 I\mathrm{I} 为示性函数。
(1) (6 分) 求 g(θ)g(\theta) 的最大似然估计量。
(2) (8 分) 证明 YYg(θ)g(\theta) 的无偏估计量。
(3) (10 分) 求 g(θ)g(\theta) 的最小方差无偏估计量。

Solution:
(1) 似然函数为: L(x1xnθ)=enθi=1n(θxixi!)L\left(x_{1} \ldots x_{n} \mid \theta\right)=e^{-n \theta} \prod_{i=1}^{n}\left(\frac{\theta^{x_{i}}}{x_{i} !}\right)
两边取对数: lnL=nθ+lnθi=1nxii=1nln(xi!)\ln L=-n \theta+\ln \theta \sum_{i=1}^{n} x_{i}-\sum_{i=1}^{n} \ln \left(x_{i} !\right), 对 θ\theta 求导并置 0 , 有

lnLθ=n+i=1nxiθ=0\frac{\partial \ln L}{\partial \theta}=-n+\frac{\sum_{i=1}^{n} x_{i}}{\theta}=0

解得 θ\theta 的最大似然估计 θ^=xˉ\hat{\theta}=\bar{x}, 再由最大似然估计的不变性可得 g(θ)g(\theta) 的的 最大似然估计: exˉe^{-\bar{x}}.
(2)
E(Y)=P(X1=0)=eθ=g(θ)E(Y)=P\left(X_{1}=0\right)=e^{-\theta}=g(\theta), 所以 YYg(θ)g(\theta) 的无偏估计量.
(3)
根据因子分解定理以及指数族分布的性质, 由 1)中的似然函数可看出:
i=1nXi\sum_{i=1}^{n} X_{i} 是充分完备统计量. 而 E(Y)=E[E(Yi=1nXi)]=g(θ)E(Y)=E\left[E\left(Y \mid \sum_{i=1}^{n} X_{i}\right)\right]=g(\theta), 故 E(Yi=1nXi)E\left(Y \mid \sum_{i=1}^{n} X_{i}\right) 是 无偏估计.
由 Lehmann-Scheffe 定理知 E(Yi=1nXi)E\left(Y \mid \sum_{i=1}^{n} X_{i}\right)g(θ)g(\theta) 的最小方差无偏估计量, 进一步计算, 得

E(Yi=1nXi)=P(X1=0T=t)=P(x1=0)P(i=2nxi=t)P(i=1nxi=t)=θ0eθ[(n1)θ]t0e(n1)θ(t0)!(nθ)tenθt!=(n1n)i=1nxi\begin{aligned} E\left(Y \mid \sum_{i=1}^{n} X_{i}\right) &=P\left(X_{1}=0 \mid T=t\right) \\ =& \frac{P\left(x_{1}=0\right) P\left(\sum_{i=2}^{n} x_{i}=t\right)}{P\left(\sum_{i=1}^{n} x_{i}=t\right)} \\ &=\frac{\theta^{0} e^{-\theta} \frac{[(n-1) \theta]^{t-0} e^{-(n-1) \theta}}{(t-0) !}}{\frac{(n \theta)^{t} e^{-n \theta}}{t !}}=\left(\frac{n-1}{n}\right)^{\sum_{i=1}^{n} x_{i}} \end{aligned}

所以 g(θ)g(\theta) 的最小方差无偏估计: (n1n)i=1nxi\left(\frac{n-1}{n}\right)^{\sum_{i=1}^{n} x_{i}}.

五、(18 分)设 X1,,X9X_1, \cdots, X_9 为来自正态总体 N(μ1,1)N\left(\mu_1, 1\right) 的简单随机样本, Y1,,Y16Y_1, \cdots, Y_{16} 为来自正态总体 N(μ2,1)N\left(\mu_2, 1\right) 的简单随机样本, 且两样本独立。针对假设 H0:μ1=μ2=0\mathrm{H}_0: \mu_1=\mu_2=0 v.s. H1:μ10\mathrm{H}_1: \mu_1 \neq 0μ20\mu_2 \neq 0
(1) (8 分) 若给出拒绝域为 C={XˉYˉ>b}C=\{|\bar{X}-\bar{Y}|>b\}, 求常数 bb, 使其显著性水平 α=0.05\alpha=0.05
(2) (10 分) 给定显著性水平 α=0.05\alpha=0.05, 请构建似然比检验。要求: 写出似然比统计量, 并把它 表示为一个服从 χ2\chi^2 分布的统计量 TT 的函数形式,并以 TT 的形式给出拒绝域。

Solution: (1) 由题意可知 XˉYˉN(μ1μ2,25144)\bar{X}-\bar{Y} \sim N\left(\mu_{1}-\mu_{2}, \frac{25}{144}\right), 对于所给假设, 检验的拒绝域为:

T={XˉYˉ>512z0.975},T=\left\{|\bar{X}-\bar{Y}|>\frac{5}{12} z_{0.975}\right\},

由所给数据可知: Z0.975=1.96Z_{0.975}=1.96. 所以有 b=512×196100=4960b=\frac{5}{12} \times \frac{196}{100}=\frac{49}{60}.
(2) (X,Y)(X, Y) 的联合概率密度函数: f(x,y)=12πe(xμ1)2+(yμ2)22f(x, y)=\frac{1}{2 \pi} e^{-\frac{\left(x-\mu_{1}\right)^{2}+\left(y-\mu_{2}\right)^{2}}{2}}, 则似然函数为

L(x1x9,y1y16μ1,μ2)=i=1912πe(xiμ1)22i=11612πe(yiμ2)22L\left(x_{1} \ldots x_{9}, y_{1} \cdots y_{16} \mid \mu_{1} ,\mu_{2}\right)=\prod_{i=1}^{9} \frac{1}{\sqrt{2 \pi}} e^{-\frac{\left(x_{i}-\mu_{1}\right)^{2}}{2}} \prod_{i=1}^{16} \frac{1}{\sqrt{2 \pi}} e^{\frac{\left(y_{i}-\mu_{2}\right)^{2}}{2}}

取对数并分别对 μ1,μ2\mu_{1}, \mu_{2} 求偏导并置 0 , 得似然方程组

lnLμ1=i=19(xiμ1)=0lnLμ2=i=116(yiμ2)=0\begin{aligned} &\frac{\partial \ln L}{\partial \mu_{1}}=\sum_{i=1}^{9}\left(x_{i}-\mu_{1}\right)=0 \\ &\frac{\partial \ln L}{\partial \mu_{2}}=\sum_{i=1}^{16}\left(y_{i}-\mu_{2}\right)=0 \end{aligned}

解得 μ1,μ2\mu_{1}, \mu_{2} 的无约束最大似然估计分别为 μ^1=i=19Xi9,μ^2=j=116Yj16\hat{\mu}_{1}=\frac{\sum_{i=1}^{9} X_{i}}{9}, \hat{\mu}_{2}=\frac{\sum_{j=1}^{16} Y_{j}}{16}.
而在约束 μ1=μ2=0\mu_{1}=\mu_{2}=0 下, μ1,μ2\mu_{1}, \mu_{2} 的约束最大似然估计均为 μ^0=0\hat{\mu}_{0}=0, 于是似然比统计量为

Λ=L(μ^0,μ^0)L(μ^1,μ^2)=(12π)225e12[i=19(xi)2+i=116(yi)2](12π)225e12[i=19(xiμ^1)2+i=116(yiμ^2)2]=e12(9Xˉ2+16Yˉ2)\begin{aligned} \Lambda &=\frac{L\left(\hat{\mu}_{0}, \hat{\mu}_{0}\right)}{L\left(\hat{\mu}_{1}, \hat{\mu}_{2}\right)} \\ &=\frac{\left(\frac{1}{2 \pi}\right)^{\frac{2}{25}} e^{-\frac{1}{2}\left[\sum_{i=1}^{9}\left(x_{i}\right)^{2}+\sum_{i=1}^{16}\left(y_{i}\right)^{2}\right]}}{\left(\frac{1}{2 \pi}\right)^{\frac{2}{25}} e^{-\frac{1}{2}\left[\sum_{i=1}^{9}\left(x_{i}-\hat{\mu}_{1}\right)^{2}+\sum_{i=1}^{16}\left(y_{i}-\hat{\mu}_{2}\right)^{2}\right]}} \\ &=e^{-\frac{1}{2}\left(9 \bar{X}^{2}+16 \bar{Y}^{2}\right)} \end{aligned}

若记 T=9Xˉ2+16Yˉ2T=9 \bar{X}^{2}+16 \bar{Y}^{2}, 根据指数函数的单调性, 可将似然比拒绝域写为 {Λ<λ0}={T>c}\left\{\Lambda<\lambda_{0}\right\}=\{T>c\}. 这里 cc 使得检验的水平是 0.050.05.
又因为 XˉN(0,19),YˉN(0,116)\bar{X} \sim N\left(0, \frac{1}{9}\right), \bar{Y} \sim N\left(0, \frac{1}{16}\right), 且它们是相互独立的, 所以

T=9Xˉ2+16Yˉ2χ2(2)T=9 \bar{X}^{2}+16 \bar{Y}^{2} \sim \chi^{2}(2)

因此似然比拒绝域是 {9Xˉ2+16Yˉ2>χ0.952(2)}\left\{9 \bar{X}^{2}+16 \bar{Y}^{2}>\chi^2_{0.95}(2)\right\}. 结合 χ2(2)\chi^2(2) 就是 Exp(1/2)Exp(1/2) 的事实, 解得 χ0.952(2)=ln0.05\chi_{0.95}^2(2)=-\ln 0.05.