中山大学-432统计学-2020年

一、选择题(每小题3分, 共30分)

  1. 在 6 对夫妻中任选 4 人, 则至少有一对夫妻被选中的概率为 ( ).
    (A) C61C102C124\frac{C_{6}^{1} C_{10}^{2}}{C_{12}^{4}};
    (B) 24C64C124\frac{2^{4} C_{6}^{4}}{C_{12}^{4}};
    (C) C64C124\frac{C_{6}^{4}}{C_{12}^{4}};
    (D) 124C64C1241-\frac{2^{4}C_{6}^{4}}{C_{12}^{4}}.

Solution: D
考虑对立事件 Aˉ=\bar{A}= “没有一对夫支被选中”. 对于样本空间 Ω\Omega, 有# Ω=C124\Omega=C_{12}^{4}, 而# Aˉ=24C64\bar{A}=2^{4} C_{6}^{4}, 因此

P(A)=124C64C124P(A)=1-\frac{2^{4} C_{6}^{4}}{C_{12}^{4}}

  1. A,B,CA, B, C 都是事件. 又 AABB 独立, BBCC 独立, AACC 互不相容. P(A)=1/2,P(B)=1/4,P(C)=1/8P(A)=1 / 2, P(B)=1 / 4, P(C)=1 / 8. 则概率 P(ABC)P(A \cup B \cup C) 为 ( ).
    (A) 23/3323 / 33;
    (B) 23/3223 / 32;
    © 11/16;
    (D) 2/32 / 3.

Solution: B
根据题意, 有

P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(AC)+P(ABC)=P(A)+P(B)+P(C)P(A)P(B)P(B)P(C)=12+14+1812×1414×18=2332\begin{aligned} P(A \cup B \cup C) &=P(A)+P(B)+P(C)-P(A B)-P(B C)-P(A C)+P(A B C) \\ &=P(A)+P(B)+P(C)-P(A) P(B)-P(B) P(C) \\ &=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}-\frac{1}{2} \times \frac{1}{4}-\frac{1}{4} \times \frac{1}{8} \\ &=\frac{23}{32} \end{aligned}

故 B 选项正确.

  1. 将一枚硬币独立地掷两次, 引进事件: A1={A_{1}=\{ 第一次出现正面 },A2={\}, A_{2}=\{ 第 二次出现正面 },A3={\}, A_{3}=\{ 正、反面各出现一次 },A4={\}, A_{4}=\{ 正面出现两次 }\}, 则 ( ).
    (A) A1,A2,A3A_{1}, A_{2}, A_{3} 两两独立;
    (B) A1,A2,A3A_{1}, A_{2}, A_{3} 相互独立;
    (C) A2,A3,A4A_{2}, A_{3}, A_{4} 两两独立;
    (D) A2,A3,A4A_{2}, A_{3}, A_{4} 相互独立.

Solution: A

P(A1)=12P(A2)=12P(A3)=12P(A4)=14P\left(A_{1}\right)=\frac{1}{2} 、 P\left(A_{2}\right)=\frac{1}{2} 、 P\left(A_{3}\right)=\frac{1}{2} 、 P\left(A_{4}\right)=\frac{1}{4}

P(A1A2)=14=P(A1)P(A2)P(A1A3)=14=P(A1)P(A3)P\left(A_{1} A_{2}\right)=\frac{1}{4}=P\left(A_{1}\right) P\left(A_{2}\right) 、 P\left(A_{1} A_{3}\right)=\frac{1}{4}=P\left(A_{1}\right) P\left(A_{3}\right)

P(A2A3)=14=P(A2)P(A3)P(A1A2A3)=0P(A1)P(A2)P(A3) 、 P\left(A_{2} A_{3}\right)=\frac{1}{4}=P\left(A_{2}\right) P\left(A_{3}\right) 、 P\left(A_{1} A_{2} A_{3}\right)=0 \neq P\left(A_{1}\right) P\left(A_{2}\right) P\left(A_{3}\right) \text { 、 }

P(A2A4)=14P(A2)P(A4)P\left(A_{2} A_{4}\right)=\frac{1}{4} \neq P\left(A_{2}\right) P\left(A_{4}\right), 故 A 正确, BCD\mathrm{BCD} 错误.

  1. 随机变量 XX 有密度 p(x)=c1x2I(1,1)(x)p(x)=\frac{c}{\sqrt{1-x^{2}}} I_{(-1,1)}(x), 则常数 cc 的取值为 ( ).
    (A) 2 ;
    (B) π\pi;
    (C) π/2\pi / 2
    (D) 1/π1 / \pi.

Solution: D

11c11x2=carcsinx11=cπ=1,c=1π,D 正确. \int_{-1}^{1} c \frac{1}{\sqrt{1-x^{2}}}=\left.c \arcsin x\right|_{-1} ^{1}=c \pi=1, c=\frac{1}{\pi}, \mathrm{D} \text { 正确. }

  1. ZZ[0,1][0,1] 上服从均匀分布, 随机变量 X,YX, Y 满足方程组 {X+Y=4Z+1XY=2Z1\left\{\begin{array}{l}X+Y=4 Z+1 \\ X-Y=2 Z-1\end{array}\right.XXYY 各自落在 [0,1][0,1] 中的概率为 ( ).
    (A) 1/31 / 31/21 / 2;
    (B) 1/21 / 21/21 / 2;
    (C) 1/31 / 300 ;
    (D) 1/31 / 32/32 / 3.

Solution: C
解方程组, 得 X=3ZU(0,3),Y=Z+1U(1,2)X=3 Z \sim U(0,3), Y=Z+1 \sim U(1,2), 则 XXYY 各自; 落 在 [0,1][0,1] 的概率为 1/31 / 30,C0, C 正确.
6.C6 . C

XP(λ), 则 E(X)=D(X)=λ,P(X=1)=λeλ,P(X=2)=λ22eλX \sim P(\lambda) \text {, 则 } E(X)=D(X)=\lambda, P(X=1)=\lambda e^{-\lambda}, P(X=2)=\frac{\lambda^{2}}{2} e^{-\lambda}

  1. 设随机变量 XX 服从参数为 λ\lambda 的泊松分布, 则下列条件中导出参数 λ=2\lambda=2 的 条件是 ( ).
    (A) EX=1/2E X=1 / 2;
    (B) Var(X)=1/4\operatorname{Var}(X)=1 / 4;
    (C) P{X=1}=P{X=2}P\{X=1\}=P\{X=2\};
    (D) P{X=2}=2P{X=1}P\{X=2\}=2 P\{X=1\}.

Solution: C

XP(λ)X \sim P(\lambda), 则 E(X)=D(X)=λ,P(X=1)=λeλ,P(X=2)=λ22eλE(X)=D(X)=\lambda, P(X=1)=\lambda e^{-\lambda}, P(X=2)=\frac{\lambda^{2}}{2} e^{-\lambda}
A 选项: 若 E(X)=12E(X)=\frac{1}{2}, 则 λ=12, A\lambda=\frac{1}{2}, \mathrm{~A} 错误.
B 选项: 若 D(X)=14D(X)=\frac{1}{4}, 则 λ=14, B\lambda=\frac{1}{4}, \mathrm{~B} 错误.
C 选项: P(X=2)P(X=1)=λ22eλλeλ=λ2=1,λ=2\frac{P(X=2)}{P(X=1)}=\frac{\frac{\lambda^{2}}{2} e^{-\lambda}}{\lambda e^{-\lambda}}=\frac{\lambda}{2}=1, \lambda=2, C 正确.
D 选项: λ2=2,λ=4\frac{\lambda}{2}=2, \lambda=4, D 错误.

  1. 当随机向量 (X,Y)(X, Y) 服从单位圆 D={(x,y):x2+y21}D=\left\{(x, y): x^{2}+y^{2} \leq 1\right\} 内的均匀分布, 记 YY 的边际分布是 F(y),YF(y), Y 关于 XX 的条件分布末 G(yx)G(y \mid x), 则 ().
    (A) F(y)F(y) 不服从均匀分布, G(yx)G(y \mid x) 服从均匀分布;
    (B) F(y)F(y) 服从均匀分布, G(yx)G(y \mid x) 不服从均匀分布;
    (C) 二者均服从均匀分布;
    (D) 二者均不服从均匀分布.

Solution: A
SD=πS_{D}=\pi, 于是 (X,Y)(X, Y) 的联合密度为

f(x,y)={1π,(x,y)D0, 其他 f(x, y)= \begin{cases}\frac{1}{\pi}, & (x, y) \in D \\ 0, & \text { 其他 }\end{cases}

YY 的边际密度函数是

fY(y)=1y21y21πdx=21y2π,1<y<1f_{Y}(y)=\int_{-\sqrt{1-y^{2}}}^{\sqrt{1-y^{2}}} \frac{1}{\pi} \mathrm{d} x=\frac{2 \sqrt{1-y^{2}}}{\pi},-1<y<1

同理 XX 的边际密度函数是 fX(x)=21x2π,1<x<1f_{X}(x)=\frac{2 \sqrt{1-x^{2}}}{\pi},-1<x<1
因此得到 YY 的条件密度函数为

fYX(yx)=f(x,y)fX(x)=121x2,1x2<y<1x2f_{Y \mid X}(y \mid x)=\frac{f(x, y)}{f_{X}(x)}=\frac{1}{2 \sqrt{1-x^{2}}}, \quad-\sqrt{1-x^{2}}<y<\sqrt{1-x^{2}}

YY 不服从均匀分布, YXY \mid X 服从均匀分布, A 正确.

  1. 设随机变量 Xt(n),n>1,Y=1/X2X \sim t(n), n>1, Y=1 / X^{2}, 则 () .
    (A) Yχ2(n)Y \sim \chi^{2}(n);
    (B) Yχ2(n1)Y \sim \chi^{2}(n-1);
    (C) YF(1,n)Y \sim F(1, n);
    (D) YF(n,1)Y \sim F(n, 1).

Solution: D
由于 Xt(n)X \sim t(n), 故 XX 可分解为 X=ZV/nX=\frac{Z}{\sqrt{V / n}}, 其中 ZN(0,1),Vχ2(n)Z \sim N(0,1), V \sim \chi^{2}(n)ZVZ 、 V 相互独立, 则 Y=1X2=V/nZ2F(n,1)Y=\frac{1}{X^{2}}=\frac{V / n}{Z^{2}} \sim F(n, 1), D 正确.
9.C
A\mathrm{A} 选项错误:

D(Xi+Xˉ)=D(n+1nXi+1njiXj)=(n+1)2n2σ2+n1n2σ2=n+3nσ2D\left(X_{i}+\bar{X}\right)=D\left(\frac{n+1}{n} X_{i}+\frac{1}{n} \sum_{j \neq i} X_{j}\right)=\frac{(n+1)^{2}}{n^{2}} \sigma^{2}+\frac{n-1}{n^{2}} \sigma^{2}=\frac{n+3}{n} \sigma^{2}

  1. X1,X2,,Xn(n>1)X_{1}, X_{2}, \ldots, X_{n}(n>1) 为来自总体期望为 μ\mu, 总体方差为 σ2\sigma^{2} 的简单随机 样本, 记 Xˉ\bar{X} 为样本均值, 则 ( ).
    (A) D(Xi+Xˉ)=n+2nσ2D\left(X_{i}+\bar{X}\right)=\frac{n+2}{n} \sigma^{2};
    (B) D(XiXˉ)=n+1nσ2D\left(X_{i}-\bar{X}\right)=\frac{n+1}{n} \sigma^{2};
    (C) Cov(Xi,Xˉ)=1nσ2\operatorname{Cov}\left(X_{i}, \bar{X}\right)=\frac{1}{n} \sigma^{2};
    (D) Cov(Xi,Xˉ)=σ2\operatorname{Cov}\left(X_{i}, \bar{X}\right)=\sigma^{2}.

Solution: B 选项错误:

D(XiXˉ)=D(n1nXi1njiXj)=(n1)2n2σ2+n1n2σ2=n1nσ2D\left(X_{i}-\bar{X}\right)=D\left(\frac{n-1}{n} X_{i}-\frac{1}{n} \sum_{j \neq i} X_{j}\right)=\frac{(n-1)^{2}}{n^{2}} \sigma^{2}+\frac{n-1}{n^{2}} \sigma^{2}=\frac{n-1}{n} \sigma^{2}

C 选项正确, D 选项错误:

Cov(Xi,Xˉ)=Cov(Xi,1nXi+1njiXj)=Cov(Xi,1nXi)=1nσ2\operatorname{Cov}\left(X_{i}, \bar{X}\right)=\operatorname{Cov}\left(X_{i}, \frac{1}{n} X_{i}+\frac{1}{n} \sum_{j \neq i} X_{j}\right)=\operatorname{Cov}\left(X_{i}, \frac{1}{n} X_{i}\right)=\frac{1}{n} \sigma^{2}

  1. (X,Y)N(μ1,μ2;σ12,σ22;0)(X, Y) \sim N\left(\mu_{1}, \mu_{2} ; \sigma_{1}^{2}, \sigma_{2}^{2} ; 0\right), 若 P{Xμ1<c}<P{Yμ2<c}P\left\{\left|X-\mu_{1}\right|<c\right\}<P\left\{\left|Y-\mu_{2}\right|<c\right\}, 其中 cc 为某一正数, 则 ()
    (A) σ12<σ22\sigma_{1}^{2}<\sigma_{2}^{2};
    (B) σ12>σ22\sigma_{1}^{2}>\sigma_{2}^{2};
    (C) μ1<μ2\mu_{1}<\mu_{2};
    (D) μ1>μ2\mu_{1}>\mu_{2};

Solution: B
由于 P(Xμ1σ1<cσ1)<P(Yμ2σ2<cσ2)P\left(\frac{\left|X-\mu_{1}\right|}{\sigma_{1}}<\frac{c}{\sigma_{1}}\right)<P\left(\frac{\left|Y-\mu_{2}\right|}{\sigma_{2}}<\frac{c}{\sigma_{2}}\right), 即

2Φ(cσ1)1<2Φ(cσ2)1,2 \Phi\left(\frac{c}{\sigma_{1}}\right)-1<2 \Phi\left(\frac{c}{\sigma_{2}}\right)-1,

这说明 Φ(cσ1)<Φ(cσ2)\Phi\left(\frac{c}{\sigma_{1}}\right)<\Phi\left(\frac{c}{\sigma_{2}}\right), 由于 Φ(x)\Phi(x) 单调增, 故 cσ1<cσ2,σ12>σ22\frac{c}{\sigma_{1}}<\frac{c}{\sigma_{2}}, \sigma_{1}^{2}>\sigma_{2}^{2}, B 正确.

  1. EX=0,Var(X)=1,EY=1,Var(Y)=4\mathrm{EX}=0, \operatorname{Var}(X)=1, \mathrm{EY}=1, \operatorname{Var}(Y)=4, 相关系数 ρXY=1\rho_{X Y}=1, 则 ( ).
    (A) P(2XY+1=0)=1P(2 X-Y+1=0)=1;
    (B) P(2XY1=0)=1P(2 X-Y-1=0)=1;
    (C) P(2X+Y+1=0)=1P(2 X+Y+1=0)=1;
    (D) P(2X+Y1=0)=1P(2 X+Y-1=0)=1.

Solution: A
因为 XXYY 的相关系数为 1 , 所以 XXYY 之间几乎处处存在正的线性关系, 即存在 a>0,P(Y=aX+b)=1a>0, P(Y=a X+b)=1. 所以有

{E(Y)=aE(X)+b,Var(Y)=a2Var(X), 解得 {a=2,b=1,\left\{\begin{array} { l } { E ( Y ) = a E ( X ) + b , } \\ { Var ( Y ) = a ^ { 2 } Var ( X ) , } \end{array} \text { 解得 } \left\{\begin{array}{l} a=2, \\ b=1, \end{array}\right.\right.

因此 P(Y=2X+1)=1P(Y=2 X+1)=1, 即 P(2XY+1=0)=1P(2 X-Y+1=0)=1, 选项 A 正确.

  1. 在假设检验中, 第一类错误是指 ( ).
    (A)当原假设为真时, 接受原假设;
    (B) 当原假设为真时, 拒绝原假设;
    (C) 当备择假设为真时, 接受原假设;
    (D) 当备选假设为真时, 拒绝原假设.

Solution: B
假设检验中存在两类错误. 第一类错误是:原假设为真但拒绝原假设. 第二 类错误是:备选假设为真而接受原假设. 本题所问的是第一类错误,故选项 B 正确.

  1. nn 个随机变量 X1,X2,,XnX_{1}, X_{2}, \ldots, X_{n} 独立同分布, Var(X1)=σ2<+,Xˉ\operatorname{Var}\left(X_{1}\right)=\sigma^{2}<+\infty, \bar{X}S2S^{2} 分别为样本均值与样本方差, 则 ( ).
    (A) SSXˉ\bar{X} 相互独立;
    (B) SSσ\sigma 的相合估计量;
    (C) SSσ\sigma 的最大似然估计量;
    (D) SSσ\sigma 的无偏估计量.

Solution: B
X1,X2,XnX_{1}, X_{2} \ldots, X_{n} 相互独立且服从正态分布时, Xˉ\bar{X}SS 相互独立, 且有 E(S2)=σ2E\left(S^{2}\right)=\sigma^{2}, 但题目没给出具体分布, 故 A 错, 同理也无法求出 σ\sigma 的最大似然估 计量, 因此 C\mathrm{C} 错误. 由 Jensen 不等式, D\mathrm{D} 错.
选项 B 正确, 因为我们知道 S2S^{2}σ2\sigma^{2} 的相合估计量, 由依概率收敛的运算法 则, 有 SSσ\sigma 的相合估计量.

  1. X1,X2,,XnX_{1}, X_{2}, \ldots, X_{n} 为来自正态分布 N(μ,σ2)N\left(\mu, \sigma^{2}\right) 的样本, 其中 μ\mu 为已知, Xˉ\bar{X} 为样本均值, 则 σ2\sigma^{2} 的最大似然估计为 ().
    (A) 1ni=1n(XiXˉ)2\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2};
    (B) 1n1i=1n(XiXˉ)2\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2};
    (C) 1ni=1n(Xiμ)2\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\mu\right)^{2};
    (D) 1n1i=1n(Xiμ)2\frac{1}{\mathrm{n}-1} \sum_{i=1}^{n}\left(X_{i}-\mu\right)^{2}.

Solution: C
样本对应的似然函数是

L(σ)=(2πσ2)n2ei=1n(xiμ)22σ2L(\sigma)=\left(2 \pi \sigma^{2}\right)^{-\frac{n}{2}} e^{-\sum_{i=1}^{n} \frac{\left(x_{i}-\mu\right)^{2}}{2 \sigma^{2}}}

两边同时取对数得 lnL(σ2)=n2ln(2πσ2)i=1n(xiμ)22σ2\ln L\left(\sigma^{2}\right)=-\frac{n}{2} \ln \left(2 \pi \sigma^{2}\right)-\sum_{i=1}^{n} \frac{\left(x_{i}-\mu\right)^{2}}{2 \sigma^{2}}, 对其求导并令其 导数为 0 , 得到 σ2\sigma^{2} 的最大似然估计 σ^2=i=1n(xiμ)2n\hat{\sigma}^{2}=\sum_{i=1}^{n} \frac{\left(x_{i}-\mu\right)^{2}}{n}, 故选项 C 正确.

  1. 设总体 X\mathrm{X} 的概率密度函数为 f(x;θ)={e(xθ),xθ;0,x<θ,,X1,X2,,Xnf(x ; \theta)=\left\{\begin{array}{ll}e^{-(x-\theta)}, & x \geq \theta ; \\ 0, & x<\theta\end{array},, X_{1}, X_{2}, \ldots, X_{n}\right. 为来自总体 X\mathrm{X} 的样本, 则 θ\theta 的矩估计量为 ( ).
    (A) Xˉ\bar{X};
    (B) Xˉ1\bar{X}-1;
    (C) xˉ+1\bar{x}+1;
    (D) 1/Xˉ1 / \bar{X}.

Solution: B

E(X)=θ+xe(xθ)dx=θ+1,E(X)=\int_{\theta}^{+\infty} x e^{-(x-\theta)} d x=\theta+1,

由替换原理, 得到 θ\theta 的矩估计为: θ^=Xˉ1\hat{\theta}=\bar{X}-1

  1. X1,X2,,XnX_{1}, X_{2}, \ldots, X_{n} 为来自正态分布 N(μ,σ2)N\left(\mu, \sigma^{2}\right) 的样本, 其中 σ2\sigma^{2} 为已知, Xˉ\bar{X} 为 样本均值. 考虑如下假设检验: H0:μμ0H_{0}: \mu \leq \mu_{0} v.s. H1:μ>μ0H_{1}: \mu>\mu_{0}, 标准正态分布的 95%95 \% 分位数为 1.6451.645, 在显著性水平为 0.050.05 时, 拒绝 H0H_{0} 等价于 ( ).
    (A)单侧区间 (Xˉ+1.645σn,+)\left(\bar{X}+1.645 \frac{\sigma}{\sqrt{n}},+\infty\right) 不包含 μ0\mu_{0};
    (B) 单侧区间 (Xˉ+1.645σn,+)\left(\bar{X}+1.645 \frac{\sigma}{\sqrt{n}},+\infty\right) 包含 μ0\mu_{0};
    (C) 单侧区间 (,Xˉ1.645σn)\left(-\infty, \bar{X}-1.645 \frac{\sigma}{\sqrt{n}}\right) 不包含 μ0\mu_{0};
    (D) 单侧区间 (,Xˉ1.645σn)\left(-\infty, \bar{X}-1.645 \frac{\sigma}{\sqrt{n}}\right) 包含 μ0\mu_{0}.

Solution: D
依题意, 可知这是一个正态总体均值的右单侧检验, 拒绝域为

W={Xˉμ0σ/n>1.645}W=\left\{\frac{\bar{X}-\mu_0}{\sigma / \sqrt{n}}>1.645\right\}

这等价于 μ0<Xˉ1.645σn\mu_{0}<\bar{X}-1.645 \frac{\sigma}{\sqrt{n}}, 所以选项 D 正确.

  1. X1,X2,,XnX_{1}, X_{2}, \ldots, X_{n} 独立同分布, 具有期望 μ\mu, 则 ().
    (A) exp(Xˉ)\exp (\bar{X})eμe^{\mu} 的相合估计量;
    (B) exp(Xˉ)\exp (\bar{X})eμe^{\mu} 的最大似然估计量;
    (C) exp(Xˉ)\exp (\bar{X})eμe^{\mu} 的无偏估计量;
    (D) exp(Xˉ)\exp (\bar{X})eμe^{\mu} 的充分统计量.

Solution: A
由大数定律和依概率收敛可以由连续函数传递, 得 A 正确. B, D 错误, 因为 具体分布末知. C\mathrm{C} 错误, 根据 Jensen 不等式很快知道 E(exˉ)eE(xˉ)=eμE\left(e^{\bar{x}}\right) \geq e^{E(\bar{x})}=e^{\mu}, 除非 Xˉ\bar{X} 等于常数才有等号成立.

  1. X1,X2X_{1}, X_{2} 都服从参数为 1 的指数分布, YY 服从参数为 2 的指数分布, f(y)=2e2y,0<y<f(y)=2 e^{-2 y}, 0<y<\infty, 且 X1,X2,YX_{1}, X_{2}, Y 相互独立, 则 ( ).
    (A) X1+X24YF(4,2)\frac{X_{1}+X_{2}}{4 Y} \sim F(4,2);
    (B) X1+X2YF(4,2)\frac{X_{1}+X_{2}}{Y} \sim F(4,2);
    (C) X1+X24YF(2,2)\frac{X_{1}+X_{2}}{4 Y} \sim F(2,2);
    (D) X1+X2YF(2,2)\frac{X_{1}+X_{2}}{Y} \sim F(2,2).

Solution: A
我们知道对于参数为 λ\lambda 的指数分布 ZZ, 有 2λZχ2(2)2 \lambda Z \sim \chi^{2}(2), 故有

X1+X24Y=(2X1+2X2)/44Y/2F(4,2),\frac{X_{1}+X_{2}}{4 Y}=\frac{\left(2 X_{1}+2 X_{2}\right) / 4}{4 Y / 2} \sim F(4,2),

A\mathrm{A} 选项正确.

  1. θ^\hat{\theta} 为参数 θ\theta 的估计量, 且 θ^\hat{\theta} 的期望与方差 σ2\sigma^{2} 均存在, 则必有 ( ).
    (A) P(θ^θ2σ)0.5P(|\hat{\theta}-\theta| \geq 2 \sigma) \geq 0.5;
    (B) P(θ^θ2σ)0.5P(|\hat{\theta}-\theta| \geq 2 \sigma) \leq 0.5;
    (C) P(θ^θ2σ)E(θ^θ)24σ2P(|\hat{\theta}-\theta| \geq 2 \sigma) \geq \frac{E(\hat{\theta}-\theta)^{2}}{4 \sigma^{2}};
    (D) P(θ^θ2σ)E(θ^θ)24σ2P(|\hat{\theta}-\theta| \geq 2 \sigma) \leq \frac{E(\hat{\theta}-\theta)^{2}}{4 \sigma^{2}}.

Solution: D
因为 θ^\hat{\theta} 的期望和方差均存在, 由马尔可夫不等式,

P(θ^θ2σ)E(θ^θ)24σ2,P(|\hat{\theta}-\theta| \geqslant 2 \sigma) \leqslant \frac{E(\hat{\theta}-\theta)^{2}}{4 \sigma^{2}},

故选项 D 正确

  1. θ^n\hat{\theta}_{n} 为参数 θ\theta 的估计量, 且 θ^n\hat{\theta}_{n} 的期望与方差均存在, 当样本量 nn \rightarrow \infty 时, E(θ^n)θ,Var(θ^n)0E\left(\hat{\theta}_{n}\right) \rightarrow \theta, \operatorname{Var}\left(\hat{\theta}_{n}\right) \rightarrow 0, 则以下说法错误的是 ( ).
    (A) θ^n\hat{\theta}_{n}θ\theta 的相合估计量;
    (B) θ^n\hat{\theta}_{n} 依分布收敛到 θ\theta;
    (C) P(limnθ^n=θ)=1P\left(\lim _{n \rightarrow \infty} \hat{\theta}_{n}=\theta\right)=1;
    (D) limnE[(θ^nθ)2]=0\lim _{n \rightarrow \infty} E\left[\left(\hat{\theta}_{n}-\theta\right)^{2}\right]=0.

Solution: C
由于 E(θ^nθ)2=(E(θ^n)θ)2+Var(θ^)E\left(\hat{\theta}_{n}-\theta\right)^{2}=\left(E\left(\hat{\theta}_{n}\right)-\theta\right)^{2}+\operatorname{Var}(\hat{\theta}), 因此题设条件可以推出均方收 敛, 即 D\mathrm{D} 正确. 而均方收敛可以推出依概率收敛, 即 A\mathrm{A} 正确. 依概率收敛可以推 出按分布收玫, 故 B 正确. C\mathrm{C} 错误, 反例如 θ^n=θ+Xn\hat{\theta}_{n}=\theta+X_{n}, 其中 X1,,Xn,X_{1}, \cdots, X_{n}, \cdots 独立, 且 XnB(1,1n)X_{n} \sim B\left(1, \frac{1}{n}\right), 满足题设条件, 且 P(θ^nθ>ε)=1nP\left(\left|\hat{\theta}_{n}-\theta\right|>\varepsilon\right)=\frac{1}{n}, 根据 Borel-Cantelli 第二引理, 有 θ^n\hat{\theta}_{n} 不以概率 1 收敛于 θ\theta.

二、(20 分) 已知简单随机样本 X1,,XniidU(0,θ)X_{1}, \ldots, X_{n} \stackrel{\mathrm{iid}}{\sim} U(0, \theta).
(1) 求 X(1)X_{(1)} 的概率密度, 并求 EX(1)E X_{(1)};
(2) 求 (X(1),X(n))\left(X_{(1)}, X_{(n)}\right) 联合概率密度;
(3) 求 R=X(n)X(1)R=X_{(\mathrm{n})}-X_{(1)} 的概率密度函数;
(4) 在 X(n)=yX_{(n)}=y 条件下, 求 X(1)X_{(1)} 的分布.

Solution:
(1)
XX 的概率密度函数为 f(x)=1θf(x)=\frac{1}{\theta}, 分布函数 F(x)=xθF(x)=\frac{x}{\theta}, 记 U=X(1)U=X_{(1)}, 则

F(u)=1(1uθ)n,f(u)=nθ(1uθ)n1F(u)=1-\left(1-\frac{u}{\theta}\right)^{n}, f(u)=\frac{n}{\theta}\left(1-\frac{u}{\theta}\right)^{n-1}

显然有 X(1)θBeta(1,n)\frac{X_{(1)}}{\theta} \sim \operatorname{Beta}(1, n), 故 EX(1)=θn+1E X_{(1)}=\frac{\theta}{n+1}.
(2)
由次序统计量分布公式, 有 (X(1),X(n))\left(X_{(1)}, X_{(n)}\right) 联合分布是

f(u,v)=n!(n2)!fX(u)fX(v)(F(v)F(u))n2=n(n1)θn(vu)n2\begin{aligned} f(u, v) &=\frac{n !}{(n-2) !} f_{X}(u) f_{X}(v)(F(v)-F(u))^{n-2} \\ &=\frac{n(n-1)}{\theta^{n}}(v-u)^{n-2} \end{aligned}

(3)
作变量变换, 令 Z1=X(n)X(1),Z2=X(n)Z_{1}=X_{(n)}-X_{(1)}, Z_{2}=X_{(n)}, 有

{X(1)=Z2Z1X(n)=Z2\left\{\begin{array}{l} X_{(1)}=Z_{2}-Z_{1} \\ X_{(n)}=Z_{2} \end{array}\right.

雅各比行列式 J=X(1)Z1X(1)Z2X(n)Z1X(n)Z2=1101=1J=\left|\begin{array}{cc}\frac{\partial X_{(1)}}{\partial Z_{1}} & \frac{\partial X_{(1)}}{\partial Z_{2}} \\ \frac{\partial X_{(n)}}{\partial Z_{1}} & \frac{\partial X_{(n)}}{\partial Z_{2}}\end{array}\right|=\left|\begin{array}{cc}-1 & 1 \\ 0 & 1\end{array}\right|=-1, 则

f(z1,z2)=Jf(x(1),x(n))=n(n1)θn(x(n)x(1))n2=n(n1)θnz1n2,f\left(z_{1}, z_{2}\right)=|J| f\left(x_{(1)}, x_{(n)}\right)=\frac{n(n-1)}{\theta^{n}}\left(x_{(n)}-x_{(1)}\right)^{n-2}=\frac{n(n-1)}{\theta^{n}} z_{1}^{n-2},

则有

f(r)=f(z1)=z1θf(z1,z2)dz2=z1θn(n1)θnz1n2dz2=n(n1)θnz1n2(θz1)=n(n1)θnrn2(θr),\begin{aligned} f(r) &=f\left(z_{1}\right)=\int_{z_{1}}^{\theta} f\left(z_{1}, z_{2}\right) d z_{2}=\int_{z_{1}}^{\theta} \frac{n(n-1)}{\theta^{n}} z_{1}^{n-2} d z_{2} \\ &=\frac{n(n-1)}{\theta^{n}} z_{1}^{n-2}\left(\theta-z_{1}\right)=\frac{n(n-1)}{\theta^{n}} r^{n-2}(\theta-r), \end{aligned}

实际上, 有 RθBeta(n1,2)\frac{R}{\theta} \sim \operatorname{Beta}(n-1,2).
(4)
由于 X(n)θBeta(n,1)\frac{X_{(n)}}{\theta} \sim \operatorname{Beta}(n, 1), 故有密度函数, f(v)=nvn1θnf(v)=n \frac{v^{n-1}}{\theta^{n}}, 故条件分布是

f(uv)=f(u,v)f(v)=n(n1)θn(vu)n2nvn1θn=(n1)1v(1uv)n2, 故 f(uv=y)=(n1)1y(1uy)n2.\begin{gathered} f(u \mid v)=\frac{f(u, v)}{f(v)}=\frac{\frac{n(n-1)}{\theta^{n}}(v-u)^{n-2}}{n \frac{v^{n-1}}{\theta^{n}}}=(n-1) \frac{1}{v}\left(1-\frac{u}{v}\right)^{n-2}, \\ \text { 故 } f(u \mid v=y)=(n-1) \frac{1}{y}\left(1-\frac{u}{y}\right)^{n-2} . \end{gathered}

三、(15 分 )) 已知随机样本 X1,,XnX_{1}, \ldots, X_{n} 来自于同一总体, 总体的密度函数为:

f(xθ)={θ,0x<11θ,1x<2f(x \mid \theta)=\left\{\begin{array}{l} \theta, 0 \leq x<1 \\ 1-\theta, 1 \leq x<2 \end{array}\right.

MM 为所有样本中小于 1 的个数.
(1) 求 θ\theta 的矩估计;
(2) 求 θ\theta 的 MLE;
(3) 求 θ\theta 的 MLE 的分布.

Solution:
(1)

E(X)=01xθdx+12x(1θ)dx=32θE(X)=\int_{0}^{1} x \theta d x+\int_{1}^{2} x(1-\theta) d x=\frac{3}{2}-\theta

由替换原理, θ\theta 的矩估计 θ^1=32xˉ\hat{\theta}_{1}=\frac{3}{2}-\bar{x}.
(2)
似然函数 L(θ)=θM(1θ)nML(\theta)=\theta^{M}(1-\theta)^{n-M}, 取对数有

InL(θ)=Mlnθ+(nM)ln(1θ),\operatorname{In} L(\theta)=M \ln \theta+(n-M) \ln (1-\theta),

(3)
显然 M=nθ^2M=n \hat{\theta}_{2} 是二项分布, 故

P(θ^2=kn)=P(M=k)=(nk)θk(1θ)nk,k=0,1,,n.P\left(\hat{\theta}_{2}=\frac{k}{n}\right)=P(M=k)=\left(\begin{array}{l} n \\ k \end{array}\right) \theta^{k}(1-\theta)^{n-k}, k=0,1, \cdots, n .

四、(30分) 已知随机样本 X1,,XniidB(1,p)X_{1}, \ldots, X_{n} \stackrel{i i d}{\sim} B(1, p), 定义统计量 T=i=1nXiT=\sum_{i=1}^{n} X_{i}.
(1) 用充分统计量的定义证明 TTpp 的充分统计量;
(2) 定义 h(X1,,Xk)={1,X1=X2==Xk=1;0, 其他. h\left(X_{1}, \ldots, X_{k}\right)=\left\{\begin{array}{l}1, X_{1}=X_{2}=\ldots=X_{k}=1 ; \\ 0, \text { 其他. }\end{array}\right., 证明它是 pkp^{k} 的无偏 估计;
(3) 求 pkp^{k} 的 UMVUE.

Solution: (1)
样本对应的似然函数是 L(p)=pt(1p)ntL(p)=p^{t}(1-p)^{n-t}, 根据因子分解定理: TTpp 的充分统计量.
(2)
由于各样本之间独立, 故

E(h(X1,,Xk))=P(X1=X2==Xk=1)=P(X1=1)P(X2=1)P(Xk=1),=pk,\begin{aligned} E\left(h\left(X_{1}, \ldots, X_{k}\right)\right) &=P\left(X_{1}=X_{2}=\ldots=X_{k}=1\right) \\ &=P\left(X_{1}=1\right) P\left(X_{2}=1\right) \cdots P\left(X_{k}=1\right), \\ &=p^{k}, \end{aligned}

所以 h(X1,,Xk)h\left(X_{1}, \ldots, X_{k}\right)pkp^{k} 的无偏估计量.
(3)
因为 TTpp 的充分统计量, 同时由指数族分布的性质知, 它还是完全统计量, 且由 (2),h(X1,,Xk)(2), h\left(X_{1}, \ldots, X_{k}\right)pkp^{k} 的无偏估计量. 可知:

E[E(h(X1,,Xk)T)]=E(h(X1,,Xk))=pk,E\left[E\left(h\left(X_{1}, \ldots, X_{k}\right) \mid T\right)\right]=E\left(h\left(X_{1}, \ldots, X_{k}\right)\right)=p^{k},

由 Lehmann-Scheffe 定理知 E(h(X1,,Xk)T)E\left(h\left(X_{1}, \ldots, X_{k}\right) \mid T\right)pkp^{k} 的 UMVUE. 当 t<kt<k, 显然有

E(h(X1,,Xk)T=t)=0,E\left(h\left(X_{1}, \ldots, X_{k}\right) \mid T=t\right)=0,

但对 tkt \geq k, 有

E(h(X1,,Xk)T)=P(h=1,T=t)P(T=t)=P(x1=x2==xk=1)P(i=k+1nxi=tP(i=1nxi=t)=pkCnktkptk(1p)ntCntpk(1p)nt=CnktkCnt\begin{aligned} E\left(h\left(X_{1}, \ldots, X_{k}\right) \mid T\right)=& \frac{P(h=1, T=t)}{P(T=t)} \\ =& \frac{P\left(x_{1}=x_{2}=\ldots=x_{k}=1\right) P\left(\sum_{i=k+1}^{n} x_{i}=t\right.}{P\left(\sum_{i=1}^{n} x_{i}=t\right)} \\ &=\frac{p^{k} \cdot C_{n-k}^{t-k} \cdot p^{t-k} \cdot(1-p)^{n-t}}{C_{n}^{t} \cdot p^{k} \cdot(1-p)^{n-t}}=\frac{C_{n-k}^{t-k}}{C_{n}^{t}} \end{aligned}

所以 pkp^{k} 的 UMVUE 为

g^={0,T<k,CnkTkCnT,Tk.\hat{g}=\left\{\begin{array}{cc} 0, & T<k, \\ \frac{C_{n-k}^{T-k}}{C_{n}^{T}}, & T \geq k . \end{array}\right.

五、(25 分) 设简单随机样本 X1,,XnX_{1}, \ldots, X_{n} 来自于总体

f(xθ)={2xθexp(x2θ),x00,x<0f\left( x\mid \theta \right) = \left\{\begin{array}{l} \frac{2x}{\theta}\exp \left( -\frac{x^2}{\theta} \right) ,& x\ge 0\\ 0,& x<0\\ \end{array}\right.

T=i=1nXi2T=\sum_{i=1}^{n} X_{i}^{2}.
(1) 证明 TTθ\theta 的充分统计量;
(2) 利用 TT 构建 θ\theta95%95 \% 置信区间;
(3) 假设检验问题 H0:θ=1H_{0}: \theta=1 vs H1:θ>1H_{1}: \theta>1 是否存在 UMP 拒绝域? 如果存在, 写出拒绝域; 如果不存在, 请说明理由.

Solution:
(1) 样本对应的似然函数是

L(θ)=i=1n2xiexi2θ=2n(i=1nxi)ei=1nxi2θ,L(\theta)=\prod_{i=1}^{n} 2 x_{i} e^{-\frac{x_{i}^{2}}{\theta}}=2^{n}\left(\prod_{i=1}^{n} x_{i}\right) e^{-\frac{\sum_{i=1}^{n} x_{i}^{2}}{\theta}},

由因子分解定理, T=i=1nXi2T=\sum_{i=1}^{n} X_{i}^{2}θ\theta 的充分统计量.
(2) 令 Y=X2θY=\frac{X^{2}}{\theta}, 则它的分布函数是

FY(y)=P(Y<y)=P(X2θ<y)=P(X<θy)=0θy2xθex2θdx=1ey,y>0,\begin{aligned} F_{Y}(y) &=P(Y<y)=P\left(\frac{X^{2}}{\theta}<y\right)=P(X<\sqrt{\theta y}) \\ &=\int_{0}^{\sqrt{\theta_{y}}} \frac{2 x}{\theta} e^{-\frac{x^{2}}{\theta}} d x=1-e^{-y}, \quad y>0, \end{aligned}

YY 服从参数为 1 的指数分布, 因此 2TθGa(n,2)=χ2(2n)\frac{2 T}{\theta} \sim G a(n, 2)=\chi^{2}(2 n), 故

P(χ0.0252(2n)<2Tθ<χ0.9752(2n))=0.95,P\left(\chi_{0.025}^{2}(2 n)<\frac{2 T}{\theta}<\chi_{0.975}^{2}(2 n)\right)=0.95,

θ\theta95%95 \% 置信区间为 [2Tχ0.9752(2n),2Tχ0.0252(2n)]\left[\frac{2 T}{\chi_{0.975}^{2}(2 n)}, \frac{2 T}{\chi_{0.025}^{2}(2 n)}\right].
(3) 由于该问题是单参指数族的单侧检验问题, 因此存在 UMP 拒绝域, 构造似 然比

λ=L(1)L(θ2)=i=1nf(xi;1)i=1nf(xi,θ2)=(i=1n2xi)eT(i=1n2xiθ2)eTσ2=θ2neTeTσ2=θ2neT(1σ21)\lambda=\frac{L(1)}{L\left(\theta_{2}\right)}=\frac{\prod_{i=1}^{n} f\left(x_{i} ; 1\right)}{\prod_{i=1}^{n} f\left(x_{i}, \theta_{2}\right)}=\frac{\left(\prod_{i=1}^{n} 2 x_{i}\right) e^{-T}}{\left(\prod_{i=1}^{n} \frac{2 x_{i}}{\theta_{2}}\right) e^{-\frac{T}{\sigma_{2}}}}=\frac{\theta_{2}^{n} e^{-T}}{e^{-\frac{T}{\sigma_{2}}}}=\theta_{2}^{n} e^{T\left(\frac{1}{\sigma_{2}}-1\right)}

其中 θ2\theta_{2} 为一个大于 1 的常数, 可以得到 UMP\mathrm{UMP} 拒绝域由 W={λ<C}W=\{\lambda<C\} 导出, 而由于 λ=θ2neT(1o21)\lambda=\theta_{2}^{n} e^{T\left(\frac{1}{o_{2}}-1\right)}TT 的单调减函数, 故拒绝域即为 W={T>C1}W=\left\{T>C_{1}\right\}, 为使得其水平 为 α\alpha, 可以求得 UMP 拒绝域是

W={T>χ1α2(2n)2}.W=\left\{T>\frac{\chi_{1-\alpha}^{2}(2 n)}{2}\right\} .