清华大学-432统计学-2021年

一、(20分) 已知(U,V)(U,V)满足: P(U=1)=P(U=1)=1/2P(U=1)=P(U=-1)=1/2, 且

{P(V=1U=1)=23,P(V=1U=1)=13,P(V=1U=1)=13,P(V=1U=1)=23,\begin{cases} P\left( V=-1|U=1 \right) =\frac{2}{3},\\ P\left( V=1|U=1 \right) =\frac{1}{3},\\ P\left( V=-1|U=-1 \right) =\frac{1}{3},\\ P\left( V=1|U=-1 \right) =\frac{2}{3},\\ \end{cases}

(1)(10分) 求方程x2+Ux+V=0x^2+Ux+V=0有实根的概率;

(2)(10分) 求方程x2+Ux+V=0x^2+Ux+V=0最大实根的数学期望.

Solution:
(1) (U,V)(U, V) 的联合分布律是:

U=1U = -1 U=1U = 1
V=1V=-1 1/6 1/3
V=1V=1 1/3 1/6

有实根意味着: U24V0U^{2}-4 V \geq 0, 对应为

P(U24V0)=P(U=1,V=1)+P(U=1,V=1)=12.{P}\left(U^{2}-4 V \geq 0\right)={P}(U=1, V=-1)+{P}(U=-1, V=-1)=\frac{1}{2} .

(2) 最大实根为 X=U+U24V2X=\frac{-U+\sqrt{U^{2}-4 V}}{2}, 而

P(X=1+52U24V0)=23P(X=1+52U24V0)=13\begin{aligned} &\mathrm{P}\left(X=\frac{-1+\sqrt{5}}{2} \mid U^{2}-4 V \geq 0\right)=\frac{2}{3} \\ &\mathrm{P}\left(X=\frac{1+\sqrt{5}}{2} \mid U^{2}-4 V \geq 0\right)=\frac{1}{3} \end{aligned}

E(XU24V0)=1+356\mathrm{E}\left(X \mid U^{2}-4 V \geq 0\right)=\frac{-1+3 \sqrt{5}}{6}.

二、(60分) 有来自总体Exp(1λ)\mathrm{Exp}(\frac{1}{\lambda})nn个随机样本X1,,XnX_1,\cdots,X_n, 注意: Exp(1λ)\mathrm{Exp}(\frac{1}{\lambda}) 指的是期望为 λ\lambda 的指数分布.

(1)(10分) 试证:X1+X2X_1+X_2X1X2\frac{X_1}{X_2}独立;

(2)(20分) 求X(1)X_{(1)}X(n)X_{(n)}的相关系数RR, 并计算limn+nR\underset{n\rightarrow +\infty}{\lim}nR;

(3)(10分) 分别基于X(1)X_{(1)}Xˉ\bar{X}构造λ\lambda的无偏估计;

(4)(20分) 说明这两个无偏估计是否是弱相合估计.

Solution:

(1) (X1,X2)\left(X_{1}, X_{2}\right) 的联合密度是 f(x1,x2)=1λ2eλ(x1+x2)f\left(x_{1}, x_{2}\right)=\frac{1}{\lambda^{2}} e^{-\lambda\left(x_{1}+x_{2}\right)}, 可以看出 X1+X2X_{1}+X_{2} 是 指数族的充分完全统计量, X1X2\frac{X_{1}}{X_{2}} 是尺度族的辅助统计量, 由 Basu 定理, 它们独立,

(2) 令

{T1=nX(1),T2=(n1)(X(2)X(1))Ti=(ni+1)(X(i)X(i1))Tn=X(n)X(n1),\left\{\begin{array}{l} T_{1}=n X_{(1)}, \\ T_{2}=(n-1)\left(X_{(2)}-X_{(1)}\right) \\ \vdots \\ T_{i}=(n-i+1)\left(X_{(i)}-X_{(i-1)}\right) \\ \vdots \\ T_{n}=X_{(n)}-X_{(n-1)}, \end{array}\right.

计算雅可比行列式, 易得 T1,T2,,TnT_{1}, T_{2}, \cdots, T_{n} 是 i.i.d.服从 Exp(1λ)\operatorname{Exp}\left(\frac{1}{\lambda}\right) 的随机变量, 而且

X(n)=1nT1+1n1T2++12Tn1+TnX_{(n)}=\frac{1}{n} T_{1}+\frac{1}{n-1} T_{2}+\cdots+\frac{1}{2} T_{n-1}+T_{n}

EX(n)=(1+12++1n)λ,Var(X(n))=(1+122++1n2)λ2\mathrm{E} X_{(n)}=\left(1+\frac{1}{2}+\cdots+\frac{1}{n}\right) \lambda, \operatorname{Var}\left(X_{(n)}\right)=\left(1+\frac{1}{2^{2}}+\cdots+\frac{1}{n^{2}}\right) \lambda^{2}.
X(1)X_{(1)} 的分布函数是:

F1(x)=P(X(1)x)=1P(X(1)x)=1enλxF_{1}(x)=\mathrm{P}\left(X_{(1)} \leq x\right)=1-\mathrm{P}\left(X_{(1)} \geq x\right)=1-e^{-\frac{n}{\lambda} x} \text {, }

它是 Exp(nλ)\operatorname{Exp}\left(\frac{n}{\lambda}\right), 故 EX(1)=λn,Var(X(1))=λ2n2\mathrm{E} X_{(1)}=\frac{\lambda}{n}, \operatorname{Var}\left(X_{(1)}\right)=\frac{\lambda^{2}}{n^{2}}.

Cov(X(1),X(n))=1n2Var(T1)=λ2n2, 故 R=λ2n2Var(X(1))Var(X(n))=X(n))λ2n2(i=1n1i2)λ2=1ni=1n1i2,nR6π.\begin{gathered} \operatorname{Cov}\left(X_{(1)}, X_{(n)}\right)=\frac{1}{n^{2}} \operatorname{Var}\left(T_{1}\right)=\frac{\lambda^{2}}{n^{2}}, \\ \text { 故 } R=\frac{\frac{\lambda^{2}}{n^{2}}}{\sqrt{\operatorname{Var}\left(X_{(1)}\right) \operatorname{Var}\left(X_{(n)}\right)}}=\frac{\left.X_{(n)}\right)}{\sqrt{\frac{\lambda^{2}}{n^{2}} \cdot\left(\sum_{i=1}^{n} \frac{1}{i^{2}}\right) \lambda^{2}}}=\frac{1}{n \sqrt{\sum_{i=1}^{n} \frac{1}{i^{2}}}}, n R \rightarrow \frac{\sqrt{6}}{\pi} . \end{gathered}

(3) EX(1)=λn\mathrm{E} X_{(1)}=\frac{\lambda}{n}, 故 nX(1)n X_{(1)} 是无偏估计; EXˉ=λ\mathrm{E} \bar{X}=\lambda, 故 Xˉ\bar{X} 是无偏估计.

(4) 讨论相合性: 由辛钦大数定律, Xˉ\bar{X} 是弱相合估计; nX(1)=T1Exp(1λ)n X_{(1)}=T_{1} \sim \operatorname{Exp}\left(\frac{1}{\lambda}\right) 不收敛 到单点分布, 故不是弱相合估计(否则它一定收敛到单点分布).

三、(30分)设有来自总体B(1,θ)B(1,\theta)2n2n个独立样本X1,,X2nX_1,\cdots,X_{2n}, 其中θ[12,1)\theta \in[\frac{1}{2},1).

(1)(20分) 求θ\theta的最大似然估计θ^\hat{\theta}与其分布;

(2)(10分) 利用似然比检验法给出假设检验问题
H0:θ=12vsH1:θ>12 \mathrm{H}_0:\theta =\frac{1}{2}\quad \mathrm{vs}\quad \mathrm{H}_1:\theta >\frac{1}{2}
的拒绝域.

Solution:
(1) θ^=max{12,Xˉ}\hat{\theta}=\max \left\{\frac{1}{2}, \bar{X}\right\}, 其中 Xˉ=12ni=12nXi\bar{X}=\frac{1}{2 n} \sum_{i=1}^{2 n} X_{i}, 它的分布列是:

P(θ^=k2n)=P(2nXˉ=k)=C2nkθk(1θ)2nk,k=n+1,,2n.P(θ^=12)=P(2nXˉn)=k=0nC2nkθk(1θ)2nk.\begin{gathered} \mathrm{P}\left(\hat{\theta}=\frac{k}{2 n}\right)=\mathrm{P}(2 n \bar{X}=k)=C_{2 n}^{k} \theta^{k}(1-\theta)^{2 n-k}, k=n+1, \cdots, 2 n . \\ \mathrm{P}\left(\hat{\theta}=\frac{1}{2}\right)=\mathrm{P}(2 n \bar{X} \leq n)=\sum_{k=0}^{n} C_{2 n}^{k} \theta^{k}(1-\theta)^{2 n-k} . \end{gathered}

(2) 似然比

Λ=L(θ^)L(12)={1,Xˉ<12,22n[XˉXˉ(1Xˉ)(1Xˉ)]2n,Xˉ12,\Lambda=\frac{L(\hat{\theta})}{L\left(\frac{1}{2}\right)}= \begin{cases}1, & \bar{X}<\frac{1}{2}, \\ 2^{2 n}\left[\bar{X}^{\bar{X}}(1-\bar{X})^{(1-\bar{X})}\right]^{2 n}, & \bar{X} \geq \frac{1}{2},\end{cases}

注意到 g(x)=xx(1x)1xg(x)=x^{x}(1-x)^{1-x}x12x \geq \frac{1}{2} 时递增(取对数求导), 因此拒绝域是

W={Λ>C}={i=12nXi>m}W=\{\Lambda>C\}=\left\{\sum_{i=1}^{2 n} X_{i}>m\right\}

为使得水平恰小于或等于 α\alpha, 取 m=inf{s:P(i=12nXi>sθ=12)}m=\inf \left\{s: P\left(\sum_{i=1}^{2 n} X_{i}>s \mid \theta=\frac{1}{2}\right)\right\}.
若引入随机化检验, 可使水平恰为 α\alpha, 此时检验为

T(X)=1{i=12nXi>m}+γ1{i=12nXi=m}T\left( X \right) =1_{\left\{ \sum_{i=1}^{2n}{X_i}>m \right\}}+\gamma 1_{\left\{ \sum_{i=1}^{2n}{X_i}=m \right\}}

其中

m=inf{s:P(i=12nXi>sθ=12)},γ=αP(i=12nXi>mθ=12)P(i=12nXi=mθ=12)m=\inf \left\{s: P\left(\sum_{i=1}^{2 n} X_{i}>s \mid \theta=\frac{1}{2}\right)\right\}, \gamma=\frac{\alpha-P\left(\sum_{i=1}^{2 n} X_{i}>m \mid \theta=\frac{1}{2}\right)}{P\left(\sum_{i=1}^{2 n} X_{i}=m \mid \theta=\frac{1}{2}\right)}

四、(20分) 随机向量XX服从多元正态分布N(0,In)N(0,I_n), AAnn阶对称阵, 试证明: XTAXχ2(r)X^TAX\sim \chi^2(r)的充分必要条件是AA为幂等矩阵且秩为rr.

Solution:

充分性: AA 是投影矩阵, 只有 0 和 1 特征值, 又秩为 rr, 故有 rr 个 特征值为 1, 因此存在正交矩阵 CC 使得 CTAC=(IrOOO)C^{T} A C=\left(\begin{array}{cc}I_{r} & O \\ O & O\end{array}\right). 故令 Y=CTXN(0,In)Y=C^{T} X \sim N\left(0, I_{n}\right),
因此 XTAX=YTCTACY=YT(IrOOO)Yχ2(r)X^{T} A X=Y^{T} C^{T} A C Y=Y^{T}\left(\begin{array}{ll}I_{r} & O \\ O & O\end{array}\right) Y \sim \chi^{2}(r).

必要性:设 AA 的特征值是 λ1,,λn\lambda_{1}, \cdots, \lambda_{n}, 设 Λ=diag{λ1,,λn}\Lambda=\operatorname{diag}\left\{\lambda_{1}, \cdots, \lambda_{n}\right\}, 由于 AA 是对称阵,
因此存在正交矩阵 CC 使得 CTAC=ΛC^{T} A C=\Lambda. 故令 Y=CTXN(0,In)Y=C^{T} X \sim N\left(0, I_{n}\right), 因此

XTAX=YTCTACY=YTΛY=i=1nλiYi2X^{T} A X=Y^{T} C^{T} A C Y=Y^{T} \Lambda Y=\sum_{i=1}^{n} \lambda_{i} Y_{i}^{2}

i=1nλiYi2\sum_{i=1}^{n} \lambda_{i} Y_{i}^{2} 的特征函数是 j=1n(12iλjt)12\prod_{j=1}^{n}\left(1-2 i \lambda_{j} t\right)^{-\frac{1}{2}}, 若 i=1nλiYi2\sum_{i=1}^{n} \lambda_{i} Y_{i}^{2} 恰服从 χ2(r)\chi^{2}(r), 由唯一性定
理, j=1n(12iλjt)12=(12it)r2\prod_{j=1}^{n}\left(1-2 i \lambda_{j} t\right)^{-\frac{1}{2}}=(1-2 i t)^{-\frac{r}{2}} 对任意 tRt \in R 成立, 因此只能其中有 rr 个 1 , 其余
是 0 . 故 Λ=Λ2=(CTAC)2=CTA2C\Lambda=\Lambda^{2}=\left(C^{T} A C\right)^{2}=C^{T} A^{2} C, 显然 A2=AA^{2}=A 是投影矩阵.

五、(20分) 有来自总体Xg(x)X\sim g(x)nn个随机样本X1,,XnX_1,\cdots,X_n, 已知g(x)=xf(x)μg(x)= \frac{xf(x)}{\mu}, 其中f(x)f(x)是未知的概率密度函数, μ\mu是正则化常数, x>0x>0, 且有

1<μ0+f(x)xdx<+,1<\mu \int_0^{+\infty}{\frac{f\left( x \right)}{x}dx}<+\infty ,

试构造μ\mu的相合估计μ^n\hat{\mu}_n并求其渐近分布.

Solution: 注意到 E1X=1μ0+f(x)dx=1μ\mathrm{E} \frac{1}{X}=\frac{1}{\mu} \int_{0}^{+\infty} f(x) d x=\frac{1}{\mu}, 由强大数律, 1ni=1n1Xi a.s. 1μ\frac{1}{n} \sum_{i=1}^{n} \frac{1}{X_{i}} \stackrel{\text { a.s. }}{\longrightarrow} \frac{1}{\mu}, 此有 μ^n=ni=1n1Xi a.s. μ\hat{\mu}_{n}=\frac{n}{\sum_{i=1}^{n} \frac{1}{X_{i}}} \stackrel{\text { a.s. }}{\longrightarrow} \mu. 考虑到 E1X2=1μ0+f(x)xdx>1μ2\mathrm{E} \frac{1}{X^{2}}=\frac{1}{\mu} \int_{0}^{+\infty} \frac{f(x)}{x} d x>\frac{1}{\mu^{2}} 且存在, 故 Var(1X)\operatorname{Var}\left(\frac{1}{X}\right) 存在且非零, 不妨设 Var(1X)=σ2\operatorname{Var}\left(\frac{1}{X}\right)=\sigma^{2}, 由中心极限定理知:

n(i=1n1Xin1μ)dN(0,σ2),\sqrt{n}\left(\frac{\sum_{i=1}^{n} \frac{1}{X_{i}}}{n}-\frac{1}{\mu}\right) \stackrel{d}{\rightarrow} N\left(0, \sigma^{2}\right),

由 delta 方法, 令 g(x)=1x,g(1μ)=μ2g(x)=\frac{1}{x}, g^{\prime}\left(\frac{1}{\mu}\right)=-\mu^{2}, 因此 n(μμ^n)dN(0,μ4σ2)\sqrt{n}\left(\mu-\hat{\mu}_{n}\right) \stackrel{d}{\longrightarrow} N\left(0, \mu^{4} \sigma^{2}\right).