南开大学-432统计学-2021年

一、选择题 (每题 4 分, 共 28 分)

  1. 一条线段随机分成三段, 能组成三角形的概率是( ).

A. 1/2;

B. 1/4

C. 1/3;

D. 1/6.

Solution: B
不妨设总长度为 1 , 设分段点分别为 X1,X2X_{1}, X_{2} i.i.d U(0,1)\sim U(0,1), 则三段的长度分别是

x(1),x(2)x(1),1x(2)x_{(1)}, x_{(2)}-x_{(1)}, 1-x_{(2)}

设事件 AA 表示三段可以构成三角形, 则

A={x(1)+x(2)x(1)>1x(2)}{x(1)+1x(2)>x(2)x(1)}{1x(2)+x(2)x(1)>x(1)}={x(2)>12,x(2)x(1)<12,x(1)<12}\begin{aligned} A &=\left\{x_{(1)}+x_{(2)}-x_{(1)}>1-x_{(2)}\right\} \cap\left\{x_{(1)}+1-x_{(2)}>x_{(2)}-x_{(1)}\right\} \cap\left\{1-x_{(2)}+x_{(2)}-x_{(1)}>x_{(1)}\right\} \\ &=\left\{x_{(2)}>\frac{1}{2}, x_{(2)}-x_{(1)}<\frac{1}{2}, x_{(1)}<\frac{1}{2}\right\} \end{aligned}

P(A)=0122 dx112x1+12 dx2=2012x1 dx1=14P(A)=\int_{0}^{\frac{1}{2}} 2 \mathrm{~d} x_{1} \int_{\frac{1}{2}}^{x_{1}+\frac{1}{2}} \mathrm{~d} x_{2}=2 \int_{0}^{\frac{1}{2}} x_{1} \mathrm{~d} x_{1}=\frac{1}{4}

(注: 这里 (x(1),x(2))f(x1,x2)=2I{0<x1<x2<1})\left.\left(x_{(1)}, x_{(2)}\right) \sim f\left(x_{1}, x_{2}\right)=2 \mathbf{I}_{\left\{0<x_{1}<x_{2}<1\right\}}\right)

  1. 如随机变量XXYY 满足: Var(X+Y)=Var(X)+Var(Y)Var(X+Y)=Var(X)+Var(Y), 则( ).

A. X,YX,Y独立;

B. X,YX,Y不相关;

C. X,YX,Y互斥;

D. Var(XY)=Var(X)Var(Y)Var(XY)=Var(X)Var(Y).

Solution: B

Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)\operatorname{Var}(X+Y)=\operatorname{Var}(X)+\operatorname{Var}(Y)+2 \operatorname{Cov}(X, Y), 所以 Cov(X,Y)=0\operatorname{Cov}(X, Y)=0, 即 XXYY 不相关.

  1. X1,X2XnX_{1}, X_{2} \cdots X_{n}为来自正态总体N(0,σ2)N\left(0, \sigma^{2}\right)的简单随机样本, 令T=ci=1n1(Xi+1Xi)2T=c \sum_{i=1}^{n-1}\left(X_{i+1}-X_{i}\right)^{2}, 为使TT成为σ2\sigma^{2} 的无偏估计, 则 c=c=( ).

A. 1n1\frac{1}{n-1};

B. 12(n1)\frac{1}{2(n-1)};

C. 1n\frac{1}{n};

D. 12n\frac{1}{2n}.

Solution: B
由于 Xi+1XiN(0,2σ2)X_{i+1}-X_{i} \sim N\left(0,2 \sigma^{2}\right), 所以

ET=cEi=1n1(Xi+1Xi)2=c2(n1)σ2E T=c E \sum_{i=1}^{n-1}\left(X_{i+1}-X_{i}\right)^{2}=c 2(n-1) \sigma^{2}

于是 c=12(n1)c=\frac{1}{2(n-1)}.

  1. 设随机变量 XX 服从 N(0,1)N(0,1), 随机变量 YY 服从自由度为 3 的 tt 分布, 则对于一个常数 c(c>2)c(c>2), 下述正确的是( ).

A. P(Xc)>P(Yc)P(|X| \geq c)>P(|Y| \geq c);

B. P(Xc)<P(Yc)P(|X| \geq c)<P(|Y| \geq c);

C. P(Xc)=P(Yc)P(|X| \geq c)=P(|Y| \geq c);

D. 无法确定.

Solution: B
t\mathrm{t} 分布的尾部概率要大于正态分布, 即它是厚尾分布, 这是一个常用结论.

  1. X1,X2XnX_{1}, X_{2} \cdots X_{n}为来自正态总体N(μ,σ2)N\left(\mu, \sigma^{2}\right)的简单随机样本, μ,σ2\mu,\sigma^2是未知参数, 则μ\mu的置信区间长度( ).

A. 只和xˉ\bar{x}有关;

B. 只和s2s^2有关;

C. 和xˉ,s2\bar{x},s^2有关;

D. 和σ\sigma有关.

Solution: B
μ\mu 的置信区间是 Xˉ±snt1α2(n1)\bar{X} \pm \frac{s}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1), 区间长度 2snt1α2(n1)2 \frac{s}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1) 只与 ss 有关.

  1. 设总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^{2}\right), 其中 μ\mu 未知, σ2\sigma^{2} 已知,(X1,X2,X3)\left(X_{1}, X_{2}, X_{3}\right) 为来自总体 XX 的样本, 则以下哪一项不是统计量.( )

A. X1+2X2X_1+2X_2;

B. max{X1,X2,X3}\max \{X_1,X_2,X_3\};

C. i=1nXi2σ2\sum_{i=1}^n\frac{X_i^2}{\sigma^2};

D. i=1n(Xiμ)\sum_{i=1}^n (X_i - \mu).

Solution: D
统计量的表达式中不应含有末知参数.

  1. X1,X2,,XnX_1 ,X_2 ,\cdots,X_n 为来自正态总体N(μ,1)N(\mu,1) 的简单随机样本, 则关于假设

H0:μ1vsH1:μ<1H_0: \mu \ge 1 \quad \mathrm{vs} \quad H_1: \mu < 1

的显著性检验是( ).

A. 单侧uu检验;

B. 单侧tt检验;

C. 双侧uu检验;

D. 双侧tt检验.

Solution: A
正态总体, 方差已知, 备择假设单侧, 因此选用单侧 uu 检验.

二、填空题(每题4分, 共32分)

  1. 已知XN(μ,σ2)X\sim N(\mu,\sigma^2), 则σ\sigma的费雪信息量是________.

Solution: 2σ2\frac{2}{\sigma^{2}}

f(x,σ2)=12πσexp{(xμ)22σ2},lnf(x,σ2)12lnσ2(xμ)22σ2f\left(x, \sigma^{2}\right)=\frac{1}{\sqrt{2 \pi} \sigma} \exp \left\{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}\right\}, \ln f\left(x, \sigma^{2}\right) \propto-\frac{1}{2} \ln \sigma^{2}-\frac{(x-\mu)^{2}}{2 \sigma^{2}}

2lnf(x,σ2)(σ2)2=12σ4(xμ)2σ6\frac{\partial^{2} \ln f\left(x, \sigma^{2}\right)}{\partial\left(\sigma^{2}\right)^{2}}=\frac{1}{2 \sigma^{4}}-\frac{(x-\mu)^{2}}{\sigma^{6}}, 由指数族的性质算得

I(σ2)=E(2lnf(x,σ2)(σ2)2)=(12σ4σ2σ6)=12σ4I\left(\sigma^{2}\right)=-E\left(\frac{\partial^{2} \ln f\left(x, \sigma^{2}\right)}{\partial\left(\sigma^{2}\right)^{2}}\right)=-\left(\frac{1}{2 \sigma^{4}}-\frac{\sigma^{2}}{\sigma^{6}}\right)=\frac{1}{2 \sigma^{4}}

g(σ2)=σ2g\left(\sigma^{2}\right)=\sqrt{\sigma^{2}}, 则 σ=g(σ2)\sigma=g\left(\sigma^{2}\right) 的 Fisher 信息量是

I(σ)=I(σ2)(g(σ2))2=12σ41(12σ)2=2σ2I(\sigma)=\frac{I\left(\sigma^{2}\right)}{\left(g^{\prime}\left(\sigma^{2}\right)\right)^{2}}=\frac{1}{2 \sigma^{4}} \cdot \frac{1}{\left(\frac{1}{2 \sigma}\right)^{2}}=\frac{2}{\sigma^{2}} \text {. }

  1. 有来自总体XN(μ,σ2)X\sim N(\mu,\sigma^2)的样本X1,,Xn,Xn+1X_1,\cdots,X_n,X_{n+1}, 令Xˉn=1ni=1nXi\bar{X}_n=\frac{1}{n}\sum_{i=1}^n X_i, Sn2=1n1(XiXˉn)2S^2_n=\frac{1}{n-1}(X_i-\bar{X}_n)^2, 则nn+1Xn+1XˉnSn\sqrt{\frac{n}{n+1}}\frac{X_{n+1}-\bar{X}_n}{S_n}服从的分布是________.

Solution: t(n1)t(n-1)
根据 Fisher 引理知, XˉnN(μ,σ2n)\bar{X}_{n} \sim N\left(\mu, \frac{\sigma^{2}}{n}\right) 以及 (n1)Sn2σ2χ2(n1)\frac{(n-1) S_{n}{ }^{2}}{\sigma^{2}} \sim \chi^{2}(n-1), 且二者相互独 立的. 而它们显然都是与 Xn+1X_{n+1} 独立的, 则

Xn+1Xˉnn+1nσ2N(0,1)\frac{X_{n+1}-\bar{X}_{n}}{\sqrt{\frac{n+1}{n} \sigma^{2}}} \sim N(0,1)

它与 (n1)Sn2σ2\frac{(n-1) S_{n}{ }^{2}}{\sigma^{2}} 也是独立, 再根据 tt 分布的定义有,

Xn+1Xˉnn+1nσ2(n1)Sn2σ2/(n1)=nn+1Xn+1XˉnSn2t(n1).\frac{\frac{X_{n+1}-\bar{X}_{n}}{\sqrt{\frac{n+1}{n}} \sigma^{2}}}{\sqrt{\frac{(n-1) S_{n}{ }^{2}}{\sigma^{2}} /(n-1)}}=\sqrt{\frac{n}{n+1}} \frac{X_{n+1}-\bar{X}_{n}}{S_{n}{ }^{2}} \sim t(n-1) .

  1. 伽马分布f(x)=βαΓ(α)xα1eβxf(x)=\frac{\beta^{\alpha}}{\Gamma(\alpha)}x^{\alpha -1 }e^{-\beta x}的特征函数是________.

Solution: (1itβ)α\left(1-\frac{i t}{\beta}\right)^{-\alpha}

φ(t)=0eitxβαΓ(α)xα1eβxdx=0βαΓ(α)xα1e(βit)xdx=βαΓ(α)(βit)α0[(βit)x]α1e(βit)xdx=(1itβ)α.\begin{aligned} \varphi \left( t \right) &=\int_0^{\infty}{e^{itx}\frac{\beta ^{\alpha}}{\Gamma \left( \alpha \right)}x^{\alpha -1}e^{-\beta x}dx} \\ &=\int_0^{\infty}{\frac{\beta ^{\alpha}}{\Gamma \left( \alpha \right)}x^{\alpha -1}e^{-\left( \beta -it \right) x}dx} \\ &=\frac{\beta ^{\alpha}}{\Gamma \left( \alpha \right)}\left( \beta -it \right) ^{-\alpha}\int_0^{\infty}{\left[ \left( \beta -it \right) x \right] ^{\alpha -1}e^{-\left( \beta -it \right) x}dx} \\ &=\left( 1-\frac{it}{\beta} \right) ^{-\alpha}. \end{aligned}

  1. 某圆盘的半径在区间(a,b)(a,b)上服从均匀分布, 则该圆盘的平均面积为________.

Solution: π(a2+b2+ab)3\frac{\pi\left(a^{2}+b^{2}+a b\right)}{3}
半径 RU(a,b)R \sim U(a, b), 则期望面积为 E(πR2)=abπr2drba=π(a2+b2+ab)3E\left(\pi R^{2}\right)=\frac{\int_{a}^{b} \pi r^{2} d r}{b-a}=\frac{\pi\left(a^{2}+b^{2}+a b\right)}{3}.

  1. 现有nn名男生与mm名女生(mn)(m\le n)随机地站成一排, 则任意两名女生都不相邻的概率是________.

Solution: Cn+1mCn+mm\frac{C_{n+1}^{m}}{C_{n+m}^{m}}
由于本题无需考虑男女生个体的差异, 则全体样本空间中的样本点数量可视为 n+mn+m 个位置中选 mm 个位置, 即 #Ω=Cn+mm\# \Omega=C_{n+m}^{m}. 再利用隔板法, 先将 nn 个男生排列好后, 将 mm 个女 生揷入男生间隔处(所有男生中间, 以及第一个男生前方与最后一个男生后方, 共 n+1n+1 个), 有利样本数为# E=Cn+1mE=C_{n+1}^{m}. 所求概率即

P(E)=#E#Ω=Cn+1mCn+mm.P(E)=\frac{\# E}{\# \Omega}=\frac{C_{n+1}^{m}}{C_{n+m}^{m}} .

  1. 已知XN(0,1)X\sim N(0,1), 则Y=XY=|X|的密度函数是________.

Solution: fY(y)=2πey22,y>0f_{Y}(y)=\sqrt{\frac{2}{\pi}} e^{-\frac{y^{2}}{2}}, y>0
用分布函数法, 对于 y>0\forall y>0, 有

FY(y)=P(Xy)=Φ(y)Φ(y)F_{Y}(y)=P(|X| \leqslant y)=\Phi(y)-\Phi(-y)

因此 YY 的密度函数是

fY(y)=dFY(y)dy=2πey22,y>0f_{Y}(y)=\frac{d F_{Y}(y)}{d y}=\sqrt{\frac{2}{\pi}} e^{-\frac{y^{2}}{2}}, y>0

  1. 有来自总体XBeta(θ,1)X \sim Beta(\theta,1)nn个随机样本X1,,XnX_1,\cdots,X_n, 则1θ\frac{1}{\theta}的MLE是________.

Solution: 1ni=1nlnXi-\frac{1}{n}\sum_{i=1}^n{\ln X_i}

密度函数是 f(x)=θxθ1,0<x<1f(x)=\theta x^{\theta-1}, 0<x<1. 则似然函数为 L(θ)=θn(i=1nXi)θ1L(\theta)=\theta^{n}\left(\prod_{i=1}^{n} X_{i}\right)^{\theta-1}, 取对 数有 lnL(θ)=nlnθ+(θ1)i=1nlnXi\ln L(\theta)=n \ln \theta+(\theta-1) \sum_{i=1}^{n} \ln X_{i}, 将其关于参数求导并置 0 , 得似然方程

lnLθ=nθ+i=1nlnXi=0\frac{\partial \ln L}{\partial \theta}=\frac{n}{\theta}+\sum_{i=1}^{n} \ln X_{i}=0

解得 θ^=ni=1nlnXi\hat{\theta}=-\frac{n}{\sum_{i=1}^{n} \ln X_{i}}θ\theta 的 MLE. 由不变性易得答案.

  1. 设随机样本X1,,XnX_1,\cdots,X_n独立同分布, 又已知EX1=0EX_1=0, Var(X1)=σ2Var(X_1)=\sigma^2, 则Cov(X1,Xˉ)=Cov(X_1,\bar{X})=________.

Solution: 1nσ2\frac{1}{n} \sigma^{2}

Cov(X1,Xˉ)=Cov(X1,1ni=1nXi)=1nCov(X1,X1)=1nσ2.\operatorname{Cov}\left(X_{1}, \bar{X}\right)=\operatorname{Cov}\left(X_{1}, \frac{1}{n} \sum_{i=1}^{n} X_{i}\right)=\frac{1}{n} \operatorname{Cov}\left(X_{1}, X_{1}\right)=\frac{1}{n} \sigma^{2} .

三、解答题(90分)

1.(10分)设盒中有bb个黑球, rr个白球. 每次随机取出一个观察颜色后放回, 并加入cc个同色球, 如此一直重复, 求第NN次取得黑球的概率.

Solution:
用随机变量 XiX_{i} 表示第 ii 次摸球放球后, 盒子中黑球的数量, 此时盒子中球的总数为
b+r+cib+r+c i, 则第 i+1i+1 摸出黑球的概率应为 pi+1=EXib+r+cip_{i+1}=\frac{E X_{i}}{b+r+c i}.
再设 0-1 随机变量 ξi={1, 第 i 次摸出黑球 0, 第 i 次摸出白球 \xi_{i}=\left\{\begin{array}{ll}1, & \text { 第 } i \text { 次摸出黑球 } \\ 0, & \text { 第 } i \text { 次摸出白球 }\end{array}\right., 显然

Eξi=pi=EXi1b+r+c(i1)E \xi_{i}=p_{i}=\frac{E X_{i-1}}{b+r+c(i-1)}

再建立递推式, 即 Xi=Xi1+cξiX_{i}=X_{i-1}+c \xi_{i}, 利用这一递推式虽然无法求出 XiX_{i} 的分布, 但是 我们可以对该式左右取期望, 即

EXi=EXi1+cEξiEXi=EXi1+cEXi1b+r+c(i1)EXi=b+r+cib+r+c(i1)EXi1EXib+r+ci=EXi1b+r+c(i1)\begin{aligned} E X_{i} &=E X_{i-1}+c E \xi_{i} \\ E X_{i} &=E X_{i-1}+c \frac{E X_{i-1}}{b+r+c(i-1)} \\ E X_{i} &=\frac{b+r+c i}{b+r+c(i-1)} E X_{i-1} \\ \frac{E X_{i}}{b+r+c i} &=\frac{E X_{i-1}}{b+r+c(i-1)} \end{aligned}

注意到最后一个式子即 pi+1=pip_{i+1}=p_{i}, 这说明每一次摸出黑球的概率都是一样的, 所以

pn=p1=EX0b+r=bb+r.p_{n}=p_{1}=\frac{E X_{0}}{b+r}=\frac{b}{b+r} .

2.(15分)有随机变量序列{Xn}\{ X_n\}, 记Yn=1ni=1nXi,an=EYnY_n=\frac{1}{n}\sum_{i=1}^n X_i, a_n = EY_n, 证明: {Xn}\{ X_n\}服从大数定律的充要条件是

limnE[(Ynan)21+(Ynan)2]=0.\underset{n\rightarrow \infty}{\lim}E\left[ \frac{\left( Y_n-a_n \right) ^2}{1+\left( Y_n-a_n \right) ^2} \right] =0.

Solution:
[充分性] 函数 f(t)=t21+t2(t>0)f(t)=\frac{t^{2}}{1+t^{2}}(t>0) 为单调增的非负函数, 则可写出不等式

f(ε)I{Ynanε}f(Ynan)I{Ynanε}f(Ynan)f(\varepsilon) I_{\left\{\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right\}} \leqslant f\left(\left|Y_{n}-a_{n}\right|\right) I_{\left\{\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right\}} \leqslant f\left(\left|Y_{n}-a_{n}\right|\right)

对该不等式最左和最右均取期望, 不等号仍然成立, 即

f(ε)P(Ynanε)Ef(Ynan)P(Ynanε)1f(ε)Ef(Ynan)\begin{aligned} f(\varepsilon) P\left(\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right) \leqslant E f\left(\left|Y_{n}-a_{n}\right|\right) \\ P\left(\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right) \leqslant \frac{1}{f(\varepsilon)} \operatorname{Ef}\left(\left|Y_{n}-a_{n}\right|\right) \end{aligned}

1f(ε)Ef(Ynan)=1+ε2ε2E((Ynan)21+(Ynan)2)0\frac{1}{f(\varepsilon)} E f\left(\left|Y_{n}-a_{n}\right|\right)=\frac{1+\varepsilon^{2}}{\varepsilon^{2}} E\left(\frac{\left(Y_{n}-a_{n}\right)^{2}}{1+\left(Y_{n}-a_{n}\right)^{2}}\right) \rightarrow 0 ,所以 YnanP0Y_{n}-a_{n} \stackrel{P}{\rightarrow} 0, 即 {Xn}\left\{X_{n}\right\} 服从大数定律.

[必要性] {Xn}\left\{X_{n}\right\} 服从大数定律, 即对任意 ε>0,limnP(Ynanε)=0\varepsilon>0, \lim _{n \rightarrow \infty} P\left(\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right)=0.
再次考虑函数 f(t)=t21+t2(t>0)f(t)=\frac{t^{2}}{1+t^{2}}(t>0) 为单调增的非负函数以及其具有上界 1 , 利用重 期望公式, 对于任意 ε>0\varepsilon>0, 有

E[Yan21+Yan2]=E[Yan21+Yan2Ynan<ε]P(Ynan<ε)+E[Yan21+Yan2Ynanε]P(Ynanε)ε21+ε21+1P(Ynanε)\begin{aligned} E\left[\frac{\left|Y-a_{n}\right|^{2}}{1+\left|Y-a_{n}\right|^{2}}\right]=& E\left[\frac{\left|Y-a_{n}\right|^{2}}{1+\left|Y-a_{n}\right|^{2}}|| Y_{n}-a_{n} \mid<\varepsilon\right] P\left(\left|Y_{n}-a_{n}\right|<\varepsilon\right) \\ &+E\left[\frac{\left|Y-a_{n}\right|^{2}}{1+\left|Y-a_{n}\right|^{2}}|| Y_{n}-a_{n} \mid \geqslant \varepsilon\right] P\left(\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right) \\ \leqslant & \frac{\varepsilon^{2}}{1+\varepsilon^{2}} \cdot 1+1 \cdot P\left(\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right) \end{aligned}

其中 P(Ynanε)0P\left(\left|Y_{n}-a_{n}\right| \geqslant \varepsilon\right) \rightarrow 0, 再根据 ε\varepsilon 的任意性知, 令 ε0\varepsilon \rightarrow 0

E[Yan21+Yan2]0E\left[\frac{\left|Y-a_{n}\right|^{2}}{1+\left|Y-a_{n}\right|^{2}}\right] \rightarrow 0

3.(10分)有来总体F(x)F(x)nn个随机样本, Fn(x)F_n(x)为经验分布函数, 试证明: 对任意xRx\in R, Fn(x)F_n(x)均方收敛于F(x)F(x), 进而有依概率、按分布收敛于F(x)F(x).

Solution: 经验分布函数为 Fn(x)=1ni=1nI{Xix}F_{n}(x)=\frac{1}{n} \sum_{i=1}^{n} I_{\left\{X_{i} \leqslant x\right\}}, 由于 I{Xix}I_{\left\{X_{i} \leqslant x\right\}} i.i.d b(1,F(x))\sim b(1, F(x)), 根据二项 分布的可加性知道 i=1nI{Xix}B(n,F(x))\sum_{i=1}^{n} I_{\left\{X_{i} \leqslant x\right\}} \sim B(n, F(x)). 由于 EFn(x)=1nnF(x)=F(x)E F_{n}(x)=\frac{1}{n} \cdot n F(x)=F(x), 则 Fn(x)F_{n}(x)F(x)F(x) 的无偏估计, 所以

E(Fn(x)F(x))2=Var(Fn(x))=1n2nF(x)[1F(x)]1n0\begin{aligned} E\left(F_{n}(x)-F(x)\right)^{2} &=\operatorname{Var}\left(F_{n}(x)\right) \\ &=\frac{1}{n^{2}} \cdot n \cdot F(x) \cdot[1-F(x)] \\ & \leqslant \frac{1}{n} \rightarrow 0 \end{aligned}

所以对于 xR\forall x \in R, 有 Fn(x)L2F(x)F_{n}(x) \stackrel{L_{2}}{\longrightarrow} F(x), 进而 Fn(x)PF(x),Fn(x)LF(x)F_{n}(x) \stackrel{P}{\rightarrow} F(x), F_{n}(x) \stackrel{L}{\rightarrow} F(x).

4.(15分)有来自总体N(μ,1)N(\mu,1)nn个随机样本, 考虑假设检验问题

H0:μ=1vsH1:μ>1,H_0: \mu =1 \quad \mathrm{vs} \quad H_1: \mu > 1,

有拒绝域W1={xˉ:xˉ>1+z0.95n}W_1=\{\bar{x}: \bar{x} > 1+ \frac{z_{0.95}}{\sqrt{n}}\}W2={xˉ:1+z0.95n>xˉ>1+z0.9n}W_2=\{\bar{x}:1+ \frac{z_{0.95}}{\sqrt{n}} > \bar{x} > 1+ \frac{z_{0.9}}{\sqrt{n}}\}, 分别求它们的

(1) 两类错误和功效函数.

(2) 你认为谁更优, 为什么?

Solution: (1)
对于 W1W_{1}, 其功效函数为

ρW1(μ)=P(Xˉ>1+z0.95n)=P((Xˉμ)n>(1+z0.95nμ)n)=1Φ((1+z0.95nμ)n)\begin{aligned} \rho_{W_{1}}(\mu) &=P\left(\bar{X}>1+\frac{z_{0.95}}{\sqrt{n}}\right) \\ &=P\left((\bar{X}-\mu) \sqrt{n}>\left(1+\frac{z_{0.95}}{\sqrt{n}}-\mu\right) \sqrt{n}\right) \\ &=1-\Phi\left(\left(1+\frac{z_{0.95}}{\sqrt{n}}-\mu\right) \sqrt{n}\right) \end{aligned}

所以犯两类错误的概率分别为

α1=ρW1(1)=0.05β1(μ)=1ρW1(μ)=Φ((1+z0.95nμ)n),μ>1\begin{aligned} &\alpha_{1}=\rho_{W_{1}}(1)=0.05 \\ &\beta_{1}(\mu)=1-\rho_{W_{1}}(\mu)=\Phi\left(\left(1+\frac{z_{0.95}}{\sqrt{n}}-\mu\right) \sqrt{n}\right), \mu>1 \end{aligned}

对于 W2W_{2}, 其功效函数为

ρW2(μ)=P(1+z0.95n>Xˉ>1+z0.90n)=P((1+z0.95nμ)n>(Xˉμ)n>(1+z0.90nμ)n)=Φ((1+z0.95nμ)n)Φ((1+z0.90nμ)n)\begin{aligned} \rho_{W_{2}}(\mu) &=P\left(1+\frac{z_{0.95}}{\sqrt{n}}>\bar{X}>1+\frac{z_{0.90}}{\sqrt{n}}\right) \\ &=P\left(\left(1+\frac{z_{0.95}}{\sqrt{n}}-\mu\right) \sqrt{n}>(\bar{X}-\mu) \sqrt{n}>\left(1+\frac{z_{0.90}}{\sqrt{n}}-\mu\right) \sqrt{n}\right) \\ &=\Phi\left(\left(1+\frac{z_{0.95}}{\sqrt{n}}-\mu\right) \sqrt{n}\right)-\Phi\left(\left(1+\frac{z_{0.90}}{\sqrt{n}}-\mu\right) \sqrt{n}\right) \end{aligned}

所以犯两类错误的概率分别为

α2=ρW2(1)=0.05β2(μ)=1ρW2(μ)=1Φ((1+z0.95nμ)n)+Φ((1+z0.90nμ)n),μ>1\begin{aligned} \alpha_{2} &=\rho_{W_{2}}(1)=0.05 \\ \beta_{2}(\mu) &=1-\rho_{W_{2}}(\mu) \\ &=1-\Phi\left(\left(1+\frac{z_{0.95}}{\sqrt{n}}-\mu\right) \sqrt{n}\right)+\Phi\left(\left(1+\frac{z_{0.90}}{\sqrt{n}}-\mu\right) \sqrt{n}\right), \mu>1 \end{aligned}

(2)
W1W_{1} 是更优的, 根据 N-P 引理可以知道它是 UMP 拒绝域. 它是所有水平不超过 0.050.05 的 检验中犯第二类错误概率最小的, 而根据(1)的分析, W2W_{2} 是一个水平为 0.050.05 的检验, 所以 W1W_{1} 要优于它.

5.(15分) 有来自总体XB(1,p)X\sim B(1,p)的随机样本X1,,XnX_1,\cdots,X_n, q=1pq=1-p, 求

(1) pqpq的UMVUE;

(2) (1p)2(1-p)^2的MLE, 问它是否无偏, 若不是请求出一个无偏估计.

Solution: (1) 总体的分布列是

P(X=x)=px(1p)1x=(1p)(p1p)x=(1p)exp{xln(p1p)},x=0,1\begin{aligned} P(X=x) &=p^{x}(1-p)^{1-x} \\ &=(1-p)\left(\frac{p}{1-p}\right)^{x} \\ &=(1-p) \exp \left\{x \ln \left(\frac{p}{1-p}\right)\right\}, x=0,1 \end{aligned}

所以 XX 是一个单参的完全指数族分布, 由其标准形式密度函数可以看出参数 pp 的充分
完全统计量是 T=i=1nXiT=\sum_{i=1}^{n} X_{i}, 或者 Xˉ=1ni=1nXi\bar{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i}. 计算可得到

{EXˉ=pEXˉ2=pn+n1np2\left\{\begin{array}{l} E \bar{X}=p \\ E \bar{X}^{2}=\frac{p}{n}+\frac{n-1}{n} p^{2} \end{array}\right.

于是 E[nn1(XˉXˉ2)]=pp2=p(1p)=pqE\left[\frac{n}{n-1}\left(\bar{X}-\bar{X}^{2}\right)\right]=p-p^{2}=p(1-p)=p q, 所以根据 L-S 定理可知 nn1(XˉXˉ2)\frac{n}{n-1}\left(\bar{X}-\bar{X}^{2}\right)pqp q 的 UMVUE.
(2) 似然函数为 L(p)=pi=1nxi(1p)ni=1nxiL(p)=p^{\sum_{i=1}^{n} x_{i}}(1-p)^{n-\sum_{i=1}^{n} x_{i}}, 取对数并关于参数求偏导置 0 , 得

i=1nXipni=1nXi1p=0\frac{\sum_{i=1}^{n} X_{i}}{p}-\frac{n-\sum_{i=1}^{n} X_{i}}{1-p}=0

解得 pp 的 MLE 是 Xˉ\bar{X}, 再根据不变性可知 (1p)2(1-p)^{2}MLE\operatorname{MLE}(1Xˉ)2(1-\bar{X})^{2}, 而

E[(1Xˉ)2]=Var(1Xˉ)+(1p)2=(1p)2+p(1p)n,E[(1-\bar{X})^{2}]= Var(1-\bar{X}) + (1-p)^2 = (1-p)^2 + \frac{p(1-p)}{n},

它不是 (1p)2(1-p)^{2} 的无偏估计, 取

M=(1Xˉ)2nn1(XˉXˉ2),M= (1-\bar{X})^2 - \frac{n}{n-1}(\bar{X}-\bar{X}^2),

计算可验证其为 (1p)2(1-p)^{2} 的无偏估计, 根据 L-S 定理知其为 UMVUE.

6.(15分) 随机变量φU(0,1)\varphi \sim U(0,1), 随机变量RR的密度函数是f(r)=rer22,r>0f(r)=re^{-\frac{r^2}{2}},r>0, 且RRφ\varphi独立, 对于数列{an}\{a_n\}, 试证明: {Xn=Rcos(2π(an+φ))}\{X_n=R \cos (2\pi (a_n+\varphi) )\}是正态序列.

Solution:
对于任意的数列 {an},Yn=2π(an+φ)U(2πan,2πan+2π)\left\{a_{n}\right\}, Y_{n}=2 \pi\left(a_{n}+\varphi\right) \sim U\left(2 \pi a_{n}, 2 \pi a_{n}+2 \pi\right), 考虑用微分法求 XnX_{n} 的密度函数, 有

P(Xn=x)=P(RcosYn=x)=2πan2πan+2πP(R=xcosy)12πdy=2πan2πan+2π(xcosyex22cos2ydxcosyI{xcosy>0})12πdy\begin{aligned} P\left(X_{n}=x\right) &=P\left(R \cos Y_{n}=x\right) \\ &=\int_{2 \pi a_{n}}^{2 \pi a_{n}+2 \pi} P\left(R=\frac{x}{\cos y}\right) \frac{1}{2 \pi} \mathrm{d} y \\ &=\int_{2 \pi a_{n}}^{2 \pi a_{n}+2 \pi}\left(\frac{x}{\cos y} e^{-\frac{x^{2}}{2 \cos ^{2} y}} \frac{d x}{\cos y} I_{\left\{\frac{x}{\cos y}>0\right\}}\right) \frac{1}{2 \pi} \mathrm{d} y \end{aligned}

注意第二行使用了连续场合的全概率公式,该积分是对 yy 的积分, 而 dxd x 则是微分法中 的微元记号, 则被积函数中含有 yy 的部分均为周期函数 cosy\cos y, 且积分区间的长度是其周期 2π2 \pi, 于是该积分等同于

π232π(xcosyex22cos2ydxcosyI{xcosy>0})12πdy\int_{-\frac{\pi}{2}}^{\frac{3}{2} \pi}\left(\frac{x}{\cos y} e^{-\frac{x^{2}}{2 \cos ^{2} y}} \frac{d x}{\cos y} I_{\left\{\frac{x}{\cos y}>0\right\}}\right) \frac{1}{2 \pi} \mathrm{d} y

其中

π2π2ex22cos2ycos2y dy=π2π2e12(x2tan2y+x2)d(tany)=ex22π2π2e12x2tan2y d(tany)=ex22x+ez22 dz=2πex22x\begin{aligned} \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} \frac{e^{-\frac{x^{2}}{2 \cos ^{2} y}}}{\cos ^{2} y} \mathrm{~d} y &=\int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} e^{-\frac{1}{2}\left(x^{2} \tan ^{2} y+x^{2}\right)} \mathrm{d}(\tan y) \\ &=e^{-\frac{x^{2}}{2}} \int_{-\frac{\pi}{2}}^{\frac{\pi}{2}} e^{-\frac{1}{2} x^{2} \tan ^{2} y} \mathrm{~d}(\tan y) \\ &=\frac{e^{-\frac{x^{2}}{2}}}{x} \int_{-\infty}^{+\infty} e^{-\frac{z^{2}}{2}} \mathrm{~d} z=\sqrt{2 \pi} \frac{e^{-\frac{x^{2}}{2}}}{x} \end{aligned}

同理 π23π2ex22cos2ycos2y dy=2πex22x\int_{\frac{\pi}{2}}^{\frac{3 \pi}{2}} \frac{e^{-\frac{x^{2}}{2 \cos ^{2} y}}}{\cos ^{2} y} \mathrm{~d} y=\sqrt{2 \pi} \frac{e^{-\frac{x^{2}}{2}}}{x}, 综上所述

P(Xn=x)={x2π2πex22xdx,x>0x2π2πex22xdx,x<0=12πex22,<x<+P\left(X_{n}=x\right)=\left\{\begin{array}{l} \frac{x}{2 \pi} \sqrt{2 \pi} \frac{e^{-\frac{x^{2}}{2}}}{x} d x, \quad x>0 \\ \frac{x}{2 \pi} \sqrt{2 \pi} \frac{e^{-\frac{x^{2}}{2}}}{x} d x, \quad x<0 \end{array}=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^{2}}{2}},-\infty<x<+\infty\right.

这里最后一步补充了 x=0x=0 处的定义. 于是发现 XnN(0,1)X_{n} \sim N(0,1).

7.(10分) 有来自总体N(μ,σ2)N(\mu,\sigma^2)的随机样本X1,,XnX_1,\cdots,X_n, 考虑假设检验问题

H0:σ2=σ02vsH1:σ2σ02,H_0: \sigma^2 =\sigma^2_0 \quad \mathrm{vs} \quad H_1:\sigma^2 \neq \sigma_0^2,

给定显著性水平α\alpha, 证明该问题的似然比检验可由统计量χ2=(n1)S2σ02\chi^2 = \frac{(n-1)S^2}{\sigma_0^2}给出.

Solution:
似然函数为 L(μ,σ2)=(2πσ2)n2exp{i=1n(Xiμ)22σ2}L\left(\mu, \sigma^{2}\right)=\left(2 \pi \sigma^{2}\right)^{-\frac{n}{2}} \exp \left\{-\frac{\sum_{i=1}^{n}\left(X_{i}-\mu\right)^{2}}{2 \sigma^{2}}\right\}, 容易求得在无约束空 间中以及约束空间 Θ0={σ2=σ02}\Theta_{0}=\left\{\sigma^{2}=\sigma_{0}^{2}\right\} 下参数的 MLE, 它们分别是
Θ\Theta{μ^=Xˉσ^12=i=1n(XiXˉ)2n\left\{\begin{array}{l}\hat{\mu}=\bar{X} \\ \hat{\sigma}_{1}^{2}=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}{n}\end{array}\right., Θ0\Theta_{0}{μ^=Xˉσ^02=σ02\left\{\begin{array}{l}\hat{\mu}=\bar{X} \\ \hat{\sigma}_{0}^{2}=\sigma_{0}{ }^{2}\end{array}\right., 则广义似然比为

Λ=L(Xˉ,σ^2)L(Xˉ,σ02)=(2πσ^2)n2exp{i=1n(XiXˉ)22σ^2}(2πσ02)n2exp{i=1n(XiXˉ)22σ02}}=(σ^2σ02)n2exp{n2+i=1n(XiXˉ)22σ02}=(n1ns2σ02)n2exp{(n1)s22σ02}en2\begin{aligned} \Lambda &=\frac{L\left(\bar{X}, \hat{\sigma}^{2}\right)}{L\left(\bar{X}, \sigma_{0}^{2}\right)} \\ &\left.=\frac{\left(2 \pi \hat{\sigma}^{2}\right)^{-\frac{n}{2}} \exp \left\{-\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}{2 \hat{\sigma}^{2}}\right\}}{\left(2 \pi \sigma_{0}^{2}\right)^{-\frac{n}{2}} \exp \left\{-\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}{2 \sigma_{0}^{2}}\right\}}\right\} \\ &=\left(\frac{\hat{\sigma}^{2}}{\sigma_{0}^{2}}\right)^{-\frac{n}{2}} \exp \left\{-\frac{n}{2}+\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}{2 \sigma_{0}{ }^{2}}\right\} \\ &=\left(\frac{\frac{n-1}{n} s^{2}}{\sigma_{0}^{2}}\right)^{-\frac{n}{2}} \exp \left\{\frac{(n-1) s^{2}}{2 \sigma_{0}^{2}}\right\} e^{-\frac{n}{2}} \end{aligned}

χ2=(n1)s2σ02\chi^{2}=\frac{(n-1) s^{2}}{\sigma_{0}^{2}}, 则 Λ=(1n)n2(χ2)n2exp{χ22}en2\Lambda=\left( \frac{1}{n} \right) ^{-\frac{n}{2}} \left(\chi^{2}\right)^{-\frac{n}{2}} \exp \left\{\frac{\chi^{2}}{2}\right\} e^{-\frac{n}{2}} 是关于 χ2\chi^{2} 的先减后增函数, 因此 似然比拒绝域

W={Λc}{χ2a}{χ2b}W=\{\Lambda \geqslant c\} \Leftrightarrow\left\{\chi^{2} \leqslant a\right\} \cup\left\{\chi^{2} \geqslant b\right\}

又注意到当 H0H_{0} 成立时, χ2χ2(n1)\chi^{2} \sim \chi^{2}(n-1), 所以给定显著性水平 α\alpha, 该假设检验问题 的似然比拒绝域可写为

W={χ2χα22(n1)}{χ2χ1α22(n1)}.W=\left\{\chi^{2} \leqslant \chi_{\frac{\alpha}{2}}^{2}(n-1)\right\} \cup\left\{\chi^{2} \geqslant \chi_{1-\frac{\alpha}{2}}^{2}(n-1)\right\} .