中国科学技术大学-812概率论与数理统计-2019年

一、(15分) 将kk个相同的球随机放入nn个不同的罐子,每个球放入各个罐子的可能性相同. 试求

(1)(7分) 指定的某个罐子恰有rr个球的概率(r<k);(r<k) ;

(2)(8分) 不空罐子数目的数学期望.

Solution:
(1) 指定的罐子中球的个数服从 B(k,1n)B\left(k, \frac{1}{n}\right), 因此恰有 rr 个的概率是

Ckr(1n)r(n1n)kr.C_{k}^{r}\left(\frac{1}{n}\right)^{r}\left(\frac{n-1}{n}\right)^{k-r} .

(2) 用 Xi=1X_{i}=1 表示第 ii 个罐子无球, 若有球则记 Xi=0X_{i}=0, 显然有

EXi=P(Xi=1)=Ck0(1n)0(n1n)k=(11n)k,E X_{i}=P\left(X_{i}=1\right)=C_{k}^{0}\left(\frac{1}{n}\right)^{0}\left(\frac{n-1}{n}\right)^{k}=\left(1-\frac{1}{n}\right)^{k},

空罐子数的数学期望是 E[X1++Xn]=n(11n)kE\left[X_{1}+\cdots+X_{n}\right]=n\left(1-\frac{1}{n}\right)^{k}, 因此不空罐子数的数学期望 是 nn(11n)kn-n\left(1-\frac{1}{n}\right)^{k}.

二、(20分) 假设二维随机变量(X,Y)(X, Y)的联合概率密度函数为

f(x,y)={214x2y,x2y10, 其他 f(x, y)=\left\{\begin{array}{cc}\frac{21}{4} x^{2} y, & x^{2} \leq y \leq 1 \\ 0, & \text { 其他 }\end{array}\right.

(1)(7分) 求Z=X2YZ=X^{2} Y的概率密度函数;

(2)(8分) 求E(YX=0.5)E(Y |X = 0.5);

(3)(5分) 求EX2E X^{2}.

Solution:
(1) 作变量变换, 令

{Z=X2Y,W=Y,反函数{X=±Z/W,Y=W,对应{x=z/w,y=w,{x=z/w,y=w,\left\{ \begin{array}{l} Z=X^2Y,\\ W=Y,\\ \end{array} \right. \overset{\text{反函数}}{\Rightarrow}\left\{ \begin{array}{l} X=\pm \sqrt{Z/W},\\ Y=W,\\ \end{array} \right. \overset{\text{对应}}{\Rightarrow}\left\{ \begin{array}{l} x=\sqrt{z/w},\\ y=w,\\ \end{array} \right. \text{和}\left\{ \begin{array}{l} x=-\sqrt{z/w},\\ y=w,\\ \end{array} \right.

注意到此时有两支反函数, 其雅可比行列式分别是 J=±12zw|J|=\pm \frac{1}{2\sqrt{zw}} , 因此有

fZ,W(z,w)=f(zw,w)12zw+f(zw,w)12zw=214zw,0zw21,w0\begin{aligned} f_{Z,W}\left( z,w \right) &=f\left( \sqrt{\frac{z}{w}},w \right) \left| \frac{1}{2\sqrt{zw}} \right|+f\left( -\sqrt{\frac{z}{w}},w \right) \left| -\frac{1}{2\sqrt{zw}} \right| \\ &=\frac{21}{4}\sqrt{\frac{z}{w}},0\leq z\leq w^2\leq 1,w\geq 0 \end{aligned}

故有 fZ(z)=21z4z1w12dw=212(z12z34),0z1.f_Z\left( z \right) =\frac{21\sqrt{z}}{4}\int_{\sqrt{z}}^1{w^{-\frac{1}{2}}dw}=\frac{21}{2}\left( z^{\frac{1}{2}}-z^{\frac{3}{4}} \right) , 0\leq z\leq 1.

(2) 先求XX的边际密度, 有

fX(x)=21x24x21ydy=218(x2x6),1x1,f_X\left( x \right) =\frac{21x^2}{4}\int_{x^2}^1{ydy}=\frac{21}{8}\left( x^2-x^6 \right) ,\quad -1\leq x\leq 1,

故条件分布是

fYX(yx)=2y(1x4),x2y1f_{Y|X}\left( y|x \right) =\frac{2y}{\left( 1-x^4 \right)},\quad x^2\leq y\leq 1

故有

E[YX=0.5]=2(1116)141y2dy=215162164=0.7E\left[ Y|X=0.5 \right] =\frac{2}{\left( 1-\frac{1}{16} \right)}\int_{\frac{1}{4}}^1{y^2dy}=\frac{2}{\frac{15}{16}}\cdot \frac{21}{64}=0.7

(3) 根据第(2)问得到的边际密度, 有

E(X2)=21811x2(x2x6)dx=21401x4(1x4)dx=214445=2145E\left( X^2 \right) =\frac{21}{8}\int_{-1}^1{x^2\left( x^2-x^6 \right) dx}=\frac{21}{4}\int_0^1{x^4\left( 1-x^4 \right) dx}=\frac{21}{4}\cdot \frac{4}{45}=\frac{21}{45}

三、(15分) 设离散型随机变量XXYY不相关, 分别服从如下分布律

XX -1 0 1
PP 1/4 1/2 1/4

YY 0 1
PP 1/4 3/4

P(XY=0)=12P(X Y=0)=\frac{1}{2},试求

(1)(8分) X+YX + Y的分布律;

(2)(7分) Var(XY=1){Var}(X \mid Y=1).

Solution: 我们先通过题目给定信息得出联合分布, 由于 EX=0,EY=3/4E X=0, E Y=3 / 4, 因此得到 EXY=0E X Y=0, 故有 P(XY=1)P(XY=1)=0P(X Y=1)-P(X Y=-1)=0, 结合 P(XY=1)+P(XY=1)=1/2P(X Y=1)+P(X Y=-1)=1 / 2, 得 到 P(XY=1)=P(XY=1)=1/4P(X Y=1)=P(X Y=-1)=1 / 4.

(1) 根据得到的联合分布列, 很快得到 X+YX+Y 的分布列是

X+YX+Y -1 0 1 2
PP 0 1/2 1/4 1/4

(2) 给定Y=1Y = 1 , XX 的条件分布是

Y=1Y=1 X=1X=-1 X=0X=0 X=1X=1
PP 1/3 1/3 1/3

因此有 E(XY=1)=0,E(X2Y=1)=2/3E(X \mid Y=1)=0, E\left(X^{2} \mid Y=1\right)=2 / 3, 故 Var(XY=1)=2/3\operatorname{Var}(X \mid Y=1)=2 / 3.

四、(15分) 设随机变量序列{Xi}i=1\left\{X_{i}\right\}_{i=1}^{\infty}相互独立,且均服从(0,1)(0,1)上的均匀分布,试证明

(1)(7分) Yn=(i=1nXi)1/npe,Y_{n}=\left(\prod_{i=1}^{n} X_{i}\right)^{-1 / n} \rightarrow_{p} e,即依概率收敛成立, 此处ee为自然常数;

(2)(8分) 证明n(Yne)dN(0,e2),\sqrt{n}\left(Y_{n}-e\right) \rightarrow_{d} N\left(0, e^{2}\right),即依分布收敛成立.

Solution:(1) 作变换, 令 Zi=lnXiExp(1)Z_{i}=-\ln X_{i} \sim \operatorname{Exp}(1), 则 Z1,Z2,,ZnZ_{1}, Z_{2}, \cdots, Z_{n} 是来自期望为 1 的指数分布的随 机变量序列, 由于 EZ1=1E Z_{1}=1, 故根据大数定律, 得 k=1nZinP1\frac{\sum_{k=1}^{n} Z_{i}}{n} \stackrel{P}{\rightarrow} 1, 因此有 Yn=exp{k=1nZin}Pe.Y_{n}=\exp \left\{\frac{\sum_{k=1}^{n} Z_{i}}{n}\right\} \stackrel{P}{\rightarrow} e .

(2) 同样利用 Z1,Z2,,ZnZ_{1}, Z_{2}, \cdots, Z_{n} ,由中心极限定理知, n(k=1nZin1)dN(0,1)\sqrt{n}\left(\frac{\sum_{k=1}^{n} Z_{i}}{n}-1\right) \stackrel{d}{\rightarrow} N(0,1), 令 g(x)=exg(x)=e^{x}, 借助 Delta 方法, 得 n(g(k=1nZin)g(1)dg(1)N(0,1)\sqrt{n}\left(g\left(\frac{\sum_{k=1}^{n} Z_{i}}{n}\right)-g(1) \stackrel{d}{\rightarrow} g^{\prime}(1) N(0,1)\right., 即

n(Yne)dN(0,e2)\sqrt{n}\left(Y_{n}-e\right) \stackrel{d}{\rightarrow} N\left(0, e^{2}\right)

五、(20分) 设X1,,XnX_{1}, \ldots, X_{n}为来自总体XX的一组简单随机样本, 且logXN(θ,θ),\log X \sim N(\theta, \theta),其 中θ>0\theta>0为未知参数. 试

(1)(10分) 求θ\theta的最大似然估计θ^\hat{\theta}, 并证明其是唯一的;;

(2)(10分) 证明θ^\hat{\theta}低估θ,\theta,但仍是θ\theta的相合估计.

Solution: (1) 样本的似然函数是

L(θx)=(2πθ)n2exp{i=1n(lnxiθ)22θ}, 取对数得 lnL(θx)=C1n2lnθi=1n(lnxiθ)22θ=C2n2lnθi=1n(lnxi)22θn2θ, 因此 \begin{gathered} L(\theta \mid x)=(2 \pi \theta)^{-\frac{n}{2}} \exp \left\{-\frac{\sum_{i=1}^{n}\left(\ln x_{i}-\theta\right)^{2}}{2 \theta}\right\}, \\ \text { 取对数得 } \ln L(\theta \mid x)=C_{1}-\frac{n}{2} \ln \theta-\frac{\sum_{i=1}^{n}\left(\ln x_{i}-\theta\right)^{2}}{2 \theta}=C_{2}-\frac{n}{2} \ln \theta-\frac{\sum_{i=1}^{n}\left(\ln x_{i}\right)^{2}}{2 \theta}-\frac{n}{2} \theta \text {, 因此 } \end{gathered}

求导有

lnL(θx)θ=n2θ+i=1n(lnxi)22θ2n2=nθ+i=1n(lnxi)2nθ22θ2\frac{\partial \ln L(\theta \mid x)}{\partial \theta}=-\frac{n}{2 \theta}+\frac{\sum_{i=1}^{n}\left(\ln x_{i}\right)^{2}}{2 \theta^{2}}-\frac{n}{2}=\frac{-n \theta+\sum_{i=1}^{n}\left(\ln x_{i}\right)^{2}-n \theta^{2}}{2 \theta^{2}}

考虑 g(θ)=θ2θ+1ni=1n(lnxi)2g(\theta)=-\theta^{2}-\theta+\frac{1}{n} \sum_{i=1}^{n}\left(\ln x_{i}\right)^{2}, 它与似然函数的导数同正负, 因此考虑该函数就等同于考察似然函数的单调性. 使得 g(θ)=0g(\theta)=0 的根有两个, 左侧的根是导数由负转正点, 右侧的根是导数由正转负点, 故右侧的根是唯一的 MLE, 即

θ^=1+1+4ni=1n(lnxi)22\hat{\theta}=\frac{-1+\sqrt{1+\frac{4}{n} \sum_{i=1}^{n}\left(\ln x_{i}\right)^{2}}}{2}

(2) 记 T=1ni=1n(lnxi)2T=\frac{1}{n} \sum_{i=1}^{n}\left(\ln x_{i}\right)^{2}, 显然 E(T)=E[(lnX)2]=θ2+θE(T)=E\left[(\ln X)^{2}\right]=\theta^{2}+\theta, 由 Jensen 不等式得

E[1+1+4T2]<1+1+4E(T)2=θ,E\left[\frac{-1+\sqrt{1+4 T}}{2}\right]<\frac{-1+\sqrt{1+4 E(T)}}{2}=\theta,

θ^\hat{\theta} 低估 θ\theta, 但由大数定律, T=1ni=1n(lnxi)2Pθ2+θT=\frac{1}{n} \sum_{i=1}^{n}\left(\ln x_{i}\right)^{2} \stackrel{P}{\rightarrow} \theta^{2}+\theta, 因此也有

θ^=1+1+4T2P1+4θ2+4θ+12=θ.\hat{\theta}=\frac{-1+\sqrt{1+4 T}}{2} \stackrel{P}{\rightarrow} \frac{-1+\sqrt{4 \theta^{2}+4 \theta+1}}{2}=\theta .

六、(15分) 设XX为服从如下分布的离散型随机变量

P(X=1)=p,P(X=k)=(1p)2pk,k=0,1,2,P(X=-1)=p, P(X=k)=(1-p)^{2} p^{k}, k=0,1,2, \cdots

其中p(0,1)p \in(0,1)为未知参数. 试

(1)(7分) 求(1p)2(1-p)^{2}的最小方差无偏估计 ;

(2)(8分) 证明pp的最小方差无偏估计不存在.

Solution: (1) 我们先说明: 任意零的无偏估计都可以写为 U(X)=aXU(X)=a X 的形式.
先证 \Leftarrow :

EX=p+k=0+k(1p)2pk=p+(1p)2k=1+kpk=0E X=-p+\sum_{k=0}^{+\infty} k(1-p)^{2} p^{k}=-p+(1-p)^{2} \sum_{k=1}^{+\infty} k p^{k}=0

(注意: k=1+kpk=k=1+n=1kpk=n=1+k=n+pk=n=1+pn1p=p(1p)2\sum_{k=1}^{+\infty} k p^{k}=\sum_{k=1}^{+\infty} \sum_{n=1}^{k} p^{k}=\sum_{n=1}^{+\infty} \sum_{k=n}^{+\infty} p^{k}=\sum_{n=1}^{+\infty} \frac{p^{n}}{1-p}=\frac{p}{(1-p)^{2}} )

如果 a\exists a, s.t. U(X)=aXU(X)=a X, 则 EU(X)=aEX=0E U(X)=a E X=0.
再证 \Rightarrow :
U(k)=ukU(k)=u_{k}, 因为 U(X)U(X) 是零的无偏估计, 所以有:

0=u1p+(1p)2k=0+ukpk=u0+k=1+(uk22uk1+uk)pk,0=u_{-1} p+(1-p)^{2} \sum_{k=0}^{+\infty} u_{k} p^{k}=u_{0}+\sum_{k=1}^{+\infty}\left(u_{k-2}-2 u_{k-1}+u_{k}\right) p^{k},

这个等式要求对于任意 p[0,1]p \in[0,1] 成立, 等式右侧是关于 pp 的一个幂级数, 幂级数要想恒为 0 就必须所有项系数都为 0 , 即 u0=0,uk22uk1+uk=0u_{0}=0, u_{k-2}-2 u_{k-1}+u_{k}=0, 第二个式子意味着 {un}\left\{u_{n}\right\} 是等差数列, 而又有 u0=0u_{0}=0, 因此 U(k)=uk=ku1U(k)=u_{k}=k u_{1}.此外, 显然 I[X=0]I_{[X=0]}(1p)2(1-p)^{2} 的无偏估计, 实际它也是 UMVUE, 因为对于任意零的无偏估计 U(X)U(X),

Cov(I[X=0],U(X))=aCov(I[X=0],X)=aEXI[X=0]=0,\operatorname{Cov}\left(I_{[X=0]}, U(X)\right)=a \operatorname{Cov}\left(I_{[X=0]}, X\right)=a E X I_{[X=0]}=0,

因此 I[X=0]I_{[X=0]}(1p)2(1-p)^{2} 的 UMVUE.

(2) 用反证法: 如果 V(X)V(X)pp 的无偏估计, 设 V1(X)=V(X)I[X=1]V_{1}(X)=V(X)-I_{[X=-1]}
很明显可以看出 V1(X)V_{1}(X) 是零的无偏估计, 故存在 aa 使得

V(X)=aX+I[X=1],V(X)=a X+I_{[X=-1]},

对于任意一个零的无偏估计 bXb X,
Cov(V(X),bX)=abEX2+bEXI[X=1]=b[aEX2p]\operatorname{Cov}(V(X), b X)=a b E X^{2}+b E X I_{[X=-1]}=b\left[a E X^{2}-p\right], 如果想要该式对于任意 pp 恒为 0 , 就必须要求 EX2,pE X^{2}, p 线性相关, 这对于 EX2=2p1pE X^{2}=\frac{2 p}{1-p} 来说, 很明显是不满足的. 故 pp 的最小方差无偏估计不存在.

(注意: k=1+k2pk=p2k=1+k(k1)pk2+pk=1+kpk1=p+p2(1p)3\sum_{k=1}^{+\infty} k^{2} p^{k}=p^{2} \sum_{k=1}^{+\infty} k(k-1) p^{k-2}+p \sum_{k=1}^{+\infty} k p^{k-1}=\frac{p+p^{2}}{(1-p)^{3}},故 EX2=p+(1p)2k=0+k2pk=p+p+p21p=2p1pE X^{2}=p+(1-p)^{2} \sum_{k=0}^{+\infty} k^{2} p^{k}=p+\frac{p+p^{2}}{1-p}=\frac{2 p}{1-p})

七、(25分) 设如下回归模型

Yi=α+βξi+ϵiXi=ξi+δi,i=1,,n\begin{aligned} Y_{i} &=\alpha+\beta \xi_{i}+\epsilon_{i} \\ X_{i} &=\xi_{i}+\delta_{i}, i=1, \ldots, n \end{aligned}

其中ϵ1,,ϵn\epsilon_{1}, \ldots, \epsilon_{n}i.i.dN(0,σe2),δ1,,δn\sim N\left(0, \sigma_{e}^{2}\right), \delta_{1}, \ldots, \delta_{n}i.i.dN(0,σδ2),\sim N\left(0, \sigma_{\delta}^{2}\right),且诸ϵi\epsilon_{i}^{\prime}δi\delta_{i}^{\prime}相互独立. σδ2=σe2λ,\sigma_{\delta}^{2}=\sigma_{e}^{2} \lambda,其中λ\lambda固定且已知. 给定观测数据(X1,Y1),,(Xn,Yn),\left(X_{1}, Y_{1}\right), \ldots,\left(X_{n}, Y_{n}\right),

(1)(15分) 求α,β,σδ2\alpha, \beta, \sigma_{\delta}^{2}的最大似然估计α^,β^,σ^δ2;\hat{\alpha}, \hat{\beta}, \hat{\sigma}_{\delta}^{2} ;

(2)(10分) 若假设对充分大的n,ξˉn=1ni=1nξin,\bar{\xi}_n =\frac{1}{n}\sum_{i=1}^n{\xi _i}c11ni=1n(ξiξˉn)2c2c_1 \leq \frac{1}{n} \sum_{i=1}^{n}\left(\xi_{i}-\bar{\xi}_{n}\right)^{2} \leq c_{2}均一致有界, 证明α^,β^\hat{\alpha}, \hat{\beta}为相合估计.

Solution: 该模型为 error-in-variables model, 其与传统线性回归模型的不同在于观测变量是否为固定值. 在传统线性回归模型中, 观测变量 XiX_i 被视为已知常数, 而在该模型中, 观测变量为随机变量, 即 XiN(ξi,σδ2)X_i\sim N\left( \xi _i,\sigma _{\delta}^{2} \right). YiY_iξi\xi_i 之间有着线性关系, 但我们观测不到ξi\xi_i, 只能观测到 XiX_i, 因此这里ξi\xi_i也视作参数.

(1) 在σδ2=λσϵ2\sigma_{\delta}^{2}=\lambda \sigma_{\epsilon}^{2}的前提下, 似然函数为:

L(α,β,ξ1,,ξn,σδ2)=1(2π)nλn/2(σδ2)nexp[i=1n(xiξi)2+λ(yi(α+βξi))22σδ2]\begin{aligned} & L\left(\alpha, \beta, \xi_{1}, \ldots, \xi_{n}, \sigma_{\delta}^{2} \right) \\ =& \frac{1}{(2 \pi)^{n}} \frac{\lambda^{n / 2}}{\left(\sigma_{\delta}^{2}\right)^{n}} \exp \left[-\sum_{i=1}^{n} \frac{\left(x_{i}-\xi_{i}\right)^{2}+\lambda\left(y_{i}-\left(\alpha+\beta \xi_{i}\right)\right)^{2}}{2 \sigma_{\delta}^{2}}\right] \end{aligned}

对于任意的 (α,β,σδ2)\left(\alpha, \beta, \sigma_{\delta}^{2}\right), 似然函数相对于ξi\xi_{i} 的最大值点是

ξi=xi+λβ(yiα)1+λβ2\xi_{i}^{*}=\frac{x_{i}+\lambda \beta\left(y_{i}-\alpha\right)}{1+\lambda \beta^{2}}

将上式代入似然函数, 可将似然函数化简为:

L(α,β,ξ1,,ξn,σδ2)=1(2π)nλn/2(σδ2)nexp{12σδ2[λ1+λβ2i=1n(yi(α+βxi))2]}L\left(\alpha, \beta, \xi_{1}^{*}, \ldots,\xi_{n}^{*}, \sigma_{\delta}^{2} \right) = \frac{1}{(2 \pi)^{n}} \frac{\lambda^{n / 2}}{\left(\sigma_{\delta}^{2}\right)^{n}} \exp \left\{-\frac{1}{2 \sigma_{\delta}^{2}}\left[\frac{\lambda}{1+\lambda \beta^{2}} \sum_{i=1}^{n}\left(y_{i}-\left(\alpha+\beta x_{i}\right)\right)^{2}\right]\right\}

α=λα,β=λβ,yi=λyi,i=1,,n\alpha^{*}=\sqrt{\lambda} \alpha, \beta^{*}=\sqrt{\lambda} \beta, y_{i}^{*}=\sqrt{\lambda} y_{i}, i=1, \ldots, n, 对数似然函数改写为

lnL=nln2π+n2lnλnlnσδ212σδ2λ1+λβ2i=1n(yi(α+βxi))2=nln2π+n2lnλnlnσδ212σδ211+β2i=1n(yi(α+βxi))2\begin{aligned} \ln L&=-n\ln 2\pi +\frac{n}{2}\ln \lambda -n\ln \sigma _{\delta}^{2}-\frac{1}{2\sigma _{\delta}^{2}}\frac{\lambda}{1+\lambda \beta ^2}\sum_{i=1}^n{\left( y_i-\left( \alpha +\beta x_i \right) \right) ^2}\\ \\ &=-n\ln 2\pi +\frac{n}{2}\ln \lambda -n\ln \sigma _{\delta}^{2}-\frac{1}{2\sigma _{\delta}^{2}}\frac{1}{1+\beta ^{*^2}}\sum_{i=1}^n{\left( y_{i}^{*}-\left( \alpha ^*+\beta ^*x_i \right) \right) ^2} \end{aligned}

上式对 α,β,σδ2\alpha^{*},\beta^{*},\sigma_{\delta}^2 求导, 并令导数为 00, 有似然方程

{lnLα=1σδ211+β2i=1n(yi(α+βxi))=0lnLβ=1σδ211+β2i=1nxi(yi(α+βxi))+βσδ21(1+β2)2i=1n(yi(α+βxi))2=0lnLσδ2=nσδ2+1σδ411+β2i=1n(yi(α+βxi))2=0\left\{ \begin{array}{l} \frac{\partial \ln L}{\partial \alpha ^*}=\frac{1}{\sigma _{\delta}^{2}}\frac{1}{1+\beta ^{*^2}}\sum_{i=1}^n{\left( y_{i}^{*}-\left( \alpha ^*+\beta ^*x_i \right) \right)}=0\\ \frac{\partial \ln L}{\partial \beta ^*}=\frac{1}{\sigma _{\delta}^{2}}\frac{1}{1+\beta ^{*^2}}\sum_{i=1}^n{x_i\left( y_{i}^{*}-\left( \alpha ^*+\beta ^*x_i \right) \right)}+\frac{\beta ^*}{\sigma _{\delta}^{2}}\frac{1}{\left( 1+\beta ^{*^2} \right) ^2}\sum_{i=1}^n{\left( y_{i}^{*}-\left( \alpha ^*+\beta ^*x_i \right) \right) ^2}=0\\ \frac{\partial \ln L}{\partial \sigma _{\delta}^{2}}=-\frac{n}{\sigma _{\delta}^{2}}+\frac{1}{\sigma _{\delta}^{4}}\frac{1}{1+\beta ^{*^2}}\sum_{i=1}^n{\left( y_{i}^{*}-\left( \alpha ^*+\beta ^*x_i \right) \right) ^2}=0\\ \end{array} \right.

利用第一个式子可知 yi(α+βxi)=(yiyˉ)β(xixˉ)y_{i}^{*}-\left( \alpha ^*+\beta ^*x_i \right) =\left( y_{i}^{*}-\bar{y}^* \right) -\beta ^*\left( x_i-\bar{x} \right), 用其化简第二个式子, 有

(1+β2)i=1n(xixˉ)((yiyˉ)β(xixˉ))+βi=1n((yiyˉ)β(xixˉ))2=0(1+β2)(lxyβlxx)+β(lyy+β2lxx2βlxy)=0lxyβ2(lxxlyy)β+lxy=0\begin{aligned} \left( 1+\beta ^{*^2} \right) \sum_{i=1}^n{\left( x_i-\bar{x} \right) \left( \left( y_{i}^{*}-\bar{y}^* \right) -\beta ^*\left( x_i-\bar{x} \right) \right)}+\beta ^*\sum_{i=1}^n{\left( \left( y_{i}^{*}-\bar{y}^* \right) -\beta ^*\left( x_i-\bar{x} \right) \right) ^2}&=0 \\ \left( 1+\beta ^{*^2} \right) \left( l_{xy}^{*}-\beta ^*l_{xx} \right) +\beta ^*\left( l_{yy}^{*}+\beta ^{*^2}l_{xx}-2\beta ^*l_{xy}^{*} \right) &=0 \\ -l_{xy}^{*}\beta ^{*^2}-\left( l_{xx}-l_{yy}^{*} \right) \beta ^*+l_{xy}&=0 \end{aligned}

其中

lxx=i=1n(xixˉ)2,lxy=i=1n(xixˉ)(yiyˉ),lyy=lxx=i=1n(yiyˉ)2l_{xx}=\sum_{i=1}^n{\left( x_i-\bar{x} \right) ^2},l_{xy}^{*}=\sum_{i=1}^n{\left( x_i-\bar{x} \right) \left( y_{i}^{*}-\bar{y}^* \right)},l_{yy}^{*}=l_{xx}=\sum_{i=1}^n{\left( y_{i}^{*}-\bar{y}^* \right) ^2}

g(β)=lxyβ2(lxxlyy)β+lxyg\left( \beta ^* \right) =-l_{xy}^{*}\beta ^{*^2}-\left( l_{xx}-l_{yy}^{*} \right) \beta ^*+l_{xy}, 它与对数似然函数关于 β\beta^* 的导数有着相同的正负号, 我们要找似然函数的极大值点, 就是找该函数的由正转负点, 即在该二次函数的两个零点处考虑, 而该二次函数的开口方向由 lxyl_{xy}^{*} 决定, 计算可得两种开口情况下的结果是一样的

β^={(lxxlyy)+(lxxlyy)2+4lxy22lxy,lxy>0(lxxlyy)+(lxxlyy)2+4lxy22lxy,lxy<0\hat{\beta}^*=\begin{cases} \frac{-\left( l_{xx}-l_{yy}^{*} \right) +\sqrt{\left( l_{xx}-l_{yy}^{*} \right) ^2+4l_{xy}^{*^2}}}{2l_{xy}^{*}},& l_{xy}^{*}>0\\ \frac{-\left( l_{xx}-l_{yy}^{*} \right) +\sqrt{\left( l_{xx}-l_{yy}^{*} \right) ^2+4l_{xy}^{*^2}}}{2l_{xy}^{*}},& l_{xy}^{*}<0\\ \end{cases}

由于

lyy=i=1n(yiyˉ)2=1λlyy,lxy=i=1n(xixˉ)(yiyˉ)=1λlxyl_{yy}=\sum_{i=1}^n{\left( y_i-\bar{y} \right) ^2}=\frac{1}{\lambda}l_{yy}^{*},l_{xy}=\sum_{i=1}^n{\left( x_i-\bar{x} \right) \left( y_i-\bar{y} \right)}=\frac{1}{\sqrt{\lambda}}l_{xy}^{*}

以及考虑到β=λβ\beta ^*=\sqrt{\lambda}\beta, 有

β^=(lxxλlyy)+(lxxλlyy)2+4λlxy22λlxy\hat{\beta}=\frac{-\left( l_{xx}-\lambda l_{yy} \right) +\sqrt{\left( l_{xx}-\lambda l_{yy} \right) ^2+4\lambda l_{xy}^{2}}}{2\lambda l_{xy}}

再利用似然方程的第一个式子可得 α^=yˉβ^xˉ\hat{\alpha}=\bar{y}-\hat{\beta} \bar{x}, 以及根据似然方程的第三个式子可得

σ^δ2=12nλ1+λβ^2i=1n(yi(α^+β^xi))2\hat{\sigma}_{\delta}^{2}=\frac{1}{2 n} \frac{\lambda}{1+\lambda \hat{\beta}^{2}} \sum_{i=1}^{n}\left(y_{i}-\left(\hat{\alpha}+\hat{\beta} x_{i}\right)\right)^{2}

(2)

1nlxx=1ni=1n(xixˉ)2=1ni=1n(xiξi+ξiξˉn+ξˉnxˉ)2=1ni=1n(xiξi)2+1ni=1n(ξiξˉn)2(ξˉnxˉ)2=1ni=1n(ξiξˉn)2+σδ2+op(1)\begin{aligned} \frac{1}{n}l_{xx}=\frac{1}{n}\sum_{i=1}^n{\left( x_i-\bar{x} \right) ^2}&=\frac{1}{n}\sum_{i=1}^n{\left( x_i-\xi _i+\xi _i-\bar{\xi}_n+\bar{\xi}_n-\bar{x} \right) ^2}\\ &=\frac{1}{n}\sum_{i=1}^n{\left( x_i-\xi _i \right) ^2}+\frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}-\left( \bar{\xi}_n-\bar{x} \right) ^2\\ &=\frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}+\sigma _{\delta}^{2}+o_p\left( 1 \right)\\ \end{aligned}

其中 1ni=1n(xiξi)2pσδ2\frac{1}{n}\sum_{i=1}^n{\left( x_i-\xi _i \right) ^2}\rightarrow _p\sigma _{\delta}^{2} 直接根据大数定律, 以及 P((ξˉnxˉ)2>ε)E(ξˉnxˉ)2ε=1εσδ2n0P\left( \left( \bar{\xi}_n-\bar{x} \right) ^2>\varepsilon \right) \le \frac{E\left( \bar{\xi}_n-\bar{x} \right) ^2}{\varepsilon}=\frac{1}{\varepsilon}\frac{\sigma _{\delta}^{2}}{n}\rightarrow 0.

1nlyy=1ni=1n(yiyˉ)2=1ni=1n((yiαβξi)+β(ξiξˉn)+(α+βξˉnyˉ))2=1ni=1n(yiαβξi)2+1nβ2i=1n(ξiξˉn)2(α+βξˉnyˉ)2=β21ni=1n(ξiξˉn)2+σδ2+op(1)\begin{aligned} \frac{1}{n}l_{yy}^{*}=\frac{1}{n}\sum_{i=1}^n{\left( y_{i}^{*}-\bar{y} \right) ^2}&=\frac{1}{n}\sum_{i=1}^n{\left( \left( y_{i}^{*}-\alpha ^*-\beta ^*\xi _i \right) +\beta ^*\left( \xi _i-\bar{\xi}_n \right) +\left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) \right) ^2}\\ &=\frac{1}{n}\sum_{i=1}^n{\left( y_{i}^{*}-\alpha ^*-\beta ^*\xi _i \right) ^2}+\frac{1}{n}\beta ^{*^2}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}-\left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) ^2\\ &=\beta ^{*^2} \frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}+\sigma _{\delta}^{2}+o_p\left( 1 \right)\\ \end{aligned}

其中同样 1ni=1n(yiαβξi)2pσδ2\frac{1}{n}\sum_{i=1}^n{\left( y_{i}^{*}-\alpha ^*-\beta ^*\xi _i \right) ^2}\rightarrow _p\sigma _{\delta}^{2} 直接根据大数定律, 以及

P((α+βξˉnyˉ)2>ε)E(α+βξˉnyˉ)2ε=1εσδ2n0P\left( \left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) ^2>\varepsilon \right) \le \frac{E\left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) ^2}{\varepsilon}=\frac{1}{\varepsilon}\frac{\sigma _{\delta}^{2}}{n}\rightarrow 0

1nlxy=1ni=1n(xixˉ)(yiyˉ)=1ni=1n(xiξi+ξiξˉn+ξˉnxˉ)((yiαβξi)+β(ξiξˉn)+(α+βξˉnyˉ))=1ni=1n(xiξi)((yiαβξi)+β(ξiξˉn)+(α+βξˉnyˉ))+1ni=1n(ξiξˉn)((yiαβξi)+β(ξiξˉn)+(α+βξˉnyˉ))+1ni=1n(ξˉnxˉ)((yiαβξi)+β(ξiξˉn)+(α+βξˉnyˉ))\begin{aligned} \frac{1}{n}l_{xy}^{*}=&\frac{1}{n}\sum_{i=1}^n{\left( x_i-\bar{x} \right) \left( y_{i}^{*}-\bar{y}^* \right)} \\ =&\frac{1}{n}\sum_{i=1}^n{\left( x_i-\xi _i+\xi _i-\bar{\xi}_n+\bar{\xi}_n-\bar{x} \right) \left( \left( y_{i}^{*}-\alpha ^*-\beta ^*\xi _i \right) +\beta ^*\left( \xi _i-\bar{\xi}_n \right) +\left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) \right)} \\ =&\frac{1}{n}\sum_{i=1}^n{\left( x_i-\xi _i \right) \left( \left( y_{i}^{*}-\alpha ^*-\beta ^*\xi _i \right) +\beta ^*\left( \xi _i-\bar{\xi}_n \right) +\left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) \right)} \\ &+\frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) \left( \left( y_{i}^{*}-\alpha ^*-\beta ^*\xi _i \right) +\beta ^*\left( \xi _i-\bar{\xi}_n \right) +\left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) \right)} \\ &+\frac{1}{n}\sum_{i=1}^n{\left( \bar{\xi}_n-\bar{x} \right) \left( \left( y_{i}^{*}-\alpha ^*-\beta ^*\xi _i \right) +\beta ^*\left( \xi _i-\bar{\xi}_n \right) +\left( \alpha ^*+\beta ^*\bar{\xi}_n-\bar{y}^* \right) \right)} \end{aligned}

上面三行和式中, 第一行三项均可根据大数定律得出依概率收敛到 0; 第二行中的第一项根据大数定律可知收敛到 0, 第三项可直接为 0; 第三行中的第一、三项可根据大数定律得知依概率收敛到 0, 第二项直接为0, 故仅剩第二行第二项保持不动, 即

1nlxy=β1ni=1n(ξiξˉn)2+op(1)\frac{1}{n}l_{xy}^{*}=\beta ^*\frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}+o_p\left( 1 \right)

综上, 根据依概率收敛的性质, 有

β^=(lxxlyy)+(lxxlyy)2+4lxy22lxyp(1β2)1ni=1n(ξiξˉn)2+(1β2)2[1ni=1n(ξiξˉn)2]2+4β2[1ni=1n(ξiξˉn)2]2β1ni=1n(ξiξˉn)2=(β21)1ni=1n(ξiξˉn)2+(β2+1)1ni=1n(ξiξˉn)22β1ni=1n(ξiξˉn)2=β\begin{aligned} \hat{\beta}^*&=\frac{-\left( l_{xx}-l_{yy}^{*} \right) +\sqrt{\left( l_{xx}-l_{yy}^{*} \right) ^2+4l_{xy}^{*^2}}}{2l_{xy}^{*}} \\ &\rightarrow _p\frac{-\left( 1-\beta ^{*^2} \right) \frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}+\sqrt{\left( 1-\beta ^{*^2} \right) ^2\left[ \frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2} \right] ^2+4\beta ^{*^2}\left[ \frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2} \right]}}{2\beta ^*\frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}} \\ &=\frac{\left( \beta ^{*^2}-1 \right) \frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}+\left( \beta ^{*^2}+1 \right) \frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}}{2\beta ^*\frac{1}{n}\sum_{i=1}^n{\left( \xi _i-\bar{\xi}_n \right) ^2}}=\beta^* \end{aligned}

β^\hat{\beta}^*β\beta^* 的相合估计, 因此 β^\hat{\beta}β\beta 的相合估计. 再考虑 α^\hat{\alpha}, 由于

α^=yˉxˉβ^=(α+ξˉnβ)xˉβ^=α+ξˉnβxˉβ^\hat{\alpha}=\bar{y}-\bar{x}\hat{\beta}=\left( \alpha +\bar{\xi}_n\beta \right) -\bar{x}\hat{\beta}=\alpha +\bar{\xi}_n\beta -\bar{x}\hat{\beta}

其中

ξˉnβxˉβ^=ξˉnβξˉnβ^+ξˉnβ^xˉβ^=ξˉn(ββ^)+(ξˉnxˉ)β^\begin{aligned} \bar{\xi}_n\beta -\bar{x}\hat{\beta}&=\bar{\xi}_n\beta -\bar{\xi}_n\hat{\beta}+\bar{\xi}_n\hat{\beta}-\bar{x}\hat{\beta} \\ &=\bar{\xi}_n\left( \beta -\hat{\beta} \right) +\left( \bar{\xi}_n-\bar{x} \right) \hat{\beta} \end{aligned}

根据 β^\hat{\beta} 的相合性以及 ξˉn\bar{\xi}_n 的有界性, 有 ξˉn(ββ^)p0\bar{\xi}_n\left( \beta -\hat{\beta} \right) \rightarrow _p0. 而

P(ξˉnxˉ>ε)E(ξˉnxˉ)2ε2=1ε2σδ2n0P\left( \left| \bar{\xi}_n-\bar{x} \right|>\varepsilon \right) \le \frac{E\left( \bar{\xi}_n-\bar{x} \right) ^2}{\varepsilon ^2}=\frac{1}{\varepsilon ^2}\frac{\sigma _{\delta}^{2}}{n}\rightarrow 0

ξˉnxˉp0\bar{\xi}_n-\bar{x}\rightarrow _p0, 所以 (ξˉnxˉ)β^p0\left( \bar{\xi}_n-\bar{x} \right) \hat{\beta}\rightarrow _p0, 综上有

α^=α+op(1)pα\hat{\alpha}=\alpha +o_p\left( 1 \right) \rightarrow _p\alpha

α^\hat{\alpha}α\alpha 的相合估计.

注: 特别需要指出的是, 该模型中 σ^δ2pσδ22\hat{\sigma}_{\delta}^{2}\rightarrow _p\frac{\sigma _{\delta}^{2}}{2}.

八、(25分) 假设X1,,XnX_{1}, \ldots, X_{n}为来自总体f(x)=1θexθθI(x>θ)f(x)=\frac{1}{\theta} e^{-\frac{x-\theta}{\theta}} I(x>\theta)的简单随机样本,其中θ>0\theta>0为未知参数. 记Xˉ=1ni=1nXi\bar{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i}为样本均值,X(1)=min1inXi,X_{(1)}=\min _{1 \leq i \leq n} X_{i},
0<α<1/2,0<\alpha<1 / 2,

(1) (10分) 利用枢轴变量法, 分别基于Xˉ\bar{X}X(1)X_{(1)}构造θ\theta1α1-\alpha置信区间.

(2) (8分) 上述两个置信区间何者更优?

(3) (7分) 试给出假设H0:P(X>1)p0H_{0}: P(X>1) \geq p_{0}的一个水平α\alpha检验, 其中0<p0<10<p_{0}<1为一已知数.

Solution:(1) 作总体变换, 令 Yi=XiθExp(1θ)Y_{i}=X_{i}-\theta \sim \operatorname{Exp}\left(\frac{1}{\theta}\right), 则 Y1,,YnY_{1}, \cdots, Y_{n} 是来自均值为 θ\theta 的指数分布的 样本, 故有结论 Y(1)Exp(nθ),nYˉGa(n,1θ)Y_{(1)} \sim \operatorname{Exp}\left(\frac{n}{\theta}\right), n \bar{Y} \sim G a\left(n, \frac{1}{\theta}\right), 可以将其变为卡方分布, 即有

2nθY(1)χ2(2),2nθYˉχ2(2n),\frac{2 n}{\theta} Y_{(1)} \sim \chi^{2}(2), \frac{2 n}{\theta} \bar{Y} \sim \chi^{2}(2 n),

因此 T1=2nθ(X(1)θ)χ2(2)T_{1}=\frac{2 n}{\theta}\left(X_{(1)}-\theta\right) \sim \chi^{2}(2)T2=2nθ(Xˉθ)χ2(2n)T_{2}=\frac{2 n}{\theta}(\bar{X}-\theta) \sim \chi^{2}(2 n) 是枢轴量, 对于 T1T_{1}, 我们试 导出最短置信区间, 因为 aT1ba \leq T_{1} \leq b 意味着 X(1)1+b2nθX(1)1+a2n\frac{X_{(1)}}{1+\frac{b}{2 n}} \leq \theta \leq \frac{X_{(1)}}{1+\frac{a}{2 n}}, 因此求最小值就相 当于求函数 l(a,b)=11+a2n11+b2nl(a, b)=\frac{1}{1+\frac{a}{2 n}}-\frac{1}{1+\frac{b}{2 n}} 在条件 abe12xdx=1α\int_{a}^{b} e^{-\frac{1}{2} x} d x=1-\alpha 的条件下的极小值,用 拉格朗日乘数法, 设

L(a,b)=11+a2n11+b2n+λ[abe12xdx(1α)]L(a, b)=\frac{1}{1+\frac{a}{2 n}}-\frac{1}{1+\frac{b}{2 n}}+\lambda\left[\int_{a}^{b} e^{-\frac{1}{2} x} d x-(1-\alpha)\right]

求偏导数, 有

{La=12n(1+a2n)2λe12a=0Lb=12n(1+b2n)2+λe12b=0Lλ=abe12xdx(1α)0\left\{\begin{array}{l} \frac{\partial L}{\partial a}=-\frac{1}{2 n\left(1+\frac{a}{2 n}\right)^{2}}-\lambda e^{-\frac{1}{2} a}=0 \\ \frac{\partial L}{\partial b}=\frac{1}{2 n\left(1+\frac{b}{2 n}\right)^{2}}+\lambda e^{-\frac{1}{2} b}=0 \\ \frac{\partial L}{\partial \lambda}=\int_{a}^{b} e^{-\frac{1}{2} x} d x-(1-\alpha) \equiv 0 \end{array}\right.

解得 a,ba, b 满足下列关系:

{(1+a2n)2e12a=(1+b2n)2e12babe12xdx=1α\left\{\begin{array}{l} \left(1+\frac{a}{2 n}\right)^{2} e^{-\frac{1}{2} a}=\left(1+\frac{b}{2 n}\right)^{2} e^{-\frac{1}{2} b} \\ \int_{a}^{b} e^{-\frac{1}{2} x} d x=1-\alpha \end{array}\right.

这样的 a,ba, b 使得区间 [X(1)1+b2n,X(1)1+a2n]\left[\frac{X_{(1)}}{1+\frac{b}{2 n}}, \frac{X_{(1)}}{1+\frac{a}{2 n}}\right] 最短, 记作区间一 :[X(1)1+χ1α+β12(2)2n,X(1)1+χβ12(2)2n]:\left[\frac{X_{(1)}}{1+\frac{\chi_{1-\alpha+\beta_{1}}^{2}(2)}{2 n}}, \frac{X_{(1)}}{1+\frac{\chi_{\beta_{1}}^{2}(2)}{2 n}}\right].
对于 T2T_{2} ,因为 aT2ba \leq T_{2} \leq b 意味着 Xˉ1+b2nθXˉ1+a2n\frac{\bar{X}}{1+\frac{b}{2 n}} \leq \theta \leq \frac{\bar{X}}{1+\frac{a}{2 n}}, 因此求最小值就相当于求函数 l(a,b)=11+a2n11+b2nl(a, b)=\frac{1}{1+\frac{a}{2 n}}-\frac{1}{1+\frac{b}{2 n}} 在条件 ab12nΓ(n)xn1e12xdx=1α\int_{a}^{b} \frac{1}{2^{n} \Gamma(n)} x^{n-1} e^{-\frac{1}{2} x} d x=1-\alpha 的条件下的极小值, 用拉格朗日乘数法, 设

L(a,b)=11+a2n11+b2n+λ[abxn1e12xdxC]L(a, b)=\frac{1}{1+\frac{a}{2 n}}-\frac{1}{1+\frac{b}{2 n}}+\lambda\left[\int_{a}^{b} x^{n-1} e^{-\frac{1}{2} x} d x-C\right]

其中 C=2nΓ(n)(1α)C=2^{n} \Gamma(n)(1-\alpha), 求偏导数, 有

{La=12n(1+a2n)2λan1e12Lb=12n(1+b2n)2+λbn1e12b=Lλ=abxn1e12xdxC0,\left\{\begin{array}{l} \frac{\partial L}{\partial a}=-\frac{1}{2 n\left(1+\frac{a}{2 n}\right)^{2}}-\lambda a^{n-1} e^{-\frac{1}{2}} \\ \frac{\partial L}{\partial b}=\frac{1}{2 n\left(1+\frac{b}{2 n}\right)^{2}}+\lambda b^{n-1} e^{-\frac{1}{2} b}= \\ \frac{\partial L}{\partial \lambda}=\int_{a}^{b} x^{n-1} e^{-\frac{1}{2} x} d x-C \equiv 0, \end{array}\right.

解得 a,ba, b 满足下列关系:

{(1+a2n)2an1e12a=(1+b2n)2bn1e12bab12nΓ(n)xn1e12xdx=1α\left\{\begin{array}{l} \left(1+\frac{a}{2 n}\right)^{2} a^{n-1} e^{-\frac{1}{2} a}=\left(1+\frac{b}{2 n}\right)^{2} b^{n-1} e^{-\frac{1}{2} b} \\ \int_{a}^{b} \frac{1}{2^{n} \Gamma(n)} x^{n-1} e^{-\frac{1}{2} x} d x=1-\alpha \end{array}\right.

这样的 a,ba, b 使得区间 [Xˉ1+b2n,Xˉ1+a2n]\left[\frac{\bar{X}}{1+\frac{b}{2 n}}, \frac{\bar{X}}{1+\frac{a}{2 n}}\right] 最短, 记作区间二: [Xˉ1+χ1α+β22(2n)2n,Xˉ1+χ222(2n)2n]\left[\frac{\bar{X}}{1+\frac{\chi_{1-\alpha+\beta_{2}}^{2}(2 n)}{2 n}}, \frac{\bar{X}}{1+\frac{\chi_{2_{2}}^{2}(2 n)}{2 n}}\right].

注:考试时遇到复杂情形也可考虑等尾置信区间, 大概率可得分.

(2) 我认为区间一更精确, 可以比较区间长度, 区间一的长度是

C1=(χ1α+β12(2)χβ12(2))/2n(1+χ12α+β1(2)2n)(1+χ112(2)2n)X(1),C_{1}=\frac{\left(\chi_{1-\alpha+\beta_{1}}^{2}(2)-\chi_{\beta_{1}}^{2}(2)\right) / 2 n}{\left(1+\frac{\chi_{1}^{2}-\alpha+\beta_{1}(2)}{2 n}\right)\left(1+\frac{\chi_{1_{1}}^{2}(2)}{2 n}\right)} X_{(1)},

由于 χ1α+β12(2)χβ12(2)\chi_{1-\alpha+\beta_{1}}^{2}(2)-\chi_{\beta_{1}}^{2}(2) 都是常数, 故其分母趋于 1 , 而分子趋于 0 , 且与 1n\frac{1}{n} 同阶.
区间二的长度是

C2=(χ1α+β12(2n)χβ12(2n))/2n(1+χ1α+β12(2n)2n)(1+χ12(2n)2n)Xˉ,C_{2}=\frac{\left(\chi_{1-\alpha+\beta_{1}}^{2}(2 n)-\chi_{\beta_{1}}^{2}(2 n)\right) / 2 n}{\left(1+\frac{\chi_{1-\alpha+\beta_{1}}^{2}(2 n)}{2 n}\right)\left(1+\frac{\chi_{1}^{2}(2 n)}{2 n}\right)} \bar{X},

这里由于 χ1α+β22(2n),χβ22(2n)\chi_{1-\alpha+\beta_{2}}^{2}(2 n), \chi_{\beta_{2}}^{2}(2 n)nn 而动, 故需要进一步探讨, 先考虑分母, 根据 χθ22(2n)\chi_{\theta_{2}}^{2}(2 n) 的定义, 有

P(Yχβ22(2n))=β2, 即 P(Y2n2nnχβ22(2n)2n2n)=β2P\left(Y \leq \chi_{\beta_{2}}^{2}(2 n)\right)=\beta_{2} \text {, 即 } P\left(\frac{Y-2 n}{2 \sqrt{n}} \leq \sqrt{n} \frac{\chi_{\beta_{2}}^{2}(2 n)-2 n}{2 n}\right)=\beta_{2} \text {, }

其中 Yχ2(2n)Y \sim \chi^{2}(2 n), 根据中心极限定理, 有 Y2n2ndN(0,1)\frac{Y-2 n}{2 \sqrt{n}} \stackrel{d}{\rightarrow} N(0,1), 故由上式可看出 nχβ22(2n)2n2nzβ2\sqrt{n} \frac{\chi_{\beta_{2}}^{2}(2 n)-2 n}{2 n} \rightarrow z_{\beta_{2}}, 故有 χβ22(2n)2n2n0\frac{\chi_{\beta_{2}}^{2}(2 n)-2 n}{2 n} \rightarrow 0, 因此 χβ22(2n)2n1\frac{\chi_{\beta_{2}}^{2}(2 n)}{2 n} \rightarrow 1,
同理 χ1α+β22(2n)2n1\frac{\chi_{1-\alpha+\beta_{2}}^{2}(2 n)}{2 n} \rightarrow 1, 故有 C2C_{2} 的分母收敛于常数 4. 再考虑分子, 由于

P(χβ12(2n)Yχ1α+β12(2n))=1αP\left(\chi_{\beta_{1}}^{2}(2 n) \leq Y \leq \chi_{1-\alpha+\beta_{1}}^{2}(2 n)\right)=1-\alpha

P(χβ12(2n)2n2nY2n2nχ1α+β12(2n)2n2n)=1αP\left(\frac{\chi_{\beta_{1}}^{2}(2 n)-2 n}{\sqrt{2 n}} \leq \frac{Y-2 n}{\sqrt{2 n}} \leq \frac{\chi_{1-\alpha+\beta_{1}}^{2}(2 n)-2 n}{\sqrt{2 n}}\right)=1-\alpha, 再次根据中心极限定理, 我 们得知 χ1α+β12(2n)χβ12(2n)2n\frac{\chi_{1-\alpha+\beta_{1}}^{2}(2 n)-\chi_{\beta_{1}}^{2}(2 n)}{\sqrt{2 n}} 是收敛于正常数的, 故对 C2C_{2} 而言, 其分子与 1n\frac{1}{\sqrt{n}} 同阶, 比 C1C_{1} 更慢收敛于 0 , 再考虑到 X(1)XˉX_{(1)} \leq \bar{X}, 故当 nn 足够大时, 区间一更短.

注: 若考虑的是等尾置信区间, 依然是由 X(1)X_{(1)} 构造的置信区间更短, 讨论过程类似.

(3) 借助经验分布函数思想, 令 U=i=1nI{xi>1}U=\sum_{i=1}^{n} I_{\left\{x_{i}>1\right\}}, 则有当 TT 过小时拒绝原假设, 即检验函数是 T(x1,,xn)=I{U<m}+rI{U=m}T\left(x_{1}, \cdots, x_{n}\right)=I_{\{U<m\}}+r I_{\{U=m\}}, 意味着若 U<mU<m 则拒绝原假设, 若 U=mU=m 则以概率 rr 拒绝原假设, 为使得其水平为 α\alpha, 需保证 m,rm, r 满足

k=0m1Cnkp0k(1p0)nk+rCnmp0m(1p0)nm=α,\sum_{k=0}^{m-1} C_{n}^{k} p_{0}^{k}\left(1-p_{0}\right)^{n-k}+r C_{n}^{m} p_{0}^{m}\left(1-p_{0}\right)^{n-m}=\alpha,

这样的 m,rm, r 是找得到的, 即令

m=inf{s:k=0sCnkp0k(1p0)nk>α},m=\inf \left\{s: \sum_{k=0}^{s} C_{n}^{k} p_{0}^{k}\left(1-p_{0}\right)^{n-k}>\alpha\right\},

r=αk=0m1Cnkp0k(1p0)nkCnmp0m(1p0)nmr=\frac{\alpha-\sum_{k=0}^{m-1} C_{n}^{k} p_{0}^{k}\left(1-p_{0}\right)^{n-k}}{C_{n}^{m} p_{0}^{m}\left(1-p_{0}\right)^{n-m}}