中国科学技术大学-432统计学-2018年

一、(12分) 设 g(x)g(x) 是一个非负随机变量的概率密度函数, 定义

f(x,y)={g(x2+y2)2πx2+y2,x2+y2>00,x=y=0.f(x, y)=\left\{\begin{array}{c} \frac{g\left(\sqrt{x^{2}+y^{2}}\right)}{2 \pi \sqrt{x^{2}+y^{2}}}, x^{2}+y^{2}>0 \\ 0, x=y=0 . \end{array}\right.

f(x,y)f(x, y) 是否是一个二维随机向量的概率密度函数?

Solution: 由于 g(x)g(x) 为非负随机变量的概率密度函数, 则有 0+g(x)dx=1\int_{0}^{+\infty} g(x) d x=1, 且 g(x)0g(x) \geqslant 0, 所 以 f(x,y)f(x, y) 满足非负性, 此外

Rf(x,y)dxdy=02πdθ0+g(r)2πdr=0+g(r)dr=1\iint_{R} f(x, y) d x d y=\int_{0}^{2 \pi} d \theta \int_{0}^{+\infty} \frac{g(r)}{2 \pi} d r=\int_{0}^{+\infty} g(r) d r=1

所以 f(x,y)f(x, y) 满足正则性, 综上所述 f(x,y)f(x, y) 是一个二维随机向量的概率密度函数.

二、(14分) 设 XN(0,1),a>0X \sim N(0,1), \quad a>0 为常数. 定义 Y={X,xa,X,x>a.Y=\left\{\begin{array}{ll}X & ,|x| \leq a, \\ -X & ,|x|>a .\end{array}\right.YY 的分布.

Solution: 先求 YY 的分布函数, 由全概率公式, 有

P(Yy)=P(Yy,Xa)+P(Yy,X>a)=P(Xy,aXa)+P(Xy,X>a)+P(Xy,X<a)\begin{aligned} P(Y \leqslant y) &=P(Y \leqslant y,|X| \leqslant a)+P(Y \leqslant y,|X|>a) \\ &=P(X \leqslant y,-a \leqslant X \leqslant a)+P(X \geqslant-y, X>a)+P(X \geqslant-y, X<-a) \end{aligned}

按照 yy 的取值进行分类:
(i) y<ay<-a, 则

FY(y)=P(Yy)=P(Xy)=1Φ(y)=Φ(y)F_{Y}(y)=P(Y \leqslant y)=P(X \geqslant-y)=1-\Phi(-y)=\Phi(y) \text {; }

(ii) ay<a-a \leqslant y<a, 则

P(Yy)=P(a<Xy)+P(X>a)=Φ(y)Φ(a)+1Φ(a)=Φ(y)\begin{aligned} &P(Y \leqslant y)=P(-a<X \leqslant y)+P(X>a) \\ &=\Phi(y)-\Phi(-a)+1-\Phi(a)=\Phi(y) \end{aligned}

(iii) yay \geqslant a, 则

P(Yy)=P(Ya)+P(a<Yy)=Φ(y).P(Y \leqslant y)=P(Y \leqslant a)+P(a<Y \leqslant y)=\Phi(y) .

综上所述有 YN(0,1)Y \sim N(0,1).

三、(14分) 一个盒子由 aa 个白球, bb 个黑球和 nn 个红球, a,b,nN+.a, b, n \in N_{+} . 现不放回地依次取出一球, 求白球先于黑球被取出的概率,并证明该概率与 nn 无关.

Solution: 用事件 AiA_{i} 表示初始时刻盒中有 ii 个红球, 最终白球先于黑球被取出; 用事件 B1,B2,B3B_{1}, B_{2}, B_{3} 分别表示第一次抽出红、白、黑球, 则显然有 P(A0)=aa+bP\left(A_{0}\right)=\frac{a}{a+b}.
假设 P(An1)=aa+bP\left(A_{n-1}\right)=\frac{a}{a+b}, 则由全概率公式有

P(An)=P(AnB1)P(B1)+P(AnB2)P(B2)+P(AnB3)P(B3)=P(An1)na+b+n+1aa+b+n+0ba+b+n=aa+bn+aa+b+n=aa+b\begin{aligned} &P\left(A_{n}\right)=P\left(A_{n} \mid B_{1}\right) P\left(B_{1}\right)+P\left(A_{n} \mid B_{2}\right) P\left(B_{2}\right)+P\left(A_{n} \mid B_{3}\right) P\left(B_{3}\right) \\ &=P\left(A_{n-1}\right) \cdot \frac{n}{a+b+n}+1 \cdot \frac{a}{a+b+n}+0 \cdot \frac{b}{a+b+n} \\ &=\frac{\frac{a}{a+b} n+a}{a+b+n}=\frac{a}{a+b} \end{aligned}

则由数学归纳法知 P(An)aa+bP\left(A_{n}\right) \equiv \frac{a}{a+b}, 与 nn 无关.

四、(16分) 设 X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n} 是来自同一总体的简单随机样本, 总体的 概率密度是 f(x)={3x2,0<x<10, 其他 f(x)=\left\{\begin{array}{c}3 x^{2}, 0<x<1 \\ 0, \text { 其他 }\end{array}\right.,
试证明: 对任意 1i<jn,X(i)/X(j)1 \leq i<j \leq n, X_{(i)} / X_{(j)}X(j)X_{(j)} 相互独立, 并求他们各自的边缘概率密度函数.

Solution: 总体的密度函数是 F(x)={0x<0x30x<11x1F(x)=\left\{\begin{array}{ll}0 & x<0 \\ x^{3} & 0 \leqslant x<1 \\ 1 & x \geqslant 1\end{array}\right., 根据次序统计量联合分布的公式, (X(i),X(j))\left(X_{(i)}, X_{(j)}\right) 的联合密度函数是, 对于 0<y<z<10<y<z<1

fi,j(y,z)=n!3y23z2(i1)!(ji1)!(nj)!(y3)i1(z3y3)ji1(1z3)njf_{i, j}(y, z)=\frac{n ! \cdot 3 y^{2} \cdot 3 z^{2}}{(i-1) !(j-i-1) !(n-j) !}\left(y^{3}\right)^{i-1}\left(z^{3}-y^{3}\right)^{j-i-1}\left(1-z^{3}\right)^{n-j}

作变换 {T=X(i)X(j)U=X(j){X(i)=TUX(j)=U\left\{\begin{array}{l}T=\frac{X_{(i)}}{X_{(j)}} \\ U=X_{(j)}\end{array} \Leftrightarrow\left\{\begin{array}{l}X_{(i)}=T U \\ X_{(j)}=U\end{array}\right.\right., 雅各比行列式 (X(i),X(j))(T,U)=u\frac{\partial\left(X_{(i)}, X_{(j)}\right)}{\partial(T, U)}=u, 于是 (T,U)(T, U)
的密度函数是, 对于 0<tu<u<10<t u<u<1, 即 0<u,t<10<u, t<1, 有

fT,U(t,u)=fi,j(tu,u)u=n!3(tu)23u2u(i1)!(ji1)!(nj)!(tu)3(i1)(u3(tu)3)ji1(1u3)nj=9n!(i1)!(ji1)!(nj)!t3i1(1t3)ji1u3j1(1u3)nj\begin{aligned} &f_{T, U}(t, u)=f_{i, j}(t u, u)|u| \\ &=\frac{n ! \cdot 3(t u)^{2} \cdot 3 u^{2} \cdot u}{(i-1) !(j-i-1) !(n-j) !}(t u)^{3(i-1)}\left(u^{3}-(t u)^{3}\right)^{j-i-1}\left(1-u^{3}\right)^{n-j} \\ &=\frac{9 n !}{(i-1) !(j-i-1) !(n-j) !} t^{3 i-1}\left(1-t^{3}\right)^{j-i-1} u^{3j-1}\left(1-u^{3}\right)^{n-j} \end{aligned}

由于联合密度的变量可分离, 可看出 T,UT, U 相互独立, 其中 TT 的密度函数是

fT(t)=k(1t3)ji1t3i1,0<t<1f_{T}(t)=k\left(1-t^{3}\right)^{j-i-1} t^{3 i-1}, 0<t<1

其中 kk 是一个正则化常数, 由于

01(1t3)ji1t3i1du=1301(1t3)ji1t3i3dt3=1301(1y)ji1yi1dy=Γ(ji)Γ(i)3Γ(j)=(ji1)!(i1)!3(j1)!\begin{aligned} \int_{0}^{1}\left(1-t^{3}\right)^{j-i-1} t^{3 i-1} d u &=\frac{1}{3} \int_{0}^{1}\left(1-t^{3}\right)^{j-i-1} t^{3 i-3} d t^{3} \\ &=\frac{1}{3} \int_{0}^{1}(1-y)^{j-i-1} y^{i-1} d y \\ &=\frac{\Gamma(j-i) \Gamma(i)}{3 \Gamma(j)}=\frac{(j-i-1) !(i-1) !}{3(j-1) !} \end{aligned}

所以 fT(t)=3(j1)!(ji1)!(i1)!(1t3)ji1t3i1,0<t<1f_{T}(t)=\frac{3(j-1) !}{(j-i-1) !(i-1) !}\left(1-t^{3}\right)^{j-i-1} t^{3 i-1}, 0<t<1, 这便是 X(i)X(j)\frac{X_{(i)}}{X_{(j)}} 的 密度函数. 而 X(j)X_{(j)} 的边际密度函数是好求的, 直接根据公式, 它是

fj(u)=3n!(j1)!(nj)!(1u3)nju3j1,0<u<1f_{j}(u)=\frac{3 n !}{(j-1) !(n-j) !}\left(1-u^{3}\right)^{n-j} u^{3 j-1}, 0<u<1

五、(16分) 设 X1,X2,,XnN(μ,σ2),n>2X_{1}, X_{2}, \cdots, X_{n} \sim N\left(\mu, \sigma^{2}\right), n>2, 定义

Xˉ=1ni=1nXi,T=i=1n(XiXˉ)2nn1(XiXˉ)2\bar{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i}, T=\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}-\frac{n}{n-1}\left(X_{i}-\bar{X}\right)^{2}

(1) 求 ETE T;

(2) 证明 n(n2)n1X1XˉTtn2\sqrt{\frac{n(n-2)}{n-1}} \cdot \frac{X_{1}-\bar{X}}{\sqrt{T}} \sim t_{n-2}.

Solution: (1) 由于 XiXˉN(0,n1nσ2)X_{i}-\bar{X}_{\sim} N\left(0, \frac{n-1}{n} \sigma^{2}\right), 故 (XiXˉn1nσ)2χ2(1)\left(\frac{X_{i}-\bar{X}}{\sqrt{\frac{n-1}{n}} \sigma}\right)^{2} \sim \chi^{2}(1), 于是

E(X1Xˉ)2=n1nσ2E\left(X_{1}-\bar{X}\right)^{2}=\frac{n-1}{n} \sigma^{2}

所以 ET=nn1nσ2nn1n1nσ2=(n2)σ2E T=n \cdot \frac{n-1}{n} \sigma^{2}-\frac{n}{n-1} \frac{n-1}{n} \sigma^{2}=(n-2) \sigma^{2}.

(2)构建正交矩阵

A=[n1n(n1)1n(n1)1n(n1)1n1n1n]A=\left[\begin{array}{cccc} \frac{n-1}{\sqrt{n(n-1)}} & \frac{-1}{\sqrt{n(n-1)}} & \cdots & \frac{-1}{\sqrt{n(n-1)}} \\ \frac{1}{\sqrt{n}} & \frac{1}{\sqrt{n}} & \cdots & \frac{1}{\sqrt{n}} \\ \vdots & \vdots & \ddots & \vdots \end{array}\right]

该矩阵仅给出了前 2 行, 后 n2n-2 行只需保证 AA 满足正交性即可, 这样的矩阵是一定存 在的(因为我们可以任取其余 n2n-2 个与 AA 的前 2 个行向量线性无关的向量, 再利用施密特 正交化的方法给出 AA 的后 n2n-2 行).
记随机向量 X=(X1,X2,,Xn)T\boldsymbol{X}=\left(X_{1}, X_{2}, \cdots, X_{n}\right)^{T}, 作线性变换 Y=(Y1,Y2,,Yn)T=AX\boldsymbol{Y}=\left(Y_{1}, Y_{2}, \cdots, Y_{n}\right)^{T}=A \boldsymbol{X}, 由 于 XNn(μ1n,σ2In)\boldsymbol{X} \sim N_{n}\left(\mu \mathbf{1}_{n}, \sigma^{2} I_{n}\right), 则 YNn(μA1n,σ2In)\boldsymbol{Y} \sim N_{n}\left(\mu A \mathbf{1}_{n}, \sigma^{2} I_{n}\right), 其中特别的有

Y1=nn(n1)(n1nX11nX21nXn)=nn(n1)(X1Xˉ)Y2=1n(X1+X2++Xn)=nXˉ\begin{aligned} Y_{1}=\frac{n}{\sqrt{n(n-1)}}\left(\frac{n-1}{n} X_{1}-\frac{1}{n} X_{2}-\cdots-\frac{1}{n} X_{n}\right) &=\frac{n}{\sqrt{n(n-1)}}\left(X_{1}-\bar{X}\right) \\ Y_{2}=\frac{1}{\sqrt{n}}\left(X_{1}+X_{2}+\cdots+X_{n}\right) &=\sqrt{n} \bar{X} \end{aligned}

需要特别指出的是,从 Y\boldsymbol{Y} 的协方差矩阵可以看出, Y\boldsymbol{Y} 的各个分量之间都是独立的,并 且除了 Y2=nXˉN(nμ,σ2)Y_{2}=\sqrt{n} \bar{X} \sim N\left(\sqrt{n} \mu, \sigma^{2}\right) 之外, 其余的 YjY_{j} 都服从均值为 0 , 方差为 σ2\sigma^{2} 的正态分 布, 其中方差为 σ2\sigma^{2} 是显然的, 关于均值为 0 , 记

Yj=aj1X1+aj2X2++ajnXnY_{j}=a_{j 1} X_{1}+a_{j 2} X_{2}+\cdots+a_{j n} X_{n}

其中 aj=(aj1,aj2,,ajn)\boldsymbol{a}_{j}=\left(a_{j 1}, a_{j 2}, \cdots, a_{j n}\right) 是与 AA 的第二行向量正交的, 即 1ni=1naji=0\frac{1}{\sqrt{n}} \sum_{i=1}^{n} a_{j i}=0, 于是 EYj=E(i=1najiXi)=i=1najiμ=0.E Y_{j}=E\left(\sum_{i=1}^{n} a_{j i} X_{i}\right)=\sum_{i=1}^{n} a_{j i} \mu=0 .
同时, T=(n1)S2Y12T=(n-1) S^{2}-Y_{1}^{2}. 再由正交矩阵的性质注意到 i=1nXi2=i=1nYi2\sum_{i=1}^{n} X_{i}^{2}=\sum_{i=1}^{n} Y_{i}^{2}, 就有 (n1)S2=i=1nXi2nXˉ2=i=1nYi2Y22=Y12+Y32+Y42++Yn2(n-1) S^{2}=\sum_{i=1}^{n} X_{i}{ }^{2}-n \bar{X}^{2}=\sum_{i=1}^{n} Y_{i}{ }^{2}-Y_{2}{ }^{2}=Y_{1}{ }^{2}+Y_{3}{ }^{2}+Y_{4}{ }^{2}+\cdots+Y_{n}{ }^{2}
所以 T=(n1)S2Y12=Y32+Y42++Yn2T=(n-1) S^{2}-Y_{1}{ }^{2}=Y_{3}{ }^{2}+Y_{4}{ }^{2}+\cdots+Y_{n}{ }^{2}, 它仅仅是 Y3,,YnY_{3}, \cdots, Y_{n} 的函数, 所 以它与 Y1Y_{1} (即 X1XˉX_{1}-\bar{X} )独立, 并且 Tσ2χ2(n2)\frac{T}{\sigma^{2}} \sim \chi^{2}(n-2). 又 X1XˉN(0,n1nσ2)X_{1}-\bar{X} \sim N\left(0, \frac{n-1}{n} \sigma^{2}\right), 所以

X1Xˉn1nσ2T/σ2n2=n(n2)n1X1XˉTt(n2)\frac{\frac{X_{1}-\bar{X}}{\sqrt{\frac{n-1}{n} \sigma^{2}}}}{\sqrt{\frac{T / \sigma^{2}}{n-2}}}=\sqrt{\frac{n(n-2)}{n-1}} \frac{X_{1}-\bar{X}}{\sqrt{T}} \sim t(n-2)

六、(24分) 一种型号的电子元件寿命的分布函数是

F(x,α,β)={1exp{(xα)β},xα0,x<aF(x, \alpha, \beta)=\left\{\begin{array}{cc} 1-\exp \left\{\frac{-(x-\alpha)}{\beta}\right\}, &x \geq \alpha \\ 0, &x<a \end{array}\right.

α>0,β>0\alpha>0, \beta>0 均为未知参数.现取该型号原件 nn 个进行独立测试, 测得寿命分别为X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n}

(1) 分别求 α\alphaβ\beta 的矩估计和极大似然估计;

(2) 所求极大似然估计是否为无偏估计? 若不是无偏估计,则请基于该极大似然估计构造出 α\alphaβ\beta 的无偏估计.

Solution: (1) 作总体变换, 有 Yi=XiαY_{i}=X_{i}-\alpha i.i.d Exp(1β)\sim \operatorname{Exp}\left(\frac{1}{\beta}\right), 由指数分布性质:

EX=EY+α=α+β,DX=DY=β2E X=E Y+\alpha=\alpha+\beta, D X=D Y=\beta^{2}

用样本矩替代总体矩, 反解得参数的矩估计, 即

{X=α^+β^S2=β^2{α^=XˉSβ^=S\left\{\begin{array} { l } { \overline { X } = \hat { \alpha } + \hat { \beta } } \\ { S ^ { 2 } = \hat { \beta } ^ { 2 } } \end{array} \Longrightarrow \left\{\begin{array}{l} \hat{\alpha}=\bar{X}-S \\ \hat{\beta}=S \end{array}\right.\right.

再求极大似然估计, 似然函数为

L(α,β)=1βnei=1n(Xiα)βI{Xω1α}L(\alpha, \beta)=\frac{1}{\beta^{n}} e^{-\frac{\sum_{i=1}^{n}\left(X_{i}-\alpha\right)}{\beta}} I_{\left\{X_{\omega 1} \geqslant \alpha\right\}}

似然函数关于 α\alpha[X(1),+)\left[X_{(1)},+\infty\right) 上的单调递减函数, 因此可以看出 α\alpha 的极大似然估计 是 α^L=X(1)\hat{\alpha}_{L}=X_{(1)}, 再将似然函数取对数并关于 β\beta 求偏导置 0 , 可解得 β\beta 的似然方程, 即

lnLβ=nβ+nXˉnαβ2=0\frac{\partial \ln L}{\partial \beta}=-\frac{n}{\beta}+\frac{n \bar{X}-n \alpha}{\beta^{2}}=0

代入 α^L=X(1)\hat{\alpha}_{L}=X_{(1)} 解得, β^L=XˉX(1)\hat{\beta}_{L}=\bar{X}-X_{(1)}β\beta 的极大似然估计.
(2) 由指数最小值分布结论可知 Y(1)=X(1)αExp(nβ)Y_{(1)}=X_{(1)}-\alpha \sim \operatorname{Exp}\left(\frac{n}{\beta}\right), 故:

Eα^L=E(Y(1)+α)=βn+αEβ^L=E(YˉY(1))=n1nβ\begin{aligned} &E \hat{\alpha}_{L}=E\left(Y_{(1)}+\alpha\right)=\frac{\beta}{n}+\alpha \\ &E \hat{\beta}_{L}=E\left(\bar{Y}-Y_{(1)}\right)=\frac{n-1}{n} \beta \end{aligned}

所以它们均不是无偏估计. 可构造出下面两个无偏估计,

{α~=α^L1n1β^Lβ~=nn1β^L\left\{\begin{array}{l} \tilde{\alpha}=\hat{\alpha}_{L}-\frac{1}{n-1} \hat{\beta}_{L} \\ \tilde{\beta}=\frac{n}{n-1} \hat{\beta}_{L} \end{array}\right.

七、(12分) 设 θ^1\hat{\theta}_{1}θ^2\hat{\theta}_{2} 分别为未知参数 θ\theta 的两个无偏估计, 方差有限且大于 0, 假设 Cov(θ^1,θ^2)<0.\operatorname{Cov}\left(\hat{\theta}_{1}, \hat{\theta}_{2}\right)<0 . 问是否可以基于 θ^1\hat{\theta}_{1}θ^2\hat{\theta}_{2} 构造出一个 θ\theta 的无偏估计 θ^3\hat{\theta}_{3}, 且满足Var(θ^3)<Var(θ^1)?\operatorname{Var}\left(\hat{\theta}_{3}\right)<\operatorname{Var}\left(\hat{\theta}_{1}\right) ?

Solution:
θ^3=aθ^1+(1a)θ^2\hat{\theta}_{3}=a \hat{\theta}_{1}+(1-a) \hat{\theta}_{2}, 于是 Eθ^3=θE \hat{\theta}_{3}=\thetaθ\theta 的无偏估计, 则
Var(aθ^1+(1a)θ^2)=a2Var(θ^1)+(1a)2Var(θ^2)+2a(1a)Cov(θ^1,θ^2)\operatorname{Var}\left(a \hat{\theta}_{1}+(1-a) \hat{\theta}_{2}\right)=a^{2} \operatorname{Var}\left(\hat{\theta}_{1}\right)+(1-a)^{2} \operatorname{Var}\left(\hat{\theta}_{2}\right)+2 a(1-a) \operatorname{Cov}\left(\hat{\theta}_{1}, \hat{\theta}_{2}\right)
为方便起见, 记

c=Cov(θ^1,θ^2)<0,σ12=Var(θ^1),σ22=Var(θ^2)c=\operatorname{Cov}\left(\hat{\theta}_{1}, \hat{\theta}_{2}\right)<0, \sigma_{1}^{2}=\operatorname{Var}\left(\hat{\theta}_{1}\right), \sigma_{2}^{2}=\operatorname{Var}\left(\hat{\theta}_{2}\right)

于是, 令 H(a)=Var(aθ^1+(1a)θ^2)Var(θ^1)H(a)=\operatorname{Var}\left(a \hat{\theta}_{1}+(1-a) \hat{\theta}_{2}\right)-\operatorname{Var}\left(\hat{\theta}_{1}\right), 即

H(a)=(σ12+σ222c)a2+2(cσ22)a+σ22σ12H(a)=\left(\sigma_{1}{ }^{2}+\sigma_{2}{ }^{2}-2 c\right) a^{2}+2\left(c-\sigma_{2}{ }^{2}\right) a+\sigma_{2}{ }^{2}-\sigma_{1}{ }^{2}

其中二次项系数 σ12+σ222c=Var(θ^1θ^2)>0\sigma_{1}{ }^{2}+\sigma_{2}^{2}-2 c=\operatorname{Var}\left(\hat{\theta}_{1}-\hat{\theta}_{2}\right)>0, 即二次函数 H(a)H(a) 的开口向上,
又判别式

Δ=[2(cσ22)]24(σ12+σ222c)(σ22σ12)>0\Delta=\left[2\left(c-\sigma_{2}^{2}\right)\right]^{2}-4\left(\sigma_{1}^{2}+\sigma_{2}^{2}-2 c\right)\left(\sigma_{2}^{2}-\sigma_{1}^{2}\right)>0

所以 H(a)H(a) 有两个零点, 则我们取其对称轴, 即 a0=σ22cσ12+σ222ca_{0}=\frac{\sigma_{2}^{2}-c}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 c}, 就必定有 H(a0)<0H\left(a_{0}\right)<0, 即 Var(a0θ^1+(1a0)θ^2)<Var(θ^1)\operatorname{Var}\left(a_{0} \hat{\theta}_{1}+\left(1-a_{0}\right) \hat{\theta}_{2}\right)<\operatorname{Var}\left(\hat{\theta}_{1}\right), 所以取

θ^3=σ22cσ12+σ222cθ^1+(1σ22cσ12+σ222c)θ^2\hat{\theta}_{3}=\frac{\sigma_{2}^{2}-c}{\sigma_{1}^{2}+\sigma_{2}^{2}-2 c} \hat{\theta}_{1}+\left(1-\frac{\sigma_{2}^{2}-c}{\sigma_{1}{ }^{2}+\sigma_{2}{ }^{2}-2 c}\right) \hat{\theta}_{2}

就有 Var(θ^3)<Var(θ^1)\operatorname{Var}\left(\hat{\theta}_{3}\right)<\operatorname{Var}\left(\hat{\theta}_{1}\right).

八、(20分) 某减肥机构称其疗程可使参加者平均减少体重 5 kg5 \mathrm{~kg} 以上,为检验广告是否可信,随机调查了 10 名参加者,数据 (kg):

 参加前 65.3962.8963.5060.8363.0762.8857.8063.0766.0570.78 参加后 61.7259.4359.6457.3058.5060.8451.8960.0263.6765.67\begin{array}{llllllllllll} \text { 参加前 } & 65.39 & 62.89 & 63.50 & 60.83 & 63.07 & 62.88 & 57.80 & 63.07 & 66.05 & 70.78 \\ \text { 参加后 } & 61.72 & 59.43 & 59.64 & 57.30 & 58.50 & 60.84 & 51.89 & 60.02 & 63.67 & 65.67 \end{array}

假设参加前后体重均服从正态分布.

(1) 在显著性水平为 0.050.05 下检验宣传是否可信;

(2) 给出平均减少体重的 95%的置信区间.

Solution:
(1) 根据题意, 应采取成对数据的假设检验来消除个人差异引起的随机误差.
用随机变量 Xi,YiX_{i}, Y_{i} 分别表示第 ii 名参与者参加前后的体重, 并设

Zi=XiYiN(μ,σ2)Z_{i}=X_{i}-Y_{i} \sim N\left(\mu, \sigma^{2}\right)

考虑假设检验问题, H0:μ5H1:μ>5H_{0}: \mu \leqslant 5 \longleftrightarrow H_{1}: \mu>5
检验统计量为: T=n(Zˉ5)s=10(3.7585)1.184=3.317T=\frac{\sqrt{n}(\bar{Z}-5)}{s}=\frac{\sqrt{10} \cdot(3.758-5)}{1.184}=-3.317;
检验的拒绝域是 W={Tt1α(n1)}={Tt0.95(9)}={T1.833}W=\left\{T \geqslant t_{1-\alpha}(n-1)\right\}=\left\{T \geqslant t_{0.95}(9)\right\}=\{T \geqslant 1.833\}.
TWT \notin W, 所以我们不能拒绝原假设, 即宣传不可信.
(2)取枢轴量 T=n(Zˉμ)st(n1)T=\frac{\sqrt{n}(\bar{Z}-\mu)}{s} \sim t(n-1), 由于

P{t1α2(n1)Zˉμsnt1α2(n1)}=1αP\left\{-t_{1-\frac{\alpha}{2}}(n-1) \leqslant \frac{\bar{Z}-\mu}{s} \sqrt{n} \leqslant t_{1-\frac{\alpha}{2}}(n-1)\right\}=1-\alpha

反解可得到 μ\mu 的置信区间 Zˉ±snt1α2(n1)\bar{Z} \pm \frac{s}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1), 代入数据可得:

μ[2.91,4.61]\mu \in[2.91,4.61]

九、(22分)观察三种药物 A、B、C 治疗 200 例心绞痛的疗效,数据:

显著 有效 无效 合计
A 15 37 7 59
B 11 48 13 72
C 16 39 14 69
合计 42 124 34 200

用列联表分析判断这三种药物的疗效有无显著性差异. (( 检验水平 α=0.05\alpha=0.05 )

Solution:

独立情况下的理论样本数

显著 有效 无效
A 5942/200=12.3959 \cdot 42 / 200 = 12.39 59124/200=36.5859 \cdot 124 / 200 = 36.58 5934/200=10.0359 \cdot 34 / 200 = 10.03
B 7242/200=15.1272 \cdot 42 / 200 = 15.12 72124/200=44.6472 \cdot 124 / 200 = 44.64 7234/200=12.2472\cdot 34/ 200 = 12.24
C 6942/200=14.4969 \cdot 42 / 200 = 14.49 69124/200=42.7869 \cdot 124 / 200 = 42.78 6934/200=11.7369\cdot 34/ 200 = 11.73

考虑假设检验问题
H0H_{0} :三种药物无显著性差异 v.s. H1H_{1} :三种药物有显著性差异
检验统计量 χ2=i=13j=13nijnp^ip^jnp^ip^j=3.82\chi^{2}=\sum_{i=1}^{3} \sum_{j=1}^{3} \frac{n_{i j}-n \hat{p}_{i} \hat{p}_{j}}{n \hat{p}_{i} \hat{p}_{j}}=3.82, 拒绝域为 W={χ2>χ0.952(4)=9.488}W=\left\{\chi^{2}>\chi_{0.95}^{2}(4)=9.488\right\}, 所以 χ2W\chi^{2} \notin W, 因此我们没有足够理由 拒绝原假设, 故可以认为三种药物无显著差异.