南开大学-432统计学-2017年

一、选择题 (每题 4 分, 共 28 分)

  1. 已知 P(A)=P(B)=P(C)=14,P(AB)=0,P(AC)=P(BC)=116P(A)=P(B)=P(C)=\frac{1}{4}, P(A B)=0, P(A C)=P(B C)=\frac{1}{16}, 则 A,B,CA, B,C 中至少发生一个的概率是( ).

A. 58\frac{5}{8};

B. 38\frac{3}{8};

C. 34\frac{3}{4};

D. 14\frac{1}{4}.

Solution: A
由于 0P(ABC)P(AB)=00 \leq P(A B C) \leq P(A B)=0, 所以 P(ABC)=0P(A B C)=0. 因此

P(ABC)=P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC)=3418=58\begin{aligned} P(A \cup B \cup C)=& P(A)+P(B)+P(C) \\ &-P(A B)-P(A C)-P(B C)+P(A B C) \\ =& \frac{3}{4}-\frac{1}{8}=\frac{5}{8} \end{aligned}

  1. 若随机变 XX 的方差存在, 则 Var(X)=0{Var}(X)=0 的充要条件是( ).

A. XX几乎处处取某个常数aa;

B. EX=0EX=0;

C. EX2=0EX^2=0;

D. P(X=0)=1P\left(X = 0\right) = 1.

Solution: A
如果 XX 恒为一个不为 0 的常数 aa, 则

E(X)=a=0,E(X2)=a2,P(X=0)=0E(X)=a=0, E\left(X^{2}\right)=a^{2}, P(X=0)=0

由此可以排除 BCD 选项.

  1. 设随机变量X,YX, Y独立同分布, 且P(X=1)=P(X=1)=12P\left( X=-1 \right) = P\left( X=1 \right) =\frac{1}{2}, 则P(X=Y)=P\left(X = Y\right) =( ).

A. 0;

B. 14\frac{1}{4};

C. 12\frac{1}{2};

D. 1.

Solution: C

P(X=Y)=P(X=Y=1)+P(X=Y=1)=14+14=12\begin{aligned} P(X=Y) &=P(X=Y=-1)+P(X=Y=1) \\ &=\frac{1}{4}+\frac{1}{4}=\frac{1}{2} \end{aligned}

  1. 已知随机变量 X1,X2,X3X_{1}, X_{2}, X_{3} 相互独立, 且 X1U(0,6),X2N(1,3),X3Exp(3)X_{1} \sim U(0,6), X_{2} \sim N(1,3), X_{3} \sim \operatorname{Exp}(3), Y=X12X2+3X3,Y=X_{1}-2 X_{2}+3 X_{3},Var(Y)=16Var(Y)=16( ).

A. 16;

B. 283\frac{28}{3};

C. 18;

D. 10.

Solution: A

Var(Y)=Var(X1)+4Var(X2)+9Var(X3)=3+12+1=16\begin{aligned} \operatorname{Var}(Y) &=\operatorname{Var}\left(X_{1}\right)+4 \operatorname{Var}\left(X_{2}\right)+9 \operatorname{Var}\left(X_{3}\right) \\ &=3+12+1=16 \end{aligned}

  1. 如果Xnla,YnlYX_{n} \stackrel{l}{\longrightarrow} a, Y_{n} \stackrel{l}{\longrightarrow} Y, 则下列结论不一定正确的是( ).

A. XnpaX_{n} \stackrel{p}{\longrightarrow} a;

B. XnYnlaYX_{n}Y_{n} \stackrel{l}{\longrightarrow} aY;

C. Xn+Ynla+YX_{n}+Y_{n} \stackrel{l}{\longrightarrow} a+Y;

D. YnpYY_{n} \stackrel{p}{\longrightarrow} Y.

Solution: D
依概率收敛强于依分布收敛,只有在收敛到退化分布二者才等价; 所以,在一般情况下 由依分布收敛推不出依概率收敛.

  1. 以下说法不正确的是( ).

A. 若接受原假设, 可能犯取伪错误;

B. 若拒绝原假设, 可能犯第一类错误;

C. 控制α\alpha是为了控制犯第二类错误的概率;

D. 增大样本容量nn不能同时降低犯两类错误的概率.

Solution: C
原假设正确,但被拒绝,为第一类错误,又称拒真错误;
原假设不真, 但被接受, 为第二类错误, 又称取伪错误;
提出显著性检验的概念是要控制犯第一类错误的概率不超过 α\alpha.
关于 D 选项, 它有时对有时不对, 依赖于拒绝域的选取. 考虑正态总体N(μ,1)N(\mu,1)nn个样本, 探讨假设检验

H0:μ=0vsH1:μ=1,H_0:\mu = 0 \quad \mathrm{vs} \quad H_1:\mu = 1,

构造两个拒绝域:

W1={xˉ>z1αn},W2={xˉ>12}.W_1=\left\{ \bar{x}>\frac{z_{1-\alpha}}{\sqrt{n}} \right\} ,\quad W_2=\left\{ \bar{x}>\frac{1}{2} \right\} .

α1=Pμ=0(xˉ>z1αn)=α,β1=Pμ=1(xˉ<z1αn)=Pμ=1(n(xˉ1)<z1αn)=Φ(z1αn),\alpha _1=P_{\mu =0}\left( \bar{x}>\frac{z_{1-\alpha}}{\sqrt{n}} \right) =\alpha ,\quad \beta _1=P_{\mu =1}\left( \bar{x}<\frac{z_{1-\alpha}}{\sqrt{n}} \right) =P_{\mu =1}\left( \sqrt{n}\left( \bar{x}-1 \right) <z_{1-\alpha}-\sqrt{n} \right) =\Phi \left( z_{1-\alpha}-\sqrt{n} \right) ,

nn增大时, α1\alpha_1永远不变, 但β1\beta_1nn增大而递减最终趋于0.

再算W2W_2, 有

α2=Pμ=0(xˉ>12)=Pμ=0(nxˉ>n2)=1Φ(n2),β2=Pμ=1(xˉ<12)=Pμ=1(n(xˉ1)<n2)=Φ(n2),\begin{aligned} &\alpha _2=P_{\mu =0}\left( \bar{x}>\frac{1}{2} \right) =P_{\mu =0}\left( \sqrt{n}\bar{x}>\frac{\sqrt{n}}{2} \right) =1-\Phi \left( \frac{\sqrt{n}}{2} \right) ,\\ &\beta _2=P_{\mu =1}\left( \bar{x}<\frac{1}{2} \right) =P_{\mu =1}\left( \sqrt{n}\left( \bar{x}-1 \right) <-\frac{\sqrt{n}}{2} \right) =\Phi \left( -\frac{\sqrt{n}}{2} \right) ,\\ \end{aligned}

发现α2,β2\alpha_2,\beta_2都随nn增大而递减最终趋于0.

因此 D 模棱两可, 我们选更明显错误的 C.

  1. X1,X2,XnX_1,X_2,\cdots X_n 是来自总体 N(μ,σ2)N(\mu, \sigma^2) 的一组随机样本, 记xˉ=1ni=1nXi,s2=1n1i=1n(Xixˉ)2\bar{x}=\frac{1}{n}\sum_{i=1}^n{X_i}, s^2=\frac{1}{n-1}\sum_{i=1}^n{\left( X_i-\bar{x} \right) ^2}, 则下列结论正确的是 ( ).

A. s2s^2σ2\sigma^2的最大似然估计;

B. (n1)s2χ2(n1)(n-1)s^2 \sim \chi^2(n-1);

C. ssσ\sigma的无偏估计;

D. n(xˉμ)st(n1)\frac{\sqrt{n}(\bar{x}-\mu)}{s} \sim t(n-1).

Solution: D
σ^2MLE=1ni=1(xixˉ)2\hat{\sigma}^{2}{ }_{M L E}=\frac{1}{n} \sum_{i=1}\left(x_{i}-\bar{x}\right)^{2}, 故 A\mathrm{A} 错误;
(n1)S2σ2χ2(n1)\frac{(n-1) S^{2}}{\sigma^{2}} \sim \chi^{2}(n-1), 故只有当 σ2=1\sigma^{2}=1 时, B 才是正确的;
样本标准差不是总体标准差的无偏估计, C\mathrm{C} 错误;

二、填空题(每题4分, 共32分)

  1. 甲乙两人独立的向同一目标射击, 甲击中目标的概率为0.5, 乙击中目标的概率为0.6, 则目标被击中的概率为 ________.

Solution: 0.8
用事件 AA 表示目标被击中,被甲击中为 A1A_{1}, 被乙击中为 A2A_{2}. 则

P(Aˉ)=P(Aˉ1Aˉ2)=P(Aˉ1)P(Aˉ2)=0.5×0.4=0.2P(\bar{A})=P\left(\bar{A}_{1} \bar{A}_{2}\right)=P\left(\bar{A}_{1}\right) P\left(\bar{A}_{2}\right)=0.5 \times 0.4=0.2

于是 P(A)=1P(Aˉ)=0.8P(A)=1-P(\bar{A})=0.8.

  1. 已知 E(X)=2,E(X2)=5E(X)=-2, E\left(X^{2}\right)=5, 则 Var(13X)={Var}(1-3 X)= ________.

Solution: 9
因为 Var(X)=E(X2)[E(X)]2=54=1\operatorname{Var}(X)=E\left(X^{2}\right)-[E(X)]^{2}=5-4=1, 所以

Var(13X)=Var(3X)=9Var(X)=9\operatorname{Var}(1-3 X)=\operatorname{Var}(-3 X)=9 \operatorname{Var}(X)=9

  1. 随机变量 XXYY 相互独立同分布, 服从 N(μ,62)N\left(\mu, 6^{2}\right), 令 U=X+Y,V=XYU=X+Y, V=X-Y, 则UUVV 的相关系数为________.

Solution: 0
Cov(U,V)=Cov(X+Y,XY)\operatorname{Cov}(U, V)=\operatorname{Cov}(X+Y, X-Y), 而 Cov(X,Y)=0\operatorname{Cov}(X, Y)=0, 所以

Cov(U,V)=Cov(X,X)Cov(Y,Y)=Var(X)Var(Y)=0\begin{aligned} \operatorname{Cov}(U, V)&=\operatorname{Cov}(X, X)-\operatorname{Cov}(Y, Y)\\ &=\operatorname{Var}(X)-\operatorname{Var}(Y)=0 \end{aligned}

  1. 设随机变量XXYY 相互独立, XExp(λ),YExp(μ)X \sim \operatorname{Exp}(\lambda), Y \sim \operatorname{Exp}(\mu), 则P(X<Y)=P(X<Y)=________.

Solution: λλ+μ\frac{\lambda}{\lambda+\mu}
(X,Y)(X, Y) 的联合密度函数是 p(x,y)=p(x)p(y)=λμeλxμy,x>0,y>0p(x, y)=p(x) p(y)=\lambda \mu \cdot e^{-\lambda x-\mu y}, x>0, y>0
于是

P(X<Y)=0+dy0yλμeλxμydx=0+μeμy(1eλy)dy=λλ+μ\begin{aligned} P(X<Y)&=\int_{0}^{+\infty} d y \int_{0}^{y} \lambda \mu \cdot e^{-\lambda x-\mu y} d x\\ &=\int_{0}^{+\infty} \mu e^{-\mu y}\left(1-e^{-\lambda y}\right) d y \\ &=\frac{\lambda}{\lambda+\mu} \end{aligned}

  1. 随机变量 XF(n,n)X \sim F(n, n), 则 P(X<1)=P(X<1)=________.

Solution: 0.50.5
由于 XF(n,n)X \sim F(n, n), 则 Y=1XF(n,n)Y=\frac{1}{X} \sim F(n, n), 则

P(X<1)=P(Y<1)=P(1X<1)=P(X>1)P(X<1)=P(Y<1)=P\left(\frac{1}{X}<1\right)=P(X>1)

P(X<1)+P(X>1)=1P(X<1)+P(X>1)=1, 所以 P(X<1)=0.5P(X<1)=0.5.

  1. x1,,xmx_{1}, \ldots, x_{m} 是来自 N(μ1,σ12)N\left(\mu_{1}, \sigma_{1}^{2}\right) 的样本, y1,,yny_{1}, \ldots, y_{n} 是来自 N(μ2,σ22)N\left(\mu_{2}, \sigma_{2}^{2}\right) 的样本, 且两个样本相互独立, xˉ\bar{x}yˉ\bar{y} 分别是样本均值, 在 σ12\sigma_{1}^{2}σ22\sigma_{2}^{2}, 已知时, μ1μ2\mu_{1}-\mu_{2}的枢轴量为________.

Solution: u=xˉyˉ(μ1μ2)σ12m+σ22nu=\frac{\bar{x}-\bar{y}-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{m}+\frac{\sigma_{2}^{2}}{n}}}
xˉyˉN(μ1μ2,σ12m+σ22n)\bar{x}-\bar{y} \sim N\left(\mu_{1}-\mu_{2}, \frac{\sigma_{1}^{2}}{m}+\frac{\sigma_{2}^{2}}{n}\right), 所以可采用

u=xˉyˉ(μ1μ2)σ12m+σ22nN(0,1)u=\frac{\bar{x}-\bar{y}-\left(\mu_{1}-\mu_{2}\right)}{\sqrt{\frac{\sigma_{1}^{2}}{m}+\frac{\sigma_{2}^{2}}{n}}} \sim N(0,1)

作为枢轴量.

  1. 若有来自总体密度函数为f(x)={λnΓ(n)xn1eλx,x>0;0,其他.f\left( x \right) =\begin{cases} \frac{\lambda ^n}{\Gamma \left( n \right)}x^{n-1}e^{-\lambda x},& x>0;\\ 0,& \text{其他}.\\ \end{cases}的随机样本x1,,xmx_{1}, \ldots, x_{m}, 利用k(k<n)k(k<n)阶矩求出λ\lambda的矩估计是________.

Solution: Γ(n+k)mΓ(n)(xik)k\sqrt[k]{\frac{\Gamma(n+k) m}{\Gamma(n)\left(\sum x_{i}^{k}\right)}}

E(Xk)=0+λnΓ(n)xkxn1eλxdx=λnΓ(n)Γ(n+k)λn+k=Γ(n+k)Γ(n)1λk,E\left(X^{k}\right)=\int_{0}^{+\infty} \frac{\lambda^{n}}{\Gamma(n)} x^{k} x^{n-1} e^{-\lambda x} d x=\frac{\lambda^{n}}{\Gamma(n)} \frac{\Gamma(n+k)}{\lambda^{n+k}}=\frac{\Gamma(n+k)}{\Gamma(n)} \frac{1}{\lambda^{k}},

于是 λk=Γ(n+k)Γ(n)E(Xk)\lambda^{k}=\frac{\Gamma(n+k)}{\Gamma(n) E\left(X^{k}\right)}, 则 λ^=Γ(n+k)mΓ(n)(i=1nxik)k\hat{\lambda}=\sqrt[k]{\frac{\Gamma(n+k)m}{\Gamma(n)\left( \sum_{i=1}^{n} x_{i}^{k}\right)}}λ\lambda 的矩估计.

三、解答题(90分)

1.(10分)设随机变量XX的密度函数为 p(x)={a+bx2,0x1;0, 其他 .p(x)=\left\{\begin{array}{cl}a+b x^{2}, & 0 \leq x \leq 1; \\ 0, & \text { 其他 }.\end{array}\right., 如果E(X)=23E(X)=\frac{2}{3}, 求aabb.

Solution:
根据概率密度函数的正则性, 有

01p(x)dx=01(a+bx2)dx=1\int_{0}^{1} p(x) d x=\int_{0}^{1}\left(a+b x^{2}\right) d x=1

可得方程 a+13b=1a+\frac{1}{3} b=1.
再根据题意

E(X)=01(ax+bx3)dx=23E(X)=\int_{0}^{1}\left(a x+b x^{3}\right) d x=\frac{2}{3}

可知 12a+14b=23\frac{1}{2} a+\frac{1}{4} b=\frac{2}{3}, 联解方程可得 a=13,b=2a=\frac{1}{3}, b=2.

2.(10分)假设有10只同种电器元件, 其中有两只不合格品, 装配仪器时, 从这批元件中任取一只, 如是不合格品,则扔掉重新任取一只, 如仍是不合格品, 则扔掉再取一只, 试求在取到合格品之前, 已取出的不合格品数的数学期望.

Solution: 用 XX 表示取到合格品前已取出的不合格品, 则 XX 的分布列是

P(X=0)=45,P(X=2)=145P(X=1)=145145=845\begin{aligned} &P(X=0)=\frac{4}{5}, P(X=2)=\frac{1}{45} \\ &P(X=1)=1-\frac{4}{5}-\frac{1}{45}=\frac{8}{45} \end{aligned}

所以 EX=845+2145=29E X=\frac{8}{45}+2 \cdot \frac{1}{45}=\frac{2}{9}

3.(10分)设XXYY的联合密度函数为

f(x,y)={3x,0<x<1,0<y<x;0, 其他 .f(x, y)=\left\{\begin{array}{lc}3 x, & 0<x<1,0<y<x; \\ 0, & \text { 其他 }.\end{array}\right.

试求Z=XYZ=X-Y的密度函数.

Solution:
先计算 ZZ 的分布函数, 当 z(0,1)z \in(0,1) 时, 有

Fz(z)=P(Z<z)=P(XYz)=0z0x3xdydx+z1xzx3xdydx=32z12z3\begin{aligned} F_{z}(z) &=P(Z<z) \\ &=P(X-Y \leq z) \\ &=\int_{0}^{z} \int_{0}^{x} 3 x d y d x+\int_{z}^{1} \int_{x-z}^{x} 3 x d y d x \\ &=\frac{3}{2} z-\frac{1}{2} z^{3} \end{aligned}

此时有 fZ(z)=32(1z2),0<z<1f_{Z}(z)=\frac{3}{2}\left(1-z^{2}\right), 0<z<1. 当 z(0,1)z \notin(0,1) 时, 显然有 fZ(z)=0f_{Z}(z)=0.

4.(10分)设随机变量XXYY独立同分布, 均服从参数为 λ\lambda的泊松分布,令U=2X+Y,V=2XYU=2 X+Y, V=2 X-Y, 求 UUVV 的相关系数 Corr(U,V){Corr}(U, V).

Solution:

Var(U)=Var(2X+Y)=4Var(X)+Var(Y)=5λVar(V)=Var(2XY)=4Var(X)+Var(Y)=5λ\begin{aligned} &\operatorname{Var}(U)=\operatorname{Var}(2 X+Y)=4 \operatorname{Var}(X)+\operatorname{Var}(Y)=5 \lambda \\ &\operatorname{Var}(V)=\operatorname{Var}(2 X-Y)=4 \operatorname{Var}(X)+\operatorname{Var}(Y)=5 \lambda \end{aligned}

由于 X,YX, Y 相互独立, 所以

Cov(U,V)=Coc(2X+Y,2XY)=4Var(X)Var(Y)=3λ\begin{aligned} \operatorname{Cov}(U, V) &=\operatorname{Coc}(2 X+Y, 2 X-Y) \\ &=4 \operatorname{Var}(X)-\operatorname{Var}(Y) \\ &=3 \lambda \end{aligned}

于是 Corr(U,V)=3λ5λ5λ=35\operatorname{Corr}(U, V)=\frac{3 \lambda}{\sqrt{5 \lambda \cdot 5 \lambda}}=\frac{3}{5}.

5.(10分)从均值为 μ\mu, 方差为 σ2\sigma^{2}的总体中, 分别抽取容量为 n1n_{1}n2n_{2} 的两独立样本, xˉ1\bar{x}_{1}xˉ2\bar{x}_{2} 分别是这两个样本的均值.试证, 对于任意常数 a,b(a+b=1)a, b (a+b=1),T=axˉ1+bxˉ2T=a \bar{x}_{1}+b \bar{x}_{2} 都是 μ\mu 的无偏估计, 并讨论当 a,ba, b取何值时, TT的方差达到最小.

Solution: 由于 E(xˉ1)=E(xˉ2)=μE\left(\bar{x}_{1}\right)=E\left(\bar{x}_{2}\right)=\mu, 所以 E(T)=E(axˉ1+bxˉ2)=(a+b)μ=μE(T)=E\left(a \bar{x}_{1}+b \bar{x}_{2}\right)=(a+b) \mu=\mu, 即对 于任意常数 a,b,Ta, b, T 都是 μ\mu 的无偏估计.
而Var (xˉ1)=σ2n1,Var(xˉ2)=σ2n2\left(\bar{x}_{1}\right)=\frac{\sigma^{2}}{n_{1}}, \operatorname{Var}\left(\bar{x}_{2}\right)=\frac{\sigma^{2}}{n_{2}}, 于是

Var(T)=a2σ2n1+(1a)2σ2n2=σ2[(1n1+1n2)a22n2a+1n2]\begin{aligned} \operatorname{Var}(T) &=\frac{a^{2} \sigma^{2}}{n_{1}}+\frac{(1-a)^{2} \sigma^{2}}{n_{2}} \\ &=\sigma^{2}\left[\left(\frac{1}{n_{1}}+\frac{1}{n_{2}}\right) a^{2}-\frac{2}{n_{2}} a+\frac{1}{n_{2}}\right] \end{aligned}

上式是关于 aa 的一个二次函数, 显然当 a=n1n1+n2a=\frac{n_{1}}{n_{1}+n_{2}} 时, Var(T)\operatorname{Var}(T) 达到最小. 此时b=n2n1+n2b=\frac{n_{2}}{n_{1}+n_{2}}.

6.(15分)设 x1,,xnx_{1}, \cdots, x_{n} 为来自指数分布 E(λ1)E\left(\lambda_{1}\right) 的样本, Y1,,YmY_{1}, \cdots, Y_{m} 为来自指数分布 E(λ2)E\left(\lambda_{2}\right) 的样本,且两组样本独立,其中 λ1,λ2\lambda_{1}, \lambda_{2} 是未知的正值参数.

(1)求假设 H0:λ1=λ2H_{0}: \lambda_{1}=\lambda_{2} \quad vs H1:λ1λ2\quad H_{1}: \lambda_{1} \neq \lambda_{2} 的广义似然比检验;

(2)试证明上述检验法的拒绝域仅依赖于比值T=i=1nXij=1mYjT = \frac{\sum_{i=1}^n{X_i}}{\sum_{j=1}^m{Y_j}};

(3)给出原假设成立时, TT的分布.

Solution: (1) 两个样本的联合似然函数是 L(λ1,λ2)=λ1neλ1i=1nxiλ2meλ2j=1nyjL\left(\lambda_{1}, \lambda_{2}\right)=\lambda_{1}^{n} e^{-\lambda_{1} \sum_{i=1}^{n} x_{i}} \lambda_{2}^{m} e^{-\lambda_{2} \sum_{j=1}^{n} y_{j}}.
自然参数空间以及原假设对应的参数空间分别是是

Θ={(λ1,λ2):λ1>0,λ2>0}Θ0={(λ1,λ2):λ1=λ2>0}\begin{gathered} \Theta=\left\{\left(\lambda_{1}, \lambda_{2}\right): \lambda_{1}>0, \lambda_{2}>0\right\} \\ \Theta_{0}=\left\{\left(\lambda_{1}, \lambda_{2}\right): \lambda_{1}=\lambda_{2}>0\right\} \end{gathered}

在自然参数空间中容易求出 (λ1,λ2)\left(\lambda_{1}, \lambda_{2}\right) 的极大似然估计,只需将对数似然函数关于两个参 数的偏导置 0 即可, 它们分别是

λ^1=ni=1nxi,λ^2=mj=1myj\hat{\lambda}_{1}=\frac{n}{\sum_{i=1}^{n} x_{i}}, \hat{\lambda}_{2}=\frac{m}{\sum_{j=1}^{m} y_{j}}

在原假设的参数空间中求 (λ1,λ2)\left(\lambda_{1}, \lambda_{2}\right) 的约束极大似然估计, 只需在似然函数中令 λ1=λ2=λ\lambda_{1}=\lambda_{2}=\lambda, 并将对数似然函数关于 λ\lambda 的导数置 0 , 可得到 (λ1,λ2)\left(\lambda_{1}, \lambda_{2}\right) 共同的极大似然估计

λ^0=n+mi=1nxi+j=1myj\hat{\lambda}_{0}=\frac{n+m}{\sum_{i=1}^{n} x_{i}+\sum_{j=1}^{m} y_{j}}

从而可计算得到似然比统计量

Λ=L(λ^1,λ^2)L(λ^0,λ^0)=(λ^1)n(λ^2)m(λ^0)n+m=nnmm(n+m)n+m(i=1nxi+j=1myj)n+m(i=1nxi)n(j=1myj)m\Lambda=\frac{L\left(\hat{\lambda}_{1}, \hat{\lambda}_{2}\right)}{L\left(\hat{\lambda}_{0}, \hat{\lambda}_{0}\right)}=\frac{\left(\hat{\lambda}_{1}\right)^{n}\left(\hat{\lambda}_{2}\right)^{m}}{\left(\hat{\lambda}_{0}\right)^{n+m}}=\frac{n^{n} m^{m}}{(n+m)^{n+m}} \frac{\left(\sum_{i=1}^{n} x_{i}+\sum_{j=1}^{m} y_{j}\right)^{n+m}}{\left(\sum_{i=1}^{n} x_{i}\right)^{n}\left(\sum_{j=1}^{m} y_{j}\right)^{m}}

因此该问题的似然比拒绝域为 W={Λ(X,Y)>c}W=\{\Lambda(\boldsymbol{X}, \boldsymbol{Y})>c\}, 这里常数 cc 使得该拒绝域适合给 定的显著性水平 α\alpha.

(2) 将似然比统计量改写为如下的形式

Λ=nnmm(n+m)n+m(1+i=1nxij=1myj)m(1+j=1myji=1nxi)=nnmm(n+m)n+m(1+T)m(1+1T)n\begin{aligned} \Lambda &=\frac{n^{n} m^{m}}{(n+m)^{n+m}}\left(1+\frac{\sum_{i=1}^{n} x_{i}}{\sum_{j=1}^{m} y_{j}}\right)^{m}\left(1+\frac{\sum_{j=1}^{m} y_{j}}{\sum_{i=1}^{n} x_{i}}\right) \\ &=\frac{n^{n} m^{m}}{(n+m)^{n+m}}(1+T)^{m}\left(1+\frac{1}{T}\right)^{n} \end{aligned}

其中 T=i=1nxij=1myjT=\frac{\sum_{i=1}^{n} x_{i}}{\sum_{j=1}^{m} y_{j}}, 同时注意到 f(T)=(1+T)m(1+1T)nf(T)=(1+T)^{m}\left(1+\frac{1}{T}\right)^{n} 关于 TT 是一个先减后增函数, 并且 f(0+)=+,f(+)=+f(0+)=+\infty, f(+\infty)=+\infty, 于是

{Λ(X,Y)>c}{T<a}{T>b}\{\Lambda(\boldsymbol{X}, \boldsymbol{Y})>c\} \Longleftrightarrow\{T<a\} \cup\{T>b\}

这里常数 a,ba, b 满足

{f(a)=f(b)P({T<a}{T>b}λ1=λ2)=1αa<b\left\{\begin{array}{l} f(a)=f(b) \\ P\left(\{T<a\} \cup\{T>b\} \mid \lambda_{1}=\lambda_{2}\right)=1-\alpha \\ a<b \end{array}\right.

(3) 由指数分布、伽马分布、卡方分布之间的关系容易得到

i=1nxiGa(n,λ1),2λ1i=1nxiGa(n,12)=χ2(2n)j=1myjGa(m,λ2),2λ2j=1myjGa(m,12)=χ2(2m)\begin{aligned} \sum_{i=1}^{n} x_{i} \sim G a\left(n, \lambda_{1}\right), 2 \lambda_{1} \sum_{i=1}^{n} x_{i} \sim G a\left(n, \frac{1}{2}\right) &=\chi^{2}(2 n) \\ \sum_{j=1}^{m} y_{j} \sim G a\left(m, \lambda_{2}\right), 2 \lambda_{2} \sum_{j=1}^{m} y_{j} \sim G a\left(m, \frac{1}{2}\right) &=\chi^{2}(2 m) \end{aligned}

于是当原假设成立时,

2m2nT=i=1nxi/2nj=1myj/2m=2λ1(i=1nxi/2n)2λ2(j=1myj/2m)F(2n,2m)\frac{2m}{2n}T =\frac{\sum_{i=1}^n{x_i}/2n}{\sum_{j=1}^m{y_j}/2m}=\frac{2\lambda _1\left( \sum_{i=1}^n{x_i}/2n \right)}{2\lambda _2\left( \sum_{j=1}^m{y_j}/2m \right)}\sim F\left( 2n,2m \right)

7.(14分)设总体概率密度函数如下: f(x;θ,μ)=1θexμθ,x>μ,θ>0.x1,x2,,xnf(x ; \theta, \mu)=\frac{1}{\theta} e^{-\frac{x-\mu}{\theta}}, x>\mu, \theta>0. x_{1}, x_{2}, \cdots, x_{n}是来自该总体的随机样本, 求未知参数的极大似然估计.

Solution: 样本的似然函数是 L(θ,μ)=(1θ)nei=1n(xiμ)θI{x(1)μ}L(\theta, \mu)=\left(\frac{1}{\theta}\right)^{n} e^{-\frac{\sum_{i=1}^{n}\left(x_{i}-\mu\right)}{\theta}} I_{\left\{x_{(1)} \geqslant \mu\right\}}.
对于 μ\mu 而言, 无论 θ\theta 取何值, L(θ,μ)L(\theta, \mu)μ\mu(,x(1)]\left(-\infty, x_{(1)}\right] 上的单调增函数, 因此 μ\mu 的极大 似然估计是 μ^=x(1)\hat{\mu}=x_{(1)}.
对于 θ\theta 而言, 先将 μ^=x(1)\hat{\mu}=x_{(1)} 代入似然函数, 并将此时的对数似然函数关于 θ\theta 的导数置 0 , 即

dlnL(θ,μ^)dθ=nθ+i=1n(xiμ^)θ2=0\frac{\operatorname{dln} L(\theta, \hat{\mu})}{\mathrm{d} \theta}=-\frac{n}{\theta}+\frac{\sum_{i=1}^{n}\left(x_{i}-\hat{\mu}\right)}{\theta^{2}}=0

θ^=i=1n(xiμ^)n=xˉx(1)\hat{\theta}=\frac{\sum_{i=1}^{n}\left(x_{i}-\hat{\mu}\right)}{n}=\bar{x}-x_{(1)}θ\theta 的极大似然估计.

8.(15分)设 x1,x2x_{1}, x_{2} 独立同分布, 其共同的密度函数为 f(x;θ)=3x2θ3,0<x<θ,θ>0f(x ; \theta)=\frac{3 x^{2}}{\theta^{3}}, 0<x<\theta, \theta>0 .

(1)证明:T1=23(x1+x2)T_{1}=\frac{2}{3}\left(x_{1}+x_{2}\right)T2=76max{x1,x2}T_{2}=\frac{7}{6} \max \left\{x_{1}, x_{2}\right\} 都是 θ\theta 的无偏估计;

(2)计算 T1T_{1}T2T_{2} 的均方误差并进行比较.

Solution:
(1) E(X)=0θx3x2θ3dx=34θE(X)=\int_{0}^{\theta} x \frac{3 x^{2}}{\theta^{3}} d x=\frac{3}{4} \theta, 于是 E(T1)=43E(X)=θE\left(T_{1}\right)=\frac{4}{3} E(X)=\theta, 即 T1T_{1}θ\theta 的无偏估计.
Y=max{x1,x2}Y=\max \left\{x_{1}, x_{2}\right\}, 求得其密度函数 fY(y)=6y5θ6,0<y<θf_{Y}(y)=\frac{6 y^{5}}{\theta^{6}}, 0<y<\theta. 于是 E(T2)=76E(Y)=760θ6y6θ6dy=θE\left(T_{2}\right)=\frac{7}{6} E(Y)=\frac{7}{6} \int_{0}^{\theta} \frac{6 y^{6}}{\theta^{6}} d y=\theta, 则 T2T_{2}θ\theta 的无偏估计.

(2) 由于上述两个估计量都是无偏估计, 其方差便是均方误差.

E(X12)=0θx23x2θ3dx=35θ2Var(X1)=35θ2(34θ)2=380θ2\begin{aligned} E\left(X_{1}^{2}\right) &=\int_{0}^{\theta} x^{2} \frac{3 x^{2}}{\theta^{3}} d x=\frac{3}{5} \theta^{2} \\ \operatorname{Var}\left(X_{1}\right) &=\frac{3}{5} \theta^{2}-\left(\frac{3}{4} \theta\right)^{2}=\frac{3}{80} \theta^{2} \end{aligned}

MSE(T1)=89Var(X1)=130θ2\operatorname{MSE}\left(T_{1}\right)=\frac{8}{9} \operatorname{Var}\left(X_{1}\right)=\frac{1}{30} \theta^{2}.

E(Y2)=0θy26y5θ6dy=34θ2Var(Y)=34θ2(67θ)2=3196θ2\begin{aligned} E\left(Y^{2}\right) &=\int_{0}^{\theta} y^{2} \frac{6 y^{5}}{\theta^{6}} d y=\frac{3}{4} \theta^{2} \\ \operatorname{Var}(Y) &=\frac{3}{4} \theta^{2}-\left(\frac{6}{7} \theta\right)^{2}=\frac{3}{196} \theta^{2} \end{aligned}

MSE(T2)=Var(T2)=148θ2\operatorname{MSE}\left(T_{2}\right)=\operatorname{Var}\left(T_{2}\right)=\frac{1}{48} \theta^{2}. 于是有 MSE(T2)<MSE(T1)\operatorname{MSE}\left(T_{2}\right)<\operatorname{MSE}\left(T_{1}\right).