北大叉院-849统计学-2023年

一、灯泡 A1A_1, A2A_2 串联, 它们的寿命分别是期望为 1/λ1,1/λ21/\lambda_1,1/\lambda_2 的指数分布. 求整个系统的运行时长 YY 的分布与期望.

Solution: 分别用 X1E(λ1)X_1 \sim E(\lambda_1)X2E(λ2)X_2 \sim E(\lambda_2) 表示灯泡 A1A_1, A2A_2的寿命. 对于串联电路电路而言, 只要有一个灯泡损坏则该系统停止工作, 因此有 Y=min{X1,X2}Y = \min\{X_1, X_2\}, 故对任意 y>0y > 0, 有

P(Y>y)=P(X1>y,X2>y)=P(X1>y)P(X2>y)=eλ1yeλ2y=e(λ1+λ2)y.\begin{aligned} P\left( Y>y \right) =P\left( X_1>y,X_2>y \right) &=P\left( X_1>y \right) P\left( X_2>y \right)\\ &=e^{-\lambda _1y}\cdot e^{-\lambda _2y}\\ &=e^{-\left( \lambda _1+\lambda _2 \right) y}.\\ \end{aligned}

YY 的分布函数是

FY(y)={0,y<0,1e(1λ1+1λ2)y,y0,F_Y\left( y \right) =\begin{cases} 0,& y<0,\\ 1-e^{-\left( \frac{1}{\lambda _1}+\frac{1}{\lambda _2} \right) y},& y\ge 0, \\ \end{cases}

YE(λ1+λ2)Y \sim E(\lambda_1 + \lambda_2), 即期望为 1λ1+λ2\frac{1}{\lambda _1+\lambda _2} 的指数分布. 因此 E(Y)=1λ1+λ2E\left( Y \right) =\frac{1}{\lambda _1+\lambda _2}.

二、(X,Y)(X,Y) 的联合密度是

f(x,y)={cxy,x+y<1,0,其他.f\left( x,y \right) =\begin{cases} c\left| xy \right|,& \left| x \right|+\left| y \right|<1,\\ 0,& \text{其他}.\\ \end{cases}

(1) 求 cc;

(2) 求边际分布, 并判断是否独立;

(3) 求 Cov(X,Y)\mathrm{Cov}(X,Y), 并判断是否线性相关.

Solution:

(1) 根据概率密度函数的正则性, 有 x+y<1cxydxdy=1,\iint_{\left| x \right|+\left| y \right|<1}{c\left| xy \right|\text{d}x\text{d}y}=1, 根据对称性, 有

x+y<1xydxdy=4Dxydxdy,\iint_{\left| x \right|+\left| y \right|<1}{\left| xy \right|\text{d}x\text{d}y}=4\iint_D{xy\text{d}x\text{d}y},

其中 D={x>0,y>0,x+y<1}D=\left\{ x>0,y>0,x+y<1 \right\}. 计算积分

Dxydxdy=01dx01yxydx=0112y(1y)2dy=12112=124.\iint_D{xy\text{d}x\text{d}y}=\int_0^1{\text{d}x\int_0^{1-y}{xy\text{d}x}}=\int_0^1{\frac{1}{2}y\left( 1-y \right) ^2\text{d}y}=\frac{1}{2}\cdot \frac{1}{12}=\frac{1}{24}.

故有 c4124=1c\cdot 4\cdot \frac{1}{24}=1, 则 c=6c = 6.

(2) 由对称性可知 XXYY 的边际分布是一样的, 我们计算 YY 的边际分布, 对于 0<y<10 < y < 1, 有

fY(y)=y11y6xydx=6y(01yxdxy10xdx)=6y((y1)22+(y1)22)=6y(y1)2.\begin{aligned} f_Y\left( y \right) =\int_{y-1}^{1-y}{6\left| xy \right|\text{d}x}&=6y\left( \int_0^{1-y}{x\text{d}x}-\int_{y-1}^0{x\text{d}x} \right) \\ &=6y\left( \frac{\left( y-1 \right) ^2}{2}+\frac{\left( y-1 \right) ^2}{2} \right) \\ &=6y\left( y-1 \right) ^2. \end{aligned}

同理, 对于 1<y<0-1< y < 0, 有 fY(y)=6y(y+1)2f_Y\left( y \right) =-6y\left( y+1 \right) ^2, 综上所述 YY 的密度函数是

fY(y)={6y(y1)2,0y<1,6y(y+1)2,1y<0,0,其他.f_Y\left( y \right) =\begin{cases} 6y\left( y-1 \right) ^2,& 0\le y<1,\\ -6y\left( y+1 \right) ^2,& -1\le y<0,\\ 0,& \text{其他}.\\ \end{cases}

它是一个关于 0 对称化后的贝塔分布, XX 的密度函数与其相等, 故二者显然不独立, 因为 fX(x)fY(y)f(x,y)f_X\left( x \right) \cdot f_Y\left( y \right) \ne f\left( x,y \right).

(3) 根据分布的对称性(或直接计算期望)可知 E(X)=E(Y)=0E\left( X \right) =E\left( Y \right) =0. 又根据对称性有 E(XY)=0E(XY) = 0, 故 Cov(X,Y)=0\mathrm{Cov}(X,Y) = 0. 所以 XXYY 不相关.

三、已知 X,YX,Y 独立服从 N(0,1)N(0,1), 令 Z=XYZ=|X-Y|, 求 E(Z)E(Z), Var(Z)Var(Z).

Solution: 由正态分布的性质, 记 T=XYN(0,2)T = X-Y \sim N(0,2), 则

EZ=ET=t14πet24dt=20t4πet24dt=(t=2u)1π02ueu2d(2u)=(u2=s)4π012esds=2π.\begin{aligned} EZ=E\left| T \right|=\int_{-\infty}^{\infty}{\left| t \right|\frac{1}{\sqrt{4\pi}}}e^{-\frac{t^2}{4}}\text{d}t &=2\int_0^{\infty}{\frac{t}{\sqrt{4\pi}}}e^{-\frac{t^2}{4}}\text{d}t \\ &\xlongequal{\left( t=2u \right)}\frac{1}{\sqrt{\pi}}\cdot \int_0^{\infty}{2ue^{-u^2}\text{d}\left( 2u \right)} \\ &\xlongequal{\left( u^2=s \right)}\frac{4}{\sqrt{\pi}}\cdot \int_0^{\infty}{\frac{1}{2}e^{-s}\text{d}s}=\frac{2}{\sqrt{\pi}}. \end{aligned}

EZ2=ET2=2EZ^2=ET^2=2, 故 Var(Z)=24πVar\left( Z \right) =2-\frac{4}{\pi}.

四、已知 Yi=XiTβ+εi,i=1,2,,n,εiY_i=X_i^T \beta+\varepsilon_i, i=1,2, \ldots, n, \varepsilon_i i.i.d. N(0,σ2)\sim N\left(0, \sigma^2\right), XiRpX_i\in R^p, βRp\beta\in R^p.

(1) 求 β,σ2\beta, \sigma^2 的 MLE β^,σ2^\widehat{\beta}, \widehat{\sigma^2};

(2) 当 XX 是给定时, 求 β^\widehat{\beta} 的分布;

(3) Yi=a+bxi+εi,i=1,2,,n,εiY_i=a+b x_i+\varepsilon_i, i=1,2, \ldots, n, \varepsilon_i i.i.d N(0,σ2)\sim N\left(0, \sigma^2\right), 求 MLEa^,b^\operatorname{MLE} \hat{a}, \hat{b}, 并证明 a^,b^\hat{a}, \hat{b} 独立当且仅当 i=1nxi=0\sum_{i=1}^n x_i=0.

Solution:
(1) YiN(Xiβ,σ2)Y_i \sim N\left(\boldsymbol{X}_i \boldsymbol{\beta}, \sigma^2\right), 则样本的似然函数是

L(β,σ2)=(2πσ2)n2exp{12σ2i=1n(yiXiTβ)2}=(2πσ2)n2exp{12σ2(YXβ)T(YXβ)}\begin{aligned} L\left(\boldsymbol{\beta}, \sigma^2\right) &=\left(2 \pi \sigma^2\right)^{-\frac{n}{2}} \exp \left\{-\frac{1}{2 \sigma^2} \sum_{i=1}^n\left(y_i-\boldsymbol{X}_i^T \boldsymbol{\beta}\right)^2\right\} \\ &=\left(2 \pi \sigma^2\right)^{-\frac{n}{2}} \exp \left\{-\frac{1}{2 \sigma^2}(\boldsymbol{Y}-X \boldsymbol{\beta})^T(Y-X \boldsymbol{\beta})\right\} \end{aligned}

其中 Y=(y1,y2,,yn)T,X=[X1,X2,,Xn]T\boldsymbol{Y}=\left(y_1, y_2, \cdots, y_n\right)^T, X=\left[\boldsymbol{X}_1, \boldsymbol{X}_2, \cdots, \boldsymbol{X}_n\right]^T, 对数似然函数是

lnL(β,σ2)=n2ln(2πσ2)12σ2(YXβ)T(YXβ)\ln L\left(\boldsymbol{\beta}, \sigma^2\right)=-\frac{n}{2} \ln \left(2 \pi \sigma^2\right)-\frac{1}{2 \sigma^2}(\boldsymbol{Y}-X \boldsymbol{\beta})^T(Y-X \boldsymbol{\beta})

关于各个分量求偏导并置 0 , 得到似然方程组,

{lnLβ=1σ2(2XTY2XTXβ)=0lnLσ2=n21σ212σ4(YXβ)T(YXβ)=0\left\{\begin{array}{l} \frac{\partial \ln L}{\partial \boldsymbol{\beta}}=\frac{1}{\sigma^2}\left(2 X^T \boldsymbol{Y}-2 X^T X \boldsymbol{\beta}\right)=\mathbf{0} \\ \frac{\partial \ln L}{\partial \sigma^2}=-\frac{n}{2} \frac{1}{\sigma^2}-\frac{1}{2 \sigma^4}(\boldsymbol{Y}-X \boldsymbol{\beta})^T(\boldsymbol{Y}-X \boldsymbol{\beta})=0 \end{array}\right.

其中由于 XX 满秩, 所以 XTXX^T X 是可逆的, 于是解得对数似然函数的唯一驻点 β^=(XTX)1XTY,σ^2=1n(YXβ^)T(YXβ^)\hat{\boldsymbol{\beta}}=\left(X^T X\right)^{-1} X^T \boldsymbol{Y}, \hat{\sigma}^2=\frac{1}{n}(\boldsymbol{Y}-X \hat{\boldsymbol{\beta}})^T(\boldsymbol{Y}-X \hat{\boldsymbol{\beta}}), 而对数似然函数显然是一山 函数, 于是该驻点为其唯一最大值点, 即 β^\hat{\boldsymbol{\beta}}σ^2\hat{\sigma}^2 便是 β\boldsymbol{\beta}σ2\sigma^2 的 MLE.

(2) Y=(Y1,Y2,,Yn)T\boldsymbol{Y}=\left(Y_1, Y_2, \cdots, Y_n\right)^T 服从多元正态分布, 即 YN(Xβ,σ2In)\boldsymbol{Y} \sim N\left(X \boldsymbol{\beta}, \sigma^2 I_n\right). 而 β^=(XTX)1XTY\hat{\boldsymbol{\beta}}=\left(X^T X\right)^{-1} X^T \boldsymbol{Y}, 于是 β^\hat{\boldsymbol{\beta}} 亦服从多元正态分布, 且
Eβ^=(XTX)1XTXβ=βE \hat{\boldsymbol{\beta}}=\left(X^T X\right)^{-1} X^T X \boldsymbol{\beta}=\boldsymbol{\beta}
Cov(β^)=σ2(XTX)1XTInX(XTX)1\operatorname{Cov}(\hat{\boldsymbol{\beta}})=\sigma^2\left(X^T X\right)^{-1} X^T I_n X\left(X^T X\right)^{-1}
=σ2(XTX)1=\sigma^2\left(X^T X\right)^{-1}
于是 β^N(β,σ2(XTX)1)\hat{\boldsymbol{\beta}} \sim N\left(\boldsymbol{\beta}, \sigma^2\left(X^T X\right)^{-1}\right).

(3) 令 β=(a,b)T\boldsymbol{\beta}=(a, b)^T, 利用 (1) 与 (2) 的结果可知,

(a^b^)N((ab),σ2(1n+xˉ2lxxxˉlxxxˉlxx1lxx))\left(\begin{array}{l} \hat{a} \\ \hat{b} \end{array}\right) \sim N\left(\left(\begin{array}{l} a \\ b \end{array}\right), \sigma^2\left(\begin{array}{cc} \frac{1}{n}+\frac{\bar{x}^2}{l_{x x}} & -\frac{\bar{x}}{l_{x x}} \\ -\frac{\bar{x}}{l_{x x}} & \frac{1}{l_{x x}} \end{array}\right)\right)

其中, lxx=i=1n(xixˉ)2l_{x x}=\sum_{i=1}^n\left(x_i-\bar{x}\right)^2, 由正态分布的性质, a^\hat{a}b^\hat{b} 独立当且仅当 a^\hat{a}b^\hat{b} 不 相关. 而 a^\hat{a}b^\hat{b} 不相关.当且仅当 xˉ=0\bar{x}=0, 即 i=1nxi=0\sum_{i=1}^n x_i=0.

五、设有 NN 个袋子, 每个袋子都是 nn 白球和 mm 黑球. 从第一个袋子里取出一个球放到第二个袋子里, 再从第二个袋子里取球放到第三个袋子里, 以此类推.

(1) 问在最后一个口袋取出白球的概率;

(2) 已知第一个口袋取出了白球, 问最后一个口袋取出白球的概率是多少.

Solution:

(1) 用事件 AkA_k 表示从第 kk 个袋中取出白球, 记 pk=P(Ak)p_k = P(A_k), 则对 2kN2 \le k \le N, 有

P(Ak)=P(AkAk1)P(Ak1)+P(AkAˉk1)P(Aˉk1)pk=n+1n+m+1pk1+nn+m+1(1pk1)pk=1n+m+1pk1+nn+m+1pknn+m=1n+m+1(pk1nn+m),\begin{aligned} P\left( A_k \right) & =P\left( A_k\mid A_{k-1} \right) P\left( A_{k-1} \right) +P\left( A_k\mid \bar{A}_{k-1} \right) P\left( \bar{A}_{k-1} \right) \\ p_k &=\frac{n+1}{n+m+1}p_{k-1}+\frac{n}{n+m+1}\left( 1-p_{k-1} \right) \\ p_k & =\frac{1}{n+m+1}p_{k-1}+\frac{n}{n+m+1} \\ p_k-\frac{n}{n+m}&=\frac{1}{n+m+1}\left( p_{k-1}-\frac{n}{n+m} \right) , \end{aligned}

则数列 {ak}={pknn+m}\left\{ a_k \right\} =\left\{ p_k-\frac{n}{n+m} \right\}是等比数列, 其公比是 1n+m+1\frac{1}{n+m+1}, 首项 a1=p1nn+m=nn+mnn+m=0a_1=p_1-\frac{n}{n+m}=\frac{n}{n+m}-\frac{n}{n+m}=0, 因此 ak=a1(1n+m+1)k10a_k=a_1\cdot \left( \frac{1}{n+m+1} \right) ^{k-1}\equiv 0, 故 pknn+mp_k\equiv \frac{n}{n+m}, 因此有 P(AN)=nn+mP\left( A_N \right) =\frac{n}{n+m}.

(2) 已知道第一个口袋取出白球, 则第二个口袋中有 n+1n + 1 白球与 mm 黑球. 记 qk=P(AkA1)q_k=P\left( A_k\mid A_1 \right), 与 (1) 中同理, 对于 3kN3 \le k \le N, 有

P(AkA1)=P(AkAk1A1)P(Ak1A1)+P(AkAˉk1A1)P(Aˉk1A1)qk=n+1n+m+1qk1+nn+m+1(1qk1)qknn+m=1n+m+1(qk1nn+m),\begin{aligned} P\left( A_k\mid A_1 \right) &=P\left( A_k\mid A_{k-1}A_1 \right) P\left( A_{k-1}\mid A_1 \right) +P\left( A_k\mid \bar{A}_{k-1}A_1 \right) P\left( \bar{A}_{k-1}\mid A_1 \right)\\ q_k&=\frac{n+1}{n+m+1}q_{k-1}+\frac{n}{n+m+1}\left( 1-q_{k-1} \right)\\ q_k-\frac{n}{n+m}&=\frac{1}{n+m+1}\left( q_{k-1}-\frac{n}{n+m} \right) ,\\ \end{aligned}

而此时 bk=qknn+mb_k=q_k-\frac{n}{n+m} 是等比数列, b2=n+1n+m+1nn+mb_2=\frac{n+1}{n+m+1}-\frac{n}{n+m}, 因此 bN=(n+1n+m+1nn+m)(1n+m+1)N2b_N=\left( \frac{n+1}{n+m+1}-\frac{n}{n+m} \right) \cdot \left( \frac{1}{n+m+1} \right) ^{N-2}, 则

P(ANA1)=qN=(n+1n+m+1nn+m)(1n+m+1)N2+nn+m.P\left( A_N\mid A_1 \right) =q_N=\left( \frac{n+1}{n+m+1}-\frac{n}{n+m} \right) \cdot \left( \frac{1}{n+m+1} \right) ^{N-2}+\frac{n}{n+m}.

六、设有来自 N(μ,σ2)N(\mu,\sigma^2)nn 个 i.i.d. 样本.

(1) 设 σ\sigma 已知, 构造 μ\mu1α1-\alpha 置信区间, 求最小样本量使得区间长度小于等于 σ5\frac{\sigma}{5};

(2) 设 σ\sigma 未知, 构造 μ\mu1α1-\alpha 置信区间.

Solution:

(1) 当 σ\sigma 已知时, 正态均值 μ\mu1α1-\alpha 置信区间是 Xˉ±z1α2nσ\bar{X}\pm \frac{z_{1-\frac{\alpha}{2}}}{\sqrt{n}}\sigma, 区间长度是 L=2z1α2nσL=2\cdot \frac{z_{1-\frac{\alpha}{2}}}{\sqrt{n}}\sigma, 令 2z1α2nσσ52\cdot \frac{z_{1-\frac{\alpha}{2}}}{\sqrt{n}}\sigma \le \frac{\sigma}{5}, 则 n10z1α2\sqrt{n}\ge 10z_{1-\frac{\alpha}{2}}, 故 n100z1α22n\ge 100z_{1-\frac{\alpha}{2}}^{2}.

(2) 用枢轴量法, 取 T=n(Xˉμ)St(n1)T=\frac{\sqrt{n}\left( \bar{X}-\mu \right)}{S}\sim t\left( n-1 \right), 其中 S2=1n1i=1n(XiXˉ)2S^2=\frac{1}{n-1}\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}, 令

P(an(Xˉμ)Sb)=1α,P\left( a\le \frac{\sqrt{n}\left( \bar{X}-\mu \right)}{S}\le b \right) =1-\alpha ,

取等尾置信区间, 即 a=t1α2(n1),b=t1α2(n1)a=-t_{1-\frac{\alpha}{2}}\left( n-1 \right) ,b=t_{1-\frac{\alpha}{2}}\left( n-1 \right), 反解得 μ\mu1α1-\alpha 置信区间

Xˉ±Snt1α2(n1).\bar{X}\pm \frac{S}{\sqrt{n}}t_{1-\frac{\alpha}{2}}\left( n-1 \right) .

七、设有来自 U(θ,θ)U(-\theta,\theta) 总体的 nn 个 i.i.d. 样本.

(1) 求 θ\theta 的MLE;

(2) 判断无偏性;

(3) 判断相合性.

Solution:

(1) 似然函数是

L(θ)=1(2θ)nI{X(1)θ}I{X(n)θ}=1(2θ)nI{max{X(1),X(n)}θ},L\left( \theta \right) =\frac{1}{\left( 2\theta \right) ^n}I_{\left\{ X_{\left( 1 \right)}\ge -\theta \right\}}I_{\left\{ X_{\left( n \right)}\le \theta \right\}}=\frac{1}{\left( 2\theta \right) ^n}I_{\left\{ \max \left\{ -X_{\left( 1 \right)},X_{\left( n \right)} \right\} \le \theta \right\}},

θ\thetamax{X(1),X(n)}\max \left\{ -X_{\left( 1 \right)},X_{\left( n \right)} \right\} 上的递减函数, 因此 θ^=max{X(1),X(n)}\hat{\theta}=\max \left\{ -X_{\left( 1 \right)},X_{\left( n \right)} \right\}θ\theta 的MLE.

(2) 总体的密度函数是 f(x)=12θ,θ<x<θf\left( x \right) =\frac{1}{2\theta},-\theta <x<\theta, 总体的分布函数是

F(x)={0,xθ,x+θ2θ,θ<xθ,1,x>θ.F\left( x \right) =\begin{cases} 0,& x\le -\theta ,\\ \frac{x+\theta}{2\theta},& -\theta <x\le \theta ,\\ 1,& x>\theta .\\ \end{cases}

考虑 (X(1),X(n))\left( X_{\left( 1 \right)},X_{\left( n \right)} \right) 的联合分布, 有

f1,n(x1,xn)=n!(n2)!f(x1)[F(xn)F(x1)]n2f(xn),θ<x1<xn<θ=n(n1)(xnx1)n2(2θ)n,θ<x1<xn<θ.\begin{aligned} f_{1,n}\left( x_1,x_n \right) &=\frac{n!}{\left( n-2 \right) !}f\left( x_1 \right) \cdot \left[ F\left( x_n \right) -F\left( x_1 \right) \right] ^{n-2}f\left( x_n \right) ,-\theta <x_1<x_n<\theta\\ &=n\left( n-1 \right) \frac{\left( x_n-x_1 \right) ^{n-2}}{\left( 2\theta \right) ^n},-\theta <x_1<x_n<\theta .\\ \end{aligned}

T=θ^=max{X(1),X(n)}T=\hat{\theta}=\max \left\{ -X_{\left( 1 \right)},X_{\left( n \right)} \right\}, 对于 t[0,θ],t \in [0, \theta],

P(Tt)=P(X(1)t,X(n)t)=P(tX(1)X(n)t)=ttdx1x1tn(n1)(xnx1)n2(2θ)ndxn=tt1(2θ)nn(tx1)n1dx1=(2t2θ)n=(tθ)n.\begin{aligned} P\left( T\le t \right) =P\left( -X_{\left( 1 \right)}\le t,X_{\left( n \right)}\le t \right) &=P\left( -t\leq X_{\left( 1 \right)}\leq X_{\left( n \right)}\le t \right)\\ &=\int_{-t}^t{\text{d}x_1\int_{x_1}^{t}{n\left( n-1 \right) \frac{\left( x_n-x_1 \right) ^{n-2}}{\left( 2\theta \right) ^n}\text{d}x_n}}\\ &=\int_{-t}^t{\frac{1}{\left( 2\theta \right) ^n}n\left( t-x_1 \right) ^{n-1}\text{d}x_1}\\ &=\left( \frac{2t}{2\theta} \right) ^n=\left( \frac{t}{\theta} \right) ^n.\\ \end{aligned}

fT(t)=ntn1θn,0<t<θf_T\left( t \right) =n\frac{t^{n-1}}{\theta ^n},0<t<\theta, 即有 TθBeta(n,1)\frac{T}{\theta}\sim Beta\left( n,1 \right), 因此 Eθ^=θE(Tθ)=nn+1θE\hat{\theta}=\theta E\left( \frac{T}{\theta} \right) =\frac{n}{n+1}\theta, 所以 θ^\hat{\theta} 不是 θ\theta 的无偏估计.

(3) 由于

Eθ^=nn+1θθVar(θ^)=1θ2Var(θ^θ)=1θ2n(n+1)2(n+2)0\begin{aligned} E\hat{\theta}&=\frac{n}{n+1}\theta\to \theta \\ Var(\hat{\theta})&=\frac{1}{\theta^2}Var(\frac{\hat{\theta}}{\theta})=\frac{1}{\theta^2}\frac{n}{(n+1)^2(n+2)}\to 0 \end{aligned}

因此 θ^\hat{\theta}θ\theta 的相合估计.

八、现有A, B两种药以及500个患者, 将患者分为甲乙两组: 甲300个, 痊愈168个; 乙200个, 痊愈98个. 问在 α=0.05\alpha=0.05下, 两个药的效果有没有差异.

Solution: 甲、乙样本痊愈率的近似分布是

p^1AN(p1,p1(1p1)n1),p^2AN(p2,p2(1p2)n2),\hat{p}_1\sim AN\left( p_1,\frac{p_1\left( 1-p_1 \right)}{n_1} \right) ,\quad \hat{p}_2\sim AN\left( p_2,\frac{p_2\left( 1-p_2 \right)}{n_2} \right) ,

在原假设 H0:p1=p2H_0:p_1=p_2下, 有

p^1p^2AN(0,(1n1+1n2)p(1p)),\hat{p}_1-\hat{p}_2\sim AN\left( 0,\left( \frac{1}{n_1}+\frac{1}{n_2} \right) p\left( 1-p \right) \right) ,

构造 ZZ 统计量为

Z=p^1p^2(1n1+1n2)p^(1p^)AN(0,1),Z=\frac{\hat{p}_1-\hat{p}_2}{\sqrt{\left( \frac{1}{n_1}+\frac{1}{n_2} \right) \hat{p}\left( 1-\hat{p} \right)}}\sim AN\left( 0,1 \right) ,

拒绝域应是 W=Z>1.96W={|Z|>1.96}. 其中, 应用500人的均值来估计原假设成立时的 pp, 即

p^=0.532,p^1=0.56,p^2=0.49,\hat{p}=0.532,\quad \hat{p}_1=0.56,\quad \hat{p}_2=0.49,

代入有

Z=0.560.49(1300+1200)0.532(10.532)=1.53677,Z=\frac{0.56-0.49}{\sqrt{\left( \frac{1}{300}+\frac{1}{200} \right) \cdot 0.532\cdot \left( 1-0.532 \right)}}=1.53677,

故不能认为有显著差异.

九、设有 x1,x2,,xnx_1,x_2,\cdots,x_n 是来自 N(μ,σ2)N(\mu,\sigma^2) 的随机样本, 定义

μ~=argminc{i=1n(xic)2+λc2},\tilde{\mu}=\mathop {\mathrm{arg}\min} \limits_{c}\left\{ \sum_{i=1}^n{\left( x_i-c \right) ^2}+\lambda c^2 \right\} ,

其中 λ>0\lambda >0 是给定的常数.

(1) 求 μ~\tilde{\mu} 的表达式;

(2) 求 E(μ~)E(\tilde{\mu}), Var(μ~)Var(\tilde{\mu}).

Solution:

(1) 记目标函数 f(c)=i=1n(xic)2+λc2f\left( c \right) =\sum_{i=1}^n{\left( x_i-c \right) ^2}+\lambda c^2, 令

f(c)=2i=1n(xic)+2λc=0,f'\left( c \right) =-2\sum_{i=1}^n{\left( x_i-c \right)}+2\lambda c=0,

得驻点 c=nXˉn+λc=\frac{n\bar{X}}{n+\lambda}. 而目标函数是凹函数, 因此该驻点是极小值点, 故有 μ~=nXˉn+λ\tilde{\mu}=\frac{n\bar{X}}{n+\lambda}.

(2) 直接计算, 有 E(μ~)=E(nXˉn+λ)=nμn+λE\left( \tilde{\mu} \right) =E\left( \frac{n\bar{X}}{n+\lambda} \right) =\frac{n\mu}{n+\lambda} 以及 Var(μ~)=n2(n+λ)2σ2n=nσ2(n+λ)2Var\left( \tilde{\mu} \right) =\frac{n^2}{\left( n+\lambda \right) ^2}\frac{\sigma ^2}{n}=\frac{n\sigma ^2}{\left( n+\lambda \right) ^2}.