南开大学-432统计学-2022年

一、选择题 (每题 4 分, 共 28 分)

  1. 关于经验分布函数 Fn(x)F_{n}(x), 说法错误的是 ( )

(a) 它是分布函数
(b) 它是 xx 的连续函数
(c) 它是随机变量
(d) 它依概率收敛于分布函数

Solution: B

A 正确, 它满足分布函数的定义; B错误, 它在每个样本点的取值上间断; C 正确, 它依赖于样本, 具有随机性; D 正确, 根据大数定律.

  1. XX 的密度函数是 f(x)f(x), 则 Y=XY=-X 的密度函数是 ( )

(a) f(y)f(y)
(b) 1f(y)1-f(y)
(c) f(y)f(-y)
(d) f(y)-f(-y)

Solution: C

用微分法, 有

P(Y=y)=P(X=y)=P(X=y)=f(y)d(y)=f(y)dyP\left( Y=y \right) =P\left( -X=y \right) =P\left( X=-y \right) =f\left( -y \right) \left| d\left( -y \right) \right|=f\left( -y \right) dy

因此C正确.

  1. 袋中有黑球 2n2 n 个, 白球 2n12 n-1 个, 现摸 nn 个球, 已知摸到的球都是一个颜色, 求摸到的是黑球 的概率 ( )

(a) 23\frac{2}{3}
(b) C2nnC4n1n\frac{C_{2 n}^{n}}{C_{4 n-1}^{n}}
(c) 13\frac{1}{3}
(d) 1C2nnC4n1n1-\frac{C_{2 n}^{n}}{C_{4 n-1}^{n}}

Solution: A

P(全黑)=C2nnC4n1nP\left( \text{全黑} \right) =\frac{C_{2n}^{n}}{C_{4n-1}^{n}}, P(全白)=C2n1nC4n1nP\left( \text{全白} \right) =\frac{C_{2n-1}^{n}}{C_{4n-1}^{n}}, 因此

P(全黑全相同)=P(全黑)P(全黑)+P(全白)=C2nnC2nn+C2n1n=(2n)!n!n!(2n)!n!n!+(2n1)!n!(n1)!=11+12=23P\left( \text{全黑}\mid \text{全相同} \right) =\frac{P\left( \text{全黑} \right)}{P\left( \text{全黑} \right) +P\left( \text{全白} \right)}=\frac{C_{2n}^{n}}{C_{2n}^{n}+C_{2n-1}^{n}}=\frac{\frac{\left( 2n \right) !}{n!n!}}{\frac{\left( 2n \right) !}{n!n!}+\frac{\left( 2n-1 \right) !}{n!\left( n-1 \right) !}}=\frac{1}{1+\frac{1}{2}}=\frac{2}{3}

  1. 设随机变量 X1,X2,,Xn(n>1)X_{1}, X_{2}, \cdots, X_{n}(n>1) 独立同分布, 且其方差为 σ2>0\sigma^{2}>0, 令 Y=1ni=1nXiY=\frac{1}{n} \sum_{i=1}^{n} X_{i}, 则下述结论正确的是( )

(A) Cov(X1,Y)=σ2n\operatorname{Cov}\left(X_{1}, Y\right)=\frac{\sigma^{2}}{n}
(B) Cov(X1,Y)=σ2\operatorname{Cov}\left(X_{1}, Y\right)=\sigma^{2}
(C) Var(X1+Y)=n+2nσ2\operatorname{Var}\left(X_{1}+Y\right)=\frac{n+2}{n} \sigma^{2};
(D) Var(X1Y)=n+1nσ2\operatorname{Var}\left(X_{1}-Y\right)=\frac{n+1}{n} \sigma^{2}.

Solution: A

Cov(X1,Y)=1nVar(X1)=σ2nCov\left( X_1,Y \right) =\frac{1}{n}Var\left( X_1 \right) =\frac{\sigma ^2}{n}

Var(X1+Y)=Var(X1)+Var(Y)+2Cov(X1,Y)=σ2+σ2n+2nσ2=n+3nσ2Var\left( X_1+Y \right) =Var\left( X_1 \right) +Var\left( Y \right) +2Cov\left( X_1,Y \right) =\sigma ^2+\frac{\sigma ^2}{n}+\frac{2}{n}\sigma ^2=\frac{n+3}{n}\sigma ^2

Var(X1Y)=Var(X1)+Var(Y)2Cov(X1,Y)=σ2+σ2n2nσ2=n1nσ2Var\left( X_1-Y \right) =Var\left( X_1 \right) +Var\left( Y \right) -2Cov\left( X_1,Y \right) =\sigma ^2+\frac{\sigma ^2}{n}-\frac{2}{n}\sigma ^2=\frac{n-1}{n}\sigma ^2

  1. X1,,XnX_{1}, \cdots, X_{n} 是 i.i.d. 是 N(μ,σ2)N\left(\mu, \sigma^{2}\right) 随机样本, 定义

S12=1n1i=1n(XiXˉ)2,S22=1ni=1n(XiXˉ)2,S32=1n1i=1n(Xiμ)2,S42=1ni=1n(Xiμ)2,S_{1}^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}, S_{2}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}, S_{3}^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\mu\right)^{2}, S_{4}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\mu\right)^{2},

则下列服从 t(n1)t(n-1) 的是 ( )

(a) XˉμS1/n1\frac{\bar{X}-\mu}{S_{1} / \sqrt{n-1}}
(b) XˉμS2/n1\frac{\bar{X}-\mu}{S_{2} / \sqrt{n-1}}
(c) XˉμS3/n1\frac{\bar{X}-\mu}{S_{3} / \sqrt{n-1}}
(d) XˉμS4/n1\frac{\bar{X}-\mu}{S_{4} / \sqrt{n-1}}

Solution: B

B项可写作

XˉμS2/n1=(Xˉμ)/n1n1i=1n(XiXˉ)2t(n1)\frac{\bar{X}-\mu}{S_2/\sqrt{n-1}}=\frac{\left( \bar{X}-\mu \right) /\sqrt{n}}{\sqrt{\frac{1}{n-1}\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}}}\sim t\left( n-1 \right)

其他选项均不正确.

  1. XnX_{n} 依概率收敛于 X,YnX, Y_{n} 按分布收敛于 cc, 下列错误的是 ( )

(a) XnYnX_{n} Y_{n} 依概率收敛于 cXc X
(b) g(x)g(x) 是实值函数, 则 g(Xn)g\left(X_{n}\right) 依概率收敛于 g(X)g(X)
(c) Xn/YnX_{n} / Y_{n} 按分布收敛于 X/c,c0X / c, c \neq 0
(d) ana,bnba_{n} \rightarrow a, b_{n} \rightarrow b, 则 anXn+bna_{n} X_{n}+b_{n} 按分布收敛于 aX+ba X+b

Solution: B

B选项仅对连续函数成立, 反例: 记 Xn=1nX_n = \frac{1}{n} 单点分布, X=0X = 0 a.s. 则 XnpXX_n \rightarrow_p X, 取实值函数 g(x)={1,x00,x=0g\left( x \right) =\begin{cases} 1,& x\ne 0\\ 0,& x=0\\ \end{cases}, 则显然 g(Xn)g\left(X_{n}\right) 不依概率收敛于 g(X)g(X).

  1. 下列哪个总体的样本之和不是参数的充分统计量 ( )

(a) 正态
(b) 泊松
(c) 指数
(d) 均匀

Solution: D

若支撑集与参数有关, 那么通常最大/最小次序统计量会是充分统计量.

二、填空题(每题4分, 共32分)

  1. XN(μ,σ2)X \sim N\left(\mu, \sigma^{2}\right) 的特征函数是________.

Solution:eμitσ2t22e^{\mu i t-\frac{\sigma^{2} t^{2}}{2}}.

  1. nn 封信, 对应 nn 个信封, 现随机进行配对, 配对成功的信封数的期望是________.

Solution: 1

利用期望的线性性以及对称性, 第ii封信封匹配成功记作 Xi=1X_i = 1, 否则 Xi=0X_i = 0, 显然 Xib(1,1n)X_i \sim b(1, \frac{1}{n}), 因此匹配成功的信封数为 i=1nXi\sum_{i=1}^n{X_i}, 因此

E(i=1nXi)=nEX1=n1n=1E\left( \sum_{i=1}^n{X_i} \right) =nEX_1=n\cdot \frac{1}{n}=1

  1. P(A)=0.3P(A)=0.3, 且 A,BA, B 互不相容, P(B)=0.4P(B)=0.4, 则 P(BAˉ)=P(B \mid \bar{A})=________.

Solution: P(BAˉ)=P(BAˉ)P(Aˉ)=P(B)P(AB)0.7=47P(B \mid \bar{A})=\frac{P(B \bar{A})}{P(\bar{A})}=\frac{P(B)-P(A B)}{0.7}=\frac{4}{7}.

  1. (X,Y)(X, Y) 服从由 1<x<e21<x<e^{2}0<y<1x0<y<\frac{1}{x} 围成区域上的均匀分布, 则 fYX=3(y)=f_{Y \mid X=3}(y)= ________.

Solution: fYX=3(y)=3,0<y<13f_{Y \mid X=3}(y)=3,0<y<\frac{1}{3}.

f(x,y)={1SD,1<x<e2,0<y<1x,0,其他.f\left( x,y \right) =\begin{cases} \frac{1}{S_D},& 1<x<e^2,0<y<\frac{1}{x},\\ 0,& \text{其他}.\\ \end{cases}, 其中 SD=1e2dx01xdy=1e21xdx=2.S_D=\int_1^{e^2}{dx\int_0^{\frac{1}{x}}{dy}}=\int_1^{e^2}{\frac{1}{x}dx}=2.

因此 fX(x)=01x12dy=12x,1<x<e2f_X\left( x \right) =\int_0^{\frac{1}{x}}{\frac{1}{2}dy}=\frac{1}{2x},1<x<e^2, 于是

fYX=3(y)=f(3,y)fX(3)=1216=3,0<y<1/3.f_{Y\mid X=3}\left( y \right) =\frac{f\left( 3,y \right)}{f_X\left( 3 \right)}=\frac{\frac{1}{2}}{\frac{1}{6}}=3,\quad 0<y<1/3.

  1. 已知气温均值为 20 , 标准差为 2 , 某天天气气温大于 16 小于 24 的概率至少为________.

Solution: 根据切比雪夫不等式 P(16<X<24)=P(X20<4)1416=34P(16<X<24)=P(|X-20|<4) \geq 1-\frac{4}{16}=\frac{3}{4}.

  1. 已知 XB(1,p)X \sim B(1, p), 则 pp 的 Fisher 信息量是________.

Solution: 1p(1p)\frac{1}{p(1-p)}

I(p)=E[2lnf(X;p)p2]=E[Xp21X(1p)2]=1p+11p=1p(1p)I\left( p \right) =-E\left[ \frac{\partial ^2\ln f\left( X;p \right)}{\partial p^2} \right] =-E\left[ -\frac{X}{p^2}-\frac{1-X}{\left( 1-p \right) ^2} \right] =\frac{1}{p}+\frac{1}{1-p}=\frac{1}{p\left( 1-p \right)}

  1. 射击连射十次, 每次中的概率是 0.60.6, 设 X\mathrm{X} 是射中次数, 则 E(X2)=E\left(X^{2}\right)=________.

Solution: 38.4

XB(10,0.6)X\sim B\left( 10,0.6 \right), 则 EX=6,Var(X)=100.60.4=2.4EX=6,Var\left( X \right) =10\cdot 0.6\cdot 0.4=2.4, 所以 EX2=(EX)2+Var(X)=36+2.4=38.4EX^2=\left( EX \right) ^2+Var\left( X \right) =36+2.4=38.4.

  1. XX 服从泊松分布, 且 P(X=2)=P(X=3)P (X=2) = P (X=3), 则 XX 取偶数的概率是________.

Solution:1+e62\frac{1+e^{-6}}{2}

假设泊松分布的参数为 λ\lambda, 则 P(X=2)=λ22!eλ=λ33!eλ=P(X=3)P\left( X=2 \right) =\frac{\lambda ^2}{2!}e^{-\lambda}=\frac{\lambda ^3}{3!}e^{-\lambda}=P\left( X=3 \right), 解得 λ=3\lambda =3.

XX 取偶数的概率是

k=0P(X=2k)=k=0λ2k(2k)!eλ=eλeλ+eλ2=1+e2λ2=1+e62\sum_{k=0}^{\infty}{P\left( X=2k \right)}=\sum_{k=0}^{\infty}{\frac{\lambda ^{2k}}{\left( 2k \right) !}e^{-\lambda}}=e^{-\lambda}\frac{e^{\lambda}+e^{-\lambda}}{2}=\frac{1+e^{-2\lambda}}{2}=\frac{1+e^{-6}}{2}

三、解答题(90分)

1.(10分)设 P(A)=14,P(BA)=13,P(AB)=12P(A)=\frac{1}{4}, P(B \mid A)=\frac{1}{3}, P(A \mid B)=\frac{1}{2}, 令 X=IA,Y=IBX=I_{A}, Y=I_{B}, 求:

(1) 联合分布;

(2) 相关系数.

Solution: (1) P(AB)=P(BA)P(A)=112,P(B)=P(AB)P(BA)=16P(A B)=P(B \mid A) P(A)=\frac{1}{12}, P(B)=\frac{P(A B)}{P(B \mid A)}=\frac{1}{6}, 故 P(X=1,Y=1)=112P(X=1, Y=1)=\frac{1}{12}, P(X=1,Y=0)=16,P(X=0,Y=1)=112,P(X=0,Y=0)=23P(X=1, Y=0)=\frac{1}{6}, P(X=0, Y=1)=\frac{1}{12}, P(X=0, Y=0)=\frac{2}{3}.

(2) 有 EX=14,EY=16E X=\frac{1}{4}, E Y=\frac{1}{6}, 以及 E(XY)=112,D(X)=316,D(Y)=536E(X Y)=\frac{1}{12}, D(X)=\frac{3}{16}, D(Y)=\frac{5}{36}, 故 ρ=112141315516=115\rho=\frac{\frac{1}{12}-\frac{1}{4} \frac{1}{\sqrt{\frac{3}{15}}}}{\sqrt{\frac{5}{16}}}=\frac{1}{\sqrt{15}}.

2.(10分) 某班级成员一星期迟到共计 50 次, 其中星期一 12 次, 星期二 11 次, 星期三 9 次, 星期四 10 次, 星期五 8 次. 问迟到是否与星期几有关?(注 : 记 fχ2(n)(x)f_{\chi^{2}(n)}(x) 是卡方分布 χ2(n)\chi^{2}(n) 的密度函数, 且 09.48fχ2(4)(x)dx0.95,011.07fχ2(5)(x)dx0.95\int_{0}^{9.48} f_{\chi^{2}(4)}(x) d x \approx 0.95, \int_{0}^{11.07} f_{\chi^{2}(5)}(x) d x \approx 0.95)

Solution: 利用卡方拟合优度检验, 设 XX 是某一次迟到可能发生在星期 kk 的概率
(k=1,,5)(k=1, \cdots, 5), 建立假设检验问题: H0:P(X=k)=15(k=1,,5)\quad H_{0}: P(X=k)=\frac{1}{5}(k=1, \cdots, 5)
构造卡方检验统计量 χ2=k=1r(npknk)2npk\chi^{2}=\sum_{k=1}^{r} \frac{\left(n p_{k}-n_{k}\right)^{2}}{n p_{k}}, 其中 rr 表示随机变量可能的取值个数,
此处 r=5,nr=5, n 为样本总数此时 n=50,nkn=50, n_{k} 为随机变量 X=kX=k 的观测值总数, pkp_{k} 等于
原假设中的 P(X=k)P(X=k) 此处 pk15p_{k} \equiv \frac{1}{5}. 而 W={χ2χ1α2(r1)}W=\left\{\chi^{2} \geqslant \chi_{1-\alpha}^{2}(r-1)\right\}, 此时

W={χ2χ0.952(4)}={χ29.48}.W=\left\{\chi^{2} \geqslant \chi_{0.95}^{2}(4)\right\}=\left\{\chi^{2} \geqslant 9.48\right\} .

算得 χ2=k=1r(npknk)2npk=4+1+1+0+410=1W\chi^{2}=\sum_{k=1}^{r} \frac{\left(n p_{k}-n_{k}\right)^{2}}{n p_{k}}=\frac{4+1+1+0+4}{10}=1 \notin W. 所以不能拒绝原假设, 某一次 迟到可能发生在星期 kk 的概率应该是相同的, 即迟到与星期几无关.

3.(15分)设 p(0,1),0<α<(1p)/pp \in(0,1), 0<\alpha<(1-p) / p. 已知一个家庭有 nn 个小孩的概率是

pn={αpn,n1,1αp/(1p),n=0.p_{n}= \begin{cases}\alpha p^{n}, & n \geq 1, \\ 1-\alpha p /(1-p), & n=0 .\end{cases}

又设男婴和女婴的出生是等可能的. 回答:

(1) 求一个家庭有 kk 个男孩的概率;

(2) 已知某家庭 没有女孩, 求该家庭有 1 个男孩的概率.

Solution: 分别用 X1X_{1}X2X_{2} 表示一个家庭的男孩、女孩数量, 则
(1) 根据全概率公式, P(X1=k)=n=kCnk(12)npnP\left( X_1=k \right) =\sum_{n=k}^{\infty}{C_{n}^{k}\left( \frac{1}{2} \right) ^np_n},

k=0k = 0, 则

P(X1=0)=n=0Cnk(12)npn=1αp1p+n=1Cn0(12)nαpn=1αp1p+αn=1(p2)n=1αp1p+αp2pP\left( X_1=0 \right) =\sum_{n=0}^{\infty}{C_{n}^{k}\left( \frac{1}{2} \right) ^np_n}=1-\frac{\alpha p}{1-p}+\sum_{n=1}^{\infty}{C_{n}^{0}\left( \frac{1}{2} \right) ^n\alpha p^n}=1-\frac{\alpha p}{1-p}+\alpha \sum_{n=1}^{\infty}{\left( \frac{p}{2} \right) ^n}=1-\frac{\alpha p}{1-p}+\alpha \frac{p}{2-p}

k1k \ge 1, 则

P(X1=k)=n=kCnk(12)npn=n=kCnk(12)nαpn=α(p2)1n=k+1Cn1(k+1)1(p2)n=α(p2)1(p2p)k+1=2αpk(2p)k+1P\left( X_1=k \right) =\sum_{n=k}^{\infty}{C_{n}^{k}\left( \frac{1}{2} \right) ^np_n}=\sum_{n=k}^{\infty}{C_{n}^{k}\left( \frac{1}{2} \right) ^n\alpha p^n}=\alpha \left( \frac{p}{2} \right) ^{-1}\sum_{n=k+1}^{\infty}{C_{n-1}^{\left( k+1 \right) -1}\left( \frac{p}{2} \right) ^n}=\alpha \left( \frac{p}{2} \right) ^{-1}\left( \frac{p}{2-p} \right) ^{k+1}=\frac{2\alpha p^k}{\left( 2-p \right) ^{k+1}}

注意这里我们用到了负二项分布公式, 即设 ZZ 表示伯努利试验成功 rr 次所需的总次数, 即 ZNb(r,p)Z\sim Nb(r,p), 有分布列 1=n=rCn1r1prqnr=(pq)rn=rCn1r1qn1=\sum_{n=r}^{\infty}{C_{n-1}^{r-1}p^rq^{n-r}}=\left( \frac{p}{q} \right) ^r\sum_{n=r}^{\infty}{C_{n-1}^{r-1}q^n}, 则有公式 n=rCn1r1qn=(qp)r\sum_{n=r}^{\infty}{C_{n-1}^{r-1}q^n}=\left( \frac{q}{p} \right) ^r, 其中 p=1qp = 1-q. 利用该公式可计算前面式中

n=k+1Cn1(k+1)1(p2)n=(p21p2)k+1=(p2p)k+1\sum_{n=k+1}^{\infty}{C_{n-1}^{\left( k+1 \right) -1}\left( \frac{p}{2} \right) ^n}=\left( \frac{\frac{p}{2}}{1-\frac{p}{2}} \right) ^{k+1}=\left( \frac{p}{2-p} \right) ^{k+1}

(2)

P(X1=1X2=0)=P(X1=1,X2=0)P(X2=0)=12αp1αp23p+p2P\left( X_1=1\mid X_2=0 \right) =\frac{P\left( X_1=1,X_2=0 \right)}{P\left( X_2=0 \right)}=\frac{\frac{1}{2}\alpha p}{1-\frac{\alpha p}{2-3p+p^2}}

4.(15分)设某电子产品的寿命服从如下分布:

F(x;α,β)={1exαβ,xα0,x<αF(x ; \alpha, \beta)=\left\{\begin{array}{ll} 1-e^{-\frac{x-\alpha}{\beta}}, & x \geq \alpha \\ 0, & x<\alpha \end{array}\right.

现测得nn个该电子产品的寿命为X1,X2,,Xn,X_{1}, X_{2}, \cdots, X_{n}, 试求未知参数α,β\alpha, \beta的矩估计和极大似然估计.

Solution:
总体服从双参数指数分布 Exp(α,1β)\operatorname{Exp}\left(\alpha, \frac{1}{\beta}\right), 其中 α\alpha 是位置参数, β\beta 是尺度参数, 所 以 EX=α+β,Var(X)=β2E X=\alpha+\beta, \operatorname{Var}(X)=\beta^{2}, 所以令 {xˉ=α+βs2=β\left\{\begin{array}{l}\bar{x}=\alpha+\beta \\ s^{2}=\beta\end{array}\right., 解得矩估计是

{α^M=xˉsβ^M=s\left\{\begin{array}{l} \hat{\alpha}_{M}=\bar{x}-s \\ \hat{\beta}_{M}=s \end{array}\right.

样本的似然函数是

L(α,β)=1βnexp{i=1n(xiα)β}I{x(1)α}=1βnenxˉβeαβI{x(1)α}\begin{aligned} L(\alpha, \beta) &=\frac{1}{\beta^{n}} \exp \left\{-\frac{\sum_{i=1}^{n}\left(x_{i}-\alpha\right)}{\beta}\right\} \mathbf{I}_{\left\{x_{(1)} \geqslant \alpha\right\}} \\ &=\frac{1}{\beta^{n}} e^{-\frac{n \bar{x}}{\beta}} e^{\frac{\alpha}{\beta}} \mathbf{I}_{\left\{x_{(1)} \geqslant \alpha\right\}} \end{aligned}

显然它是关于 α\alpha(,x(1)]\left(-\infty, x_{(1)}\right] 上的增函数, 于是 α^L=x(1)\hat{\alpha}_{L}=x_{(1)}α\alpha 的极大似然估计. 再求 β\beta 的极大似然估计, 考虑将对数似然函数的偏导置零, 即

lnL(α,β)β=nβ+i=1n(xiα)β2=0\frac{\partial \ln L(\alpha, \beta)}{\partial \beta}=-\frac{n}{\beta}+\frac{\sum_{i=1}^{n}\left(x_{i}-\alpha\right)}{\beta^{2}}=0

解得 β=1ni=1n(xiα)\beta=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\alpha\right), 代入 α^L=x(1)\hat{\alpha}_{L}=x_{(1)}, 得 β^L=xˉx(1)\hat{\beta}_{L}=\bar{x}-x_{(1)}β\beta 的极大似然估计.

5.(10分)有一位市场调查员, 他感兴趣的是该地区成年人中购买某商品的比率 θ\theta. 现他要事先确定需要 访问多少顾客 (样本量 nn ) 才能使 [xˉd,xˉ+d][\bar{x}-d, \bar{x}+d]θ\theta0.950.95 置信区间? 其中 xˉ\bar{x} 是样本中购买 此种商品的顾客比例, dd 是事先给定的常数. 又假如事先知道 θ<θ0<12\theta<\theta_{0}<\frac{1}{2}, 会对其产生什么影响?

Solution: 这是茆诗松补充题. 利用正态近似, 有

P(nxˉθθ(1θ)<z1α2)=1α,P\left( \left| \sqrt{n}\frac{\bar{x}-\theta}{\sqrt{\theta (1-\theta )}} \right|<z_{1-\frac{\alpha}{2}} \right) =1-\alpha ,

反过来解得

θ[xˉz1α2nθ(1θ),xˉ+z1α2nθ(1θ)],\theta \in \left[ \bar{x}-\frac{z_{1-\frac{\alpha}{2}}}{\sqrt{n}}\sqrt{\theta (1-\theta )},\bar{x}+\frac{z_{1-\frac{\alpha}{2}}}{\sqrt{n}}\sqrt{\theta (1-\theta )} \right] ,

因此 dd 一定要比 z1α2nθ(1θ)\frac{z_{1-\frac{\alpha}{2}}}{\sqrt{n}} \sqrt{\theta(1-\theta)} 还大才行, 所以也要比右侧的最大值大, 考虑到二次函数

x(1x)14,当 x=1/2 时取等,x(1-x)\le \frac{1}{4},\quad \text{当 $x=1/2$ 时取等,}

因此有

dz1α22n,d \ge \frac{z_{1-\frac{\alpha}{2}}}{2\sqrt{n}},

解得 n(z1α22d)2n \geq\left(\frac{z_{1-\frac{\alpha}{2}}}{2 d}\right)^{2}.

再考虑如果已经有 θθ0<12\theta\le\theta_0<\frac{1}{2} 的条件, 那么二次函数的最大值就是

θ(1θ)θ0(1θ0)2,\theta(1-\theta)\le\theta_0(1-\theta_0)^2,

因此有

dz1α2nθ0(1θ0),d\ge \frac{z_{1-\frac{\alpha}{2}}}{\sqrt{n}}\sqrt{\theta _0\left( 1-\theta _0 \right)},

解得 n>θ0(1θ0)(z1α2d)2n>\theta_{0}\left(1-\theta_{0}\right)\left(\frac{z_{1-\frac{\alpha}{2}}}{d}\right)^{2}.

6.(10分)有来自总体 U(0,θ)\mathcal{U}(0, \theta) 的简单随机样本 X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n}, 试求 θ\theta1α1-\alpha 水平区间估计.

Solution:
T=X(n)θBeta(n,1)T=\frac{X_{\left( n \right)}}{\theta}\sim Beta\left( n,1 \right) 为枢轴量, 令 P(a<X(n)θ<b)=1αP\left( a<\frac{X_{\left( n \right)}}{\theta}<b \right) =1-\alpha, 容易解得 1α1-\alpha 置信区间为

[X(n),α1nX(n)].\left[X_{(n)}, \alpha^{-\frac{1}{n}} X_{(n)}\right].

7.(10分)对于总体 f(x)=θxθ1,0<x<1f(x)=\theta x^{\theta-1}, 0<x<1 的两个随机样本 X1,X2X_{1}, X_{2}, 考虑假设检验问题:

H0:θ=1 vs H1:θ=2H_{0}: \theta=1 \text { vs } H_{1}: \theta=2

对检验 g(x1,x2)={1,x1x2>340, 其他 g\left(x_{1}, x_{2}\right)=\left\{\begin{array}{ll}1, & x_{1} x_{2}>\frac{3}{4} \\ 0, & \text { 其他 }\end{array}\right., 试求出其势函数以及两类错误的概率.

Solution:

先求势函数,

βg(1)=P(X1X2>34θ=1)={x1x2>34}dx1dx2=14+34ln34,\beta _g\left( 1 \right) =P\left( X_1X_2>\frac{3}{4}\mid \theta =1 \right) =\iint_{\left\{ x_1x_2>\frac{3}{4} \right\}}{dx_1dx_2}=\frac{1}{4}+\frac{3}{4}\ln \frac{3}{4},

βg(2)=P(X1X2>34θ=2)={x1x2>34}4x1x2dx1dx2=716+98ln34,\beta _g\left( 2 \right) =P\left( X_1X_2>\frac{3}{4}\mid \theta =2 \right) =\iint_{\left\{ x_1x_2>\frac{3}{4} \right\}}{4x_1x_2dx_1dx_2}=\frac{7}{16}+\frac{9}{8}\ln \frac{3}{4},

所以两类错误概率分别是

α=14+34ln34,β=91698ln34.\alpha = \frac{1}{4}+\frac{3}{4} \ln \frac{3}{4},\quad \beta= \frac{9}{16}-\frac{9}{8}\ln \frac{3}{4}.

8.(10分)X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n} 是来自期望为 θ\theta 的指数分布总体的随机样本. 试求 θ\theta 的 UMVUE.

Solution: 全体样本的联合分布为

f(x1,,xn)=λnexp{1λi=1nXi}f\left( x_1,\cdots ,x_n \right) =\lambda ^{-n}\exp \left\{ \frac{1}{\lambda}\sum_{i=1}^n{X_i} \right\}

它是一个完备指数族分布, 故统计量 T=i=1nXiT=\sum_{i=1}^n{X_i} 是参数 λ\lambda 的充分完备统计量, 而 E(Xˉ)=E(1ni=1nXi)=1nnEX1=λE\left( \bar{X} \right) =E\left( \frac{1}{n}\sum_{i=1}^n{X_i} \right) =\frac{1}{n}\cdot n\cdot EX_1=\lambda. 即 Xˉ\bar{X}λ\lambda 的无偏估计. 根据 Lehamn-Scheffe定理, 知 Xˉ\bar{X}λ\lambda 的UMVUE.