南开大学-432统计学-2023年

一、选择题 (每题 4 分, 共 28 分)

  1. 离散型随机变量 XX 可能的取值是 0,2,30,2,3 , 且 P(X=0)=0.3,P(X=2)=0.1,P(X=3)=0.6P(X = 0) = 0.3, P(X = 2) = 0.1, P(X = 3) = 0.6, 令 Y=3(X1)2Y = 3 (X-1)^2, 则 E(Y)=E(Y) = ( )

(a) 8.4
(b) 6
(c) 4
(d) 7.2

Solution: A

先计算 YY 的分布列, 有 P(Y=3)=0.4,P(Y=12)=0.6P\left( Y=3 \right) =0.4,P\left( Y=12 \right) =0.6, 则 EY=30.4+120.6=8.4EY=3\cdot 0.4+12\cdot 0.6=8.4.

  1. X1,X2,,XnX_1, X_2, \cdots, X_n 是来自正态总体 N(μ,σ2)N(\mu, \sigma^2) 的简单随机样本, 记 S12=1n1i=1n(XiXˉ)2S_{1}^{2}=\frac{1}{n-1}\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}, S22=1ni=1n(XiXˉ)2S_{2}^{2}=\frac{1}{n}\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}, 则以下结论不正确的是 ( )

(a) S2S_2σ\sigma 的MLE
(b) S12S_1^2σ2\sigma^2 的相合估计
(c) S22S_2^2σ2\sigma^2 的相合估计
(d) n1(Xˉμ)S1t(n1)\frac{\sqrt{n-1}\left( \bar{X}-\mu \right)}{S_1}\sim t\left( n-1 \right)

Solution: D

D项应改为 n(Xˉμ)S1t(n1)\frac{\sqrt{n}\left( \bar{X}-\mu \right)}{S_1}\sim t\left( n-1 \right).

  1. 对于下述两个命题, 命题A: θ^\hat{\theta}θ\theta 的有效估计; 命题B: θ^\hat{\theta}θ\theta 的UMVUE. 下列结论正确的是 ( )

(a) ABA\Leftrightarrow B
(b) AB,BAA\Rightarrow B,B\nRightarrow A
(c) AB,BAA\nRightarrow B,B\Rightarrow A
(d) AB,BAA\nRightarrow B,B\nRightarrow A

Solution: B

如果有效估计存在, 说明 C-R 不等式成立, 且有效估计的方差达到 C-R 下界, 那么它一定是 UMVUE.

反之, 如果 θ^\hat{\theta} 是 UMVUE, 有可能 θ^\hat{\theta} 的方差达不到 C-R 下界, 也有可能 θ\theta 的有效估计根本不存在 (例如 U(0,θ)U(0,\theta) 总体, C-R不等式不成立).

  1. 下面关于独立性的说法中, 错误的是 ( )

(A) 随机向量的边际分布可以确定其联合分布
(B) 随机变量 X,YX,Y 独立 当且仅当 φX(t1)φY(t2)=φ(X,Y)(t1,t2)\varphi _X\left( t_1 \right) \varphi _Y\left( t_2 \right) =\varphi _{\left( X,Y \right)}\left( t_1,t_2 \right), 其中 φX(t1),φY(t2),φ(X,Y)(t1,t2)\varphi _X\left( t_1 \right) ,\varphi _Y\left( t_2 \right) ,\varphi _{\left( X,Y \right)}\left( t_1,t_2 \right) 分别是 X,YX,Y 各自的特征函数以及它们的联合特征函数
(c) 独立一定不相关
(D) 对于二元正态分布而言, 其分量之间相互独立的充要条件是不相关

Solution: A

以二元随机变量为例, 边际分布 + 条件分布才能确定联合分布, 两个边际分布无法确定联合分布.

  1. 在进行两总体 tt 检验时, 在 α=0.05\alpha = 0.05 的显著性水平下拒绝了原假设, 则两总体均值相等的概率是 ( )

(a) 119\frac{1}{19}
(b) 120\frac{1}{20}
(c) 118\frac{1}{18}
(d) 无法确定

Solution: B

显著性水平衡量了拒真概率, 即原假设(μ1=μ2\mu_1 = \mu_2)为真, 但由于样本随机性导致样本落入拒绝域, 故原假设为真的概率恰是显著性水平 0.050.05.

  1. 已知 XX 的密度函数 f(x)f(x) 是偶函数, 设 F(x)F(x) 是其分布函数, 则对于正数 aa, 下列说法正确的是 ( )

(a) F(a)+12=F(a)F(-a) + \frac{1}{2} = F(a)
(b) F(a)=1F(a)F(-a) = 1-F(a)
(c) F(a)+14=F(a)F(-a) + \frac{1}{4} = F(a)
(d) F(a)+F(a)=0F(a) + F(-a) = 0

Solution: B

根据对称性, 有 F(a)=af(t)dt=a+f(t)dtF\left( -a \right) =\int_{-\infty}^{-a}{f\left( t \right) \text{d}t}=\int_a^{+\infty}{f\left( t \right) \text{d}t}, 而 F(a)=af(t)dtF\left( a \right) =\int_{-\infty}^a{f\left( t \right) \text{d}t}, 故

F(a)+F(a)=f(t)dt=1.F\left( -a \right) +F\left( a \right) =\int_{-\infty}^{\infty}{f\left( t \right) \text{d}t}=1.

  1. 下列说法不正确的是 ( )

(a) XN(0,1)X \sim N(0,1), 则其特征函数 φ(t)=et22\varphi(t) = e^{-\frac{t^2}{2}}
(b) 伽马分布不具有可加性
(c) 若 Xn+YnpX+YX_n+Y_n\xrightarrow{p}X+Y
(d) 均匀分布 U(0,θ)U(0,\theta) 不是指数族分布

Solution: B

伽马分布具有可加性.

二、填空题(每题4分, 共32分)

  1. 一位作家共有 pp 本作品, pp 本作品成套出售, 现将 nn 套作品(共 npnp 本)打乱成 nn 堆, 每堆都有 pp 本, 则每堆作品都恰是一套作品的概率是 ________.

Solution: (n!)p(p!)n(np)!\frac{(n!)^p \left( p! \right) ^n}{\left( np \right) !}

全体样本点是一个全排列, 即 #Ω=(np)!\#\Omega =\left( np \right) !. 有利样本点可以按如下方式考虑: 我们先分配每一套作品的第一本书, 这 nn 个第一本书可以随机地分配到任意一堆中, 此时排列数为 n!n!; 对于每一套作品的第二本书, 排列数也同样是 n!n!; 以此类推, 总计有 (n!)p(n!)^p 种排列数. 而每一堆书的内部 pp 本书也可进行排列, 即 (p!)n(p!)^n. 根据乘法原理总的有利样本点数是 #A=(n!)p(p!)n\#A=(n!)^p \left( p! \right) ^n.

  1. 掷两枚骰子, 记事件 AA 为 “两枚骰子的点数和是3”, 事件 BB 为 “至少掷出1个1”, 则概率 P(AB)=P(A\mid B) =________.

Solution: 211\frac{2}{11}

利用条件概率公式 P(AB)=P(AB)P(B)P\left( A\mid B \right) =\frac{P\left( AB \right)}{P\left( B \right)}, 其中 P(B)=6+566=1136P\left( B \right) =\frac{6+5}{6\cdot 6}=\frac{11}{36}, 而事件 ABAB 等价于 “掷出 1 和 2”, 因此 P(AB)=236P\left( AB \right) =\frac{2}{36}. 综上所述

P(AB)=P(AB)P(B)=211.P\left( A\mid B \right) =\frac{P\left( AB \right)}{P\left( B \right)}=\frac{2}{11}.

  1. 现有 nn 个不同的球, 分别标号为 1,2,,n1,2,\cdots, n, 进行有放回取球, 则抽出 rr 种不同球时所用的平均次数是 ________.

Solution: k=1rnnk+1\sum_{k=1}^r{\frac{n}{n-k+1}}

XkX_k 表示 “现已经抽到 k1k - 1 个不同的球, 直至抽出一个新球所需的次数” (k=1,,nk = 1,\cdots, n), 则显然有 XkGe(nk+1n)X_k\sim Ge\left( \frac{n-k + 1}{n} \right), 题目中提及的抽出 rr 种不同球时所用的次数可写作

Y=k=1rXk,Y=\sum_{k=1}^r{X_k},

因此 EY=k=1rEXk=k=1rnnk+1EY=\sum_{k=1}^r{EX_k}=\sum_{k=1}^r{\frac{n}{n-k+1}}.

  1. 随机变量 X,YX,Y 独立, 皆服从标准正态分布 N(0,1)N(0,1), 则 E[max{X,Y}]=E\left[ \max \left\{ X,Y \right\} \right] = ________.

Solution: 1π\frac{1}{\sqrt{\pi}}

Z=max{X,Y}Z = \max \left\{ X,Y \right\}, 根据最大值分布的结论, ZZ 的密度函数是

fZ(z)=2Φ(z)φ(z),f_Z\left( z \right) =2\Phi \left( z \right) \varphi \left( z \right) ,

其中 Φ\Phiφ\varphi 分别是标准正态分布的分布函数与密度函数, 因此 EZ=z2Φ(z)φ(z)dzEZ=\int_{-\infty}^{\infty}{z2\Phi \left( z \right) \varphi \left( z \right) \text{d}z}, 注意到其中 zφ(z)=φ(z)z\varphi \left( z \right) =-\varphi '\left( z \right), 因此用分部积分法

EZ=z2Φ(z)φ(z)dz=2Φ(z)φ(z)+2[φ(z)]2dz=0+212πex2dx=1π\begin{aligned} EZ=\int_{-\infty}^{\infty}{z2\Phi \left( z \right) \varphi \left( z \right) \text{d}z}&=-2\Phi \left( z \right) \varphi \left( z \right) \mid_{-\infty}^{\infty}+2\int_{-\infty}^{\infty}{\left[ \varphi \left( z \right) \right] ^2\text{d}z} \\ &=0+2\int_{-\infty}^{\infty}{\frac{1}{2\pi}e^{-x^2}\text{d}x}=\frac{1}{\sqrt{\pi}} \end{aligned}

  1. 设总体 XU(0,θ)X \sim U(0, \theta),现从该总体中抽取容量为 10 的样本,样本值为:

0.51.30.61.72.21.20.81.52.01.6\begin{array}{llllllllll} 0.5 & 1.3 & 0.6 & 1.7 & 2.2 & 1.2 & 0.8 & 1.5 & 2.0 & 1.6 \end{array}

则参数 θ\theta 的矩估计是________.

Solution: 2.682.68
EX=θ2E X=\frac{\theta}{2}, 所以 θ\theta 的矩估计是 2Xˉ=21.34=2.682 \bar{X}=2 \cdot 1.34=2.68.

  1. 有来自N(μ,σ2)N(\mu,\sigma^2)nn个随机样本x1,,xnx_1,\cdots,x_n, μ,σ\mu, \sigma未知, xˉ\bar{x}s2s^2是样本均值和样本方差, 则μ\mu1α1-\alpha置信区间是________.

Solution: xˉ±snt1α2(n1)\bar{x} \pm \frac{s}{\sqrt{n}} t{ }_{1-\frac{\alpha}{2}}(n-1)

  1. 随机变量 XB(N,p)X \sim B(N,p), 其中 NN 已知, 则参数 pp 的 Fisher信息量是 ________.

Solution: Np(1p)\frac{N}{p\left( 1-p \right)}

根据定义, I(p)=E[2logf(X;p)p2]I\left( p \right) =-E\left[ \frac{\partial ^2\log f\left( X;p \right)}{\partial p^2} \right], 而其中

logf(X;p)=logCNX+Xlogp+(NX)log(1p)\log f\left( X;p \right) =\log C_{N}^{X}+X\log p+\left( N-X \right) \log \left( 1-p \right)

于是

I(p)=E[2logf(X;p)p2]=E[Xp2NX(1p)2]=(Npp2NNp(1p)2)=Np+N1p=Np(1p).\begin{aligned} I\left( p \right) =-E\left[ \frac{\partial ^2\log f\left( X;p \right)}{\partial p^2} \right] &=-E\left[ -\frac{X}{p^2}-\frac{N-X}{\left( 1-p \right) ^2} \right] \\ &=-\left( -\frac{Np}{p^2}-\frac{N-Np}{\left( 1-p \right) ^2} \right) \\ &=\frac{N}{p}+\frac{N}{1-p}=\frac{N}{p\left( 1-p \right)}. \end{aligned}

  1. 随机变量 XX 的取值范围是 [0,1][0,1], 则 Var(X)Var(X) 最多不超过 ________.

Solution: 14\frac{1}{4}

利用经典结论 Var(X)E(Xc)2Var\left( X \right) \le E\left( X-c \right) ^2, 其中我们取 c=12c = \frac{1}{2}, 则

Var(X)E(X12)2E(112)2=14.Var\left( X \right) \le E\left( X-\frac{1}{2} \right) ^2\le E\left( 1-\frac{1}{2} \right) ^2=\frac{1}{4}.

下面再说明该上界是紧的, 只需说明存在符合题意的随机变量, 其方差是 14\frac{1}{4}. 考虑两点分布 Xb(1,12)X \sim b(1, \frac{1}{2}), 则 Var(X)=14Var(X) = \frac{1}{4}.

三、解答题(90分)

1.(10分) 随机向量 (X,Y)(X,Y) 的联合密度函数是 f(x,y)=x+y,0<x,y<1f(x,y) = x+y, 0 < x,y < 1.

(1) 求 (X,Y)(X,Y) 的联合分布函数 F(x,y)F(x,y);

(2) 求 X,YX,Y 各自的边际密度函数;

(3) 判断 X,YX,Y 是否独立.

Solution:

(1) 对于 0x,y<10\le x, y<1, 有

F(x,y)=0xdu0y(u+v)dv=x2y+xy22,F\left( x,y \right) =\int_0^x{\text{d}u\int_0^y{\left( u+v \right) \text{d}v}}=\frac{x^2y+xy^2}{2},

对于 0x<10\le x < 1, y1y \ge 1, 有 F(x,y)=x2+x2F\left( x,y \right) =\frac{x^2+x}{2};

对于 0y<10\le y < 1, y1y \ge 1, 有 F(x,y)=y2+y2F\left( x,y \right) =\frac{y^2+y}{2};

对于 x,y1x,y \ge 1, 有 F(x,y)=1F(x,y) = 1.

综上所述,

F(x,y)={x2y+xy22,0x,y<1,x2+x2,0x<1,y1,y2+y2,0y<1,x1,1,x1,y1,0,其他.F\left( x,y \right) =\begin{cases} \frac{x^2y+xy^2}{2},& 0\le x,y<1,\\ \frac{x^2+x}{2},& 0\le x<1,y\ge 1,\\ \frac{y^2+y}{2},& 0\le y<1,x\ge 1,\\ 1,& x\ge 1,y\ge 1,\\ 0,& \text{其他}.\\ \end{cases}

(2) 计算得 XX 的边际密度函数

fX(x)=01(x+y)dy=x+12, 0<x<1f_X\left( x \right) =\int_0^1{\left( x+y \right) \text{d}y}=x+\frac{1}{2},\ 0<x<1

同理有 YY 的边际密度函数

fY(y)=01(x+y)dx=y+12, 0<y<1f_Y\left( y \right) =\int_0^1{\left( x+y \right) \text{d}x}=y+\frac{1}{2},\ 0<y<1

(3) 由于 fX(x)fY(y)f(x,y)f_X\left( x \right) f_Y\left( y \right) \ne f\left( x,y \right), 故 XXYY 不独立.

2.(10分) X1,X2,,XnX_1, X_2, \cdots, X_n 是来自总体密度函数为

f(x)=(a+1)xa,0<x<1.f\left( x \right) =\left( a+1 \right) x^a,0<x<1.

的简单随机样本, 试求 aa 的矩估计与 MLE.

Solution: 可以看出总体是贝塔分布 Beta(a+1,1)Beta\left( a + 1,1 \right), 因此 EX=a+1a+2EX=\frac{a + 1}{a+2}, 由替换原理得 a^M=12XˉXˉ1\hat{a}_M=\frac{1-2\bar{X}}{\bar{X}-1}aa 的矩估计.

样本的似然函数是

L(a)=(a+1)n(i=1nXi)aL\left( a \right) =\left( a+1 \right) ^n\left( \prod_{i=1}^n{X_i} \right) ^a

对数似然函数

(a)=nlog(a+1)+ai=1nlogXi\ell \left( a \right) =n\log \left( a+1 \right) +a\sum_{i=1}^n{\log X_i}

关于参数求偏导置 0, 有

a=na+1+i=1nlogXi=0,\frac{\partial \ell}{\partial a}=\frac{n}{a+1}+\sum_{i=1}^n{\log X_i}=0,

解得 a^L=ni=1nlogXi1\hat{a}_L=-\frac{n}{\sum_{i=1}^n{\log X_i}}-1aa 的 MLE.

3.(15分) X1,X2,,XnX_1, X_2, \cdots, X_n 是来自总体 U(0,θ)U(0, \theta) 的简单随机样本, 则

(1) 证明 U=n+1nX(n)U=\frac{n+1}{n}X_{\left( n \right)}V=2XˉV=2\bar{X} 均为 θ\theta 的无偏估计;

(2) 判断并说明 UUVV 二者谁更有效.

Solution:

(1) 由于 X(n)θBeta(n,1)\frac{X_{\left( n \right)}}{\theta}\sim Beta\left( n,1 \right), 故 EX(n)=nn+1θEX_{\left( n \right)}=\frac{n}{n+1}\theta, 所以 EU=n+1nnn+1θ=θEU=\frac{n+1}{n}\cdot \frac{n}{n+1}\theta =\theta.

EV=2EXˉ=2EX=2θ2=θEV=2E\bar{X}=2EX=2\cdot \frac{\theta}{2}=\theta.

所以 U,VU,V 都是 θ\theta 的无偏估计.

(2) 比较二者的方差, 由于 X(n)θBeta(n,1)\frac{X_{\left( n \right)}}{\theta}\sim Beta\left( n,1 \right), 所以 Var(X(n))=n(n+1)2(n+2)θ2Var\left( X_{\left( n \right)} \right) =\frac{n}{\left( n+1 \right) ^2\left( n+2 \right)}\theta ^2, 因此

Var(U)=(n+1)2n2n(n+1)2(n+2)θ2=θ2n(n+2)Var\left( U \right) =\frac{\left( n+1 \right) ^2}{n^2}\cdot \frac{n}{\left( n+1 \right) ^2\left( n+2 \right)}\theta ^2=\frac{\theta ^2}{n\left( n+2 \right)}

Var(V)=4Var(Xˉ)=4nVar(X)=4n112θ2=θ23nVar\left( V \right) =4Var\left( \bar{X} \right) =\frac{4}{n}Var\left( X \right) =\frac{4}{n}\cdot \frac{1}{12}\theta ^2=\frac{\theta ^2}{3n}

所以 UU 更有效.

4.(10分) 已知随机序列 XnLXX_n\xrightarrow{L}X 以及 YnpaY_n\xrightarrow{p}a, 证明: Xn+YnLX+aX_n+Y_n\xrightarrow{L}X+a.

Solution:

5.(10分) 为判断一枚骰子是否均匀, 掷 120 次, 得到的结果如下表:

1 2 3 4 5 6
xx 20 20 20 20 40x40-x

则当 xx 的值为多少时, 可以认为骰子是均匀的?

Solution:

利用卡方拟合优度检验, 当前情况下的卡方统计量是

χ2=i=16(Ni20)220=(x20)210\chi ^2=\sum_{i=1}^6{\frac{\left( N_i-20 \right) ^2}{20}}=\frac{\left( x-20 \right) ^2}{10}

在原假设成立时 (即认为骰子是均匀的), 有 χ2χ2(5)\chi ^2\sim \chi ^2\left( 5 \right), 我们在 χ2χ0.952(5)=11.07\chi ^2\le \chi _{0.95}^{2}\left( 5 \right) =11.07 时接受原假设, 因此令

(x20)21011.07\frac{\left( x-20 \right) ^2}{10}\le 11.07

解得 x20±110.7x\in 20\pm \sqrt{110.7}. 而 110.7=10.5214\sqrt{110.7}=10.5214, 考虑到 xx 是整数, 因此 xx 的取值范围是 {10,11,12,,30}\{10, 11, 12, \cdots, 30\}.

6.(10分) 某住宅楼调查住户是否愿意安装电梯, 假设住户中愿意安装电梯的比例是 pp,

(1) 若 p=0.5p = 0.5, 试用中心极限定理估计事件 A=A = “25位居民中至少有14位愿意安装电梯” 发生的概率;

(2) 若 pp 未知, 调查得到居民中愿意安装电梯的比例是 Xˉn\bar{X}_n, 且要求 pp 的 90% 置信区间包含在 [Xˉn0.01,Xˉn+0.01]\left[ \bar{X}_n-0.01,\bar{X}_n+0.01 \right] 中, 试求样本量 nn.

Solution:

(1) 用 XX 表示 25 位居民中愿意安装电梯的人数, 则 XB(25,0.5)X \sim B(25, 0.5), 则

P(X14)=P(X12.5250.251412.5250.25)=P(X12.5250.251.52.5)1Φ(35),\begin{aligned} P\left( X\ge 14 \right) &=P\left( \frac{X-12.5}{\sqrt{25\cdot 0.25}}\ge \frac{14-12.5}{\sqrt{25\cdot 0.25}} \right) \\ &=P\left( \frac{X-12.5}{\sqrt{25\cdot 0.25}}\ge \frac{1.5}{2.5} \right) \approx 1-\Phi \left( \frac{3}{5} \right) , \end{aligned}

其中 Φ\Phi 是标准正态分布的分布函数.

(2) 根据中心极限定理以及Slutsky定理, 有渐近枢轴量

n(Xˉp)Xˉ(1Xˉ)N(0,1)\frac{\sqrt{n}\left( \bar{X}-p \right)}{\sqrt{\bar{X}\left( 1-\bar{X} \right)}}\rightarrow N\left( 0,1 \right)

故参数 pp 的近似 90% 水平置信区间是

Xˉ±Xˉ(1Xˉ)nz0.95.\bar{X}\pm \frac{\sqrt{\bar{X}\left( 1-\bar{X} \right)}}{\sqrt{n}}z_{0.95}.

其中 Xˉ(1Xˉ)14\bar{X}\left( 1-\bar{X} \right) \le \frac{1}{4}, 故令 1/2nz0.950.01\frac{1/2}{\sqrt{n}}z_{0.95}\le 0.01, 解得

n(501.645)2=82.252=6765.06.n\ge \left( 50\cdot 1.645 \right) ^2=82.25^2=6765.06.

nn 至少是 6766.

7.(15分) 现有 100 个来自总体 N(μ,4)N(\mu, 4) 的简单随机样本 X1,X2,,X100X_1, X_2, \cdots, X_{100}, 对于假设检验问题

H0:μ=3 vs H1:μ3,H_0:\mu =3\ vs\ H_1:\mu \ne 3,

(1) 给出显著性水平 α=0.05\alpha = 0.05 下的拒绝域;

(2) 求 μ=3.5\mu = 3.5 时的第二类错误;

(3) 当 μ=4\mu = 4时, 当样本量增加为 nnnn \rightarrow \infty 时, 证明检验的功效 1\rightarrow 1.

Solution:

(1) 检验统计量 z=10(Xˉ3)2z=\frac{10\left( \bar{X}-3 \right)}{2}, 在原假设成立时它是标准正态分布.

拒绝域是

W={zz1α2}={zz0.975}={z1.96}W=\left\{ \left| z \right|\ge z_{1-\frac{\alpha}{2}} \right\} =\left\{ \left| z \right|\ge z_{0.975} \right\} =\left\{ \left| z \right|\ge 1.96 \right\}

(2) 先求此时的功效, 有

ρ(3.5)=Pμ=3.5(10(Xˉ3)2z0.975)=Pμ=3.5(10(Xˉ3)2z0.975)+Pμ=3.5(10(Xˉ3)2z0.975)=Pμ=3.5(Xˉ3.515z0.97512)+Pμ=3.5(Xˉ3.515z0.97512)=Pμ=3.5(10(Xˉ3.5)2z0.97552)+Pμ=3.5(10(Xˉ3.5)2z0.97552)=1Φ(z0.97552)+Φ(z0.97552).\begin{aligned} \rho \left( 3.5 \right) &=P_{\mu =3.5}\left( \left| \frac{10\left( \bar{X}-3 \right)}{2} \right|\ge z_{0.975} \right) \\ &=P_{\mu =3.5}\left( \frac{10\left( \bar{X}-3 \right)}{2}\ge z_{0.975} \right) +P_{\mu =3.5}\left( \frac{10\left( \bar{X}-3 \right)}{2}\le -z_{0.975} \right) \\ &=P_{\mu =3.5}\left( \bar{X}-3.5\ge \frac{1}{5}z_{0.975}-\frac{1}{2} \right) +P_{\mu =3.5}\left( \bar{X}-3.5\le -\frac{1}{5}z_{0.975}-\frac{1}{2} \right) \\ &=P_{\mu =3.5}\left( \frac{10\left( \bar{X}-3.5 \right)}{2}\ge z_{0.975}-\frac{5}{2} \right) +P_{\mu =3.5}\left( \frac{10\left( \bar{X}-3.5 \right)}{2}\le -z_{0.975}-\frac{5}{2} \right) \\ &=1-\Phi \left( z_{0.975}-\frac{5}{2} \right) +\Phi \left( -z_{0.975}-\frac{5}{2} \right) . \end{aligned}

则第二类错误的概率是 β(3.5)=1ρ(3.5)=Φ(z0.97552)Φ(z0.97552)\beta \left( 3.5 \right) =1-\rho \left( 3.5 \right) =\Phi \left( z_{0.975}-\frac{5}{2} \right) -\Phi \left( -z_{0.975}-\frac{5}{2} \right).

(3) 这时候检验统计量变为 z=n(Xˉ3)2z=\frac{\sqrt{n}\left( \bar{X}-3 \right)}{2}, 拒绝域不变. 类似地有

ρ(4)=Pμ=4(n(Xˉ3)2z0.975)=Pμ=4(n(Xˉ3)2z0.975)+Pμ=4(n(Xˉ3)2z0.975)=Pμ=4(Xˉ42nz0.9751)+Pμ=3.5(Xˉ42nz0.9751)=Pμ=4(n(Xˉ4)2z0.975n)+Pμ=4(n(Xˉ4)2z0.975n)=1Φ(z0.975n)+Φ(z0.975n)1\begin{aligned} \rho \left( 4 \right) &=P_{\mu =4}\left( \left| \frac{\sqrt{n}\left( \bar{X}-3 \right)}{2} \right|\ge z_{0.975} \right) \\ &=P_{\mu =4}\left( \frac{\sqrt{n}\left( \bar{X}-3 \right)}{2}\ge z_{0.975} \right) +P_{\mu =4}\left( \frac{\sqrt{n}\left( \bar{X}-3 \right)}{2}\le -z_{0.975} \right) \\ &=P_{\mu =4}\left( \bar{X}-4\ge \frac{2}{\sqrt{n}}z_{0.975}-1 \right) +P_{\mu =3.5}\left( \bar{X}-4\le -\frac{2}{\sqrt{n}}z_{0.975}-1 \right) \\ &=P_{\mu =4}\left( \frac{\sqrt{n}\left( \bar{X}-4 \right)}{2}\ge z_{0.975}-\sqrt{n} \right) +P_{\mu =4}\left( \frac{\sqrt{n}\left( \bar{X}-4 \right)}{2}\le -z_{0.975}-\sqrt{n} \right) \\ &=1-\Phi \left( z_{0.975}-\sqrt{n} \right) +\Phi \left( -z_{0.975}-\sqrt{n} \right) \rightarrow 1 \end{aligned}

8.(10分) X1,X2,,XnX_1, X_2, \cdots, X_n 是来自总体瑞利分布总体的简单随机样本, 总体的密度函数是

f(x)=1θ2xex22θ2,x>0,f\left( x \right) =\frac{1}{\theta ^2}xe^{-\frac{x^2}{2\theta ^2}},x>0,

试求 θ\theta 的 UMVUE.

Solution:

样本的联合分布是

f(x1,,xn;θ)=θ2n(i=1nXi)e12θ2i=1nXi2,f\left( x_1,\cdots ,x_n;\theta \right) =\theta ^{-2n}\left( \prod_{i=1}^n{X_i} \right) e^{-\frac{1}{2\theta ^2}\sum_{i=1}^n{X_{i}^{2}}},

它是一个完备的单参数指数族分布, 参数 θ\theta 的充分完备统计量是 T=i=1nXi2T=\sum_{i=1}^n{X_{i}^{2}}.

先求 Yi=Xi2Y_i = X_i^2 的分布, 容易算得其密度函数是

fY(y)=12θ2ey2θ2,y>0,f_Y\left( y \right) =\frac{1}{2\theta ^2}e^{-\frac{y}{2\theta ^2}},y>0,

即期望为 2θ22\theta^2 的指数分布 Exp(12θ2)Exp(\frac{1}{2\theta^2}), 因此 T=i=1nYiGamma(n,12θ2)T=\sum_{i=1}^n{Y_i}\sim Gamma\left( n,\frac{1}{2\theta ^2} \right). 所以

ET=0+t(12θ2)n(n1)!tn1et2θ2dt=u=t2θ22θ20+1(n1)!un12eudu=2Γ(n+12)(n1)!θ.\begin{aligned} E\sqrt{T} &=\int_0^{+\infty}{\sqrt{t}\frac{\left( \frac{1}{2\theta ^2} \right) ^n}{\left( n-1 \right) !}t^{n-1}e^{-\frac{t}{2\theta ^2}}\text{d}t} \\ &\xlongequal{u=\frac{t}{2\theta ^2}}\sqrt{2\theta ^2}\int_0^{+\infty}{\frac{1}{\left( n-1 \right) !}u^{n-\frac{1}{2}}e^{-u}\text{d}u} \\ &=\frac{\sqrt{2}\Gamma \left( n+\frac{1}{2} \right)}{\left( n-1 \right) !}\theta . \end{aligned}

(n1)!2Γ(n+12)T\frac{\left( n-1 \right) !}{\sqrt{2}\Gamma \left( n+\frac{1}{2} \right)}\sqrt{T} 是基于充分完备统计量给出的 θ\theta 的无偏估计, 根据 L-S 定理知它是 θ\theta 的 UMVUE.