复旦大学-432统计学-2023年

一、(10分) 从 112n+12n+1 这些整数里任意挑选 22 个, 求其中一个大于 n+1n+1, 另外一个小于 n+1n+1 的概率.

Solution: #Ω=C2n+12=(2n+1)2n21=n(2n+1)\#\Omega = C_{2n+1}^2=\frac{(2n+1)\cdot 2n}{2\cdot 1}=n(2n+1), #A=Cn1Cn1=n2\#A=C_n^1\cdot C_n^1=n^2, 因此

P(A)=n2n(2n+1)=n2n+1.P(A)=\frac{n^2}{n(2n+1)}=\frac{n}{2n+1}.

二、(10分) 证明: 二元正态分布的边际分布是正态分布. 但两个边际正态分布联合却不一定是正态分布, 请举例说明.

Solution: 二元正态 (X,Y)N(μ1,μ2;σ12,σ22;ρ)(X,Y)\sim N(\mu_1,\mu_2;\sigma_1^2,\sigma_2^2;\rho), 令

U=Xμ1σ1,V=Yμ2σ2,U=\frac{X-\mu_1}{\sigma_1},\quad V=\frac{Y-\mu_2}{\sigma_2},

容易验证 (U,V)N(0,0;1,1;ρ)(U,V)\sim N(0,0;1,1;\rho), 再考虑 Z=UρV1ρ2Z=\frac{U-\rho V}{\sqrt{1-\rho^2}}, 得到

(U,Z)N(0,0;1,1;0),(U,Z)\sim N(0,0;1,1;0),

根据独立性直接得到 UN(0,1)U\sim N(0,1), 故 X=σ1U+μ1N(μ1,σ12)X=\sigma_1 U+\mu_1\sim N(\mu_1,\sigma_1^2). 同理有 YN(μ2,σ22)Y\sim N(\mu_2,\sigma_2^2), 结论成立.

反之, 直接考虑 XN(0,1)X\sim N(0,1), 以及 Y=XY=X, 而 (X,Y)(X,Y) 没有二元密度函数, 不构成二元正态.

三、(10分) 设 XN(0,1)X\sim N(0,1), YExp(1)Y\sim Exp(1), 且它们独立, 求 XY\frac{X}{Y} 的密度函数.

[考点透析] 我们在三模出了一道计算方式上几乎一致的题, 可以先看这个, 作为练习: 对于 XN(a,b2)X\sim N(a,b^2), 尝试求 EXE|X|.

对于一个 ZN(a,1)Z\sim N(-a,1), 有 EZ=EWaE|Z|=E|W-a|, 这里 WN(0,1)W\sim N(0,1), 故

EZ=EWa=E[(Wa)I{W>a}+(aW)I{W<a}]=E[WI{W>a}]E[WI{W<a}]+aP(W<a)aP(W>a)=E[WI{W>a}]E[WI{W<a}]+a(2Φ(a)1),\begin{aligned} E\left| Z \right|&=E\left| W-a \right|=E\left[ \left( W-a \right) I_{\left\{ W>a \right\}}+\left( a-W \right) I_{\left\{ W<a \right\}} \right]\\ &=E\left[ WI_{\left\{ W>a \right\}} \right] -E\left[ WI_{\left\{ W<a \right\}} \right] +aP\left( W<a \right) -aP\left( W>a \right)\\ &=E\left[ WI_{\left\{ W>a \right\}} \right] -E\left[ WI_{\left\{ W<a \right\}} \right] +a\left( 2\Phi \left( a \right) -1 \right),\\ \end{aligned}

并且对于计算概率, (W,a)(W,a)(W,a)(-W,a) 是完全一致的, 因此

E[WI{W<a}]=E[WI{W<a}]=E[WI{W>a}],E\left[ WI_{\left\{ W<a \right\}} \right] =E\left[ -WI_{\left\{ -W<a \right\}} \right] =-E\left[ WI_{\left\{ W>-a \right\}} \right] ,

所以有 E[WI{W>a}]E[WI{W<a}]=E[WI{a<W<a}]+2E[WI{W>a}]=2πea22E\left[ WI_{\left\{ W>a \right\}} \right] -E\left[ WI_{\left\{ W<a \right\}} \right] =E\left[ WI_{\left\{ -a<W<a \right\}} \right] +2E\left[ WI_{\left\{ W>a \right\}} \right] =\sqrt{\frac{2}{\pi}}e^{-\frac{a^2}{2}}.

因此对YN(a,b2)Y\sim N(a,b^2), 有EY=2πbea22b2+a(2Φ(ab)1)E\left| Y \right|=\sqrt{\frac{2}{\pi}}be^{-\frac{a^2}{2b^2}}+a\left( 2\Phi \left( \frac{a}{b} \right) -1 \right).

现在再回到本题, 利用商的分布, 有 Z=XYZ=\frac{X}{Y} 的 p.d.f. 是

fZ(z)=0+12πvez2v22vdv=12πe12z20+vez22(v+1z2)2dv=1ze12z20+12π1z2ve(v+1z2)221z2dv=1ze12z2E[VI{V>0}].\begin{aligned} f_Z\left( z \right) &=\int_0^{+\infty}{\frac{1}{\sqrt{2\pi}}ve^{-\frac{z^2v^2}{2}-v}dv}\\ &=\frac{1}{\sqrt{2\pi}}e^{\frac{1}{2z^2}}\int_0^{+\infty}{ve^{-\frac{z^2}{2}\left( v+\frac{1}{z^2} \right) ^2}dv}\\ &=\frac{1}{|z|}e^{\frac{1}{2z^2}}\int_0^{+\infty}{\frac{1}{\sqrt{2\pi \frac{1}{z^2}}}ve^{-\frac{\left( v+\frac{1}{z^2} \right) ^2}{2\cdot \frac{1}{z^2}}}dv}=\frac{1}{|z|}e^{\frac{1}{2z^2}}E\left[ VI_{\left\{ V>0 \right\}} \right] .\\ \end{aligned}

其中 VN(1z2,1z2)V\sim N\left(-\frac{1}{z^2},\frac{1}{z^2}\right). 我们直接探讨 VN(a,1)V\sim N(a,1) 即可, 其中 a>0a>0, 有

E[VI{V>0}]=E[(Va)I{Va>a}]+aE[I{Va>a}]=E[WI{W>a}]+a(1Φ(a)),E\left[ VI_{\left\{ V>0 \right\}} \right] =E\left[ \left( V-a \right) I_{\left\{ V-a>-a \right\}} \right] +aE\left[ I_{\left\{ V-a>-a \right\}} \right] =E\left[ WI_{\left\{ W>-a \right\}} \right] +a\left( 1-\Phi \left( -a \right) \right) ,

这里 WN(0,1)W\sim N(0,1), 我们前面已经算过 E[WI{W>a}]=12πea22E\left[ WI_{\left\{ W>a \right\}} \right] =\sqrt{\frac{1}{2\pi}}e^{-\frac{a^2}{2}}, 而

E[WI{W>a}]=E[WI{a<W<a}]+E[WI{W>a}]=12πea22.E\left[ WI_{\left\{ W>-a \right\}} \right] =E\left[ WI_{\left\{ -a<W<a \right\}} \right] +E\left[ WI_{\left\{ W>a \right\}} \right] =\sqrt{\frac{1}{2\pi}}e^{-\frac{a^2}{2}}.

再考虑 VN(a,b2)V\sim N(a,b^2), 有

E[VI{V>0}]=bE[VbI{Vb>0}]=b[12πea22b2+ab(1Φ(ab))],E\left[ VI_{\left\{ V>0 \right\}} \right] =bE\left[ \frac{V}{b}I_{\left\{ \frac{V}{b}>0 \right\}} \right] =b\left[ \sqrt{\frac{1}{2\pi}}e^{-\frac{a^2}{2b^2}}+\frac{a}{b}\left( 1-\Phi \left( -\frac{a}{b} \right) \right) \right] ,

因为有 VbN(ab,1)\frac{V}{b}\sim N(\frac{a}{b},1), 化简得

E[VI{V>0}]=12πbea22b2+a(1Φ(ab)).E\left[ VI_{\left\{ V>0 \right\}} \right] =\sqrt{\frac{1}{2\pi}}be^{-\frac{a^2}{2b^2}}+a\left( 1-\Phi \left( -\frac{a}{b} \right) \right) .

这里代入 a=1z2a=-\frac{1}{z^2}, b=1zb=\frac{1}{|z|}, 则有

E[VI{V>0}]=12π1ze12z21z2(1Φ(1z)),E\left[ VI_{\left\{ V>0 \right\}} \right] =\sqrt{\frac{1}{2\pi}}\frac{1}{|z|}e^{-\frac{1}{2z^2}}-\frac{1}{z^2}\left( 1-\Phi \left( \frac{1}{|z|} \right) \right) ,

因此有

fZ(z)=12π1z21z3e12z2(1Φ(1z)),f_Z\left( z \right) =\sqrt{\frac{1}{2\pi}}\frac{1}{z^2}-\frac{1}{|z|^3}e^{\frac{1}{2z^2}}\left( 1-\Phi \left( \frac{1}{|z|} \right) \right) ,

去除瑕点, 写为

fZ(z)={12π1z21z3e12z2(1Φ(1z)),z0,0,z=0.f_Z\left( z \right) =\begin{cases} \sqrt{\frac{1}{2\pi}}\frac{1}{z^2}-\frac{1}{|z|^3}e^{\frac{1}{2z^2}}\left( 1-\Phi \left( \frac{1}{|z|} \right) \right) ,& z\ne 0,\\ 0,& z=0.\\ \end{cases}

四、(10分) 设 XN(0,1)X\sim N(0,1), YB(1,p)Y\sim B(1,p), 且它们独立, 求 X+YX+Y 的概率分布.

Solution: 利用微分法, 令 Z=X+YZ=X+Y, 有

P(Z=z)=P(X=z,Y=0)+P(X=z1,Y=1)=(1p)φ(z)+pφ(z1),zR.\begin{aligned} P\left( Z=z \right) &=P\left( X=z,Y=0 \right) +P\left( X=z-1,Y=1 \right)\\ &=\left( 1-p \right) \varphi \left( z \right) +p\varphi \left( z-1 \right) ,\quad z\in R.\\ \end{aligned}

对应的分布函数是

F(z)=(1p)Φ(z)+pΦ(z1),zR.F(z)=(1-p)\Phi(z)+p\Phi(z-1),\quad z\in R.

五、(10分) 设YY是非负随机变量, 且0<Var(Y)<0<Var(Y)<\infty, 证明

P(Y>0)(EY)2E(Y2).P(Y>0) \ge \frac{(EY)^2}{E(Y^2)}.

Solution: 由于Y=0Y=0时对求期望不影响, 故

E(I{Y>0}2)E(Y2)[E(YI{Y>0})]2=(EY)2,E\left( I_{\left\{ Y>0 \right\}}^{2} \right) E\left( Y^2 \right) \ge \left[ E\left( YI_{\left\{ Y>0 \right\}} \right) \right] ^2=\left( EY \right) ^2,

E(I{Y>0}2)=P(I{Y>0}=1)=P(Y>0)E\left( I_{\left\{ Y>0 \right\}}^{2} \right) =P\left( I_{\left\{ Y>0 \right\}}=1 \right) =P\left( Y>0 \right), 结论得证.

六、(15分) 设 α>0,β0,ξ\alpha>0, \beta \geq 0, \xi 是随机变量. 证明: limx+xα+βP(ξ>x)=0\lim _{x \uparrow+\infty} x^{\alpha+\beta} P(|\xi|>x)=0 当且仅当

limx+xαE(ξβIξ>x)=0.\lim _{x \uparrow+\infty} x^{\alpha} E\left(|\xi|^{\beta} I_{|\xi|>x}\right)=0 .

Solution: 充分性用马尔可夫型不等式很容易证明. 对于必要性: 我们先证明一个等式:

βx+tβ1P(ξ>t)dt=βx+t+tβ1dF(s)dt=βx+xstβ1dtdF(s)=x+(sβxβ)dF(s)=E(ξβI{ξ>x})xβP(ξ>x).\begin{aligned} \beta \int_x^{+\infty}{t^{\beta -1}P\left( \left| \xi \right|>t \right) dt}&=\beta \int_x^{+\infty}{\int_t^{+\infty}{t^{\beta -1}dF\left( s \right) dt}}\\ &=\beta \int_x^{+\infty}{\int_x^s{t^{\beta -1}dtdF\left( s \right)}}\\ &=\int_x^{+\infty}{\left( s^{\beta}-x^{\beta} \right) dF\left( s \right)}\\ &=E\left( \left| \xi \right|^{\beta}I_{\left\{ \left| \xi \right|>x \right\}} \right) -x^{\beta}P\left( \left| \xi \right|>x \right) .\\ \end{aligned}

因此, 有

xα(EξβI{ξ>x})=xα+βP(ξ>x)+βxαx+tβ1P(ξ>t)dt.x^{\alpha}\left( E\left| \xi \right|^{\beta}I_{\left\{ \left| \xi \right|>x \right\}} \right) =x^{\alpha +\beta}P\left( \left| \xi \right|>x \right) +\beta x^{\alpha}\int_x^{+\infty}{t^{\beta -1}P\left( \left| \xi \right|>t \right) dt}.

其中, 用洛必达法则, 有

limx+xαx+tβ1P(ξ>t)dt=limx+x+tβ1P(ξ>t)dtxα=limx+xβ1P(ξ>x)αxα1=0\lim_{x\rightarrow +\infty} x^{\alpha}\int_x^{+\infty}{t^{\beta -1}P\left( \left| \xi \right|>t \right) dt}=\lim_{x\rightarrow +\infty} \frac{\int_x^{+\infty}{t^{\beta -1}P\left( \left| \xi \right|>t \right) dt}}{x^{-\alpha}}=\lim_{x\rightarrow +\infty} \frac{x^{\beta -1}P\left( \left| \xi \right|>x \right)}{\alpha x^{-\alpha -1}}=0

命题得证.

七、(15分) XN(0,1)X\sim N(0,1), ff 是有界连续函数, 其导函数也有界连续 求证:

(1) (Stein引理) E[f(X)X]=E[f(X)]E[f(X)X]=E[f'(X)];
(2) (Poincare不等式) E[(f(X)Ef(X))2]E[(f(X))2]E\left[ \left(f(X)-Ef(X)\right)^2 \right] \le E\left[ \left( f'\left( X \right) \right) ^2 \right].

[考点透析]: 第(1)问考察了很多次, 课上讲过很多次、考卷了出了很多次, 必须得分. 第 (2) 问的 Poincare 不等式在概率论中的版本较早地由 J. Nash (1959), H. Chernoff (1981), L. Chen (1982) 等人研究, 在他们的证明中需要用到二次可积函数的Hermite展开式 (类似傅里叶变换).

Solution: (1) 利用分部积分法, 有

E[f(X)X]=12πRf(x)xex22dx=12π[f(x)ex22+Rf(x)ex22dx]=0+12πRf(x)ex22dx=E[f(X)].\begin{aligned} E\left[ f\left( X \right) X \right] &=\frac{1}{\sqrt{2\pi}}\int_R{f\left( x \right) xe^{-\frac{x^2}{2}}dx}=-\frac{1}{\sqrt{2\pi}}\left[ \left. f\left( x \right) e^{-\frac{x^2}{2}} \right|_{-\infty}^{+\infty}-\int_R{f'\left( x \right) e^{-\frac{x^2}{2}}dx} \right]\\ &=0+\frac{1}{\sqrt{2\pi}}\int_R{f'\left( x \right) e^{-\frac{x^2}{2}}dx}=E\left[ f'\left( X \right) \right] .\\ \end{aligned}

(2) [法一]: 概率论方法. 利用方差性质以及柯西-施瓦茨不等式, 有

Var(f(X))E[(f(X)f(0))2]=E[(0Xf(t)dt)2]E[(0X(f(t))2dt)(0X12dt)]=E[X(0X(f(t))2dt)]=E[(f(X))2].\begin{aligned} Var\left( f\left( X \right) \right) &\le E\left[ \left( f\left( X \right) -f\left( 0 \right) \right) ^2 \right] =E\left[ \left( \int_0^X{f'\left( t \right) dt} \right) ^2 \right]\\ &\le E\left[ \left( \int_0^X{\left( f'\left( t \right) \right) ^2dt} \right) \left( \int_0^X{1^2dt} \right) \right]\\ &=E\left[ X\left( \int_0^X{\left( f'\left( t \right) \right) ^2dt} \right) \right]\\ &=E\left[ \left( f'\left( X \right) \right) ^2 \right] .\\ \end{aligned}

最后一步用了第一问的Stein引理.

[法二]: 我们来看一看H. Chernoff (1981)给出的证明. 利用 L2L^2 空间 (二次可积函数的全体) 的正交展开, 任意一个 fL2f\in L^2 都可以写为正交Hermite多项式的形式 (这也称为广义傅里叶展开), 即

f(x)=a0+k=1akHk(x),f\left( x \right) =a_0+\sum_{k=1}^{\infty}{a_k\mathcal{H} _k\left( x \right)},

其中 {H0,H1,H2,}\{\mathcal{H}_0,\mathcal{H}_1,\mathcal{H}_2,\cdots\} 是Hermite正交函数列(H0(x)=1\mathcal{H}_0(x)=1), 满足

E[Hk(X)]=0,E[Hk2(X)]=1,E[Hk(X)Hj(X)]=0,kj,E\left[ \mathcal{H} _k\left( X \right) \right] =0,\quad E\left[ \mathcal{H} _{k}^{2}\left( X \right) \right] =1,\quad E\left[ \mathcal{H} _k\left( X \right) \mathcal{H} _j\left( X \right) \right] =0,k\ne j,

其中系数由 ak=E[f(X)Hk(X)]a_k=E[f(X)\mathcal{H}_k(X)] 给出, 截止目前都和傅里叶展开几乎无差距. 而Hermite正交函数列有一个性质是 Hk(x)=kHk1(x)\mathcal{H}_k'(x)=\sqrt{k}\mathcal{H}_{k-1}(x), 这个性质类似对应傅里叶展开里的 (cosnx)=nsinnx\left(\cos nx\right)'=n \sin nx.

因此, 利用该展开式, 我们有

Var(f(X))=E[f2(X)]a02=E[(k=0akHk(x))2]a02=E[k=0ak2Hk2]a02=k=1ak2.\begin{aligned} Var\left( f\left( X \right) \right) &=E\left[ f^2\left( X \right) \right] -a_{0}^{2}=E\left[ \left( \sum_{k=0}^{\infty}{a_k\mathcal{H} _k\left( x \right)} \right)^2 \right] -a_{0}^{2}\\ &=E\left[ \sum_{k=0}^{\infty}{a_{k}^{2}\mathcal{H} _{k}^{2}} \right] -a_{0}^{2}=\sum_{k=1}^{\infty}{a_{k}^{2}}.\\ \end{aligned}

同时, 根据 f,ff, f'有界, 求和与求导交换次序我们有

f(x)=(a0+k=1akHk(x))=k=1akHk(x)=k=1akkHk1(x),f'\left( x \right) =\left( a_0+\sum_{k=1}^{\infty}{a_k\mathcal{H} _k\left( x \right)} \right) '=\sum_{k=1}^{\infty}{a_k\mathcal{H} _k'\left( x \right)}=\sum_{k=1}^{\infty}{a_k\sqrt{k}\mathcal{H} _{k-1}\left( x \right)},

因此发现

E[(f(X))2]=k=1ak2kk=1ak2=Var(f(X)).E\left[ \left( f'\left( X \right) \right) ^2 \right] =\sum_{k=1}^{\infty}{a_{k}^{2}k}\ge \sum_{k=1}^{\infty}{a_{k}^{2}}=Var\left( f\left( X \right) \right) .

八、(20分) (1) 请写出 P(λ)\mathcal{P}(\lambda) 的分布列;

(2) 请证明 P(λ)\mathcal{P}(\lambda) 的可加性;

(3) 利用中心极限定理证明: limnenk=0nnkk!=12\lim_{n\rightarrow \infty} e^{-n}\sum_{k=0}^n{\frac{n^k}{k!}}=\frac{1}{2}.

Solution: (1) 直接写出:

P(X=k)=λkk!eλ.P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}.

(2) 用特征函数, 泊松分布的特征函数是

eλ(eit1),e^{\lambda \left( e^{it}-1 \right)},

两个独立的泊松分布, XP(λ1)X\sim \mathcal{P}(\lambda_1), YP(λ2)Y\sim \mathcal{P}(\lambda_2), 且独立, 我们有 X+YX+Y 的特征函数是

e(λ1+λ2)(eit1),e^{(\lambda_1+\lambda_2) (e^{it}-1)},

由唯一性定理, X+YP(λ1+λ2)X+Y\sim \mathcal{P}(\lambda_1+\lambda_2).

(3) 设 YnP(n)Y_n\sim \mathcal{P}(n), 题设概率等同于 P(Ynn)P(Y_n \le n), 而由泊松分布可加性, 我们设 X1,X2,,XnX_1,X_2,\cdots,X_n 是 i.i.d. 的 P(1)\mathcal{P}(1), 则有 Yn=X1++XnY_n=X_1+\cdots+X_n, 根据中心极限定理, 有

limnP(Ynn)=limn(k=1nXnnn0)=Φ(0)=12.\lim_{n\rightarrow \infty} P\left( Y_n\le n \right) =\lim_{n\rightarrow \infty} \left( \frac{\sum_{k=1}^n{X_n}-n}{n}\le 0 \right) =\Phi \left( 0 \right) =\frac{1}{2}.

九、(10分) 设 X1,,XnX_1,\cdots,X_n 是i.i.d. 来自 U(0,θ)U(0,\theta) 的随机样本, 其次序统计量是 (X(1),,X(n))(X_{(1)},\cdots,X_{(n)}). 对于假设检验问题

H0:θ5vsH1:θ<5H_0:\theta \ge 5 \quad \mathrm{vs} \quad H_1:\theta <5

给定拒绝域 W={X(n)4}W=\{X_{(n)}\le 4\}, 要求第一类错误小于0.01, 问 nn 至少是多少?

Solution: 第一类错误是

α=sup{Pθ(XW):θ5}=P5(X(n)4)=(45)n,\alpha =\mathrm{sup}\left\{ P_{\theta}\left( X\in W \right) :\theta \ge 5 \right\} =P_5\left( X_{\left( n \right)}\le 4 \right) =\left( \frac{4}{5} \right) ^n,

令其 0.01\le 0.01, 解得

nln(0.01)ln(45)=2ln102ln2ln5=2ln10ln52ln2.n\ge \frac{\ln \left( 0.01 \right)}{\ln \left( \frac{4}{5} \right)}=\frac{-2\ln 10}{2\ln 2-\ln 5}=\frac{2\ln 10}{\ln 5-2\ln 2}.

用计算器可以算出 n21n\ge 21, 没有计算器就只能得到上面结论.

十、(10分) 设总体为均匀分布 U(θ,θ+1)U(\theta,\theta+1), θ\theta 的先验分布是 U(5,8)U(5,8), 现有观测值: 6.1, 6.5, 6.7, 6.9. 求 θ\theta 的后验分布.

Solution: 条件似然函数是

p(xθ)=I{x(n)1<θ<x(1)},p\left( x|\theta \right) =I_{\left\{ x_{\left( n \right) -1}<\theta <x_{\left( 1 \right)} \right\}},

(x,θ)(x,\theta) 的联合密度是

h(x,θ)=13I{x(n)1<θ<x(1)}=13I{5.9<θ<6.1},h\left( x,\theta \right) =\frac{1}{3}I_{\left\{ x_{\left( n \right) -1}<\theta <x_{\left( 1 \right)} \right\}}=\frac{1}{3}I_{\left\{ 5.9<\theta <6.1 \right\}},

积掉 θ\theta, 即 pX(x)=0.23p_X(x)=\frac{0.2}{3}, 故有

π(θx)=10.2I{5.9<θ<6.1},\pi(\theta|x) = \frac{1}{0.2}I_{\{5.9<\theta<6.1\}},

U(5.9,6.1)U(5.9,6.1).

十一、(15分) 设有来自总体 f(x;θ)f(x;\theta) 的 i.i.d. 样本 X1,,XnX_1,\cdots,X_n.

(1) 叙述充分统计量的定义;

(2) 若 f(x;θ)=θ(1θ)x,x=0,1,,f(x;\theta)=\theta (1-\theta)^{x}, x=0,1,\cdots, 判断 T=k=1nXkT=\sum_{k=1}^n X_k 是否为充分统计量.

Solution: (1) TTθ\theta 的充分统计量意味着条件分布

P(X=xT=t)P\left( X=x\mid T=t \right)

θ\theta 无关, 即样本中 TT 已经蕴含了 θ\theta 的所有信息.

其等价定义是“因子分解定理”, 即如果联合密度可以写成

p(X;θ)=C(X)S(θ)h(θ;T(X))p\left( X;\theta \right) =C\left( X \right) S\left( \theta \right) h\left( \theta ;T\left( X \right) \right)

的形式, 则 TTθ\theta 的充分统计量.

(2) 联合密度为

p(X;θ)=θn(1θ)k=1nxk=θn(1θ)k=1nxk,p\left( X;\theta \right) =\theta ^n\left( 1-\theta \right) ^{\sum_{k=1}^n{x_k}}=\theta ^n\cdot \left( 1-\theta \right) ^{\sum_{k=1}^n{x_k}},

根据因子分解定理, T=k=1nXkT=\sum_{k=1}^n X_k 是充分统计量.

十二、(15分) 设有来自 f(x;θ)=θxθ1,0<x<1f(x;\theta)= \theta x^{\theta-1},0<x<1 的 i.i.d. 样本 X1,,XnX_1,\cdots,X_n.

(1) 求 g(θ)=1θg(\theta)=\frac{1}{\theta} 的MLE;

(2) 第(1)问的MLE是否为有效估计?

Solution: (1) 似然函数和对数似然函数是

L(θ)=θnk=1nxkθ1,lnL(θ)=(θ1)k=1nlnxk+nlnθ,L\left( \theta \right) =\theta ^n\prod_{k=1}^n{x_{k}^{\theta -1}},\quad \ln L\left( \theta \right) =\left( \theta -1 \right) \sum_{k=1}^n{\ln x_k}+n\ln \theta ,

求导置零, 得 θ^=k=1nlnxkn\hat{\theta}=-\frac{\sum_{k=1}^n\ln x_k}{n}.

(2) 可以验证的是, 令 Y=lnXY=-\ln X, 有

P(Y=y)=P(lnX=y)=P(X=ey)=θe(θ1)yd(ey)=θeθydy,P\left( Y=y \right) =P\left( -\ln X=y \right) =P\left( X=e^{-y} \right) =\theta e^{-\left( \theta -1 \right) y}\left| d\left( e^{-y} \right) \right|=\theta e^{-\theta y}dy,

故有 E(Y)=1θE(Y)=\frac{1}{\theta}, Var(Y)=1θ2Var(Y)=\frac{1}{\theta^2}, 因而 E(θ^)=1θE(\hat{\theta})=\frac{1}{\theta}, Var(θ^)=1nθ2Var(\hat{\theta})=\frac{1}{n\theta^2}. 而对应的 Fisher 信息量是

I(θ)=E[(lnfθ)2]=E[(lnX1θ)2]=1θ2,I\left( \theta \right) =E\left[ \left( \frac{\partial \ln f}{\partial \theta} \right) ^2 \right] =E\left[ \left( -\ln X-\frac{1}{\theta} \right) ^2 \right] =\frac{1}{\theta ^2},

故 C-R 下界是

CR=[g(θ)]2nI(θ)=1nθ2=Var(θ^).\mathrm{CR}=\frac{\left[ g'\left( \theta \right) \right] ^2}{nI\left( \theta \right)}=\frac{1}{n\theta ^2}=Var\left( \hat{\theta} \right) .

因此 θ^\hat{\theta} 是有效估计.