中国科学技术大学-812概率论与数理统计-2016年

一、计算题(理由要充分.每小题8分,共88分)

  1. 连续抛掷一枚非均匀的硬币nn次, 且假设抛掷的结果并不独立: 第一次掷出正面的概率为α(0<α<1),\alpha(0<\alpha<1), 第二次后每次出现与前一次相同面的概率为β(0<β<1).\beta(0<\beta<1). 求第nn次出现正面的概率, 并讨论nn \rightarrow \infty时的极限情况.

Solution:
用事件 AnA_{n} 表示第 nn 次郑出的是正面, 则对于 n=1,2,n=1,2, \cdots

P(An+1)=P(An+1An)P(An)+P(An+1Aˉn)P(Aˉn)=βP(An)+(1β)(1P(An))\begin{aligned} P\left(A_{n+1}\right) &=P\left(A_{n+1} \mid A_{n}\right) P\left(A_{n}\right)+P\left(A_{n+1} \mid \bar{A}_{n}\right) P\left(\bar{A}_{n}\right) \\ &=\beta P\left(A_{n}\right)+(1-\beta)\left(1-P\left(A_{n}\right)\right) \end{aligned}

若记 pn=P(An)p_{n}=P\left(A_{n}\right), 则上式为一差分方程, 等式两侧同时减去 12\frac{1}{2}, 有

pn+112=(2β1)(pn12)p_{n+1}-\frac{1}{2}=(2 \beta-1)\left(p_{n}-\frac{1}{2}\right)

p1=αp_{1}=\alpha, 则 pn=12+(α12)(2β1)n1p_{n}=\frac{1}{2}+\left(\alpha-\frac{1}{2}\right)(2 \beta-1)^{n-1}. 显然有 limnpn=12\lim _{n \rightarrow \infty} p_{n}=\frac{1}{2}.

  1. 设随机变量XX的概率密度为f(x)=2(1x),f(x)=2(1-x), 其中0<x<1.0<x<1 . 试构造区间(0,1)上的一个单调递增函数g(x),g(x), 使得g(X)g(X)恰好服从参数为1的指数分布.

Solution: XX 的分布函数是 F(x)={0,x<01(1x)2,0x<1,1,x1F(x)= \begin{cases}0, & x<0 \\ 1-(1-x)^{2}, & 0 \leqslant x<1, \\ 1, & x \geqslant 1\end{cases} 于是令 U1=1(1X)2U(0,1)U_{1}=1-(1-X)^{2} \sim U(0,1), 而 U2=1U1U(0,1)U_{2}=1-U_{1} \sim U(0,1). YExp(1)Y \sim \operatorname{Exp}(1) 有分布函数 FY(y)={1ey,y00,y<0F_{Y}(y)=\left\{\begin{array}{ll}1-e^{-y}, & y \geqslant 0 \\ 0, & y<0\end{array}\right., 其反函数为 FY1(u)=ln(1u),0<u<1F_{Y}^{-1}(u)=-\ln (1-u), 0<u<1
ln(1U1)Exp(1)-\ln \left(1-U_{1}\right) \sim \operatorname{Exp}(1), 即 ln(U2)=2ln(1X)Exp(1)-\ln \left(U_{2}\right)=-2 \ln (1-X) \sim \operatorname{Exp}(1), 于是 取 g(x)=2ln(1x)g(x)=-2 \ln (1-x), 就有 g(X)Exp(1)g(X) \sim \operatorname{Exp}(1), 同时容易验证 g(x)g(x) 是单调增加的.

  1. 设随机变量XXYY的联合密度函数为

f(x,y)=ex,0<yx<f(x, y)=e^{-x}, \quad 0<y \leq x<\infty

试求XXYY的相关系数Corr(X,Y)\operatorname{Corr}(X, Y).

Solution:

fX(x)=0xex dy=xex,0<x<+f_{X}(x)=\int_{0}^{x} e^{-x} \mathrm{~d} y=x e^{-x}, 0<x<+\infty

fY(y)=y+ex dx=ey,0<y<+f_{Y}(y)=\int_{y}^{+\infty} e^{-x} \mathrm{~d} x=e^{-y}, 0<y<+\infty

其中 YExp(1)Y \sim \operatorname{Exp}(1), 于是 EY=1,Var(Y)=1E Y=1, \operatorname{Var}(Y)=1.
EX=0+x2ex dx=Γ(3)=2,EX2=0+x3ex dx=Γ(4)=6E X=\int_{0}^{+\infty} x^{2} e^{-x} \mathrm{~d} x=\Gamma(3)=2, E X^{2}=\int_{0}^{+\infty} x^{3} e^{-x} \mathrm{~d} x=\Gamma(4)=6
所以 Var(X)=64=2\operatorname{Var}(X)=6-4=2
EXY=0+dx0xxyex dy=0+xexx22 dx=12Γ(4)=3E X Y=\int_{0}^{+\infty} \mathrm{d} x \int_{0}^{x} x y e^{-x} \mathrm{~d} y=\int_{0}^{+\infty} x e^{-x} \frac{x^{2}}{2} \mathrm{~d} x=\frac{1}{2} \Gamma(4)=3
所以 Cov(X,Y)=EXYEXEY=321=1\operatorname{Cov}(X, Y)=E X Y-E X E Y=3-2 \cdot 1=1
于是 Corr(X,Y)=121=22\operatorname{Corr}(X, Y)=\frac{1}{\sqrt{2 \cdot 1}}=\frac{\sqrt{2}}{2}.

  1. 设有nn个球依次随机地放入nn个盒子中, 设每个球放入每个盒子中的概率相等, 求放完后空盒子个数的期望, 以及当nn \rightarrow \infty 时空盒子的平均比例.

Solution:
Xi={1, 第 i 个盒子空 0, 第 i 个盒子非空, X_{i}=\left\{\begin{array}{ll}1, & \text { 第 } i \text { 个盒子空 } \\ 0, & \text { 第 } i \text { 个盒子非空, }\end{array}\right.,则空盒子个数 Y=i=1nXiY=\sum_{i=1}^{n} X_{i}.
EXi=P(Xi=1)=P{nE X_{i}=P\left(X_{i}=1\right)=P\{n 个球均放在剩下 n1n-1 个空盒中 }=(n1n)n\}=\left(\frac{n-1}{n}\right)^{n}
于是 EY=i=1nEXi=n(11n)nE Y=\sum_{i=1}^{n} E X_{i}=n\left(1-\frac{1}{n}\right)^{n}.
空盒子的平均比例是 EYn=(11n)ne1E \frac{Y}{n}=\left(1-\frac{1}{n}\right)^{n} \rightarrow e^{-1}.

  1. 在一圆周上随机取三个点, 求这些点能落在同一个半圆上(即能找到一条直径使得它们在该直径的同一侧)的概率.

Solution:
设三个点分别为 A,B,C\mathrm{A}, \mathrm{B}, \mathrm{C}, 圆心记为 O\mathrm{O}, 不失一般性, 以 O\mathrm{O} 为原点, 取 OA\mathrm{OA}xx 轴正方向, 由于对称性, 仅考虑 α=BOAU(0,π)\alpha=\angle B O A \sim U(0, \pi), 点 C\mathrm{C} 先不取, 示意图如下,

显然当且仅当点 CC 落在红色区域时候, A,B,CA, B, C 三点不在一个半圆上, 而在 α\alpha 给定时, 这一概率是 α2π\frac{\alpha}{2 \pi}, 于是由连续场合的全概率公式

P{ 三点在同一侧半圆周 }=10πα2π1πdα=114π2π2=34P\{\text { 三点在同一侧半圆周 }\}=1-\int_{0}^{\pi} \frac{\alpha}{2 \pi} \cdot \frac{1}{\pi} \mathrm{d} \alpha=1-\frac{1}{4 \pi^{2}} \pi^{2}=\frac{3}{4}

  1. (X,Y)(X, Y)服从由xx 轴, yy 轴及直线x+y=1x+y=1 所围成的区域内的均匀分布, 求U=XYU=\frac{X}{Y}的概率密度函数.

Solution:
f(x,y)={1SD=2,(x,y)D0, 其他 f(x, y)=\left\{\begin{array}{ll}\frac{1}{S_{D}}=2, & (x, y) \in D \\ 0, & \text { 其他 }\end{array}\right., 其中 D={(x,y)x>0,y>0,x+y<1}D=\{(x, y) \mid x>0, y>0, x+y<1\}
用增补变量法, 令 {U=XYV=Y\left\{\begin{array}{l}U=\frac{X}{Y} \\ V=Y\end{array}\right., 反解可得 {X=UVY=V\left\{\begin{array}{l}X=U V \\ Y=V\end{array}\right., 则 J=vu01=vJ=\left|\begin{array}{ll}v & u \\ 0 & 1\end{array}\right|=v.

Duv={uv>0,v>0,uv+v<1}{u>0,0<v<1u+1}D_{u v}=\{u v>0, v>0, u v+v<1\} \Rightarrow\left\{u>0,0<v<\frac{1}{u+1}\right\}

(u,v)Duv,(U,V)\forall(u, v) \in D_{u v},(U, V) 有密度函数 g(u,v)=f(uv,v)J=2vg(u, v)=f(u v, v)|J|=2 v. 于是 UU 的边际密度函数是 gU(u)=01u+12v dv=1(u+1)2,u>0g_{U}(u)=\int_{0}^{\frac{1}{u+1}} 2 v \mathrm{~d} v=\frac{1}{(u+1)^{2}}, u>0

  1. 每个分量均为连续型随机变量的随机向量也是连续型的吗? 若不是, 请举例说明.

Solution: 假设 X,YX, Y 都是连续型随机变量, 但限制 X=YX=Y, 则 (X,Y)(X, Y) 不存在联合密度函数.

  1. 利用中心极限定理, 求拋一枚均匀的硬币, 至少要拋多少次才能保证正面出现的比例落在45%和55%之间的可能性不小于90%?

Solution:
Xi={1, 第 i 次掷出正面 0, 第 i 次掷出反面 X_{i}=\left\{\begin{array}{ll}1, & \text { 第 } i \text { 次掷出正面 } \\ 0, & \text { 第 } i \text { 次掷出反面 }\end{array}\right., 则 XiX_{i} i.i.d b(1,12)\sim b\left(1, \frac{1}{2}\right).
于是正面比例为 xˉ=1ni=1nXi\bar{x}=\frac{1}{n} \sum_{i=1}^{n} X_{i}. 且 Exˉ=12,Var(xˉ)=14nE \bar{x}=\frac{1}{2}, \operatorname{Var}(\bar{x})=\frac{1}{4 n}, 根据中心极限定 理

P(0.45xˉ0.55)=P(n10xˉ0.514nn10)2Φ(n10)10.9\begin{aligned} P(0.45 \leqslant \bar{x} \leqslant 0.55) &=P\left(-\frac{\sqrt{n}}{10} \leqslant \frac{\bar{x}-0.5}{\sqrt{\frac{1}{4 n}}} \leqslant \frac{\sqrt{n}}{10}\right) \\ & \approx 2 \Phi\left(\frac{\sqrt{n}}{10}\right)-1 \geqslant 0.9 \end{aligned}

所以 Φ(n10)0.95n101.645\Phi\left(\frac{\sqrt{n}}{10}\right) \geqslant 0.95 \Longrightarrow \frac{\sqrt{n}}{10} \geqslant 1.645

n16.45n270.6025\begin{aligned} \sqrt{n} & \geqslant 16.45 \\ n & \geqslant 270.6025 \end{aligned}

nn 至少为 271 .

  1. 设某电子产品的寿命服从如下分布:

F(x;α,β)={1exαβ,xα0,x<αF(x ; \alpha, \beta)=\left\{\begin{array}{ll} 1-e^{-\frac{x-\alpha}{\beta}}, & x \geq \alpha \\ 0, & x<\alpha \end{array}\right.

现测得nn个该电子产品的寿命为X1,X2,,Xn,X_{1}, X_{2}, \cdots, X_{n}, 试求未知参数α,β\alpha, \beta的矩估计和极大似然估计.

Solution:
总体服从双参数指数分布 Exp(α,1β)\operatorname{Exp}\left(\alpha, \frac{1}{\beta}\right), 其中 α\alpha 是位置参数, β\beta 是尺度参数, 所 以 EX=α+β,Var(X)=β2E X=\alpha+\beta, \operatorname{Var}(X)=\beta^{2}, 所以令 {xˉ=α+βs2=β2\left\{\begin{array}{l}\bar{x}=\alpha+\beta \\ s^{2}=\beta^2\end{array}\right., 解得矩估计是

{α^M=xˉsβ^M=s\left\{\begin{array}{l} \hat{\alpha}_{M}=\bar{x}-s \\ \hat{\beta}_{M}=s \end{array}\right.

样本的似然函数是

L(α,β)=1βnexp{i=1n(xiα)β}I{x(1)α}=1βnenxˉβeαβI{x(1)α}\begin{aligned} L(\alpha, \beta) &=\frac{1}{\beta^{n}} \exp \left\{-\frac{\sum_{i=1}^{n}\left(x_{i}-\alpha\right)}{\beta}\right\} \mathbf{I}_{\left\{x_{(1)} \geqslant \alpha\right\}} \\ &=\frac{1}{\beta^{n}} e^{-\frac{n \bar{x}}{\beta}} e^{\frac{\alpha}{\beta}} \mathbf{I}_{\left\{x_{(1)} \geqslant \alpha\right\}} \end{aligned}

显然它是关于 α\alpha(,x(1)]\left(-\infty, x_{(1)}\right] 上的增函数, 于是 α^L=x(1)\hat{\alpha}_{L}=x_{(1)}α\alpha 的极大似然估计. 再求 β\beta 的极大似然估计, 考虑将对数似然函数的偏导置零, 即

lnL(α,β)β=nβ+i=1n(xiα)β2=0\frac{\partial \ln L(\alpha, \beta)}{\partial \beta}=-\frac{n}{\beta}+\frac{\sum_{i=1}^{n}\left(x_{i}-\alpha\right)}{\beta^{2}}=0

解得 β=1ni=1n(xiα)\beta=\frac{1}{n} \sum_{i=1}^{n}\left(x_{i}-\alpha\right), 代入 α^L=x(1)\hat{\alpha}_{L}=x_{(1)}, 得 β^L=xˉx(1)\hat{\beta}_{L}=\bar{x}-x_{(1)}β\beta 的极大似然估计.

  1. 已知某种型号的导线电阻值服从正态分布N(μ,σ2),N\left(\mu, \sigma^{2}\right), 现测量16次, 算得样本均值为10.78欧姆, 样本标准差为1.40欧姆. 分别求均值μ\mu 和方差 σ2\sigma^{2}的置信水平为95%的置信区间(精确到小数点后两位).

Solution:
选取枢轴量 T=n(xˉμ)st(n1)T=\frac{\sqrt{n}(\bar{x}-\mu)}{s} \sim t(n-1), 则 μ\mu1α1-\alpha 的置信区间是

xˉ±snt1α2(n1)\bar{x} \pm \frac{s}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1)

此时 xˉ=10.78,s=1.4,n=16,t0.975(15)=2.132\bar{x}=10.78, s=1.4, n=16, t_{0.975}(15)=2.132, 代入上式, 得

10.78±1.442.132=[10.03,11.53]10.78 \pm \cdot \frac{1.4}{4} \cdot 2.132=[10.03,11.53]

选取枢轴量 χ2=(n1)s2σ2χ2(n1)\chi^{2}=\frac{(n-1) s^{2}}{\sigma^{2}} \sim \chi^{2}(n-1), 则 σ2\sigma^{2}1α1-\alpha 的置信区间是

[(n1)s2χ1a22(n1),(n1)s2χα22(n1)]\left[\frac{(n-1) s^{2}}{\chi_{1-\frac{a}{2}}^{2}(n-1)}, \frac{(n-1) s^{2}}{\chi_{\frac{\alpha}{2}}^{2}(n-1)}\right]

代入数据 s=1.4,n=16,χ0.9752(15)=27.488,χ0.0252(15)=6.262s=1.4, n=16, \chi_{0.975}^{2}(15)=27.488, \chi_{0.025}^{2}(15)=6.262, 得到

[15(1.4)227.488,15(1.4)26.262]=[1.07,4.70]\left[\frac{15 \cdot(1.4)^{2}}{27.488}, \frac{15 \cdot(1.4)^{2}}{6.262}\right]=[1.07,4.70]

  1. 设总体XN(μ1,σ12),YN(μ2,σ22),X \sim N\left(\mu_{1}, \sigma_{1}^{2}\right), Y \sim N\left(\mu_{2}, \sigma_{2}^{2}\right), 其中 μ1,μ2,σ12,σ22\mu_{1}, \mu_{2}, \sigma_{1}^{2}, \sigma_{2}^{2}均未知, 但 σ12=kσ22,k>0\sigma_{1}^{2}=k \sigma_{2}^{2}, k>0 为已知常数. 又设 X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n}Y1,Y2,,YmY_{1}, Y_{2}, \cdots, Y_{m}是分别来自总体XXYY的两个独立样本. 记它们的样本均值分别为Xˉ\bar{X}Yˉ,\bar{Y}, 样本方差分别为 SX2S_{X}^{2}SY2,S_{Y}^{2},

S2=(n1)SX2+k(m1)SY2n+m2S^{2}=\frac{(n-1) S_{X}^{2}+k(m-1) S_{Y}^{2}}{n+m-2}

对检验水平α(0<α<1),\alpha(0<\alpha<1), 现欲检验假设

H0:μ1=μ2H1:μ1μ2\mathrm{H}_{0}: \mu_{1}=\mu_{2} \leftrightarrow \mathrm{H}_{1}: \mu_{1} \neq \mu_{2}

试构造该检验所需的统计量T,T, 要求该统计量服从t分布, 并写出含有TT的拒绝域形式.

Solution:
xˉN(μ1,knσ22),yˉN(μ1,1mσ22)\bar{x} \sim N\left(\mu_{1}, \frac{k}{n} \sigma_{2}^{2}\right), \bar{y} \sim N\left(\mu_{1}, \frac{1}{m} \sigma_{2}^{2}\right), 于是

Z=(xˉyˉ)(μ1μ2)σ2kn+1mN(0,1)Z=\frac{(\bar{x}-\bar{y})-\left(\mu_{1}-\mu_{2}\right)}{\sigma_{2} \sqrt{\frac{k}{n}+\frac{1}{m}}} \sim N(0,1)

根据 Fisher 引理, xˉ\bar{x}sx2s_{x}^{2} 独立, 且 (n1)sx2kσ22χ2(n1)\frac{(n-1) s_{x}^{2}}{k \sigma_{2}^{2}} \sim \chi^{2}(n-1).
同理 yˉ\bar{y}sy2s_{y}^{2} 独立, 且 (m1)sy2σ22χ2(m1)\frac{(m-1) s_{y}^{2}}{\sigma_{2}^{2}} \sim \chi^{2}(m-1).
所以 χ2=(n1)sx2kσ22+(m1)sy2σ22=n+m2kσ22S2χ2(n+m2)\chi^{2}=\frac{(n-1) s_{x}^{2}}{k \sigma_{2}^{2}}+\frac{(m-1) s_{y}^{2}}{\sigma_{2}^{2}}=\frac{n+m-2}{k \sigma_{2}^{2}} S^{2} \sim \chi^{2}(n+m-2), 并且 χ2Z\chi^{2} 与 Z 是独立的. 所以

T=Zχ2/(n+m2)=k[(xˉyˉ)(μ1μ2)]kn+1mSt(n+m2)T=\frac{Z}{\sqrt{\chi^{2} /(n+m-2)}}=\frac{\sqrt{k}\left[(\bar{x}-\bar{y})-\left(\mu_{1}-\mu_{2}\right)\right]}{\sqrt{\frac{k}{n}+\frac{1}{m}} S} \sim t(n+m-2)

H0H_{0} 成立时, T=k(xˉyˉ)kn+1mSt(n+m2)T=\frac{\sqrt{k}(\bar{x}-\bar{y})}{\sqrt{\frac{k}{n}+\frac{1}{m}} S} \sim t(n+m-2) 可作为检验统计量, 显著性 水平为 α\alpha 的拒绝域是 W={Tt1α2(n+m2)}W=\left\{|T| \geqslant t_{1-\frac{\alpha}{2}}(n+m-2)\right\}.

二、(20分) 设某全套邮票由nn种不同类型的邮票组成, 某集邮爱好者每次等可能地获得其中一种. 记XnX_{n}表示他能聚齐全套nn种邮票所需集邮次数.

(1)(10分) 求XnX_{n}的数学期望和方差.

(2)(10分) 证明: 当nn \rightarrow \infty 时, Xn/(nlnn)X_{n} /(n \ln n)依概率收敛到1.

Solution:
(1) 用 Yi(i=0,1,,n1)Y_{i}(i=0,1, \cdots, n-1) 表示收集到第 ii 种邮票后, 新收集到一种邮票所 需的次数, 则显然诸 YiY_{i} 是独立的, 并且有

P(Y0=1)=1,YiGe(nin)(i=1,2,,n1)P\left(Y_{0}=1\right)=1, Y_{i} \sim G e\left(\frac{n-i}{n}\right)(i=1,2, \cdots, n-1)

EXn=E(i=0n1Yi)=i=0n1nni=nk=1n1kE X_{n}=E\left(\sum_{i=0}^{n-1} Y_{i}\right)=\sum_{i=0}^{n-1} \frac{n}{n-i}=n \sum_{k=1}^{n} \frac{1}{k}
Var(Xn)=i=0n1Var(Yi)=i=1n1n2(ni)2in=i=1n1n(ni)i2\operatorname{Var}\left(X_{n}\right)=\sum_{i=0}^{n-1} \operatorname{Var}\left(Y_{i}\right)=\sum_{i=1}^{n-1} \frac{n^{2}}{(n-i)^{2}} \frac{i}{n}=\sum_{i=1}^{n-1} \frac{n(n-i)}{i^{2}}
(2) 由于 E(Xnnlnn)=k=1n1klnn1E\left(\frac{X_{n}}{n \ln n}\right)=\frac{\sum_{k=1}^{n} \frac{1}{k}}{\ln n} \rightarrow 1, 以及 Var(Xnnlnn)=1n2ln2ni=1n1n(ni)i21ln2ni=1n11i20\operatorname{Var}\left(\frac{X_{n}}{n \ln n}\right)=\frac{1}{n^{2} \ln ^{2} n} \sum_{i=1}^{n-1} \frac{n(n-i)}{i^{2}} \leqslant \frac{1}{\ln ^{2} n} \sum_{i=1}^{n-1} \frac{1}{i^{2}} \rightarrow 0, 可知 Xnnlnnp1\frac{X_{n}}{n \ln n} \stackrel{p}{\rightarrow} 1.

三、(24分) 设总体服从参数为λ>0\lambda>0的Poisson分布, 且X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n}为一组来自此总体的简单随机样本. 又设

Tn=i=1nXi,g^(λ)=(11n)Tn,g(λ)=eλT_{n}=\sum_{i=1}^{n} X_{i}, \quad \hat{g}(\lambda)=\left(1-\frac{1}{n}\right)^{T_{n}}, \quad g(\lambda)=e^{-\lambda}

(1)(8分) 问 g^\hat{g} 是否为gg的无偏估计? 证明你的结论.

(2)(8分) 求 g^\hat{g} 的方差.

(3)(8分) 证明: g^\hat{g} 的方差没有达到无偏估计方差的Cramer-Rao下界, 但当 nn \rightarrow \infty时它们之比趋向1.

Solution: (1) 由于 Tn=i=1nXiPoisson(nλ)T_{n}=\sum_{i=1}^{n} X_{i} \sim \operatorname{Poisson}(n \lambda), 则

E(g^)=k=0(11n)k(nλ)kk!enλ=k=0[λ(n1)]kk!eλ(n1)eλ=eλE(\hat{g})=\sum_{k=0}^{\infty}\left(1-\frac{1}{n}\right)^{k} \frac{(n \lambda)^{k}}{k !} e^{-n \lambda}=\sum_{k=0}^{\infty} \frac{[\lambda(n-1)]^{k}}{k !} e^{-\lambda(n-1)} e^{-\lambda}=e^{-\lambda}

所以 g^\hat{g}eλe^{-\lambda} 的无偏估计.
(2)

E(g^2)=k=0(11n)2k(nλ)kk!enλ=k=0[(n2+1n)λ]kk!e(n2+1n)λe(21n)λ=e(21n)λVar(g^)=E(g^2)(Eg^)2=e(21n)λe2λ=e2λ(eλn1)\begin{aligned} E\left(\hat{g}^{2}\right) &=\sum_{k=0}^{\infty}\left(1-\frac{1}{n}\right)^{2 k} \frac{(n \lambda)^{k}}{k !} e^{-n \lambda} \\ &=\sum_{k=0}^{\infty} \frac{\left[\left(n-2+\frac{1}{n}\right) \lambda\right]^{k}}{k !} e^{\left(n-2+\frac{1}{n}\right) \lambda} e^{-\left(2-\frac{1}{n}\right) \lambda}=e^{-\left(2-\frac{1}{n}\right) \lambda} \\ \operatorname{Var}(\hat{g}) &=E\left(\hat{g}^{2}\right)-(E \hat{g})^{2}=e^{-\left(2-\frac{1}{n}\right) \lambda}-e^{-2 \lambda}=e^{-2 \lambda}\left(e^{\frac{\lambda}{n}}-1\right) \end{aligned}

(3) 先计算 Poisson 分布的 Fisher 信息量

I(λ)=E[lnP(X;λ)λ]2=E(Xλ1)2=1λ2E(Xλ)2=1λI(\lambda)=E\left[\frac{\partial \ln P(X ; \lambda)}{\partial \lambda}\right]^{2}=E\left(\frac{X}{\lambda}-1\right)^{2}=\frac{1}{\lambda^{2}} E(X-\lambda)^{2}=\frac{1}{\lambda}

g(λ)=eλg(\lambda)=e^{-\lambda} 的无偏估计的方差的 C-R 下界是 [g(λ)]2nI(λ)=λne2λ\frac{\left[g^{\prime}(\lambda)\right]^{2}}{n I(\lambda)}=\frac{\lambda}{n} e^{-2 \lambda}
e2λ(eλn1)>λne2λe^{-2 \lambda}\left(e^{\frac{\lambda}{n}}-1\right)>\frac{\lambda}{n} e^{-2 \lambda}, 所以 g^\hat{g} 的方差达不到 CR\mathrm{C}-\mathrm{R} 下界, 但是

limne2λ(eλn1)λne2λ=limx0+ex1x=1\lim _{n \rightarrow \infty} \frac{e^{-2 \lambda}\left(e^{\frac{\lambda}{n}}-1\right)}{\frac{\lambda}{n} e^{-2 \lambda}}=\lim _{x \rightarrow 0+} \frac{e^{x}-1}{x}=1

四、(18分) 设总体XX的概率分布如下表所示, 其中p>0p>0为未知参数.

XX -1 0 1
PP 2p2 p 15p1-5 p 3p3 p

现有一样本容量n=60n=60的简单随机样本, 其中0出现了30次, 1和-1均出现了15次.

(1)(9分) 求pp的极大似然估计p^\hat{p}的值;

(2)(9分) 在显著性水平α=0.05\alpha=0.05下, 利用p^\hat{p}和拟合优度检验, 我们能否可以认为“该组样本来自于总体XX”?

Solution:
(1) 样本的似然函数是 L(p)=(2p)n1(15p)n0(3p)n1L(p)=(2 p)^{n_{1}}(1-5 p)^{n_{0}}(3 p)^{n_{1}}, 其中 nin_{i} 表示的是取到 ii 的样本数量, 将对数似然函数的导数置 0 , 有

dlnL(p)dp=n1p5n015p+n1p=0\frac{\mathrm{d} \ln L(p)}{\mathrm{d} p}=\frac{n_{-1}}{p}-\frac{5 n_{0}}{1-5 p}+\frac{n_{1}}{p}=0

代入 n1=n1=15,n0=30n_{-1}=n_{1}=15, n_{0}=30, 解得 pp 的极大似然估计 p^=0.1\hat{p}=0.1.

(2) χ2=(1512)212+(3030)230+(1518)218=1.25\chi^{2}=\frac{(15-12)^{2}}{12}+\frac{(30-30)^{2}}{30}+\frac{(15-18)^{2}}{18}=1.25
χ2χH0(1)\chi^{2} \sim \chi^{H_{0}}(1), 该检验的拒绝域是 W={χ2χ0.952(1)}={χ23.841}W=\left\{\chi^{2} \geqslant \chi_{0.95}^{2}(1)\right\}=\left\{\chi^{2} \geqslant 3.841\right\}
由于 1.25W1.25 \notin W, 可知此时我们应该接受原假设, 即认为该组样本确实是来 自于总体 XX.