复旦大学-432统计学-2018年

一、(20分) 从1-10中不放回选3个数字, 求以下概率
(1)(5分) 最小数字是5;
(2)(5分) 最大数字是5;
(3)(5分) 至少一个小于6;
(4)(5分) 一个小于5, 一个等于5, 一个大于5.

Solution:

(1) #Ω=C103=120\# \Omega=C_{10}^{3}=120, #A A1=1C52=10,P(A1)=#A1#Ω=112A_{1}=1 \cdot C_{5}^{2}=10, P\left(A_{1}\right)=\frac{\# A_{1}}{\# \Omega}=\frac{1}{12}.

(2) #A2=1C42=6,P(A2)=#A2#Ω=120\# A_{2}=1 \cdot C_{4}^{2}=6, P\left(A_{2}\right)=\frac{\# A_{2}}{\# \Omega}=\frac{1}{20}.

(3) #A3=C53=10,P(A3)=1#A3#Ω=1112\# \overline{A_{3}}=C_{5}^{3}=10, P\left(A_{3}\right)=1-\frac{\# \overline{A_{3}}}{\# \Omega}=\frac{11}{12}.

(4) #A4=415=20,P(A4)=#A4#Ω=16\# A_{4}=4 \cdot 1 \cdot 5=20, P\left(A_{4}\right)=\frac{\# A_{4}}{\# \Omega}=\frac{1}{6}.

二、(15分) 你在重复尝试一个成功概率为 pp 的事件, 直至连续出现两次成功或两次失败才停止, 求你 以两次成功停止的概率.

Solution:

AA “以两次成功停止”", p0=P(A),p1=P(Ap_{0}=P(A), p_{1}=P(A \mid 第一次成功 ),p1=P), p_{-1}=P (AA \mid 第一次失败 )), 根据全概率公式:

{p0=p1p+p1(1p)p1=p+p1(1p)p1=p1p \left\{\begin{array}{l} p_{0}=p_{1} \cdot p+p_{-1} \cdot(1-p) \\ p_{1}=p+p_{-1} \cdot(1-p) \\ p_{-1}=p_{1} \cdot p \end{array}\right.

解得 p0=p2(2p)1p(1p)p_{0}=\frac{p^{2}(2-p)}{1-p(1-p)}.

三、(15分) 求二项分布, (a,b)(a,b)上均匀分布, 伽马分布的期望和方差.

Solution:

(1) 二项分布: XB(n,p),P(X=k)=Cnkpk(1p)nk,k=0,1,,nX \sim B(n, p), P(X=k)=C_{n}^{k} p^{k}(1-p)^{n-k}, k=0,1, \ldots, n,

EX=k=0nkn!k!(nk)!pk(1p)nk=npk=1n(n1)!(k1)!(nk)!pk1(1p)nk=np,E X=\sum_{k=0}^{n} k \frac{n !}{k !(n-k) !} p^{k}(1-p)^{n-k}=n p \sum_{k=1}^{n} \frac{(n-1) !}{(k-1) !(n-k) !} p^{k-1}(1-p)^{n-k}=n p,

EX(X1)=k=0nk(k1)Cnkpk(1p)nk=n(n1)p2k=2nCn2k2pk2(1p)nk=n(n1)p2,E X(X-1)=\sum_{k=0}^{n} k(k-1) C_{n}^{k} p^{k}(1-p)^{n-k}=n(n-1) p^{2} \sum_{k=2}^{n} C_{n-2}^{k-2} p^{k-2}(1-p)^{n-k}=n(n-1) p^{2},

因此 EX2=n(n1)p2+np,DX=EX2(EX)2=n(n1)p2+npn2p2=np(1p)E X^{2}=n(n-1) p^{2}+n p, D X=E X^{2}-(E X)^{2}=n(n-1) p^{2}+n p-n^{2} p^{2}=n p(1-p).

(2)均匀分布: XU(a,b),f(x)=1ba,a<x<bX \sim U(a, b), f(x)=\frac{1}{b-a}, a<x<b,

EX=abxbadx=a+b2,DX=ab(xa+b2)21badx=(ba)212.E X=\int_{a}^{b} \frac{x}{b-a} d x=\frac{a+b}{2}, D X=\int_{a}^{b}\left(x-\frac{a+b}{2}\right)^{2} \frac{1}{b-a} d x=\frac{(b-a)^{2}}{12} .

(3)伽马分布: XGa(α,λ),f(x)=λαΓ(α)xα1eλx,x>0X \sim G a(\alpha, \lambda), f(x)=\frac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha-1} e^{-\lambda x}, x>0,

EX=0+λαΓ(α)xαeλxdx=1λΓ(α)0+(λx)αeλxd(λx)=Γ(α+1)λΓ(α)=αλ,E X=\int_{0}^{+\infty} \frac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha} e^{-\lambda x} d x=\frac{1}{\lambda \Gamma(\alpha)} \int_{0}^{+\infty}(\lambda x)^{\alpha} e^{-\lambda x} d(\lambda x)=\frac{\Gamma(\alpha+1)}{\lambda \Gamma(\alpha)}=\frac{\alpha}{\lambda},

EX2=0+λαΓ(α)xα+1eλxdx=1λ2Γ(α)0+(λx)α+1eλxd(λx)=Γ(α+2)λ2Γ(α)=α(α+1)λE X^{2}=\int_{0}^{+\infty} \frac{\lambda^{\alpha}}{\Gamma(\alpha)} x^{\alpha+1} e^{-\lambda x} d x=\frac{1}{\lambda^{2} \Gamma(\alpha)} \int_{0}^{+\infty}(\lambda x)^{\alpha+1} e^{-\lambda x} d(\lambda x)=\frac{\Gamma(\alpha+2)}{\lambda^{2} \Gamma(\alpha)}=\frac{\alpha(\alpha+1)}{\lambda},
DX=EX2(EX)2=α(α+1)λ2α2λ2=αλ2.D X=E X^{2}-(E X)^{2}=\frac{\alpha(\alpha+1)}{\lambda^{2}}-\frac{\alpha^{2}}{\lambda^{2}}=\frac{\alpha}{\lambda^{2}} .

四、(20分) 证明E(X2)<E\left(X^{2}\right)<\infty的充要条件是级数nP(X>n)\sum n P(|X|>n)收敛.

Solution:
Y=XY=|X|, 且 FFYY 的分布函数, 则

E(Y2)=0+y2dF(y)=0+0y2tdtdF(y)=20+tt+dF(y)dt=20+tP(Y>t)dt,E\left( Y^2 \right) =\int_0^{+\infty}{y^2dF\left( y \right)}=\int_0^{+\infty}{\int_0^y{2tdt}dF\left( y \right)}=2\int_0^{+\infty}{t\int_t^{+\infty}{dF\left( y \right) dt}}=2\int_0^{+\infty}{tP\left( Y>t \right) dt},

一方面有

0+tP(Y>t)dt=k=0kk+1tP(Y>t)dtk=0kk+1(k+1)P(Y>k)dt=k=0(k+1)P(Y>k),\int_0^{+\infty}{tP\left( Y>t \right) dt}=\sum_{k=0}^{\infty}{\int_k^{k+1}{tP\left( Y>t \right) dt}}\le \sum_{k=0}^{\infty}{\int_k^{k+1}{\left( k+1 \right) P\left( Y>k \right) dt}}=\sum_{k=0}^{\infty}{\left( k+1 \right) P\left( Y>k \right)},

右侧和kP(X>k)\sum kP(|X|>k)同敛散, 这说明了kP(X>k)\sum kP(|X|>k)收敛能推出E(Y2)E(Y^2)存在.

同时我们还有

0+tP(Y>t)dt=k=0kk+1tP(Y>t)dtk=0kk+1kP(Y>k+1)dt=k=0kP(Y>k+1)=k=1(k1)P(Y>k),\int_0^{+\infty}{tP\left( Y>t \right) dt}=\sum_{k=0}^{\infty}{\int_k^{k+1}{tP\left( Y>t \right) dt}}\ge \sum_{k=0}^{\infty}{\int_k^{k+1}{kP\left( Y>k+1 \right) dt}}=\sum_{k=0}^{\infty}{kP\left( Y>k+1 \right)}=\sum_{k=1}^{\infty}{\left( k-1 \right) P\left( Y>k \right)},

右侧仍然和kP(X>k)\sum kP(|X|>k)同敛散, 这说明 E(Y2)E(Y^2) 存在可以推出kP(X>k)\sum kP(|X|>k)收敛. 证明已经结束.

五、(20分) X1,X2,X3X_{1}, X_{2}, X_{3}是取自期望为α\alpha的指数分布的随机样本, 求概率 P(X1<X2<X3)P\left(X_{1}<X_{2}<X_{3}\right) 以及 X(1)X_{(1)} 的概率密度.

Solution:
根据轮换对称性, P(X1<X2<X3)=16P\left(X_{1}<X_{2}<X_{3}\right)=\frac{1}{6}. 令 Y=X(1)Y=X_{(1)}, 则当 y>0y>0 时, 1F(y)=P{Y>y}=P3{X1>y}=e3αy1-F(y)=P\{Y>y\}=P^{3}\left\{X_{1}>y\right\}=e^{-\frac{3}{\alpha} y}, 故 f(y)=3αe3αy,y>0f(y)=\frac{3}{\alpha} e^{-\frac{3}{\alpha} y}, y>0. 这恰好是 Exp(3α)\operatorname{Exp}\left(\frac{3}{\alpha}\right).

六、(20分) P(Xi=0.3)=P(Xi=0.4)=12,i=1,2,,n,P\left(X_{i}=-0.3\right)=P\left(X_{i}=0.4\right)=\frac{1}{2}, i=1,2, \ldots, n, 相互独立, 构造随机变量序列Yn=i=1n(Xi+1),Y_{n}=\prod_{i=1}^{n}\left(X_{i}+1\right),YnY_{n}的极限并证明YnY_{n}的期望趋于无穷.

Solution:
由强大数律, 1nlnYn=1ni=1nln(Xi+1) a.s. Eln(X1+1)=12ln0.98<0\frac{1}{n} \ln Y_{n}=\frac{1}{n} \sum_{i=1}^{n} \ln \left(X_{i}+1\right) \stackrel{\text { a.s. }}{\longrightarrow} E \ln \left(X_{1}+1\right)=\frac{1}{2} \ln 0.98<0, 故 lnYn a.s. ,Yn a.s. 0\ln Y_{n} \stackrel{\text { a.s. }}{\longrightarrow}-\infty, Y_{n} \stackrel{\text { a.s. }}{\longrightarrow} 0, 因此 YnY_{n} 的极限是单点分布, 以概率 1 取 0 . 而

EYn=i=1nE(Xi+1)=i=1n(0.7+1.42)=1.05n+.E Y_{n}=\prod_{i=1}^{n} E\left(X_{i}+1\right)=\prod_{i=1}^{n}\left(\frac{0.7+1.4}{2}\right)=1.05^{n} \rightarrow+\infty.

七、(20分) 有一堆球: 2红, 3黑, 4白. 从中随机摸一个球, 如果是黑色则记你赢, 如果是其他颜色, 则有放回的继续摸球, 直至重复出现该颜色或黑色为止, 如果出现你第一次摸到的颜色, 则你赢, 否则你输. 求你赢的概率.

Solution:
AkA_k为第kk次赢的概率, 待求结果为P(A)=P(k=1Ak)=k=1P(Ak)P(A)=P(\bigcup_{k=1}^{\infty}A_k)=\sum_{k=1}^{\infty}P(A_k).
(i) 第一次赢的概率P(A1)=13P(A_1)=\frac{1}{3}.
(ii) 第kk次赢(k>1k>1)表明: 第一次未摸到黑球, 后续的2,3,...,k12,3,...,k-1次没有摸到黑也没有摸到你第一次摸中的颜色, 最后第kk次摸中了最初的颜色, 这一概率肯定与你最初摸到的颜色有关, 考虑全概率公式P(Ak)=P(R)P(AkR)+P(W)P(AkW)P(A_k)=P(R)P(A_k|R)+P(W)P(A_k|W), 其中RR表示摸到红, WW表示摸到白, 有

P(AkR)=(49)k229,P(AkW)=(29)k249.P\left( A_k|R \right) =\left( \frac{4}{9} \right) ^{k-2}\frac{2}{9},\quad P\left( A_k\mid W \right) =\left( \frac{2}{9} \right) ^{k-2}\frac{4}{9}.

因此

P(Ak)=P(R)29(49)k2+P(W)49(29)k2=481(49)k2+1681(29)k2.P\left( A_k \right) =P\left( R \right) \frac{2}{9}\left( \frac{4}{9} \right) ^{k-2}+P\left( W \right) \frac{4}{9}\left( \frac{2}{9} \right) ^{k-2}=\frac{4}{81}\left( \frac{4}{9} \right) ^{k-2}+\frac{16}{81}\left( \frac{2}{9} \right) ^{k-2}.

进行求和, 有

P(A)=P(A1)+481(149)+1681(129)=13+445+1663=71105.P\left( A \right) =P\left( A_1 \right) +\frac{4}{81\left( 1-\frac{4}{9} \right)}+\frac{16}{81\left( 1-\frac{2}{9} \right)}=\frac{1}{3}+\frac{4}{45}+\frac{16}{63}=\frac{71}{105}.

八、(20分)
(1)(10分) 解释相合估计;
(2)(10分) X1,,XnX_{1}, \ldots, X_{n}是来自一个同一个总体的样本, 写出一个中位数的相合估计, 并说明理由.

Solution:
(1) g^\hat{g}gg 的相合估计意味着 g^pg\hat{g} \stackrel{p}{\rightarrow} g, 这说明了 g^\hat{g} 是一个很好的估计, 至少在样本量 nn 较大时, 它偏离 gg 的概率极小. 更进一步, 如果说 g^\hat{g}gg 的强相合估计意味着 g^ a.s. g\hat{g} \stackrel{\text { a.s. }}{\longrightarrow} g.

(2) 样本中位数 X[n2]X_{\left[\frac{n}{2}\right]} 就是总体中位数 x0.5x_{0.5} 的相合估计量, 设总体密度函数为 f(x)f(x), 有样本中位数的渐近正态分布

X[n2]N(x0.5,14nf2(x0.5)),X_{\left[\frac{n}{2}\right]} \sim N\left(x_{0.5}, \frac{1}{4 n f^{2}\left(x_{0.5}\right)}\right),

由其渐近正态分布可以得到

P(X[n2]x0.5<ε)=P(2nf(x0.5)X[n2]x0.5<2nf(x0.5)ε)Φ(2nf(x0.5)ε)Φ(2nf(x0.5)ε)1. P\left( \left| X_{\left[ \frac{n}{2} \right]}-x_{0.5} \right|<\varepsilon \right) =P\left( 2\sqrt{n}f\left( x_{0.5} \right) \left| X_{\left[ \frac{n}{2} \right]}-x_{0.5} \right|<2\sqrt{n}f\left( x_{0.5} \right) \varepsilon \right) \sim \Phi \left( 2\sqrt{n}f\left( x_{0.5} \right) \varepsilon \right) -\Phi \left( -2\sqrt{n}f\left( x_{0.5} \right) \varepsilon \right) \rightarrow 1.

上式说明了样本中位数 X[n2]X_{\left[\frac{n}{2}\right]} 就是总体中位数x0.5x_{0.5} 的相合估计量.