北大叉院-849统计学-2020年

一、(15分) 有5根线段, 长度分别为1,3,5,7,9厘米, 先从中随机抽取3根, 求能够组成三角形的概率.

Solution:
符合题意的事件可写为 A={{3,5,7},{3,7,9},{5,7,9}}A=\{\{3,5,7\},\{3,7,9\},\{5,7,9\}\}, 所以

P(A)=3C53=310P(A)=\frac{3}{C_{5}^{3}}=\frac{3}{10}

二、(15分) 甲、乙两人独立射击一目标, 命中目标的概率是0.6, 0.8. 现已知目标被击中, 求乙击中的概率.

Solution:
用事件 AA 表示甲射中, 事件 BB 表示乙命中, 则

P(BAB)=P(B)P(AB)=0.810.40.2=0.80.92=2023P(B \mid A \cup B)=\frac{P(B)}{P(A \cup B)}=\frac{0.8}{1-0.4 \cdot 0.2}=\frac{0.8}{0.92}=\frac{20}{23}

三、(15分) 已知随机变量NP(λ)N\sim \mathcal P(\lambda), X0=0X_0=0, 而X1,,XnX_1,\cdots,X_n是i.i.d.服从B(1,p)B(1,p)的随机变量, 试证:

i=0NXiP(λp).\sum_{i=0}^{N} X_i \sim \mathcal P(\lambda p).

Solution:
Y=i=0NXiY=\sum_{i=0}^{N} X_{i}, 则由全概率公式, 对 k=0,1,k=0,1, \cdots, 有

P(Y=k)=n=kP(i=1nXi=k)P(N=n)=n=kCnkpk(1p)nkλnn!eλ=n=kn!k!(nk)!(λp)k[λ(1p)]nk1n!eλ=(λp)kk!eλn=k[λ(1p)]nk(nk)!=(λp)kk!eλj=0[λ(1p)]jj!=(λp)kk!eλeλ(1p)=(λp)kk!eλp\begin{aligned} P(Y=k) &=\sum_{n=k}^{\infty} P\left(\sum_{i=1}^{n} X_{i}=k\right) P(N=n) \\ &=\sum_{n=k}^{\infty} C_{n}^{k} p^{k}(1-p)^{n-k} \frac{\lambda^{n}}{n !} e^{-\lambda} \\ &=\sum_{n=k}^{\infty} \frac{n !}{k !(n-k) !}(\lambda p)^{k}[\lambda(1-p)]^{n-k} \frac{1}{n !} e^{-\lambda} \\ &=\frac{(\lambda p)^{k}}{k !} e^{-\lambda} \sum_{n=k}^{\infty} \frac{[\lambda(1-p)]^{n-k}}{(n-k) !} \\ &=\frac{(\lambda p)^{k}}{k !} e^{-\lambda} \sum_{j=0}^{\infty} \frac{[\lambda(1-p)]^{j}}{j !} \\ &=\frac{(\lambda p)^{k}}{k !} e^{-\lambda} \cdot e^{\lambda(1-p)}=\frac{(\lambda p)^{k}}{k !} e^{-\lambda p} \end{aligned}

YP(λp)Y \sim \mathcal{P}(\lambda p).

四、(15分) 已知甲袋中有1个黑球和kk个白球, 乙袋中有k+1k+1个白球, 每次从两袋中各取一球进行交换, 记交换nn次后黑球在甲袋的概率为pnp_n, 试证:

limnpn=12.\underset{n\rightarrow \infty}{\lim} p_n =\frac{1}{2}.

Solution: 用事件 AnA_{n} 表示交换 nn 次后黑球还在甲袋, 则由全概率公式, 对于 n=0,1,n=0,1, \cdots

P(An+1)=P(An+1An)P(An)+P(An+1Aˉn)P(Aˉn)=kk+1pn+1k+1(1pn)=k1k+1pn+1k+1\begin{aligned} P\left(A_{n+1}\right) &=P\left(A_{n+1} \mid A_{n}\right) P\left(A_{n}\right)+P\left(A_{n+1} \mid \bar{A}_{n}\right) P\left(\bar{A}_{n}\right) \\ &=\frac{k}{k+1} p_{n}+\frac{1}{k+1}\left(1-p_{n}\right) \\ &=\frac{k-1}{k+1} p_{n}+\frac{1}{k+1} \end{aligned}

注意到 pn+1=P(An+1)p_{n+1}=P\left(A_{n+1}\right), 则上式可写为

pn+1=k1k+1pn+1k+1pn+112=k1k+1(pn12)\begin{array}{r} p_{n+1}=\frac{k-1}{k+1} p_{n}+\frac{1}{k+1} \\ p_{n+1}-\frac{1}{2}=\frac{k-1}{k+1}\left(p_{n}-\frac{1}{2}\right) \end{array}

k=1k=1 时, pn12p_{n} \equiv \frac{1}{2}; 当 k>1k>1 时, pn120p_{n}-\frac{1}{2} \rightarrow 0, 所以 pn12p_{n} \rightarrow \frac{1}{2}.

五、(15分) 随机向量(X,Y)(X,Y)的密度函数是

f(x,y)={ke3x4y,x>0,y>0,0,其他,f\left( x,y \right) =\begin{cases} ke^{-3x-4y},& x>0,y>0,\\ 0,& \text{其他},\\ \end{cases}

(1)(5分) 求kk;

(2)(5分) 求P(0<X<1,0<Y<2)\mathrm{P}(0<X<1,0<Y<2);

(3)(5分) 求(X,Y)(X,Y)的分布函数.

Solution:
(1)
由概率密度函数的正则性知
0+dx0+ke3x4ydy=k0+e3xdx0+e4ydy=k12=1\int_{0}^{+\infty} d x \int_{0}^{+\infty} k e^{-3 x-4 y} d y=k \int_{0}^{+\infty} e^{-3 x} d x \int_{0}^{+\infty} e^{-4 y} d y=\frac{k}{12}=1 解得 k=12k=12.

(2) 容易发现 XExp(3)X \sim \operatorname{Exp}(3)YExp(4)Y \sim \operatorname{Exp}(4) 是相互独立的, 所以

P(0<X<1,0<Y<2)=FX(1)FY(2)=(1e3)(1e8)P(0<X<1,0<Y<2)=F_{X}(1) F_{Y}(2)=\left(1-e^{-3}\right)\left(1-e^{-8}\right)

(3)
根据独立性可知,

F(x,y)=FX(x)FY(y)={(1e3x)(1e4y),x0,y00, 其他 F(x, y)=F_{X}(x) F_{Y}(y)= \begin{cases}\left(1-e^{-3 x}\right)\left(1-e^{-4 y}\right), & x \geqslant 0, y \geqslant 0 \\ 0, & \text { 其他 }\end{cases}

六、(15分) 已知X1,,XnX_1,\cdots,X_n是i.i.d.f(x)=2λxeλx2I[x>0]\sim f(x)=2\lambda xe^-{\lambda x^2}I_{[x>0]}的随机样本, 其中λ>0\lambda>0是未知参数.

(1)(5分) 求λ\lambda的MLE;

(2)(5分) 验证无偏性;

(3)(5分) 验证相合性.

Solution:
(1)
似然函数为 L(λ)=2nλn(i=1nxi)eλi=1nxi2L(\lambda)=2^{n} \lambda^{n}\left(\prod_{i=1}^{n} x_{i}\right) e^{-\lambda \sum_{i=1}^{n} x_{i}^{2}}, 取对数处理, 有

lnL(λ)=nln2+nlnλ+i=1nlnxiλi=1nxi2\ln L(\lambda)=n \ln 2+n \ln \lambda+\sum_{i=1}^{n} \ln x_{i}-\lambda \sum_{i=1}^{n} x_{i}^{2}

dlnL dλ=nλi=1nxi2=0\frac{\mathrm{d} \ln L}{\mathrm{~d} \lambda}=\frac{n}{\lambda}-\sum_{i=1}^{n} x_{i}^{2}=0, 解得驻点 λ^=ni=1nxi2\hat{\lambda}=\frac{n}{\sum_{i=1}^{n} x_{i}^{2}}. 又由于 d2lnL dλ2=nλ2<0\frac{\mathrm{d}^{2} \ln L}{\mathrm{~d} \lambda^{2}}=-\frac{n}{\lambda^{2}}<0, 于是所求驻点是对数似然函数的极大值点, 综上所述 λ^=ni=1nxi2\hat{\lambda}=\frac{n}{\sum_{i=1}^{n} x_{i}^{2}}λ\lambda 的 MLE.

(2)
作总体变换, 令 Y=X2Y=X^{2}, 则 YfY(y)=λeλy,y>0Y \sim f_{Y}(y)=\lambda e^{-\lambda y}, y>0. 即 Xi2X_{i}^{2} 相互独立服从 参数为 λ\lambda 的指数分布, 因为 g(t)=1tg(t)=\frac{1}{t}(0,+)(0,+\infty) 上是严格凸函数, 所以由 Jensen 不等式

E(λ^)=E(ni=1nxi2)>n1E(i=1nxi2)=nn1λ=λE(\hat{\lambda})=E\left(\frac{n}{\sum_{i=1}^{n} x_{i}^{2}}\right)>n \frac{1}{E\left(\sum_{i=1}^{n} x_{i}^{2}\right)}=\frac{n}{n \frac{1}{\lambda}}=\lambda

于是 λ^\hat{\lambda} 不是 λ\lambda 的无偏估计. (需要注意地是, Jensen 不等式的取等条件为 “ g(t)g(t) 几乎处处是线性函数”,而此处显然不是,于是 Jensen 不等式严格成立. ) 或者利用 xi2Ga(n,λ)\sum x_{i}^{2} \sim G a(n, \lambda), 计算得到 E(ni=1nxi2)=nn1λE\left(\frac{n}{\sum_{i=1}^{n} x_{i}^{2}}\right)=\frac{n}{n-1} \lambda, 同样可以说明 它不是无偏估计, 但显然不如 Jensen 不等式来得快.
(3)
由于 Xi2X_{i}^{2} 相互独立, 均服从参数为 λ\lambda 的指数分布, 则根据强大数定律, 有

i=1nxi2n1λ, a.s. \frac{\sum_{i=1}^{n} x_{i}^{2}}{n} \rightarrow \frac{1}{\lambda}, \text { a.s. }

ni=1nxi2λ,a.s.\frac{n}{\sum_{i=1}^{n} x_{i}^{2}} \rightarrow \lambda, a . s ., 即 λ^\hat{\lambda}λ\lambda 的强相合估计.

七、(15分) X1,,XnX_1,\cdots,X_n是来自密度函数f(x)=2θ2x3I[xθ]f(x)=\frac{2\theta^2}{x^3}I_{[x\ge \theta]}的随机样本, 求θ\theta的矩估计与最大似然估计.

Solution:
EX=θ+2θ2x3dx=2θ2(1x)θ+=2θE X=\int_{\theta}^{+\infty} \frac{2 \theta^{2}}{x^{3}} d x=\left.2 \theta^{2}\left(-\frac{1}{x}\right)\right|_{\theta} ^{+\infty}=2 \theta, 所以 θ\theta 的矩估计是 θ^M=xˉ2\hat{\theta}_{M}=\frac{\bar{x}}{2}.
似然函数 L(θ)=2ni=1nxi3θ2nI{x(1)θ}L(\theta)=\frac{2^{n}}{\prod_{i=1}^{n} x_{i}^{3}} \theta^{2 n} I_{\left\{x_{(1)} \geqslant \theta\right\}}θ\theta(0,x(1)]\left(0, x_{(1)}\right] 上的单调增加函数, 所以 θ^L=x(1)\hat{\theta}_{L}=x_{(1)}θ\theta 的最大似然估计.

八、(15分) X1,,XnX_1,\cdots,X_n是i.i.d.的随机变量序列, 且EX1=μ\mathrm{E}X_1=\mu, Var(X1)=σ2\mathrm{Var}(X_1)=\sigma^2存在, 证明:

nXˉμσdN(0,1).\sqrt{n}\frac{\bar{X}-\mu}{\sigma}\xrightarrow{d}N\left( 0,1 \right) .

Solution:
Yi=XiμσY_{i}=\frac{X_{i}-\mu}{\sigma}, 并记其特征函数为 φY(t)\varphi_{Y}(t), 则 Zn=nXˉμσ=1ni=1nYiZ_{n}=\sqrt{n} \frac{\bar{X}-\mu}{\sigma}=\frac{1}{\sqrt{n}} \sum_{i=1}^{n} Y_{i} 有特征函数 φZn(t)=[φY(tn)]n\varphi_{Z_{n}}(t)=\left[\varphi_{Y}\left(\frac{t}{\sqrt{n}}\right)\right]^{n}.
由于 EYi=0,EYi2=Var(Yi)=1E Y_{i}=0, E Y_{i}^{2}=\operatorname{Var}\left(Y_{i}\right)=1, 于是 φY(t)=0,φY(t)=1\varphi_{Y}^{\prime}(t)=0, \varphi_{Y}^{\prime \prime}(t)=-1. 将 φY(tn)\varphi_{Y}\left(\frac{t}{\sqrt{n}}\right)t=0t=0 处展开, 有 φY(tn)=112t2n+o(1n)\varphi_{Y}\left(\frac{t}{\sqrt{n}}\right)=1-\frac{1}{2} \frac{t^{2}}{n}+o\left(\frac{1}{n}\right), 所以

φZn(t)=[112t2n+o(1n)]net22\varphi_{Z_{n}}(t)=\left[1-\frac{1}{2} \frac{t^{2}}{n}+o\left(\frac{1}{n}\right)\right]^{n} \rightarrow e^{-\frac{t^{2}}{2}}

右侧恰是标准正态分布的特征函数, 由连续性定理知

nXˉμσdN(0,1)\sqrt{n} \frac{\bar{X}-\mu}{\sigma} \stackrel{d}{\rightarrow} N(0,1)

九、(15分) X1,,XnX_1,\cdots,X_n是来自总体U(0,θ)U(0,\theta)的随机样本, 试求

(1)(7分) θ\theta的最大似然估计;

(2)(8分) θ\theta1α1-\alpha置信区间.

Solution:
(1)
似然函数 L(θ)=1θnI{x(n)θ}L(\theta)=\frac{1}{\theta^{n}} I_{\left\{x_{(n)} \leqslant \theta\right\}}θ\theta[x(n),1)\left[x_{(n)}, 1\right) 上的单调递减函数, 因此 θ\theta 的极 大似然估计是 x(n)x_{(n)}.
(2)
由于 T=x(n)θBeta(n,1)T=\frac{x_{(n)}}{\theta} \sim \operatorname{Beta}(n, 1), 以此为枢轴量, 令

P(cTd)=1αdncn=1α\begin{aligned} P(c \leqslant T \leqslant d) &=1-\alpha \\ d^{n}-c^{n} &=1-\alpha \end{aligned}

反解得到此时的置信区间为 [x(n)d,x(n)c]\left[\frac{x_{(n)}}{d}, \frac{x_{(n)}}{c}\right], 现即求 1c1d\frac{1}{c}-\frac{1}{d}dncn=1αd^{n}-c^{n}=1-\alpha 下的最小值, 由消元法易得 d=1,c=α1nd=1, c=\alpha^{\frac{1}{n}} (消元法指的是用约束条件消去一个变量), 故置信区间是

[x(n),x(n)α1n]\left[x_{(n)}, x_{(n)} \alpha^{-\frac{1}{n}}\right]

十、(15分) X1,,XnX_1,\cdots,X_n是来自总体N(μ,σ2)N(\mu,\sigma^2)的随机样本, 试给出一个σ\sigma的无偏估计.

Solution:
考虑基于样本标准差 s=i=1n(xixˉ)2n1s=\sqrt{\frac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}{n-1}} 来构造 σ\sigma 的无偏估计. 由于

T=(n1)s2σ2χn12T=\frac{\left( n-1 \right) s^2}{\sigma ^2}\sim \chi _{n-1}^{2}

所以

ET=0+t12(12)n12Γ(n12)tn121e12tdt=2Γ(n12)0+(t2)n22e12td(t2)=2Γ(n2)Γ(n12)\begin{aligned} E \sqrt{T} &=\int_{0}^{+\infty} t^{\frac{1}{2}} \frac{\left(\frac{1}{2}\right)^{\frac{n-1}{2}}}{\Gamma\left(\frac{n-1}{2}\right)} t^{\frac{n-1}{2}-1} e^{-\frac{1}{2} t} d t \\ &=\frac{\sqrt{2}}{\Gamma\left(\frac{n-1}{2}\right)} \int_{0}^{+\infty}\left(\frac{t}{2}\right)^{\frac{n-2}{2}} e^{-\frac{1}{2} t} d\left(\frac{t}{2}\right)=\frac{\sqrt{2} \Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{n-1}{2}\right)} \end{aligned}

于是 Es=σn1ET=σn12Γ(n2)Γ(n12)E s=\frac{\sigma}{\sqrt{n-1}} E \sqrt{T}=\frac{\sigma}{\sqrt{n-1}} \frac{\sqrt{2} \Gamma\left(\frac{n}{2}\right)}{\Gamma\left(\frac{n-1}{2}\right)}. 因此 σ\sigma 的无偏估计是 n12Γ(n12)Γ(n2)s\sqrt{\frac{n-1}{2}} \frac{\Gamma\left(\frac{n-1}{2}\right)}{\Gamma\left(\frac{n}{2}\right)} s.