复旦大学-432统计学-2021年

一、(15分) 某平面上有无数条距离为2的等距平行线, 先投掷一边长为1的正三角形, 求三角形交于平行线的概率.

Solution:
ABC\triangle A B C 的三条边分别为 a,b,ca, b, c. 则三角形与平行线相交有以下几种情况:(1) 三角形的一个顶点在平行线上; (2)三角形的一条边与直线重合; (3)三角形的两条 边与平行线相交.
根据概率的几何概型 P(1)=P(2)=0P(1)=P(2)=0, 因此仅需要考虑情况(3). 而 P(3)=Pab+Pac+PbcP(3)=P_{a b}+P_{a c}+P_{b c}, 其中 PabP_{a b} 表示边 aba 、 b 与平行线相交. 为此,记 PaP_{a} 表示边 aa 与平行线相交, 则 Pa=Pac+PabP_{a}=P_{a c}+P_{a b}. 故

P(3)=12(Pa+Pb+Pc),P(3)=\frac{1}{2}\left(P_{a}+P_{b}+P_{c}\right),

现仅需要求出 PaPbPcP_{a} 、 P_{b} 、 P_{c}. 这是一个 Buffon 投针模型, 其概率是 Pa=2adπP_{a}=\frac{2 a}{d \pi}, 其中 aa 是边 aa 的长度, dd 是平行 线之间的间距,代入数据可算得 Pa=22π=1πP_{a}=\frac{2}{2 \pi}=\frac{1}{\pi}. 同理 Pb=Pc=1πP_{b}=P_{c}=\frac{1}{\pi}. 故

P{ 三角形压到直线 }=P(3)=12(Pa+Pb+Pc)=32π.P\{\text { 三角形压到直线 }\}=P(3)=\frac{1}{2}\left(P_{a}+P_{b}+P_{c}\right)=\frac{3}{2 \pi}.

二、(15分) 甲乙两人抛硬币, 若正面朝上则甲赢1元, 反面朝上乙赢1元. 共进行20轮, 最终两人皆不输不赢. 已知甲初始没有钱, 问在整个过程中甲不欠钱的概率.

Solution:
用折线法, 题设问题是: 从点 (0,0)(0,0) 随机游走到点 (20,0)(20,0), 期间不能触碰直线 y=1y=-1. 首先, 从点 (0,0)(0,0) 随机游走到点 (20,0)(20,0) 总计有 C2010C_{20}^{10} 种(20 次中, 甲赢 10 次). 从点 (0,0)(0,0) 随机游走到与 (20,0)(20,0) 关于 y=1y=-1 对称的点 (20,2)(20,-2) 总计有种 C209C_{20}^{9} 种. 故 题设事件的概率是:

P(A)=1C209C2010=111.\mathrm{P}(A)=1-\frac{C_{20}^{9}}{C_{20}^{10}}=\frac{1}{11}.

三、(15分) X0,,Xn,X_0,\cdots,X_n,\cdots是i.i.d.的服从U(0,1)U(0,1)的随机变量, 记

N=inf{n1:Xn>X0},N=\inf \{ n\ge1:X_n>X_0 \},

NN的分布律.

Solution:
先计算给定 X0=xX_{0}=x 时的条件分布, 它类似几何分布:

P(N=kX0=x)=Pk1(X1x)P(Xk>x)=xk1(1x)\begin{aligned} \mathrm{P}\left(N=k \mid X_{0}=x\right) &=\mathrm{P}^{k-1}\left(X_{1} \leq x\right) \mathrm{P}\left(X_{k}>x\right) \\ &=x^{k-1}(1-x) \end{aligned}

由连续场合的全概率公式, 有 P(N=k)=01xk1(1x)dx=1k(k+1)\mathrm{P}(N=k)=\int_{0}^{1} x^{k-1}(1-x) d x=\frac{1}{k(k+1)}.

四、(15分) X1,,XnX_1,\cdots,X_n是i.i.d.的随机变量, P(X=1)=0.4,P(X=0.5)=0.6\mathrm{P}(X=1)=0.4,\mathrm{P}(X=-0.5)=0.6. 令Sn=(1+X1)(1+X2)(1+Xn)S_n=(1+X_1)(1+X_2)\cdots(1+X_n), 问E(Sn)\mathrm{E}(S_n)SnS_n是否收敛? 若收敛, 求其极限.

Solution:
E(Sn)=i=1nE(1+Xi)=(1.1)n+\mathrm{E}\left(S_{n}\right)=\prod_{i=1}^{n} \mathrm{E}\left(1+X_{i}\right)=(1.1)^{n} \rightarrow+\infty, 期望不收敛; 由强大数律
1nlnSn=1ni=1nln(1+Xi) a.s. Eln(1+X1)=15ln2<0\frac{1}{n} \ln S_{n}=\frac{1}{n} \sum_{i=1}^{n} \ln \left(1+X_{i}\right) \stackrel{\text { a.s. }}{\longrightarrow} \operatorname{Eln}\left(1+X_{1}\right)=-\frac{1}{5} \ln 2<0,
Sn a.s. limnexp{n5ln2}=0.S_{n} \stackrel{\text { a.s. }}{\longrightarrow} \lim _{n \rightarrow \infty} \exp \left\{-\frac{n}{5} \ln 2\right\}=0 .

五、(15分) 投掷一枚硬币, 连续出现三次同面则停止, 记投掷次数为NN, 求EN\mathrm{E}N.

Solution:
A2,A1,A0,A1,A2A_{-2}, A_{-1}, A_{0}, A_{1}, A_{2} 分别表示状态 “刚刚连续投出 2 次反面”、“刚刚连续投出 1 次反面”、初始状态”、“刚刚连续投出 1 次正面”、“刚刚连续投出 2 次正面”. 设 XX 表示从当前状态开始, 连续三次同面而停止的次数, 则有:

E[XA2]=12+12(E[XA1]+1)E[XA1]=12(E[XA2]+1)+12(E[XA1]+1)E[XA0]=12(E[XA1]+1)+12(E[XA1]+1)E[XA1]=12(E[XA1]+1)+12(E[XA2]+1)E[XA2]=12+12(E[XA1]+1)\begin{aligned} \mathrm{E}\left[X \mid A_{-2}\right] &=\frac{1}{2}+\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{1}\right]+1\right) \\ \mathrm{E}\left[X \mid A_{-1}\right] &=\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{-2}\right]+1\right)+\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{1}\right]+1\right) \\ E\left[X \mid A_{0}\right] &=\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{-1}\right]+1\right)+\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{1}\right]+1\right) \\ \mathrm{E}\left[X \mid A_{1}\right] &=\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{-1}\right]+1\right)+\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{2}\right]+1\right) \\ \mathrm{E}\left[X \mid A_{2}\right] &=\frac{1}{2}+\frac{1}{2}\left(\mathrm{E}\left[X \mid A_{-1}\right]+1\right) \end{aligned}

很明显该问题具有对称性, 设

x=E[XA2]=E[XA2],y=E[XA1]=E[XA1],z=E[XA0],x=E\left[X \mid A_{-2}\right]=E\left[X \mid A_{2}\right], y=E\left[X \mid A_{-1}\right]=E\left[X \mid A_{1}\right], z=E\left[X \mid A_{0}\right],

故有

{x=12+12(y+1),y=12(x+1)+12(y+1),z=12(y+1)+12(y+1),{x12y=1,xy=2,z=y+1,{x=4,y=6,z=7.\begin{cases} x=\frac{1}{2}+\frac{1}{2}\left( y+1 \right) ,\\ y=\frac{1}{2}\left( x+1 \right) +\frac{1}{2}\left( y+1 \right) ,\\ z=\frac{1}{2}\left( y+1 \right) +\frac{1}{2}\left( y+1 \right) ,\\ \end{cases}\Longrightarrow \begin{cases} x-\frac{1}{2}y=1,\\ x-y=-2,\\ z=y+1,\\ \end{cases}\Longrightarrow \begin{cases} x=4,\\ y=6,\\ z=7.\\ \end{cases}

EN=E[XA0]=7\mathrm{E} N=\mathrm{E}\left[X \mid A_{0}\right]=7.

六、(15分) X1,X2X_1,X_2独立同服从N(0,1)N(0,1), 求X1X2\frac{X_1}{X_2}X12X22\frac{X_{1}^2}{X_{2}^2}的分布.

Solution:
Y=X1X2Cau(0,1)Y=\frac{X_{1}}{X_{2}} \sim \operatorname{Cau}(0,1), 令 Z=Y2Z=Y^{2},

P(Zz)=P(zYz)=20z1π(1+x2)dx=2πarctanz\begin{aligned} \mathrm{P}(Z \leq z) &=\mathrm{P}(-\sqrt{z} \leq Y \leq \sqrt{z}) \\ &=2 \int_{0}^{\sqrt{z}} \frac{1}{\pi\left(1+x^{2}\right)} d x \\ &=\frac{2}{\pi} \arctan \sqrt{z} \end{aligned}

求导后, 有密度函数

fZ(z)=1π(1+z)z,z>0f_{Z}(z)=\frac{1}{\pi(1+z) \sqrt{z}}, z>0

换句话说, 由于 Yt(1)Y \sim t(1), 故 Z=Y2F(1,1)Z=Y^{2} \sim F(1,1).

七、(10分) 简答题:
(1)(5分) 叙述充分统计量的定义.
(2)(5分) 叙述C-R不等式.

Solution:
(1) 充分统计量是充分蕴含了样本刻画参数信息的统计量, 当充分统计量 TT 给定时, 样本的条件分布 f(x1,,xnT=t)f\left(x_{1}, \cdots, x_{n} \mid T=t\right) 与参数无关.
(2) C-R 不等式是指一类总体(满足正则性条件: 积分求导可以换序)考虑参数的函数的无偏估计时方差会具有一个下界, 若对 g(θ)g(\theta) 作估计, C-R 下界是 [g(θ)]2nI(θ)\frac{\left[g^{\prime}(\theta)\right]^{2}}{n I(\theta)}, 其中 I(θ)=E[lnf(X;θ)θ]2I(\theta)=\mathrm{E}\left[\frac{\partial \ln f(X ; \theta)}{\partial \theta}\right]^{2} 是费雪信息量.

八、(10分) 有来自总体f(x)=2x,0<x<1f(x)=2x,0<x<1的10个随机样本X1,,X10X_1,\cdots,X_{10}, 问X(3)X(6)\frac{X_{(3)}}{X_{(6)}}X(6)X_{(6)}是否独立, 请说明理由.

Solution:
(U=X(3)X(6),V=X(6))\left(U=\frac{X_{(3)}}{X_{(6)}}, V=X_{(6)}\right) 的联合分布是:

f(u,v)=vfX(3),X(6)(uv,v)=Cv11(1v2)4u5(1u2)2\begin{aligned} f(u, v) &=v f_{X_{(3)}, X_{(6)}}(u v, v) \\ &=C v^{11}\left(1-v^{2}\right)^{4} u^{5}\left(1-u^{2}\right)^{2} \end{aligned}

其中, u(0,1),v(0,1)u \in(0,1), v \in(0,1), 定义域是矩形且可以因式分解, 故 U,VU, V 独立.

九、(10分) 有来自总体N(μ,1)N(\mu,1)nn个随机样本X1,,XnX_1,\cdots,X_n, 证明:Xˉ\bar{X}是充分统计量.

Solution:
联合密度函数可以写成

f(x1,,xn;μ)=Cexp{i=1n(xiμ)22}=Cexp{2μi=1nxi+nμ2+i=1nxi22}\begin{aligned} f\left(x_{1}, \cdots, x_{n} ; \mu\right) &=C \exp \left\{-\frac{\sum_{i=1}^{n}\left(x_{i}-\mu\right)^{2}}{2}\right\} \\ &=C \exp \left\{-\frac{-2 \mu \sum_{i=1}^{n} x_{i}+n \mu^{2}+\sum_{i=1}^{n} x_{i}^{2}}{2}\right\} \end{aligned}

由因子分解定理, Xˉ\bar{X} 是充分统计量.

十、(10分) 有来自总体U(θ,2θ)U(\theta,2\theta)nn个随机样本X1,,XnX_1,\cdots,X_n, 求θ\theta的最大似然估计, 并判断其无偏性与相合性.

Solution:
似然函数是

L(θ)=1θnI{x(1)>θ>x(w)2},L(\theta)=\frac{1}{\theta^{n}} I_{\left\{x_{(1)}>\theta>\frac{x_{(w)}}{2}\right\}},

前面部分关于 θ\theta 单调递减, 示性函数说明 θ\theta 最小取 x(n)2\frac{x_{(n)}}{2}, 因此最大似然估计是 θ^=X(n)2\hat{\theta}=\frac{X_{(n)}}{2}. 令 Y=XθθU(0,1)Y=\frac{X-\theta}{\theta} \sim U(0,1), 故 Y(n)Beta(n,1)Y_{(n)}\sim Beta(n,1), 因此 EY(n)=nn+11\mathrm{E} Y_{(n)}=\frac{n}{n+1}\to 1, Var(Y(n))=n(n+1)2(n+2)0Var(Y_{(n)})=\frac{n}{(n+1)^2(n+2)}\to 0, 故 Y(n)P1Y_{(n)} \stackrel{P}{\longrightarrow} 1, 故有

Eθ^=2n+12n+2θθ,θ^Pθ\mathrm{E} \hat{\theta}=\frac{2 n+1}{2 n+2} \theta \neq \theta, \quad \hat{\theta} \stackrel{P}{\longrightarrow} \theta \text {. }

这说明它有偏, 但仍然是相合估计.

十一、(10分) 有来自总体N(μ,σ2)N(\mu,\sigma^2)nn个随机样本X1,,XnX_1,\cdots,X_n, 其中μ\mu已知, 令

σ^=1nπ2i=1nXiμ,\hat{\sigma}=\frac{1}{n}\sqrt{\frac{\pi}{2}}\sum_{i=1}^n{\left| X_i-\mu \right|},

验证σ^\hat{\sigma}σ\sigma的无偏估计, 但不是有效估计.

Solution:
先计算 σ2\sigma^{2} 的 Fisher 信息量, 根据定义

I(σ2)=E[lnf(X;σ2)σ2]2=14σ4E[(Xμσ)21]2,I\left(\sigma^{2}\right)=E\left[\frac{\partial \ln f\left(X ; \sigma^{2}\right)}{\partial \sigma^{2}}\right]^{2}=\frac{1}{4 \sigma^{4}} E\left[\left(\frac{X-\mu}{\sigma}\right)^{2}-1\right]^{2},

恰好 E[(Xμσ)21]2E\left[\left(\frac{X-\mu}{\sigma}\right)^{2}-1\right]^{2}χ2(1)\chi^{2}(1) 的方差, 故 I(σ2)=12σ4I\left(\sigma^{2}\right)=\frac{1}{2 \sigma^{4}}. 令 g(x)=xg(x)=\sqrt{x}, 则 σ\sigma 的 C-R 下界为 [g(σ2)]2nI(σ2)=12nσ2\frac{\left[g^{\prime}\left(\sigma^{2}\right)\right]^{2}}{n I\left(\sigma^{2}\right)}=\frac{1}{2 n} \sigma^{2}, 我们再去计算 1nπ2i=1nXiμ\frac{1}{n} \sqrt{\frac{\pi}{2}} \sum_{i=1}^{n}\left|X_{i}-\mu\right| 的期望方差:

1σEX1μ=+x12πex22dx=2π0+xex22dx=2πEX1μ=2πσ,EX1μ2=σ2, 故 Var(X1μ)=σ22πσ2=(12π)σ2,\begin{gathered} \frac{1}{\sigma} E\left|X_{1}-\mu\right|=\int_{-\infty}^{+\infty}|x| \frac{1}{\sqrt{2 \pi}} e^{-\frac{x^{2}}{2}} d x=\sqrt{\frac{2}{\pi}} \int_{0}^{+\infty} x e^{-\frac{x^{2}}{2}} d x=\sqrt{\frac{2}{\pi}} \Rightarrow E\left|X_{1}-\mu\right|=\sqrt{\frac{2}{\pi}} \sigma, \\ E\left|X_{1}-\mu\right|^{2}=\sigma^{2}, \text { 故 } \operatorname{Var}\left(\left|X_{1}-\mu\right|\right)=\sigma^{2}-\frac{2}{\pi} \sigma^{2}=\left(1-\frac{2}{\pi}\right) \sigma^{2}, \end{gathered}

E[1nπ2i=1nXiμ]=σ,Var[1nπ2i=1nXiμ]=(π21)nσ2,E\left[\frac{1}{n} \sqrt{\frac{\pi}{2}} \sum_{i=1}^{n}\left|X_{i}-\mu\right|\right]=\sigma, \operatorname{Var}\left[\frac{1}{n} \sqrt{\frac{\pi}{2}} \sum_{i=1}^{n}\left|X_{i}-\mu\right|\right]=\frac{\left(\frac{\pi}{2}-1\right)}{n} \sigma^{2},

它是无偏估计, 但没有达到 C-R 下界, 不是有效估计.

十二、(10分) 有来自总体P(θ)\mathcal P(\theta)nn个随机样本, 考虑假设检验问题:

H0:θ=2vsH1:θ=3,\mathrm{H}_0:\theta=2 \quad \mathrm{vs} \quad \mathrm{H}_1:\theta=3,

有拒绝域W={xˉ2.8}W=\{ \bar{x} \ge 2.8\}, 问
(1)(5分) n=5n=5时, 犯两类错误的概率分别是多少?
(2)(5分) nn趋于无穷时, 犯两类错误的概率会有什么变化? 请说明.

Solution:
(1) 第一类错误是:

α=Pθ=2{Xˉ2.8}=Pθ=2{i=15Xi14}=k=1410kk!e10\begin{aligned} \alpha &=\mathrm{P}_{\theta=2}\{\bar{X} \geq 2.8\} \\ &=\mathrm{P}_{\theta=2}\left\{\sum_{i=1}^{5} X_{i} \geq 14\right\} \\ &=\sum_{k=14}^{\infty} \frac{10^{k}}{k !} e^{-10} \end{aligned}

第二类错误是:

β=Pθ=3{Xˉ<2.8}=Pθ=3{i=15Xi<14}=k=01315kk!e15\begin{aligned} \beta &=\mathrm{P}_{\theta=3}\{\bar{X}<2.8\} \\ &=\mathrm{P}_{\theta=3}\left\{\sum_{i=1}^{5} X_{i}<14\right\} \\ &=\sum_{k=0}^{13} \frac{15^{k}}{k !} e^{-15} \end{aligned}

(2)由大数定律:

α=Pθ=2{Xˉ2.8}Pθ=2{Xˉ20.8}0β=Pθ=3{Xˉ<2.8}Pθ=3{Xˉ3>0.2}0\begin{aligned} \alpha &=\mathrm{P}_{\theta=2}\{\bar{X} \geq 2.8\} \\ & \leq \mathrm{P}_{\theta=2}\{|\bar{X}-2| \geq 0.8\} \longrightarrow 0 \\ \beta &=\mathrm{P}_{\theta=3}\{\bar{X}<2.8\} \\ & \leq \mathrm{P}_{\theta=3}\{|\bar{X}-3|>0.2\} \longrightarrow 0 \end{aligned}

所以当样本量趋于无穷时, 两类错误都会趋于 0 .