复旦大学-432统计学-2024年

一、(10分) 8 部车随机地停在一列12个位置的停车场内, 求 4 个空位恰好连在一起的概率.

Solution:

总样本点个数为 #Ω=C124\#\Omega = C_{12}^4, 而 4 个空位连在一起的情况数只有 #A=9\#A=9, 因此 P(A)=155P(A)=\frac{1}{55}.

Remark: 应坚刚《概率论》原题.

二、(10分) 将 nn 个球随机地放进 nn 个盒子中, 记空盒个数为 XX, 求 XX 的期望与方差.

Solution: 记 Xi=1X_i = 1 表示第 ii 个盒子无球, 则有 X=i=1nXiX = \sum_{i=1}^n X_i, 故有期望

E(X)=nE(X1)=n(11n)n,E(X) = n E(X_1) = n \left(1-\frac{1}{n}\right)^n,

以及方差

Var(X)=nVar(X1)+n(n1)Cov(X1,X2)=n[(11n)n(1(11n)n)]+n(n1)[(12n)n(11n)2n].\begin{aligned} Var(X) &= n Var(X_1) + n(n-1)Cov(X_1,X_2) \\ &= n \left[\left(1-\frac{1}{n}\right)^n \cdot \left( 1- \left(1-\frac{1}{n}\right)^n \right)\right] + n(n-1) \left[ \left(1-\frac{2}{n}\right)^n - \left(1-\frac{1}{n}\right)^{2n} \right]. \end{aligned}

Remark: 《考前一天20个知识点》命中. 实际也是九阳神功中科大812-2019-第一题重现.

三、(10分) 设区域 DD(0,0)(0,0), (1,0)(1,0), (1,1)(1,1) 围成的三角形区域, (X,Y)(X,Y) 服从 DD 上的均匀分布, 求 ρ(X,Y)\rho(X,Y).

Solution: SD=12S_D=\frac{1}{2}, 于是 f(x,y)={2,(x,y)D,0, 其他. f(x, y)=\left\{\begin{array}{ll}2, & (x, y) \in D, \\ 0, & \text { 其他. }\end{array}\right. 于是

EX=012x dx0x dy=012x2 dx=23,EX2=012x2 dx0x dy=012x3 dx=12,Var(X)=1249=118,EY=012 dx0xy dy=01x2 dx=13EY2=012 dx0xy2 dy=0123x3 dx=16,Var(Y)=1613=118,\begin{aligned} E X & =\int_0^1 2 x \mathrm{~d} x \int_0^x \mathrm{~d} y=\int_0^1 2 x^2 \mathrm{~d} x=\frac{2}{3}, \\ E X^2 & =\int_0^1 2 x^2 \mathrm{~d} x \int_0^x \mathrm{~d} y=\int_0^1 2 x^3 \mathrm{~d} x=\frac{1}{2}, \\ \operatorname{Var}(X) & =\frac{1}{2}-\frac{4}{9}=\frac{1}{18}, \\ E Y & =\int_0^1 2 \mathrm{~d} x \int_0^x y \mathrm{~d} y=\int_0^1 x^2 \mathrm{~d} x=\frac{1}{3} \\ E Y^2 & =\int_0^1 2 \mathrm{~d} x \int_0^x y^2 \mathrm{~d} y=\int_0^1 \frac{2}{3} x^3 \mathrm{~d} x=\frac{1}{6}, \\ \operatorname{Var}(Y) & =\frac{1}{6}-\frac{1}{3}=\frac{1}{18}, \end{aligned}

EXY=012x dx0xy dy=01x3 dx=14E X Y=\int_0^1 2 x \mathrm{~d} x \int_0^x y \mathrm{~d} y=\int_0^1 x^3 \mathrm{~d} x=\frac{1}{4} ,于是

Cov(X,Y)=EXYEXEY=142313=136,\operatorname{Cov}(X, Y)=E X Y-E X E Y=\frac{1}{4}-\frac{2}{3} \frac{1}{3}=\frac{1}{36},

ρXY=Cov(X,Y)Var(X)Var(Y)=136118118=12\rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{\operatorname{Var}(X) \operatorname{Var}(Y)}}=\frac{\frac{1}{36}}{\sqrt{\frac{1}{18} \frac{1}{18}}}=\frac{1}{2}.

Remark: 九阳神功北大849-2017-第二题重现.

四、(10分) 设 X1,X2X_1,X_2 独立同服从 N(μ,σ2)N(\mu,\sigma^2), 证明: Emax{X1,X2}=μ+σπE\max\{X_1,X_2\} = \mu + \frac{\sigma}{\sqrt{\pi}}.

Solution: 利用 max{X1,X2}=X+Y+XY2\max\{X_1,X_2\} = \frac{X+Y+|X-Y|}{2} 即可, 详见茆书3.4.18原题.

Remark: 《考前一天20个知识点》命中. 同时也是茆书3.4.18原题.

五、(10分) 证明: E(X)E(|X|) 存在与 k=0P(X>k)\sum_{k=0}^{\infty} P(|X|>k) 等价.

Solution: 设 FFY=XY=|X| 的分布函数, 则

E(Y)=0+ydF(y)=0+0ydtdF(y)=0+t+dF(y)dt=0+P(Y>t)dt,E\left( Y \right) =\int_0^{+\infty}{y\mathrm{d}F\left( y \right)}=\int_0^{+\infty}{\int_0^y{\mathrm{d}t}\mathrm{d}F\left( y \right)}=\int_0^{+\infty}{\int_t^{+\infty}{\mathrm{d}F\left( y \right) \mathrm{d}t}}=\int_0^{+\infty}{P\left( Y>t \right) \mathrm{d}t},

P(Y>t)P(Y>t) 关于tt单调递减趋于0, 根据积分-级数的同收散性质, 这个积分和k=0P(Y>k)\sum_{k=0}^{\infty} P(Y>k)同敛散.

Remark : 《考前一天20个知识点》命中.

六、(10分) X,YX,Y 独立同服从标准柯西分布, 密度函数是 f(x)=1π(1+x2)f(x) =\frac{1}{\pi(1+x^2)}, 证明: X+Y2\frac{X+Y}{2} 也服从柯西分布.

Solution: 设 XCau(1,0)X \sim Cau(1,0), 则其特征函数是 φX(t)=et\varphi_X(t) = e^{-|t|}, 因此有 Z=X+Y2Z=\frac{X+Y}{2} 的特征函数是

φZ(t)=E[eitZ]=E[eit2(X+Y)]=E[eit2X]E[eit2Y]=et,\varphi_Z\left(t\right) = E\left[e^{itZ}\right] =E\left[e^{i\frac{t}{2}\left(X+Y\right)}\right] =E\left[e^{i\frac{t}{2}X}\right]E\left[e^{i\frac{t}{2}Y}\right] = e^{-\left|t\right|},

由唯一性定理, Z=X+Y2Cau(1,0)Z=\frac{X+Y}{2}\sim Cau(1,0).

Remark: 茆书4.2.11原题, 同时也是应坚刚《概率论》原题.

七、(20分) (Borel-Cantelli引理) 对于事件序列 AnA_n, 记 A=k=1n=kAnA=\bigcap_{k=1}^{\infty} \bigcup_{n=k}^{\infty}A_n.

(1)(10分) 若 P(An)<\sum P(A_n) <\infty, 则 P(A)=0P(A)=0.

(2)(10分) 若 AnA_n 是独立序列, 则 P(A)=1P(A)=1 等价于 P(An)=\sum P(A_n) =\infty.

Solution: 可在下述视频课程找到解答: (i) 大师兄《一苇渡江》强化班强大数律课程; (ii) 大师兄《一苇渡江》专题班概率极限理论课程; (iii) 大师兄《一苇渡江》李贤平概率论基础-概率极限定理课程; (iv) 大师兄《一苇渡江》何书元概率论-5.4概率极限理论… 或翻看书本李贤平《概率论基础》第五章.

Remark: Borel-Cantelli引理属于书本定理, 主流概率论书籍上都能找到这个定理的证明. 这题属于试卷上比较难的, 如果没有复习Borel-Cantelli引理的话不是很容易写出来.

八、(20分) 设独立序列满足 P(ξn=±nδ)=12P(\xi_n = \pm n^{\delta}) = \frac{1}{2}.

(1)(10分) 给出 {ξn}\{\xi_n\} 服从大数定律的充要条件, 即给出 δ\delta 的范围.

(2)(10分) 详细证明第 (1) 问的结论.

Solution: (1) 服从大数定律指 SnnP0\frac{S_n}{n} \xrightarrow{P} 0, 其中 Sn=i=1nXiS_n = \sum_{i=1}^n X_i, 利用切比雪夫不等式, 有

P(Snn>ε)1n2ε2Var(Sn)=1n2ε2i=1nVar(ξi)=1ε2i=1ni2δn2,P\left( \left| \frac{S_n}{n} \right|>\varepsilon \right) \le \frac{1}{n^2\varepsilon ^2}Var\left( S_n \right) =\frac{1}{n^2\varepsilon ^2}\sum_{i=1}^n{Var\left( \xi _i \right)}=\frac{1}{\varepsilon ^2}\frac{\sum_{i=1}^n{i^{2\delta}}}{n^2},

根据 Stolz 公式, 有

limni=1ni2δn2=limnn2δn2(n1)2=limnn2δ2n,\lim_{n\rightarrow \infty} \frac{\sum_{i=1}^n{i^{2\delta}}}{n^2}=\lim_{n\rightarrow \infty} \frac{n^{2\delta}}{n^2-\left( n-1 \right) ^2}=\lim_{n\rightarrow \infty} \frac{n^{2\delta}}{2n},

因此可以看出, 如果 δ<12\delta < \frac{1}{2}, 则 P(Snn>ε)0P\left( \left| \frac{S_n}{n} \right|>\varepsilon \right)\to 0, 即大数定律成立. 而如果 δ12\delta \ge \frac{1}{2}, 则 Var(Snn)=i=1ni2δn2Var\left( \frac{S_n}{n} \right) =\frac{\sum_{i=1}^n{i^{2\delta}}}{n^2} 并不收敛于 0. 因此可以合理地猜测: {ξn}\{\xi_n\} 服从大数定律的充要条件是 δ<12\delta <\frac{1}{2}.

(2) 现在进行详细证明, 首先对于任意 δ>12\delta > -\frac{1}{2}, 我们可以作分解 Snn=Snnδ+121n12δ\frac{S_n}{n} = \frac{S_n}{n^{\delta + \frac{1}{2}}} \cdot \frac{1}{n^{\frac{1}{2}-\delta}}. 针对 SnS_n, 可以求出 Bn2:=Var(Sn)=i=1ni2δ12δ+1n2δ+1B_n^2:=Var(S_n) = \sum_{i=1}^n i^{2\delta} \sim \frac{1}{2\delta +1} n^{2\delta +1}, 且显然 ξnnδBn|\xi_n|\le n^{\delta} \ll B_n, 因此李雅普诺夫条件成立, 故有中心极限定理 Snnδ+12dN(0,2δ+1)\frac{S_n}{n^{\delta + \frac{1}{2}}} \xrightarrow{d} N(0,2\delta +1).

(i) 如果 δ<12\delta < \frac{1}{2}, 则有 1n12δ0\frac{1}{n^{\frac{1}{2}-\delta}} \to 0, 故Snn=Snnδ+121n12δP0\frac{S_n}{n} = \frac{S_n}{n^{\delta + \frac{1}{2}}} \cdot \frac{1}{n^{\frac{1}{2}-\delta}} \xrightarrow{P} 0.

(ii) 如果 δ=12\delta = \frac{1}{2}, 则有 1n12δ=1\frac{1}{n^{\frac{1}{2}-\delta}} = 1, 故Snn=Snnδ+121n12δdN(0,2)\frac{S_n}{n} = \frac{S_n}{n^{\delta + \frac{1}{2}}} \cdot \frac{1}{n^{\frac{1}{2}-\delta}} \xrightarrow{d} N\left( 0, 2 \right).

(iii) 如果 δ>12\delta > \frac{1}{2}, 则有 1n12δ\frac{1}{n^{\frac{1}{2}-\delta}} \to \infty, 故Snn=Snnδ+121n12δP\frac{S_n}{n} = \frac{S_n}{n^{\delta + \frac{1}{2}}} \cdot \frac{1}{n^{\frac{1}{2}-\delta}} \xrightarrow{P} \infty.

综上所述, {ξn}\{\xi_n\} 服从大数定律的充要条件是 δ<12\delta <\frac{1}{2}.

Remark: 本题充分性比较简单, 运用切比雪夫不等式即可, 必要性则需要证明“不服从大数定律”, 相对较难, 于茆书 4.3.16 曾经考察, 如果没有做过相关内容, 可能不是很容易写出来.

九、(10分) 设有来自 U(θ,θ)U(-\theta,\theta) 的简单随机样本 X1,,XnX_1,\cdots,X_n, 其中 θ>0\theta>0.

(1) 证明: max{X1,,Xn}\max \{|X_1|,\cdots,|X_n|\}θ\theta 的充分统计量.

(2) 求 θ\theta 的 MLE.

Solution: (1) 记 Yi=XiY_i = |X_i|, 则有 YiU(0,θ)Y_i \sim U(0,\theta), 似然函数是 L(θ)=1θnI{0<θ<Y(n)}L\left(\theta\right) = \frac{1}{\theta ^n} I_{\{0< \theta <Y_{(n)}\}},
根据因子分解定理, Y(n)=max{X1,,Xn}Y_{(n)} = \max \{|X_1|,\cdots,|X_n|\}θ\theta 的充分统计量.

(2) 可以看出, L(θ)=1θnI{0<θ<Y(n)}L\left(\theta\right) = \frac{1}{\theta ^n} I_{\{0< \theta <Y_{(n)}\}}1θn\frac{1}{\theta ^n}θ\theta 的单调减函数, 因此当 θ\theta 取到最大值 Y(n)Y_{(n)} 时, 似然函数达到最大, 故 θ^=max{X1,,Xn}\widehat{\theta} = \max \{|X_1|,\cdots,|X_n|\}.

Remark: 本题属于多次考察的常规题, 一苇渡江课程已经讲过.

十、(10分) 设有来自 P(λ)\mathcal{P}(\sqrt{\lambda}) 的简单随机样本 X1,,XnX_1,\cdots,X_n, 其中 λ>0\lambda>0.

(1) 求 λ\lambda 的 MLE.

(2) 判断 (1) 中的估计量是否无偏.

Solution: (1) 根据泊松分布的结论, λ^=Xˉ\widehat{\sqrt{\lambda}} = \bar{X}, 根据 MLE 的不变性, 有 λ^=Xˉ2\widehat{\lambda} = \bar{X}^2.

(2) EXˉ2=E(Xˉ)2+Var(Xˉ=E(X1)2+1nVar(X1)=λ+λnE\bar{X}^2 = E(\bar{X})^2 + Var(\bar{X} = E(X_1)^2 + \frac{1}{n} Var(X_1) = \lambda + \frac{\sqrt{\lambda}}{n}, 不无偏.

Remark: 本题属于多次考察的常规题, 考察 MLE 不变性.

十一、(15分) 设有来自 U(θ,θ+1)U(\theta,\theta+1) 的简单随机样本 X1,,XnX_1,\cdots,X_n, 考虑假设检验问题:

H0:θ=0H1:θ>0,H_0: \theta = 0 \quad H_1: \theta>0,

定义拒绝域 W={X(1)>k}{X(n)>1}W=\left\{X_{(1)}>k\right\} \cup \left\{X_{(n)}>1\right\}, 要使犯第一类错误对概率不足 0.05, 求 kk 至少为多少?

Solution: 求第一类错误概率, 有

α=Pθ=0(xW)=Pθ=0(X(1)>k)+Pθ=0(X(n)>1)=(1k)n,\alpha = P_{\theta = 0} \left( \boldsymbol{x} \in W\right) = P_{\theta = 0} \left( X_{(1)}>k\right) + P_{\theta = 0} \left( X_{(n)}>1\right) = \left(1-k\right)^n,

α0.05\alpha \le 0.05, 解得 k10.051nk \ge 1-0.05^{\frac{1}{n}}.

Remark: 本题属于多次考察的常规题, 类似于九阳神功复旦432-2023-第九题.

十二、(15分) 设有来自 U(0,θ)U(0,\theta) 的简单随机样本 X1,,XnX_1,\cdots,X_n, 其中参数 θ\theta 的先验分布是 π(θ)=2θ3\pi \left(\theta\right) = \frac{2}{\theta^3}, θ>1\theta>1. 现有 4 个观测值: 0.1, 1.2, 1.5, 0.9, 求参数的后验分布.

Solution: x\boldsymbol{x} 关于 θ\theta 的条件密度是

f(xθ)=1θn,θ>x(n),f\left(\boldsymbol{x}|\theta\right) = \frac{1}{\theta^n},\quad \theta>x_{(n)},

因此联合密度是

p(x,θ)=2θn+3,θ>max{1,x(n)},p\left( \boldsymbol{x},\theta \right) = \frac{2}{\theta^{n+3}}, \quad \theta>\max\{1,x_{(n)}\},

因此有后验密度为

π(θx)=p(x,θ)pX(x)=C(x)2θn+3,θ>max{1,x(n)},\pi\left( \theta | \boldsymbol{x} \right) = \frac{p\left( \boldsymbol{x},\theta \right)}{p_X\left(\boldsymbol{x}\right)} = C\left( \boldsymbol{x} \right) \frac{2}{\theta^{n+3}}, \quad \theta>\max\{1,x_{(n)}\},

代入数据得 π(θx)=C2θ7\pi\left( \theta | \boldsymbol{x} \right) = C \frac{2}{\theta^7}, θ>1.5\theta > 1.5, 为满足正则性, 有 π(θx)=61.56θ7\pi\left( \theta | \boldsymbol{x} \right) = \frac{6 \cdot 1.5^6}{\theta^7}, θ>1.5\theta > 1.5.

Remark: 茆书 6.5.8原题.