复旦大学861-861概率论与数理统计-2018年

一、(30 分) 解决下述问题:

(1) 已知 AABˉ\bar{B} 互不相容, 且 P(A)=0.6,P(B)=0.7P(A)=0.6, P(B)=0.7, 试求 P(AB)P(A \mid B);

(2) 随机向量 (X,Y)N(0,0;1,4;ρ)(X, Y) \sim N(0,0 ; 1,4 ; \rho), 且 D(2XY)=1D(2 X-Y)=1, 试求 ρ\rho;

(3) XiX_{i} 是独立同分布的随机变量, 已知 E(Xi)=D(Xi)=1E\left(X_{i}\right)=D\left(X_{i}\right)=1, 试求

limnP(i=1nXin>n)\lim _{n \rightarrow \infty} P\left(\sum_{i=1}^{n} X_{i}-n>\sqrt{n}\right)

Solution:
(1) 因为 A\mathrm{A}Bˉ\bar{B} 互不相容, 所以有: P(ABˉ)=0P(A \bar{B})=0, 可以求得:

P(AB)=P(AB)P(B)=P(A)P(ABˉ)P(B)=P(A)P(B)=67.P(A \mid B)=\frac{P(A B)}{P(B)}=\frac{P(A)-P(A \bar{B})}{P(B)}=\frac{P(A)}{P(B)}=\frac{6}{7} .

(2) 根据题意有

1=D(2XY)=4D(X)4Cov(X,Y)+D(Y)=48ρ+4\begin{aligned} 1 &=D(2 X-Y) \\ &=4 D(X)-4 \operatorname{Cov}(X, Y)+D(Y) \\ &=4-8 \rho+4 \end{aligned}

解得 ρ=78\rho=\frac{7}{8}.
(3) 由中心极限定理, 当 nn 趋于无穷时, 有 i=1nXiN(n,n),i=1nXinnN(0,1)\sum_{i=1}^{n} X_{i} \sim N(n, n), \frac{\sum_{i=1}^{n} X_{i}-n}{\sqrt{n}} \sim N(0,1), 所以有

limnP(i=1nXin>n)=limnP(i=1nXinn>nn)=1Φ(1).\lim _{n \rightarrow \infty} P\left(\sum_{i=1}^{n} X_{i}-n>\sqrt{n}\right)=\lim _{n \rightarrow \infty} P\left(\frac{\sum_{i=1}^{n} X_{i}-n}{\sqrt{n}}>\frac{\sqrt{n}}{\sqrt{n}}\right)=1-\Phi(1) .

二、 (20(20)){Xi}\left\{X_{i}\right\} 是来自标准正态分布的随机样本, 尝试解决以下问题

(1) 试求 Sn=i=1nXiS_{n}=\sum_{i=1}^{n} X_{i} 的分布;

(2) 试求 limnP(1nSn1n)\lim _{n \rightarrow \infty} P\left(\left|\frac{1}{n} S_{n}\right| \leq \frac{1}{\sqrt{n}}\right).

Solution:
(1)由正态分布的再生性(可加性), 因为 XiN(0,1)X_{i} \sim N(0,1), 所以

Sn=i=1nXiN(0,n).S_{n}=\sum_{i=1}^{n} X_{i} \sim N(0, n) .

(2)因为 SnnN(0,1n)\frac{S_{n}}{n} \leq N\left(0, \frac{1}{n}\right), 因此有

limnP(1nSn1n)=limnP(n1nSn1)=Φ(1)Φ(1).\lim _{n \rightarrow \infty} P\left(\left|\frac{1}{n} S_{n}\right| \leq \frac{1}{\sqrt{n}}\right)=\lim _{n \rightarrow \infty} P\left(\sqrt{n}\left|\frac{1}{n} S_{n}\right| \leq 1\right)=\Phi(1)-\Phi(-1) .

三、 (20 分) 解决下述问题:

(1) 用特征函数的方法证明:若 XiX_{i} 是独立同分布, 均服从参数为 1 的泊松分 布, 则 1n(i=1nXin)\frac{1}{\sqrt{n}}\left(\sum_{i=1}^{n} X_{i}-n\right) 渐进服从标准正态分布;

(2) A,B,CA, B, C 两两独立不同时发生, 且 P(A)=P(B)=P(C)=pP(A)=P(B)=P(C)=p, 试证明 p12p \leq \frac{1}{2}.

Solution:

(1) 根据泊松分布的性质, 我们知道 X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n} 期望为 1 , 方差也为 1 , 将 Xi1X_{i}-1 的特征函数 φi(t)=E[eit(Xi1)]\varphi_{i}(t)=E\left[e^{i t\left(X_{i}-1\right)}\right] 展开到二阶, 得到 φi(t)=1t22+o(t2)\varphi_{i}(t)=1-\frac{t^{2}}{2}+o\left(t^{2}\right), 根据卷积公式, 得到 i=1nXin\sum_{i=1}^{n} X_{i}-n 的特征函数是 i=1nφi(t)=[1t22+o(t2)]n\prod_{i=1}^{n} \varphi_{i}(t)=\left[1-\frac{t^{2}}{2}+o\left(t^{2}\right)\right]^{n}, 因此有 1n(i=1nXin)\frac{1}{\sqrt{n}}\left(\sum_{i=1}^{n} X_{i}-n\right) 的特征函数 是 gn(t)=i=1nφi(tn)=[1t22n+o(t2n)]net22g_{n}(t)=\prod_{i=1}^{n} \varphi_{i}\left(\frac{t}{\sqrt{n}}\right)=\left[1-\frac{t^{2}}{2 n}+o\left(\frac{t^{2}}{n}\right)\right]^{n} \longrightarrow e^{-\frac{t^{2}}{2}}, 极限恰是 N(0,1)N(0,1) 的特征函数, 根据 Levy-Cramer 连续性定理, 有 1n(i=1nXin)dN(0,1)\frac{1}{\sqrt{n}}\left(\sum_{i=1}^{n} X_{i}-n\right) \stackrel{d}{\rightarrow} N(0,1).

(2)显然有 P(AP(A \cup

B)P(ABC), 而 P(AB)=P(A)+P(B)P(AB)=2pp2,P(ABC)=P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC)=3p3p2,\begin{aligned} &B) \leqslant P(A \cup B \cup C) \text {, 而 } P(A \cup B)=P(A)+P(B)-P(A B)=2 p-p^{2}, \\ &\begin{aligned} P(A \cup B \cup C)=& P(A)+P(B)+P(C) \\ &-P(A B)-P(A C)-P(B C)+P(A B C) \\ =& 3 p-3 p^{2}, \end{aligned} \end{aligned}

分别代入不等式, 得到 2pp23p3p22 p-p^{2} \leqslant 3 p-3 p^{2}, 解得 p12p \leqslant \frac{1}{2}.

四、 (50 分) 设 {Xi}\left\{X_{i}\right\} 是来自双参数指数分布的简单随机样本, 总体的密度函数为

f(x)={1λexθλ,x>θ0,xθf(x)= \begin{cases}\frac{1}{\lambda} e^{-\frac{x-\theta}{\lambda}}, & x>\theta \\ 0, & x \leq \theta\end{cases}

其中尺度参数 λ>0\lambda>0 已知.

(1) 试求 θ\theta 的矩估计及其均方误差;

(2) 试求 θ\theta 的极大似然估计及其均方误差;

(3) 判断以上两个估计量是否是相合的;

(4) 试求 θ\theta 的一个充分统计量, 并求 x(1)θx_{(1)}-\theta 的分布, 判断其分布是否依赖于 θ\theta;

(5) 给出 θ\theta 的 1- α\alpha 置信区间.

Solution:
(1)作总体变换, 令 Yi=XiθλExp(1)Y_{i}=\frac{X_{i}-\theta}{\lambda} \sim \operatorname{Exp}(1), 则有 1=E(Y1)=1λ[E(X1)θ]1=E\left(Y_{1}\right)=\frac{1}{\lambda}\left[E\left(X_{1}\right)-\theta\right], 得 到 E(X1)=λ+θE\left(X_{1}\right)=\lambda+\theta, 由替换原理得到矩估计 θ^1=Xˉλ\hat{\theta}_{1}=\bar{X}-\lambda, 它恰是无偏估计, 故

mse(θ^1)=Var(θ^1)=Var(X1)n=λ2n.\operatorname{mse}\left(\hat{\theta}_{1}\right)=\operatorname{Var}\left(\hat{\theta}_{1}\right)=\frac{\operatorname{Var}\left(X_{1}\right)}{n}=\frac{\lambda^{2}}{n} .

(2)样本对应的似然函数是 L(θx)=1λne1λ(i=1nxinθ)I{θ<x(j)}}=C(x)enλθI{θ<x(j))L(\theta \mid x)=\frac{1}{\lambda^{n}} e^{-\frac{1}{\lambda}\left(\sum_{i=1}^{n} x_{i}-n \theta\right)} \cdot I_{\left\{\theta<x_{(j)\}}\right\}}=C(x) e^{\frac{n}{\lambda} \theta} I_{\left\{\theta<x_{(j)}\right)}, 其中 C(x)C(x) 是于参数无关的部分, 由于 enλθe^{\frac{n}{\lambda} \theta} 关于 θ\theta 单调递增, 因此要使 L(θ)L(\theta) 尽量大, 则 θ\theta 的取值要在取 值范围内尽可能大, 故 θ\theta 的极大似然估计是 θ^2=X(1)\hat{\theta}_{2}=X_{(1)}, 借助第(1) 问的总体变换, 有 Y(1)=X(1)θλExp(n)Y_{(1)}=\frac{X_{(1)}-\theta}{\lambda} \sim \operatorname{Exp}(n), 因此容易求出 E(X(1))=λn+θ,D(X(1))=λ2n2E\left(X_{(1)}\right)=\frac{\lambda}{n}+\theta, D\left(X_{(1)}\right)=\frac{\lambda^{2}}{n^{2}}, 故 θ^2\hat{\theta}_{2} 的均 方误差是 mse(θ^2)=D(X(1))+[E(X(1))θ]2=λ2n2+λ2n2=2λ2n2\operatorname{mse}\left(\hat{\theta}_{2}\right)=D\left(X_{(1)}\right)+\left[E\left(X_{(1)}\right)-\theta\right]^{2}=\frac{\lambda^{2}}{n^{2}}+\frac{\lambda^{2}}{n^{2}}=\frac{2 \lambda^{2}}{n^{2}}.
(3) 由于 limnE(θ^1)=limnE(θ^2)=θ,limnD(θ^1)=limnD(θ^2)=0\lim _{n \rightarrow \infty} E\left(\hat{\theta}_{1}\right)=\lim _{n \rightarrow \infty} E\left(\hat{\theta}_{2}\right)=\theta, \lim _{n \rightarrow \infty} D\left(\hat{\theta}_{1}\right)=\lim _{n \rightarrow \infty} D\left(\hat{\theta}_{2}\right)=0, 因此很容易看出 θ^1,θ^2\hat{\theta}_{1}, \hat{\theta}_{2} 均为相合估计.
(4) 根据因子分解定理, θ\theta 的充分统计量为 X(1)X_{(1)}, 因为 Y(1)=X(1)θλY_{(1)}=\frac{X_{(1)}-\theta}{\lambda} 服从参数为 nn 的指数 分布, 所以 X(1)θX_{(1)}-\theta 服从参数为 nλ\frac{n}{\lambda} 的指数分布, 与 θ\theta 无关.
(5) 令 T=Y(1)=X(1)θλExp(n)T=Y_{(1)}=\frac{X_{(1)}-\theta}{\lambda} \sim \operatorname{Exp}(n), 其分布与参数无关, 是枢轴量. 我们试导出基于 该枢轴量的最短置信区间, 由于 {a<T<b}\{a<T<b\} 意味着 {X(1)λb<θ<X(1)λa}\left\{X_{(1)}-\lambda b<\theta<X_{(1)}-\lambda a\right\}, 因此最短 区间的构造等同于在 abnenxdx=1α\int_{a}^{b} n e^{-n x} d x=1-\alpha 的条件下求 bab-a 的极小值, 而由于 nenxn e^{-n x} 单调递减, 因此显然有 a=0a=0 时区间最短, 此时 b=lnαnb=-\frac{\ln \alpha}{n}, 故最短置信区间是 [X(1)+λlnαn,X(1)]\left[X_{(1)}+\frac{\lambda \ln \alpha}{n}, X_{(1)}\right].

五、 (30 分) 设 {Xi}\left\{X_{i}\right\} 是来自均匀分布 U(0,θ)U(0, \theta) 的简单随机样本, 考虑如下的假设检 验问题

H0:θ12 vs θ>12H_{0}: \theta \leq \frac{1}{2} \quad \text { vs } \quad \theta>\frac{1}{2}

现给出一个拒绝域为 W={x(n)>c}W=\left\{x_{(n)}>c\right\}, 其中 cc 是一个待确定常数, 解决下述问题

(1) 求该检验法的功效函数;

(2) 找出最小的常数 cc, 使得该检验犯第一类错误的概率不超过 0.050.05;

(3) 对于 (2) 中确定的常数 cc, 当 θ=34\theta=\frac{3}{4} 时, 想要控制该检验犯第二类错误的概率不超过 0.020.02, 那么样本量 nn 至少为多少;

(4) 若样本容量 n=20n=20, 且 x(20)=0.48x_{(20)}=0.48, 已知 0.95120=0.99740.95^{\frac{1}{20}}=0.9974, 试在 0.050.05 的显 著性水平下对该假设检验问题作出判断.

Solution:
(1)我们只考虑 cc 取正数, 因为负数显然无讨论必要. 由功效函数的定义, 有

g(θ)=Pθ(X(n)>c)={1[Pθ(X1<c)]n=1(cθ)n,c<θ,0,cθ.g(\theta)=P_{\theta}\left(X_{(n)}>c\right)= \begin{cases}1-\left[P_{\theta}\left(X_{1}<c\right)\right]^{n}=1-\left(\frac{c}{\theta}\right)^{n}, & c<\theta, \\ 0, & c \geq \theta .\end{cases}

(2)犯第一类错误概率 α(θ)=1cnθn,θ12\alpha(\theta)=1-\frac{c^{n}}{\theta^{n}}, \theta \leq \frac{1}{2}, 由于 supθ12α(θ)=α(12)=1(2c)n\sup _{\theta \leq \frac{1}{2}} \alpha(\theta)=\alpha\left(\frac{1}{2}\right)=1-(2 c)^{n}, 只 要它小于等于 0.050.05 即可, 解得 cmin =0.95n2c_{\text {min }}=\frac{\sqrt[n]{0.95}}{2}.
(3)犯第二类错误概率

β(34)=1g(34)=0.952n(34)n=0.95×(23)n,\beta\left(\frac{3}{4}\right)=1-g\left(\frac{3}{4}\right)=\frac{\frac{0.95}{2^{n}}}{\left(\frac{3}{4}\right)^{n}}=0.95 \times\left(\frac{2}{3}\right)^{n},

令其不超 0.020.02, 解得 n9.522n \geq 9.522.
(4)根据前三题结论, 此时拒绝域应为

W={X(20)>0.99742},W=\left\{X_{(20)}>\frac{0.9974}{2}\right\},

但此时 x(20)=0.48x_{(20)}=0.48 没有落入拒绝域, 故不能拒绝原假设.