北京大学数院-431金融学综合-2020年

一、(11分) 已知 $(X, Y)$ 服从二元正态分布, $X, Y$ 同分布， $F$ 是 $X$ 的分布函数, $E X=1, F(0)=\frac{1}{10}$ .

(1)(5分) 求 $P(1<Y<2)$ ;

(2)(6分) 若 $P(Y<2 \mid X \geq 2)=\frac{1}{2},$ 求 $P(\max \{X, Y\}>2)$ .

Solution:
(1) 根据题设可以得到 $P\{Y<0\}=\frac{1}{10}, P\{Y<1\}=\frac{1}{2}$ , 所以 $P\{0<Y<1\}=\frac{2}{5}$ , 根据正态分布的对称性, $P\{1<Y<2\}=\frac{2}{5}$ .

(2) $\frac{1}{2}=P\{Y<2 \mid X \geq 2\}=\frac{P\{X \geq 2, Y<2\}}{P\{X \geq 2\}}$ , 由此见得

P\{X \geq 2, Y<2\}=\frac{1}{2} P\{X \geq 2\}=\frac{1}{2} \cdot \frac{1}{10}=\frac{1}{20},

故 $P\{X \leq 2, Y \leq 2\}=P\{X<2, Y<2\}=P\{Y<2\}-P\{X \geq 2, Y<2\}=\frac{17}{20}$ , 因此

P(\max \{X, Y\}>2)=1-\frac{17}{20}=\frac{3}{20} .

二、(11分) $Y_{n}=\frac{1}{n} \sum_{i=1}^{n} e^{2 X_{i}},X_{1}, X_{2}, \ldots, X_{n}$ 相互独立且同服从 $U(0,1)$ .

(1)(5分) 求 $E Y_{n}, \operatorname{Var}\left(Y_{n}\right)$ ;

(2)(6分) 证明 $Y_{n}$ 依概率收敛到某个常数 $y,$ 并求 $y$ .

Solution:
(1) $E Y_{n}=E e^{2 X_{1}}=\int_{0}^{1} e^{2 x} d x=\frac{e^{2}-1}{2}, E e^{4 X_{1}}=\int_{0}^{1} e^{4 x} d x=\frac{e^{4}-1}{4}$ , 故

D e^{2 X_{1}}=E e^{4 X_{1}}-\left[E e^{2 X_{1}}\right]^{2}=\frac{e^{2}-1}{2},

因此 $D Y_{n}=\frac{1}{n} D e^{2 X_{1}}=\frac{e^{2}-1}{2 n}$ .

(2) 利用切比雪夫不等式, 对任意 $\varepsilon>0$ ,

P\left\{\left|Y_{n}-\frac{e^{2}-1}{2}\right|>\varepsilon\right\} \leq \frac{D Y_{n}}{\varepsilon^{2}}=\frac{e^{2}-1}{\varepsilon^{2}} \cdot \frac{1}{n} \rightarrow 0,

因此 $Y_{n}$ 依概率收敛到 $\frac{e^{2}-1}{2}$ . (注：或直接使用大数定律)

三、(14分) $\Omega=\left\{\omega_{1}, \omega_{2}, \omega_{3}\right\}, P\left\{\omega_{1}\right\}=\frac{1}{3}, P\left\{\omega_{2}\right\}=\frac{1}{6}, P\left\{\omega_{3}\right\}=\frac{1}{2} \cdot X\left(\omega_{1}\right)=2, X\left(\omega_{2}\right)=X\left(\omega_{3}\right)=0$ .

(1)(4分) 求 $X$ 的分布函数;

(2)(5分) 已知 $E Y=2, P(Y=X \mid X>0)=1, \quad P(Y=X \mid X=0)=\frac{3}{4},$ 求 $Y$ 的概率分布;

(3)(5分) 证明 $X, Y$ 不独立也不相关.

Solution:
(1) $P\{X=0\}=P\left\{\omega_{2}\right\}+P\left\{\omega_{3}\right\}=\frac{2}{3}, P\{X=2\}=P\left\{\omega_{1}\right\}=\frac{1}{3}$ ,

\text { 故 } F(x)= \begin{cases}0, & x<0, \\ \frac{2}{3}, & 0 \leq x<2, \\ 1, & 2 \leq x .\end{cases}

(2) $1=P\{Y=X \mid X>0\}=P\{Y=2 \mid X=2\}$ , 这意味着 $Y\left(\omega_{1}\right)=2, \quad \frac{3}{4}=P\{Y=0 \mid X=0\}$ ,
这意味着 $Y\left(\omega_{2}\right), Y\left(\omega_{3}\right)$ 中有一个是 0 , 我们发现

\frac{P\left\{\omega_{3}\right\}}{P\left\{\omega_{2}\right\}+P\left\{\omega_{3}\right\}}=\frac{3}{4}, \frac{P\left\{\omega_{2}\right\}}{P\left\{\omega_{2}\right\}+P\left\{\omega_{3}\right\}}=\frac{1}{4}

因此 $Y\left(\omega_{3}\right)=0$ . 为使得 $E Y=2$ , 必须要满足

2=2 \cdot \frac{1}{3}+Y\left(\omega_{2}\right) \cdot \frac{1}{6}+0 \cdot \frac{1}{2} \Rightarrow Y\left(\omega_{2}\right)=8

因此 $Y$ 的概率分布是

$Y$	0	2	8
$P$	1/2	1/3	1/6

(3) 先判断独立性, 由于 $\frac{3}{4}=P\{Y=0 \mid X=0\} \neq P\{Y=0\}=\frac{1}{2}$ , 因此不独立.
再判断相关性, 首先 $E X=\frac{2}{3}, E Y=2$ , 而

(X, Y)_{\omega_{1}}=(2,2),(X, Y)_{\omega_{2}}=(0,8),(X, Y)_{\omega_{3}}=(0,0),

因此 $E X Y=\frac{4}{3}=E X E Y$ , 不相关.

四、(14分) $X \sim \operatorname{Exp}(\lambda), \lambda>1, \quad Y_{k}=\left\{\begin{array}{ll}-1, & \quad X \leq k \\ 0, & k<X \leq 2 k, k=1,2 \\ 1, & X>2 k\end{array}\right.$

(1)(7分) 求 $\left(Y_{1}, Y_{2}\right)$ 的联合分布;

(2)(7分) 求 $a$ 的值( $a \in[1,10]),$ 使得 $E\left(a Y_{1}+Y_{2}\right)$ 最大.

Solution:
(1) 可以直接将 $\left(Y_{1}, Y_{2}\right)$ 的联合分布转化为 $X$ 的分布, 先画出联合分布表:

	$Y_{1}=-1$	$Y_{1}=0$	$Y_{1}=1$
$Y_{2}=-1$	$P\{X \leq 1\}$	$P\{1<X \leq 2\}$	0
$Y_{2}=0$	0	0	$P\{2<X \leq 4\}$
$Y_{2}=1$	0	0	$P\{4<X\}$

现在, 只需要计算对应事件的概率即可:

\begin{aligned} &P\{X \leq 1\}=1-e^{-\lambda}, P\{1<X \leq 2\}=e^{-\lambda}-e^{-2 \lambda}, \\ &P\{2<X \leq 4\}=e^{-2 \lambda}-e^{-4 \lambda}, \quad P\{4<X\}=e^{-4 \lambda}, \end{aligned}

因此, $\left(Y_{1}, Y_{2}\right)$ 的联合分布是

	$Y_{1}=-1$	$Y_{1}=0$	$Y_{1}=1$
$Y_{2}=-1$	$1-e^{-\lambda}$	$e^{-\lambda}-e^{-2 \lambda}$	0
$Y_{2}=0$	0	0	$e^{-2 \lambda}-e^{-4 \lambda}$
$Y_{2}=1$	0	0	$e^{-4 \lambda}$

(2) 令 $Z=a Y_{1}+Y_{2}$ , 画出其分布列:

$Z$	$-a-1$	$-1$	$a$	$a+1$
$P$	$1-e^{-\lambda}$	$e^{-\lambda}-e^{-2 \lambda}$	$e^{-2 \lambda}-e^{-4 \lambda}$	$e^{-4 \lambda}$

故 $E Z=-(a+1)\left(1-e^{-\lambda}\right)-\left(e^{-\lambda}-e^{-2 \lambda}\right)+a\left(e^{-2 \lambda}-e^{-4 \lambda}\right)+(a+1) e^{-4 \lambda}$

=\left(e^{-2 \lambda}+e^{-\lambda}-1\right) a+\left(e^{-4 \lambda}+e^{-2 \lambda}-1\right) .

现在要取讨论 $e^{-2 \lambda}+e^{-\lambda}-1$ 的取值, 令 $f(t)=t^{2}+t-1, t \in\left(0, e^{-1}\right)$ ,
可以看出 $f(t)$ 与 $e^{-2 \lambda}+e^{-\lambda}-1$ 的取值范围是一样的, $f(t)=t^{2}+t-1=\left(t+\frac{1}{2}\right)^{2}-\frac{3}{4}$ ,
在其对称轴右侧单调递增, 且

-\frac{3}{4}=f(0)<f(t)<f\left(e^{-1}\right)=e^{-2}+e^{-1}-1<2 e^{-1}-1<2 \cdot 2^{-1}-1=0,

故 $e^{-2 \lambda}+e^{-\lambda}-1<0$ , 所以 $E\left[a Y_{1}+Y_{2}\right]$ 关于 $a$ 单调递减, 所以取 $a=1$ .

五、(11分) (1)(3分) 解释最小方差无偏估计的含义;

(2)(2分) 解释两类错误的含义;

(3)(3分) 解释非参数检验的含义;

(4)(3分) 解释回归分析中复相关系数的平方的含义.

Solution:
(1) 最小方差无偏估计是指在所有无偏估计中方差最小的, 或者说最小方差无偏估计是一个与任一零的无偏估计不相关的无偏估计. 最小方差无偏估计在几乎处处的意义下是唯一的.

(2) 如果给定假设检验问题:
$H_{0}: \theta \in \Theta_{0}$ vs $H_{1}: \theta \in \Theta_{1}$ , 设其拒绝域为 $W$
第一类错误 (拒真错误)
$\alpha(\theta)=P_{\theta}\{\vec{X} \in W\}$ , 其中 $\theta \in \Theta_{0}$ , 表示原假设为真, 但样本值由于随机性落入
了拒绝域, 这时候我们得出了结论：拒绝原假设.
第二类错误（取伪错误）
$\beta(\theta)=P_{\theta}\{\vec{X} \in \bar{W}\}$ , 其中 $\theta \in \Theta_{1}$ , 表示原假设为假, 但样本值由于随机性落入
了接受域, 这时候我们得出了结论：接受原假设.

(3) 参数检验是在总体分布形式已知的情况下, 对总体分布的参数如均值、方差等进行推断的方法. 但是, 在数据分析过程中, 由于种种原因, 人们往往无法对总体分布形态作简单假定, 此时参数检验的方法就不再适用了. 非参数检验正是一类基于这种考虑, 在总体分布未知或知道甚少的情况下, 利用样本数据对总体分布形态等进行推断的方法. 由于非参数检验方法在推断过程中不涉及有关总体分布的参数, 因而得名为“非参数”检验.

(4) 复相关系数是测量一个变量与其他多个变量之间线性相关程度的指标, 而在回归分析中复相关系数的平方恰恰就是我们常说的可决系数或拟合优度, 它表示的是整个模型的解释程度, 复相关系数的平方越大（越接近1）则说明回归的解释力度越大.

六、(11分) 可能出现三种情况 $\mathrm{MM}, \mathrm{MN}, \mathrm{NN},$ 这三种情况出现的概率分别是 $p^{2}, 2 p(1-p),(1-p)^{2},$ 一次实验中三种情况分别出现的次数是 $n_{1}, n_{2}, n_{3},$ 且次数都 $\geqslant 10$ 次.

(1)(5分) 求 $p$ 的最大似然估计;

(2)(6分) 试给出检验问题

H_{0}: MM: MN: NN=1: 2: 1

的水平为 $\alpha$ 的拒绝域(备择假设是其对立).

Solution:
(1) 似然函数 $L=p^{2 n_{1}} \cdot[2 p(1-p)]^{n_{2}} \cdot(1-p)^{2 n_{3}} \propto p^{2 n_{1}+n_{2}}(1-p)^{n_{2}+2 n_{3}}=L_{1}$ ,

\ln L_{1}=\left(2 n_{1}+n_{2}\right) \ln p+\left(n_{2}+2 n_{3}\right) \ln (1-p),

$\frac{\partial \ln L_{1}}{\partial p}=\frac{2 n_{1}+n_{2}}{p}-\frac{n_{2}+2 n_{3}}{1-p}=0$ , 解得 $\hat{p}=\frac{2 n_{1}+n_{2}}{2 n}$ , 其中 $n=n_{1}+n_{2}+n_{3}$ .

(2)法一: 首先原假设等价于 $H_{0}: p=\frac{1}{2}$ , 我们去考虑总体的矩母函数, 当取到 $\mathrm{MM}, \mathrm{MN}$ ,
$\mathrm{NN}$ 时分别记作 $X=1,0,-1$ , 因此可以得到 $X$ 的矩母函数是:

E e^{t X}=e^{t} p^{2}+2 p(1-p)+e^{-t}(1-p)^{2}=\left[e^{\frac{t}{2}} p+e^{-\frac{t}{2}}(1-p)\right]^{2}=e^{-t}\left[e^{t} p+(1-p)\right]^{2},

根据卷积公式, $\sum_{i=1}^{n} X_{i}$ 的矩母函数是 $e^{-n t}\left[e^{t} p+(1-p)\right]^{2 n}$ , 因此

Y=2 n_{1}+n_{2}=n+\sum_{i=1}^{n} X_{i}

的矩母函数是 $\left[e^{t} p+(1-p)\right]^{2 n}$ , 这恰好是 $B(2 n, p)$ 的矩母函数, 因此 $Y \sim B(2 n, p)$ . 如果原假设成立, 那么 $Y$ 的实际观测值 $y_{0}$ 应该是与 $n$ 比较接近的. 由于 $Y$ 的分布是对称的, 我们去考虑一个双侧检验:
设 $\sum_{i=y_{0}}^{2 n} C_{2 n}^{i} p^{i}(1-p)^{2 n-i}=\frac{\alpha}{2}$ 与 $\sum_{i=0}^{y_{0}} C_{2 n}^{i} p^{i}(1-p)^{2 n-i}=\frac{\alpha}{2}$ 的解分别是 $p_{U}\left(y_{0}\right), p_{L}\left(y_{1}\right)$ ,
如果 $p_{U}\left(y_{0}\right) \geq \frac{1}{2}$ 或 $p_{L}\left(y_{0}\right) \leq \frac{1}{2}$ 我们就拒绝掉原假设. 再次回想二项分布与Beta 分布的前世今生, 我们知道

p_{U}\left(y_{0}\right)=\operatorname{Beta}_{\frac{\alpha}{2}}\left(y_{0}, 2 n-y_{0}+1\right), p_{L}\left(y_{0}\right)=\operatorname{Beta}_{1-\frac{\alpha}{2}}\left(y_{0}+1,2 n-y_{0}\right),

因此拒绝域为 $W=\left\{p_{U}\left(2 n_{1}+n_{2}\right) \geq \frac{1}{2}\right\} \cup\left\{p_{L}\left(2 n_{1}+n_{2}\right) \leq \frac{1}{2}\right\}$ .

法二: 由于有很多同学看不懂法一的答案, 考场上如果想不到用矩母函数, 我们也可以使用非参的优度检验方法, 尽管不是最优的方法.
在 $\Theta_0$ 下, 有 $p=1/2$ . 检验问题对应的 $\chi^2$ 统计量为

\chi^2=\sum_{i=1}^3\frac{(n\hat{p}_i-n_i)^2}{n\hat{p}_i}\overset{\Theta_0}{\sim}\chi^2(2)

故此时的拒绝域为 $W=\{ \chi^2 > \chi^2_{1-\alpha}(2)\}$ .

[注]: 使用拟合优度检验是不严谨的做法, 因为非参的方法没有用上题干中 $p^{2}$ , $2 p(1-p),(1-p)^{2}$ 的信息, 但是在题意不明的情况下, 写成非参也是合情合理的.

七、(14分) $f$ 在 $\left\{\left(x_{1}, \ldots, x_{d}\right): 0 \leq x_{i} \leq 1, i=1, \ldots, d\right\}$ 上连续, 且

\theta=\int_{0}^{1} \cdots \int_{0}^{1} f\left(x_{1}, \ldots, x_{d}\right) d x_{1} \ldots d x_{d}

现有
服从 [0,1] 上均匀分布的独立随机变量 $U_{0}, U_{1}, \ldots, U_{n d-1}$ , 令

\hat{\theta}=\frac{1}{n} \sum_{i=1}^{n} f\left(U_{i d}, U_{i d+1}, \ldots, U_{i d+d-1}\right).

(1)(7分) 证明 $\hat{\theta}$ 是 $\theta$ 的无偏、强相合估计;

(2)(7分) 构造 $\theta$ 的近似 $95 \%$ 置信区间.

Solution:
(1) 先说明其无偏性, 由于

E \hat{\theta}=\frac{1}{n} \sum_{i=0}^{n-1} E f\left(U_{i d}, \ldots, U_{i d+d-1}\right)=E f\left(U_{0}, \ldots, U_{d-1}\right)=\int_{[0,1]^{d}} f\left(x_{1}, \ldots, x_{d}\right) d x_{1} \cdots d x_{d}=\theta,

故 $\hat{\theta}$ 是无偏估计. 而 $\hat{\theta}$ 可以看作独立同分布的 $n$ 项均值, 根据强大数律 $\hat{\theta}$ 是强相合估计.

(2) 因为 $f$ 在 $[0,1]^{d}$ 连续, 故 $f^{2}$ 也在 $[0,1]^{d}$ 连续, 因此积分 $\int_{[0,1]^{d}} f^{2}\left(x_{1}, \ldots, x_{d}\right) d x_{1} \cdots d x_{d}$ 存在, 令 $\sigma^{2}=\int_{[0,1]^{d}} f^{2} d x_{1} \cdots d x_{d}-\theta^{2}$ , 根据中心极限定理, 当 $n$ 较大时, 近似有

\sqrt{n} \frac{\hat{\theta}-\theta}{\sigma} \sim N(0,1),

为构造置信区间, 我们还需要得到 $\sigma$ 的估计量, 令

\hat{\sigma}^{2}=\frac{1}{n-1} \sum_{i=0}^{n-1}\left[f\left(U_{i d+1}, \cdots, U_{i d+d-1}\right)-\hat{\theta}\right]^{2},

它是 $\sigma$ 的相合估计量, 故当 $n$ 较大时, 近似有 $\sqrt{n} \frac{\hat{\theta}-\theta}{\hat{\sigma}} \sim N(0,1)$ , 因此 $\theta$ 的近似 $95 \%$ 置信区间是

\left[\hat{\theta}-1.96 \frac{\hat{\sigma}}{\sqrt{n}}, \hat{\theta}+1.96 \frac{\hat{\sigma}}{\sqrt{n}}\right]

八、(14分) 已知 $y_{i j}=\mu+\alpha_{i}+\varepsilon_{i j},$ 约束条件 $\sum_{i=1}^{s} \alpha_{i}=0,$ 对每个 $i=1,2 \ldots, s,$ 都有 $r$ 个观测值, 残差相互独立服从 $N\left(0, \sigma^{2}\right), \mu, \alpha_{i}, \sigma^{2}$ 未知.

(1)(7分) 求 $\mu, \alpha_{i}$ 的最小二乘估计;

(2)(7分) 给出 $H_{0}: \alpha_{1}=\alpha_{2}=\ldots=\alpha_{s}=0$ 的水平为 $\alpha$ 的否定域.

Solution:
(1) 令 $\theta_{i}=\mu+\alpha_{i}, i=1,2, \ldots, s$ , 这样可以减少一个参数. 则此时 $y_{i j}=\theta_{i}+\varepsilon_{i j}$ . 为方便,
我们令 $\overline{y_{i}}=\frac{1}{r} \sum_{j=1}^{r} y_{i j}$ , 对残差平方和进行分解.

\begin{aligned} Q=\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\theta_{i}\right)^{2}=& \sum_{i=1}^{s} \sum_{j=1}^{r}\left[\left(y_{i j}-\overline{y_{i}}\right)+\left(\overline{y_{i}}-\theta_{i}\right)\right]^{2} \\ &=\sum_{i=1}^{s} \sum_{j=1}^{r}\left[\left(y_{i j}-\overline{y_{i}}\right)^{2}+2\left(y_{i j}-\overline{y_{i}}\right)\left(\overline{y_{i}}-\theta_{i}\right)+\left(\overline{y_{i}}-\theta_{i}\right)^{2}\right] \\ &=\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}+r \sum_{i=1}^{s}\left(\overline{y_{i}}-\theta_{i}\right)^{2} \end{aligned}

要使得残差平方和达到最小, 就必须使得 $\sum_{i=1}^{s}\left(\overline{y_{i}}-\theta_{i}\right)^{2}=0$ , 这说明了 $\hat{\theta}_{i}=\bar{y}_{i}$ , 结合
约束条件, 我们知道 $\hat{\mu}=\bar{y}=\frac{1}{s} \sum_{i=1}^{s} \overline{y_{i}}, \hat{\alpha}_{i}=\overline{y_{i}}-\bar{y}, i=1,2, \ldots, s$ .

(2) 对总平方和进行分解:

\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\bar{y}\right)^{2}=\sum_{i=1}^{s} \sum_{j=1}^{r}\left[\left(y_{i j}-\overline{y_{i}}\right)+\left(\overline{y_{i}}-\bar{y}\right)\right]^{2}=\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}+r \sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right)^{2},

在原假设成立的情况下, $y_{i j} \sim N\left(\mu, \sigma^{2}\right)$ , 因此

\frac{1}{\sigma^{2}} \sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\bar{y}\right)^{2} \sim \chi^{2}(s r-1), \frac{1}{\sigma^{2}} \sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2} \sim \chi^{2}(s(r-1)) .

由于 $\overline{y_{i}} \sim N\left(\mu, \frac{\sigma^{2}}{r}\right)$ , 因此 $\frac{r}{\sigma^{2}} \sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right)^{2} \sim \chi^{2}(s-1)$ . 而显然, $\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}$ 与 $\sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right)^{2}$ 独立.（每一个 $\sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}$ 都和 $\overline{y_{i}}$ 独立, $\bar{y}$ 是各 $\overline{y_{i}}$ 的线性组合, 自然也和每个 $\sum_{j=1}^{r}\left(y_{i j}-\bar{y}_{i}\right)^{2}$ 独立)
我们考虑, 原假设成立时组间差异应很小, 而 $\sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right)^{2}$ 反映的是组间差异, $\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}$ 反映的是组内差异，当组间差异比起组内差异相对较小时, 我们
可以认为原假设是成立的. 故构造统计量

F=\frac{r \sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right) /(s-1)}{\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2} /(s r-s)} \sim F(s-1, s r-s),

故拒绝域为 $W=\left\{F>F_{1-\alpha}(s-1, s r-s)\right\}$ .