中国科学技术大学-812概率论与数理统计-2021年
一、(20分) 若河边仅有一个码头,甲乙两船在 0:00~24:00 之间,等可能的在任意时刻到达码头,且到达时刻独立。若甲到达码头需停靠 2h,乙需停靠 1h。问:
(1)(10分) 甲乙停靠时间间隔大于 2h 的概率.
(2)(10分) 一艘船到达后需要等待一段时间的概率.
Solution: (1) 设 分别是甲乙到达的时间, 它们是 i.i.d. 的服从 的随机变量, 则有类似几何分布:
(2) 需要等待意味着 , 该概率是
二、(20分) 随机向量 有联合密度 .
(1)(5分) 求 ;
(2)(5分) 求 时, 的条件分布;
(3)(10分) 证明 与 独立.
Solution: (1) 积分, 有, 故有 .
(2) 先求 , 有 , 是均匀分布, 故条件分布是
(3) 令 , , 有
其中 , 而边际分布是
同理 , 因此我们发现它们独立.
三、(20分) 盒中有大小形状相同的 个白球, 个黑球,依次从中取出 个球,, 记 为取出球中白球的个数, 为第 次取出的球为白球的示性随机变量, .
(1)(5分) 求 的分布;
(2)(5分) 求 的分布, ;
(3)(10分) 求 , .
Solution: (1) 根据抽签与顺序无关, 任意一次取出白球的概率都是 , 取出黑球的概率是 , 故 .
(2) 第 次和第 次都取出白球的概率是 , 同理, 有
(3) 显然 , 故有 , 方差略麻烦一些, 有
其中 ,
汇总后有
四、(15分) 证明: 随机变量序列 依概率收敛于 的充分必要条件是
Solution: 先证必要性: 已知 依概率收敛于 , 考虑到当 时, 有界, 根据有界收敛定理, 有
再证充分性: 已知 , 考虑到当 时, 单调, 故对任意 , 有
充分性得证.
五、(20分) 设 来自离散分布 的随机样本, 其中 , 求:
(1)(5分) 的矩估计 ;
(2)(5分) 的最大似然估计 ;
(3)(10分) 和 的渐近分布.
Solution: (1) 求期望, 有
用样本矩替换并反解, 得到 .
(2) 根据两点分布的 MLE 及其不变性, 有 , 反解得 .
(3) 由 CLT, 我们有
令 , 求导有 , , 故由 Delta 方法, 我们有
六、(20分) 为调查某商品在商场货架上的滞留时间,随机调查9个样本的滞留时间 , 其中计算得到 , 假设总体 . .
(1)(5分) 检验 , 备择假设是其对立, .
(2)(5分) 若 , 样本量改为 , 求犯第二类错误的概率 , 并指出: 想要 , 我们应该需要多少样本.
(3)(10分) 求 的 MLE, 并给出 95% 置信下限.
Solution: (1) 拒绝域是
现在 , 不落入拒绝域, 不能拒绝原假设.
(2) 犯第二类错误的概率是
令其小于 , 则有
解得 , 故 , 取 .
(3) 计算得
由 MLE 不变性, 有 . 而由于 是单调函数, 是 单调减函数, 故有
我们可以选 为 的 0.95 置信上限, 即 , 故有
是 的 0.95 置信下限.
七、(20分) 人的早晚收缩压 , 随机抽取 人, 其中 人有早晚数据 , 剩下 人只有早上数据 , 令 . 只有 , 是待估参数.
(1)(10分) 求 的 MLE ;
(2)(10分) 证明 是无偏估计, 并求条件方差 .
Solution: (1)
写出对数似然函数, 有
求导, 有
令第二个式子为 0, 得
而令第一个式子即 , 得
代入 , 解得 , 故有
这里我们用 表示用前 个样本计算的样本均值.
(2) 求期望, 由于 , , 因此很显然 .
再考虑方差, 当 已知, 中只有 需要被考虑, 剩下的部分已经是已知了, 而
从 求一个平均, 有
故条件分布应为
因此条件方差是 .
八、(15 分) 设有线性模型
其中
对于 , 定义
(1)(7 分) 试求残差平方和 的期望.
(2)(8 分) 记 , 证明:
其中 是去除掉数据 后的估计量, 而 是矩阵 的 元.
Solution: (1) 令 , 求导有
得 , 即岭回归解. 而
而对矩阵, 有
代入 , 有
(2) 显然,
利用下述逆展开公式:
记 , 我们得到
其中 , 进而有
代入 , 注意利用 , 得
因此结论得证.