北京大学数院-431金融学综合-2019年
一、(10分) 盒中有 10 个乒乓球,2 个被用过,其余的都是新的.第一次比赛时从中任取 3 个球用,比赛结束后放回.第二次比赛再取 3 个.
(1)(5分) 求第二次比赛取得都是新球的概率;
(2)(5分) 已知第二次比赛取得都是新球, 求第一次取得都是新球的概率.
Solution:
(1) 首先计算第一次比赛后, 盒中新球数量的分布情况:
根据全概率公式:
故第二次比赛取得都是新球的概率是 .
(2) 根据贝叶斯公式:
故已知第一次比赛取得都是新球, 则第一次取得的都是新球的概率是 .
二、(10分) 已知随机变量 的概率密度 ,
(1)(5分) 求 ;
(2)(5分) 求 .
Solution:
(1) , 因此为满足概率的正则性, , 因为
(2)
三、(10分) 指出 和 相互独立的充要条件.
Solution:
首先, 二维正态分布各分量的线性组合仍然是正态分布, 所以 都仍然是 正态分布. 其次,正态分布的独立与不相关是等价的,我们去考虑其协方差.
因此我们可以认为 相互独立的充要条件是 的方差相等.
(1) 相互独立 .
(2) 相互独立.
四、(10分) 独立序列 其子列 独立同分布, 子列 独立同分布 .证明
按分布收敛到标准正态分布.
Solution:
令 , 很显然 是独立同分布序列,
根据独立同分场合的中心极限定理,
五、(10分) 公司 1 和公司 2 是否违约相互独立,发生违约的次数都是强度为 的泊松过程, 记公司 第一次发生违约的时间为 .
(1)(2分) 到 时刻未发生违约的概率;
(2)(2分) 求违约风险 ;
(3)(3分) 求 ;
(4)(3分) 已知 求 的条件分布.
Solution:
(1)
(2) , 故违约风险 .
(3) 想计算 , 就是要计算 和 , 而
实际上, . 同时, , , 而
因此 .
(4)
所以 的联合概率密度是 , 将 积分后得到 的边缘密度,
故条件分布为
六、(10分) 总体 求矩估计并证明其强相合性.
Solution:
现验证其相合性, 根据强大数律, , a.s., 故 , a.s.
七、(10分) 人群中支持某政策的比例为 未知. 随机抽 人,设有 人支持, 为 样本支持率.
(1)(5分) 用正态近似法给出 的 置信区间
(2)(5分) 要求置信区间长度小于 0.2, 至少需要多大.
Solution:
(1) 根据独立同分布场合的中心极限定理, 当 较大时, 近似地有
但是由于 是末知的, 故用 取代分母的 (根据强大数律, , 因此该取
代是合理的), 故近似地有 , 因此 的 置信区间是
(2) 置信区间长度 (注意到 ), 令 , 解得 , 故至少需要 97 个调查对象.
八、(10分) 叙述2×2 的列联表独立性检验.
Solution:
假设有两个离散分布总体 , 分别有 种取值, 根据样本得到的信息: 事件 被观测到的次数是 次, . 根据样本 信息来判断 是否独立.其被称为列联表的原因就是该问题可以被写成一个类 似二元离散分布的列联表.
我们知道, 如果 独立, 那么应该可以在样本种观察到 对所有 都近似成立, 也就是在直观上讲如果 越小, 我们就认为越 有可能是独立的. 但实际上, 每个事件的偏离程度是不一样的, 也就是 的量级越大,则它本身发生偏差的可能性就越大, 故我们要标准化每个事件的偏离程度, 即用 作为每个事件的权重, 如果 越小, 我们就认为越有可 能是独立的.
恰好, 统计量 近似服从 (可以自己思考一下自由度的问题, 课程和书本都有), 这就给了我们一个很好的用来检验独立性的统计量. 这就是 的列联表独立性检验的方法.
九、(10分) 设有线性回归模型
其中误差项独立同服从正态, 和是未知参数. 求的最大似然估计.
Solution: 对数似然函数为
欲求的最大似然估计, 等价于极小化残差平方和
求导得
解得
十、(10分) 不全为 i.i.d. 有观测值 满足 未知.
(1) 求 最大似然估计;
(2) 求 的分布;
(3) vs 构造水平为 的拒绝域.
Solution:
(1) 首先由于 , 记 , 我们写出似然函数
取对数, , 求偏导得到方程组:
解得, .
(2) 由于多元正态分布分量的线性组合还是正态分布, 而
故 , 这意味着 .
(3) 根据第二题的结论, 我们知道
但 是末知的, 但根据 , 因此用 代
替 后, 有统计量
当原假设成立时, , 而且由于 是 的估计量, 的绝对值应 该相当小才对, 如果 的绝对值很大, 我们有理由拒绝原假设, 因此拒绝域为