北京大学光华-431金融学统计-2021年
一、(20分) 设 的密度函数是
(1)(10分) 求 的边际分布;
(2)(10分) 求 的分布.
Solution: (1) 先求 的边际, 积分有
再求 的边际, 积分有
(2) 作变量变换:
因此有
当 有 , 当 , 有 , 因此积分得
二、(15分) 为检验声波是否对心率有影响, 对 9 位测试者进行测试, 收集数据如下:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
---|---|---|---|---|---|---|---|---|---|
无声波 | 69 | 73 | 76 | 68 | 79 | 71 | 75 | 73 | 74 |
有声波 | 75 | 80 | 75 | 81 | 74 | 84 | 81 | 75 | 78 |
(1)(3分) 求有声波和无声波时的平均心率差值.
(2)(8分) 求心率差的 置信区间.
(3)(2分) 解释(2)问的意义.
(4)(2分) 根据(2)的结果判断, 声波对心率是否有显著影响.
[注]: 可能用到的分位数是 , , , .
Solution: (1) 作差计算得
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | |
---|---|---|---|---|---|---|---|---|---|
差值 | 6 | 7 | -1 | 13 | -5 | 13 | 6 | 2 | 4 |
计算得平均值为 . 此外计算出样本标准差是 .
(2) 假设心率差 , 有枢轴量
有置信区间为 , 代入得
(3) 我们有 的把握, 认为 的真实值处于区间 中.
(4) 置信区间和假设检验的对偶关系: 双侧置信区间不包含 当且仅当双侧假设检验问题
的原假设被拒绝.
在本题中, 考虑 . 由于 置信区间中不含 , 因此该问题的原假设被拒绝, 我们认为声波对心率会产生显著影响.
三、(20分) 某电视台在考虑缩短广告时间节约成本, 但担心缩短广告时间会导致广告效果产生负面影响, 收集数据如下:
20s广告 | 25s广告 | 30s广告 | 合计 | |
---|---|---|---|---|
有印象 | 16 | 32 | 12 | 60 |
无印象 | 44 | 38 | 58 | 140 |
合计 | 60 | 70 | 70 | 200 |
(1)(2分) 写出 和 ;
(2)(5分) 求各单元格期望计数;
(3)(8分) 求检验结果;
(4)(5分) 针对检验结果, 给出你的建议.
Solution: (1) 原假设应为广告时长不影响广告效果, 即
(2) 期望计数即为独立情形下预计出现的数量, 由于
而 , 因此有
20s广告 | 25s广告 | 30s广告 | 合计 | |
---|---|---|---|---|
有印象期望 | 18 | 21 | 21 | 60 |
无印象期望 | 42 | 49 | 49 | 140 |
合计 | 60 | 70 | 70 | 200 |
(3) 可计算出对应的差值 (实测期望) 是
20s广告 | 25s广告 | 30s广告 | |
---|---|---|---|
有印象差值 | -2 | 11 | -9 |
无印象差值 | 2 | -11 | 9 |
得到列联表检验统计量
原假设成立时有 , 拒绝域是
回忆起 , 令 , 解得
显然此时 , 落入拒绝域, 故认为广告时长与广告效果不独立.
(3) 可以发现: s 时长的广告效果是最好的. 因此可以将 s 的广告缩减时间到 s, 既可以节省成本, 又增强了广告效果.
四、(20分) 设有线性模型 , 其中 . 假设收集到独立数据 .
(1)(10分) 求 的极大似然估计 .
(2)(5分) 求 的分布.
(3)(5分) 根据该模型, 如何判断 与 是否存在明显的线性关系?
Solution: (1) 似然函数是
对数似然函数是
求导有
令它们为 , 且记, 由 直接得
再由 直接得 . 整理 得
即 , 同理由 得 . 即有线性方程组
根据克拉默法则, 解得
代入得
(2) 根据线性回归结论, 有 , 其中 , 此处
若记 , 则有
根据逆矩阵计算公式, 有
先计算行列式, 有
因此有
以及
和
综上所述, 有
(3) 根据该模型, 如果 和 具有线性关系, 那么系数 应该非常显著, 同时, 非线性关系项 对应的系数 不应显著.