北京大学光华-431金融学统计-2022年
一、(20分) 设 有密度函数
(1)(5分) 求 .
(2)(10分) 求 的期望和方差.
(3)(5分) 求 的概率分布.
Solution: (1) 由密度函数的正则性, 有
解得 .
(2) 先计算期望, 由奇函数性质, 有
再算二阶矩, 由偶函数性质, 有
因此 .
(3) 利用分布函数法, 对 , 有
求导, 得
二、(15分) 某生产灯泡的公司想估计灯泡的平均寿命(小时). 设灯泡寿命 .
(1)(5分) 想将 的置信水平的置信区间误差控制在 小时内, 需要多少样本量?
(2)(5分) 现将置信水平改为 , 重新回答(1).
(3)(5分) 现在考虑置信水平还是 , 但误差需要在 小时内, 需要多少样本量?
Solution: (1) 枢轴量为 , 因此有置信区间
查表得 , 因此令
这说明至少需要 个样本量.
(2) 同理, 查表得 , 因此令
这说明至少需要 个样本量.
(3) 令
至少需要 个样本量.
三、(20分) 为调查折扣水平和订阅服务量是否有关, 收集如下数据.
无折扣 | 普通折扣 | 大折扣 | 总和 | |
---|---|---|---|---|
订阅 | 20 | 50 | 30 | 100 |
不订阅 | 80 | 150 | 70 | 300 |
总和 | 100 | 200 | 100 | 400 |
(1)(5分) 写出 和 .
(2)(10分) 给出检验统计量及其在 下的分布, 并计算其样本值.
(3)(5分) 在 显著性水平下, 是否认为折扣水平和订阅服务量有关?
Solution: (1) 原假设应是折扣水平和订阅服务量无关, 备择假设是有关, 即
(2) 列联表检验统计量
我们先计算出独立时每个单元格期望值 , 即
无折扣 | 普通折扣 | 大折扣 | 总和 | |
---|---|---|---|---|
订阅 | 25 | 50 | 25 | 100 |
不订阅 | 75 | 150 | 75 | 300 |
总和 | 100 | 200 | 100 | 400 |
对应计算出差值 , 即
无折扣 | 普通折扣 | 大折扣 | |
---|---|---|---|
订阅差值 | -5 | 0 | 5 |
不订阅差值 | 5 | 0 | -5 |
因此有卡方统计量的值为
(3) 对应的拒绝域是
回忆起 , 令 , 解得
显然此时 , 不落入拒绝域, 故我们认为订阅量与折扣水平独立.
四、(20分) 设有线性模型 , 其中 . 假设收集到独立数据 .
(1)(5分) 求 的 OLS 估计量.
(2)(5分) 根据该模型, 如何判断 与 是否存在明显的线性关系?
(3)(10分) 如果 与 存在线性关系, 求 的OLS估计量, 并证明它是无偏的.
Solution: (1) 记, OLS 估计意味着残差平方和最小, 即
最小. 求导有
令它们为 , 由 直接得 .
整理 得
即 , 同理由 得 . 即有线性方程组
根据克拉默法则, 解得
代入得 .
(2) 根据该模型, 如果 和 具有线性关系, 那么系数 应该非常显著, 同时, 非线性关系项 对应的系数 不应显著.
(3) 如果已知 和 只存在线性关系, 则有非线性关系项 对应的系数真值为 , 此时残差平方和为 , 重复 (1) 中求导步骤得
根据期望的线性性, 有