北京大学光华-431金融学统计-2018年

一、(15分) 解释或回答以下概念及问题:

(1)(5 分)随机变量 XXYY 的相关性。
(2)(5 分)随机变量 XXYY 的独立性。
(3)(5 分)如果 XXYY 不相关,那么 XXYY 是否独立?请具体论述。

二、(15 分)给定模型 yi=bxi+εiy_i =b x_i + \varepsilon_i,随机误差项 εi N(0,σ2)\varepsilon_i~N(0, \sigma^2)相互独立, 其中 σ2>0\sigma^2>0 未知, 现收集到数据 (xi,yi)(x_i, y_i), i=1,2,,ni = 1,2,\cdots,n.
(1)(5 分)请给出bb的最小二乘估计量b^\hat{b}
(2)(5 分)求b^\hat{b}的期望、方差和分布。
(3)(5 分)对于检验问题 H0:b=0H_0: b = 0 vs H1:b>0H_1: b > 0, 给出检验法.

三、(10 分)工商局抽查了 NN 家小微企业,发现 MM 家企业存在违规行为。请你设计一个统计模型,检验企业主的性别男女与违规行为是否有关。

四、(15分) 在股票交易系统中,任何一只股票连续两次交易的时间间隔tit_i服从泊松分布。现有两只股票一周的全部交易数据,请检验这两只股票是否服从同一泊松分布。

五、(20 分)假定一个研究者要考查公司管理层的收入是否与公司管理的绩效有关,收集相关数据建立了一个回归模型,变量 yy 为CEO 年薪,变量 x1x_1 为公司上一年年报收益,变量 x2x_2 为公司上一年市场价格,变量 x3x_3 为公司盈利能力,变量 x4x_4 为公司规模。使用的回归模型为:

y=β0+β1x1+β2x2+β3x3+β4x4+εy = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + \beta_3 x_3 + \beta_4 x_4 + \varepsilon

(1)如果只利用收集到的20 家公司进行分析,是否适合?如不适合,请给出原因。
(2)如果通过收集数据,将公司数量增加到80 家,使用这些数据重新估计模型,请判断系数的估计值是否会改变,tt统计量的值是否会改变。模型的调整 R2R^2 是否会改变,如果会改变,给出其化关系。
(3)如果通过上述80 家公司,发现模型的 R2R^2 并不低,但所有变量的系数都不显著。请你分析可能存在的原因,以及如何进行改进?