北京大学光华-431金融学统计-2020年

一、(15分) 研究团队调查了大、中、小型公司的各200名高管, 询问他们是否已经开展了大数据项目, 他们的回答结果如下:

是否已开展大数据项目 小型公司 中型公司 大型公司
10%10\% 35%35\% 26%26\%
90%90\% 65%65\% 74%74\%

请在5%5\%的显著性水平下, 判断不同类型公司是否在开展大数据项目上存在显著差异.

二、(15 分) 假设 X1,X2,XnX_1, X_2, \cdots X_n 是独立同分布的随机变量, 它们的分布密度函数 为: f(x;β,σ)=12σexβσ,xRf(x ; \beta, \sigma)=\frac{1}{2 \sigma} e^{-\frac{|x-\beta|}{\sigma}}, x\in R.
(1)(5 分) 请写出 X1,X2,XnX_1, X_2, \cdots X_n 的联合密度函数.
(2)(5 分) 如果β\beta已知, 求 σ\sigma 的极大似然估计.
(3)(5 分) 如果σ\sigma已知, 求 β\beta 的极大似然估计.

三、(15 分) 假设y1,y2,,yny_1,y_2,\cdots,y_n独立同服从下述异方差线性回归模型:

yi=β0+β1xi+εi,i=1,2,,n,y_i = \beta_0 + \beta_1 x_i + \varepsilon_i, \quad i =1,2,\cdots,n,

其中 εiN(0,i2)\varepsilon_i \sim N(0,i^2), x1,,xnx_1,\cdots,x_n是已知数.
(1)(5分) 求对数似然函数.
(2)(5分) 请写出 (β0,β1)(\beta_0,\beta_1) 的极大似然估计 (β^0,β^1)(\hat{\beta}_0,\hat{\beta}_1) 的数学公式.
(3)(5分) 给出(β^0,β^1)(\hat{\beta}_0,\hat{\beta}_1)的统计学分布.

四、(15分) 有一位市场调查员, 他感兴趣的是该地区成年人中购买某商品的比率 θ\theta. 现在他准备调查 nn 个顾客(nn较大), 如果购买了该商品则纪录为 xi=1x_i=1, 否则 xi=0x_i=0.
(1)(5分) 求 xˉ\bar{x}的近似分布.
(2)(5分) 现他要事先确定需要 访问多少顾客才能使 [xˉd,xˉ+d][\bar{x}-d, \bar{x}+d]θ\theta1α1-\alpha 置信区间? 其中 dd 是事先给定的常数.
(3)(5分) 又假如事先知道去年该比率是 20%20\%, 调查员试图研究今年是否有显著不同, 请写出假设检验问题并给出假设检验过程.

五、(15分) 假设 X1X_1X2X_2 都是独立同分布的泊松随机变量, 均值分别为 μ1\mu_1μ2\mu_2
(1) (5 分) 写出 X1X_1 的概率分布列.
(2) (5 分) 写出 X1+X2X_1+X_2 的概率分布列
(3)(5 分)请问 2X12 X_1 还服从泊松分布吗?