清华大学-432统计学-2017年
一、(20分) 证明函数 是密度函数的充要条件是:
Solution:
(必要性) 由于 是密度函数, 因此 , 而 ,
要想积分收敛, 看出 , 同理若对 配方由对称性也有 . 在 此情形下, 有
由此得 .
(充分性) 此时显然 非负, 且根据上述计算, 有积分
故正则性也成立, 即 是密度函数.
二、(40分) 已知简单随机样本 i.i.d. .
(1)(10分) 证明 是充分完备统计量;
(2)(10分) 证明存在随机变量 使得 并求 的分布;
(3)(10分) 证明 是 的最大似然估计;
(4)(10分) 是否为 的无偏估计? 是否为 的弱相合估计? 并说明理由.
Solution:
, 根据因子分解定理, 是充分统计量. 下证 的完备性. 由均匀分布次序统计量的分布, 我们知道 . 设 有一Borel 可测函数 , 满足 , 也就是 即 , 因此 对 成立,
等式左右对 求导, 得 , 故 , 而 , 故 . 因此 是充分完备统计量.
(2) 记 . 而 , 其密度函数是:
现求 的分布, 利用微分法
因此
所以 的分布函数是
而 , 这是参数为 的指数分布的分布函数.
也就是说 , 其中 .
(3) 总体的密度函数是 , 所以似然函数 , 可以看出它是关于 的单调减函数, 同时从示性函数中看出 , 故当 时, 似然函数取到最大值. 因此 .
(4) , 因此 不是 的无偏估计.
根据 Beta 分布的数字特征,
根据切比雪夫不等式,
同时当 时, .
因此 , 即 是 的弱相合估计.
三、(40分) 已知简单随机样本 iid . 参数 的先验分布为贝塔分 布 , 则
(1)(5分) 求 的最大似然估计 ;
(2)(10分) 求 的贝叶斯估计 ;
(3)(10分) 求 与 的均方误差 与 ;
(4)(10分) 试确定 与 的值使得 与 无关;
(5)(5分) 在(4)的基础上求出 并比较 与 的大小.
Solution:
(1) 似然函数 , 令 , 可 以解得 , 由于总体服从指数族分布, 因此无需求二阶导, 其对数似然函数 的驻点必定是极大似然估计.
(2) 参数 的先验分布是 . 则样本与参数的
联合分布是: .
样本的边际分布是:
故参数 的后验分布是
也就是说参数的后验分布是 , 其后验期望估计是:
, 也就是 的贝叶斯估计.
(3) , 因此 是无偏估计, 它的均方误差即它的方差.
(4) 是一个关于 的二次多项式.
若要求它与 无关, 则
(5) 当 时,
而 .
(此处等号当且仅当 时取到) 因此可以判断, 当 较大时, 要比 小.
四、(20分) 已知总体 其中参数 与 未知 是在其中抽取的样本, 试确定 与 的关系, 使得 的 置信区间 最短, 其中
Solution:
为枢轴量. 如果 , 则 . 则
可得 的 置信区间: . 可知
根据题意, 也就是求 在 下的条件极小值, 其中 是 的密度函数. 利用拉格朗日乘数法,令
对第一个式子进行变形, 有
同理, (2) . 因此有 . 综上所述, 与 需要满足下述关系:
五、(30分) 通过实验观察得出 个样本点 . 假设 与 之间存在线 性关系, 并有统计模型 其中 i.i.d.. 为参数, 为一般变量, . 则 :
(1)(10分) 求 的最大似然估计 ;
(2)(10分) 上述 是否为 的无偏估计? 若是,请说明理由; 若不是,试构造 的无偏估计;
(3)(10分) 对线性回归方程的显著性作出假设 vs 给出你的检验标准.
Solution:
(1) 由题意可知, , 似然函数
对数似然函数 .
令 , 解得
其中
(2) 在讨论 之前,我们需要先去回忆一下 的分布:它们是二维正态,
因此有 , 且.
再去探讨 ,有
其中, , 且.
综上所述, 有 , 因此 不是无偏估计, 但可找到一个修正的无 偏估计
(3) [法一]一方面, 这是线性模型的显著性检验, 可以对总平方和进行分解,
其中残差平方和 , 回归平方和 ,当原假设成立, 这些平方和除以 后无疑都是服从卡方分布的, 根据我们的理解 与分析, 总平方和的自由度是 , 残差平方和的期望是 , 那么回归平 方和就无疑对应一个白由度为 1 的卡方分布.
因此, 当原假设成立时, , 得到拒绝域为
[法二] 另一方面, 这也是一个系数的 检验, 由于 , 因此有
但是方差项 是末知的, 我们只能用无偏估计量
去替代.而 且与分子独立, 因此有原假设成立时的检验
两种方法的拒绝域是等价的.