清华大学-432统计学-2018年
一、(20分) 设有独立的随机变量序列 其中 ,
(1)(6分) 当 时 与 是否趋于 请说明理由;
(2)(7分) 当 时, 是否有 请说明理由;
(3)(7分) 当 时, 是否有 请说明理由.
Solution:
(1) .
因此 .
(2) 对于 , 有 , 因此 .
(3) 此时由于诸 独立, 且对于 , 所以由独 立场合的 Borel-Cantelli 引理, 有 a.s.
二、(20分) 设有一批产品100件,其中4件次品. 现从中任取3件, 若检验出其中有次品, 则认为该批次产品不合格. 检验时, 正品误判成次品的概率是0.05, 次品误判成正品的概率0.01. 试求该批产品检验结果合格的概率.
Solution:
用随机变量 表示该次抽检中抽到次品的数量, 事件 表示检验结果
合格. 则
因此 .
[点评] 在不能带计算器的前提下, 此类题不可能再考察. 但计算方法仍需掌握.
三、(20分) 某班级成员一星期迟到共计 50 次, 其中星期一 12 次, 星期二 11 次, 星期三 9 次, 星期四 10 次, 星期五 8 次. 问迟到是否与星期几有关?(注 : 记 是卡方分布 的密度函数, 且 )
Solution:
利用卡方拟合优度检验, 设 是某一次迟到可能发生在星期 的概率
, 建立假设检验问题:
构造卡方检验统计量 , 其中 表示随机变量可能的取值个数,
此处 为样本总数此时 为随机变量 的观测值总数, 等于
原假设中的 此处 . 而 , 此时
算得 . 所以不能拒绝原假设, 某一次 迟到可能发生在星期 的概率应该是相同的, 即迟到与星期几无关.
四、(50分) 随机变量 的密度函数为 其中 . 现有简单随机样本 .
(1)(10分) 记 ,试求 的密度函数;
(2)(10分) 求 分布的中位数, 以及
(3)(10分) 求 的极大似然估计
(4)(10分) 求 的密度函数;
(5)(10分) 求 的充分统计量.
Solution:
(1) , 则 由公式法, 有
根据 , 可确定 , 即 .
(2) 显然 .
求 的分布函数, 对
则令 , 解二次方程可得
(3) 似然函数
对数似然函数
由于总体服从单参指数族分布, 所以驻点一定是极大值点,
(4) 由于 , 由伽马分布的可加性可知 , 则求 的分布.
因此 的密度函数为逆伽马分布
(5) 似然函数 , 由因子分解定理可知: 是 的充分统计量.
五、(40分) 有观测数据 . 并有线性回归模型 为不为 0 的随机设置点.不可观测的随机误差变量 为未知参数, 则 :
(1)(20分) 求 的最小二乘估计 与 的极大似然估计 以及 的极大似然估计;
(2)(10分) 是否为 的无偏估计? 并比较二者的有效性 ;
(3)(10分) 利用似然比检验法给出假设检验问题 vs 的检验拒绝域.
Solution:
(1) 的最小二乘估计大家已经很熟悉了, . 现在我们继
续求极大似然估计: 令 , 这就是独立同正态分布样本 的估计了, 我们很明显知道
(2)先求期望, , 因此 是无偏估计,
, 因此 也是无偏估计. 再求方差, 有
(注意运用柯西-施瓦茨不等式
而 . 因此 是更有效的. 实际上, 由于正态分布总体 均值的估计是有效估计, 因此本题只需想方设法证明 LSE 的方差更大即可.
(3) 仍然借助 , 似然函数为
记 , 分别是 的 MLE.
当不加限制条件时,
当限制 时, 记 是此时 的 MLE, 则
因此有
其中 , 而 显然是 的单调增函数, 故拒绝域为
其中 是由显著性水平确定的常数, 由于当 时, , 故水平为 的拒 绝域为 .