清华大学-432统计学-2019年
一、(30分) 独立随机变量序列 , , 其中 .
(1)(10分) 当 时, 是否有 请说明理由;
(2)(10分) 当 时, 是否有 请说明理由;
(3)(10分) 是否存在单调增加的正数列 使 其中
Solution:
(1) 对任意 ,
注意, 利用切比雪夫不等式 ,
而对第二个式子, 足够大时, 这个事件就是空集, 概率也是 0 .
因此 , 故 .
(2) [法一] 复刻第(1)问, 有标准正态分布 的任意阶矩存在, , 而
对任意 , 注意, 利用马尔可夫不等式 , 级数收敛.
而对第二个式子, 足够大时, 这个事件就是空集, 概率也是 0 .
根据比较判别法 , 由 Borel-Cantelli 引理, .
[法二] 借助不等式: 对 有 , 故
等比数列的级数收敛, 因此也能得到 .
(3) 在上一题的计算过程中我们已经知道 , 故
根据前 2 问, , 而 更是显然的, 因此 .
二、(20分) 是来自总体 的简单随机样本,其中 试求
(1)(10分) 的极大似然估计 ,
(2)(10分) 的极限分布.
Solution:
(1) 似然函数 , 其中 ,
因此我们可以看出, 当 时, 单调递增;
而当 时, 单调递减, 这说明了 是 的极大值点, .
但是如果出现 是没有办法取到 , 不过通过刚才的求导发现当 时 单调递减, 因此此时 .
综上所述, , 其中 表示集合 的示性函数.
(2) 首先根据辛钦大数定律, , 不难发现 . 这是由于
因此根据依概率收敛的 乘法性质, 有 .
但是单点分布的极限分布提供的信息过少, 为此我们去研究 的渐 近性质, 由于有
因此有 , 而 , 综上所述有
三、(30分) 是来自总体 的简单随机样本.
(1)(10分) 是否为充分统计量?
(2)(10分) 求 的充分完全统计量 ;
(3)(10分) 基于 构造 的相合估计量.
Solution:
【第三题】、(1)似然函数 , 根据因子分解定理, 是充分统 计量, 包含了样本的所有信息, 而 与 并不是一一对应的, 因此不是充 分统计量. 至于为何不是一一对应, 理由如下:
情况 1: , 此时 ;
情况 2: , 此时 ;
我们发现, 对于情况 1 和情况 的值不变, 但充分统计量 的取值改变, 故 反应不了样本的所有信息.
(2) 总体服从 , 是指数族, 因此充分统计量就是其完全充分统计量, 故 是其充分完全统计量, 也是其充分完全统计量 (因为和 . 一对应).
(3) 令 , 用微分法求其概率分布:
因此 , 根据强大数律 , 故 是 的 强相合估计.
四、(20分) 假设能够生成一列服从均匀分布 的独立同分布样本 . 现有随机变量 的密度函数为 . 请用两种不同方法通过 生成服从该分布的随 机数序列 .
Solution:
法一: , 现用微分法说明 :
法二: , 很显然,由于 , 故 .
法三:我们可以观察到 恰好是 的密度函数, 而 可以由 均匀分布的次序统计量来生成, 即令 , 这些 就是服从 Beta 的随机数序列了.
[点评]: 法一、法二用的都是分布函数的反函数与均匀分布的关系, 法三实际上 并不满足条件, 因为题目要求随机数的数量一致.
五、(20分) 两独立样本 i.i.d. 和 i.i.d. 求假设检验问题 :
的拒绝域, 其中已知.
Solution:
令 , 构造检验统计量 , 当原假设成立时, , 我们认为如果原假设成立时, 理应很小, 如果 比较大我们 就应该拒绝原假设, 因此自然而然地我们得出该检验问题的水平为 的拒绝域:
六、(30分) 简答题:
(1)(10分) 简述假设检验中功效,两类错误和 值的概念 ;
(2)(10分) 两类错误能不能同时很小? 为什么?
(3)(10分) 区间估计中的置信区间与假设检验中的拒绝域之间有何联系?请举例说明.
Solution:
(1) 功效的定义是 , 表示的是样本落入拒绝域的概率, 是参数 的函数.
两类错误分别是:第一类错误(拒真错误): 原假设成 立时, 样本由于随机性而落入拒绝域; 和第二类错误(取伪错误): 它代表着当原 假设不成立时, 样本由于随机性而落入接受域.
犯第一类错误的概率定义为 .
犯第二类错误的概率定义为 .
如果拒绝域是 , 这里 是检验统计量, 是某个常数. 那么 值的定义是: , 这里 表示统计量的观测值. 也就是说 值的概念是:当原假设成立时, 统计量大于它的观测值的概率的上确界(前提是拒绝域的形式是 , 即当统计量 较大时进行拒绝). 其他类型 的拒绝域对应的 值可以类似定义. 或简单的介绍为: 值是在原假设成立时, 发生比当前观测还要更“极端”的情况的概率, 这里“极端”的概念由拒绝域形式决定. 且 值是可以做出拒绝原假设判断的最小显著性水平.
(2) 当样本容量固定时, 两类错误的概率不可能同时很小. 理由如下:
对于一个假设检验问题, 假设有拒绝域 .
则此时犯第一类错误的概率是 .
犯第二类错误的概率是 .
为使得犯第一类错误的概率减小, 引入另一个拒绝域 , 而此时犯第一类错误的概率是 . 很显然对于 , 有 . 也就是说犯第一类错误的概率减少了. 但是此时, 犯第 二类错误的概率为 , 同样很显然的是 , 有 . 也就是说当一类错误的概率减少时, 另外一类错误 的概率就会增加. 故二者不可能同时很小.
(3) 现有显著性水平为 的拒绝域 (其中 是已知量, 其值由原假 设给出). 那么若将其补集 (也就是接受域) 中的 视作末知参数 , 并反解出形如 的集合,那么这一区间 就是参数 的 置信水平的置信区间. 这种求解置信区间的方法也称作反转接 受域.
现在给出一个例子: 正态分布总体(均值 末知, 方差 已知), 给出假设检验 问题: vs
这个假设检验问题显著性水平为 的拒绝域是 , 若将其 中 视为末知参数 , 从其补集 中可以反解出 , 而我们知道这正是 的水平为 的置信区间.