北京师范大学-432统计学-2019年
一、选择题(每题5分, 总计30分)
- 在某公司进行的英语水平测试中,新员工的平均得分是80分,标准差是 5 分,中位数是85分,则新员工得分的分布形状是 ( ).
A. 对称的
B. 左偏的
C. 右偏的
D. 无法确定
Solution: B. 平均值小于中位数, 说明是左偏的.
- 从 0-9 选一个数字, 检查学号尾号是此数的学生, 这种抽样方法是 ( )
A. 简单随机抽样
B. 系统抽样
C. 方便抽样
D. 整群抽样
Solution: B.
- 根据样本已经得到了 的 置信区间 , 正确的是( ).
A. 该区间以 的概率包含真值
B. 参数 在该区间内的概率为
C. 该区间有 的可能性包含参数
D. 参数 或者在 内, 或者不在 内
Solution: D. 此时已经根据样本值得到了一个固定的置信区间, 参数要么在这个固定的区间中, 要么不在其中. 注意如果题干改为抽样之前, 则由于样本还未获得, 两个区间端点都是随机的, 随机区间 覆盖参数真值 的概率是 . 但现在, 区间已定, 参数也是个常数, 要么在里面, 要么不在里面.
- 线性回归分析的说法, 正确的是 ( )
A. 选择解释变量时, 残差平方和越小越好
B. 线性检验是指对系数的线性关系检验
C. 一元线性回归中, 检验与 检验等价
D. 残差与误差有相同的分布, 可用残差估计误差
Solution: C. 变量越多, 残差平方和一定越小, 而选择解释变量时, 以变量对应系数是否能显著为准; 线性检验是对变量之间线性关系的检验; 一元回归时单个系数的显著性 检验与方程整体的 检验一致, 注意 ; 误差 , 残差指 , 它们分布不相同.
- 各自服从: , 当 时, 比较 ( ).
A.
B.
C.
D.
Solution: D. 显然不等式条件无法分辨 与 . 而我们知道
这说明 .
- 设 为来自正态分布 的样本,其中 为已知, 为 样本均值. 考虑如下假设检验: v.s. : , 标准正态分布的 分位数为 , 在显著性水平为 时, 拒绝 等价于 ().
A. 单侧区间 不包含
B. 单侧区间 包含
C. 单侧区间 不包含
D. 单侧区间 包含 ;
Solution: B. 依题意, 可知这是一个正态总体均值的右单侧检验, 拒绝域为
这等价于 , 所以选项B 正确.
二、分析计算题(共120分)
- (12分) 10 份外卖订单完成时间为 , (单位 min),要求用至少两种统计指标和统计图进行分析报告.
Solution: 统计图: 可用茎叶图 , 箱线图, 直方图.
统计指标: 平均数, 中位数 , 众数, 方差, 极差等.
- (15分) 将 三个字母之一输入信道, 输出原字母的概率为 , 而输出其它任一 字母的概率都是 . 现将字母串 , BBB, CCC 之一输入信道, 输入 AAA, BBB, CCC 的概率分别为 . 已知输出为 , 问输 入的是 概率是多少? (假设信道传输 每个字母的工作是独立的)
Solution: 根据贝叶斯公式有
其中 , 而
因此 .
- (15分) 概率为1的事件的积事件一定是概率1事件吗? 说明你的理由.
Solution: 是的. 设都是概率1事件, 则它们对立事件都是0概率事件, 则有
其中用到了德摩根公式和次可加性.
- (16分) 某天体专家取多次测量平均值作为实际估计值.假设各测量值 是独立同分布的随机变量, 已知测量方差为 , 若想以 的把握使误差控制在 之内, 问: 至少需要测量多少次?
Solution: 以 估计 , 假设是正态分布,
根据题设要求
意味着 , 解得
即至少 次.
- (15分) 总体 , 已知, 样本量为 . 总体 , 样本量为 . 两组样本独立.
(1)(5分) 写出 的 置信区间;
(2)(5分) 写出 的 置信区间;
(3)(5分) 若 , 写出 的 置信区间.
Solution: (1) 方差已知, 用枢轴量
置信区间是
(2) 方差未知, 用枢轴量
置信区间是
(3) 由于 已知, 故有
枢轴量为
因此置信区间为
- (16分) 设是i.i.d.的的随机样本.
(1)(8分) 求矩估计和极大似然估计;
(2)(8分) 比较说明矩估计和极大似然估计及其优缺点.
Solution: (1) 先求矩估计, 期望是, 则矩估计. 再看极大似然估计, 似然函数是
看出, 区间中任意一个值都是的MLE.
(2) 根据大数定律, 矩估计总是相合的; 但矩估计不一定是充分统计量的函数. MLE则一般都和充分统计量有关, 但缺点是可能不唯一.
- (16分) 从 总体抽取 100 个随机样本 , 为讨论假设检验问题
构造拒绝域 .
(1)(8分) 已知 , 证明犯第一类错误概率 ;
(2)(8分) 是一个合适的拒绝域吗? 为什么?
Solution: (1) 样本均值 , 故有
(2) 不是, 实际正反应了 比较小, 接近于 0, 正确的拒绝域形式应是形如 , 其中 可由显著性水平确定.
- (16分) 设有位置模型:
其中独立同分布, 期望为 , 方差为 .
(1)(8分) 给出 的两种估计及统计原理.
(2)(8分) 给出 的无偏估计 , 并判断 是否为 的无偏估计.
Solution: (1) 第一种: 矩估计, 用矩替换. 求期望得 , 因此 .
第二种: 最小二乘法. 令
最小, 也得 .
第三种: 最小一乘法. 令
最小, 得 , 即样本中位数.
注意这里没有分布条件, 不能求MLE.
(2) 样本方差是总体方差的无偏估计, 故
但是由于
即有
它不是无偏估计.