北京师范大学-432统计学-2016年
一、选择题(15分)
- 下面关于箱线图和算术平均数正确的是( ).
A. 平均数大于15
B. 平均数等于15
C. 平均数小于15
D. 无法判断
Solution: A.
- 技术人员对某生产线上的产品每隔100件抽样一次, 他使用的抽样方法是( ).
A. 简单随机抽样
B. 整群抽样
C. 分层抽样
D. 系统抽样
Solution: D.
- 根据样本已经得到了 的 置信区间 , 正确的是( ).
A. 该区间以 的概率包含真值
B. 参数 在该区间内的概率为
C. 该区间有 的可能性包含参数
D. 参数 或者在 内, 或者不在 内
Solution: D. 此时已经根据样本值得到了一个固定的置信区间, 参数要么在这个固定的区间中, 要么不在其中. 注意如果题干改为抽样之前, 则由于样本还未获得, 两个区间端点都是随机的, 随机区间 覆盖参数真值 的概率是 . 但现在, 区间已定, 参数也是个常数, 要么在里面, 要么不在里面.
- 设 , 则当 增大时, 概率 逐渐( )
A. 增大
B. 减小
C. 不变
D. 无法确定
Solution: C. 是定值.
- 某校学生的成绩服从正态分布 , 在显著性水平 的情况下, 则要使估计 的测量误差控制在 之内, 需要多少样本量()
A. 139
B. 2238
C. 48
D. 934
Solution: A. , 令 , 化简得
这也意味着 , 解得 .
二、问答题
- (10分) 抽样调查的主要优点有哪些?
Solution:
1、抽样调查可以减少调查的工作量,调查内容可以求多、求全或求专,可以保证调查对象的完整性。
2、可以从数量上以部分推算总体,利用概率论和数理统计原理,以一定的概率保证推算结果的可靠程度,起到全面调查认识总体的功能,可以保证调查的精度。
3、因为抽样调查是针对总体中的一部分单位进行的,抽样调查可以大大减少调查费用,提高调查效率。
4、收集、整理数据、综合样本的速度快,保证调查的时效性。
2.(10分) 某篮球队队员年龄为 , 写出这组数据的分析报告.
Solution:
(i) 可以用 平均值、中位数、标准差 等统计量作分析;
(ii) 可以用 箱线图、茎叶图 等图形作分析;
(iii) 可以用 集中趋势、离散趋势、分布形状作分析.
这里, 有
, , 变异系数 , 中位数 .
茎叶图为
茎 | 叶 |
---|---|
3 | 7 5 2 |
2 | 8 7 7 4 2 |
1 | 9 |
分析:
变异系数较小, 仅为 0.21, 说明数据集中程度较高. 茎叶图中可以也看出, 年龄主要集中在20多岁.
- (12分) 一个罐子里有黑球和白球, 有放回地抽取一个样本容量为 的样本, 其中有 个白球, 问: 罐子里黑球和白球数之比 的极大似然估计量如何?
Solution: 有放回取球, 取出的白球数 , 其中 是白球的比例. 有 , 而 , 根据MLE的不变性, 有
- (12分) 机场大巴从起点站到西单站恰有站, 某次大巴从机场开出时有位旅客, 每位旅客在每站下车都是等可能的(即每人都有次下车选择), 如果无人下车则中途不停车. 求机场大巴到西单站的平均停车次数.
. 设分别是各站停车次数, 表示在第一站停车, 表示不停车, 则题目所求即为. 而
因此.
- (15分) 下面论述是否正确? 正确的给出证明, 错误的举出反例.
(1) 概率为 0 的事件是不可能事件;
(2) 概率为 1 的事件是必然事件;
(3) 小概率事件迟早会发生.
(1) 错误. 如设 , , 显然 并非不可能事件(并非 ), 但 , 在线段上取到单点的概率为 0.
(2) 错误, 如设 , , 显然 并非必然事件(并非全集), 但 .
(3) 正确, 设事件 发生的概率都非常小, 为 , 一直不发生的概率为
因此迟早会发生.
- (20分) 设 是来自 的独立样本.
(1) (7分) 求 的MLE, 它们是无偏估计吗?
(2) (6分) 写出样本方差的表达式, 它是无偏估计吗?
(3) (7分) 如果 , 求 的 置信区间.
似然函数为
对数似然函数是
求导得
令其为 , 解得
, 是无偏估计. 但由于, 因此 , 不是无偏估计.
(2) 样本方差的表达式是
根据第(1)问的论述, 它是 的无偏估计.
(3) 利用 构造区间, 即有
- (15分) 设 是来自一个期望为 , 方差为 的正态总体独立样本.
(1) (7分) 为使得 为 的无偏估 计, 求 .
(2) (8分) 是 的无偏估计吗? 若不是, 给出 的一个无偏估计.
(1) 由正态分布性质, 有, 故, 由期望的线性可加性, 有
因此.
(2) 由于 , 故 , 它不是 的无偏估计, 修正后看出 恰好是 的无偏估计, 其中 是样本方差.
- (15分) 从 总体抽取 100 个随机样本 , 为讨论假设检验问题
构造拒绝域 .
(1)(8分) 已知 , 证明犯第一类错误概率 ;
(2)(7分) 是一个合适的拒绝域吗? 为什么?
Solution: (1) 样本均值 , 故有
(2) 不是, 实际正反应了 比较小, 接近于 0, 正确的拒绝域形式应是形如 , 其中 可由显著性水平确定.
- (20分) 有下述一元线性回归模型
以及对应的方差分析表.
变量 | 平方和 | 自由度 | 均方 | 比 | Prob() |
---|---|---|---|---|---|
回归 | 1212 | 1 | 0.0001 | ||
残差 | |||||
总 | 1888 | 29 |
(1)(7分) 补齐方差分析表.
(2)(8分) 给定 , 方程是否显著? 写出原假设和备择假设.
Solution:
[注]: 自由度与样本量、参数的关系是:
假设有 个样本、 个参数, 如 是2个参数, 如 是3个参数, 则总自由度 , 回归自由度 , 残差自由度 .
(1) 补齐后如下:
变量 | 平方和 | 自由度 | 均方 | 比 | Prob() |
---|---|---|---|---|---|
回归 | 1212 | 1 | 1212 | 50.21 | 0.0001 |
残差 | 676 | 28 | 24.14 | ||
总 | 1888 | 29 |
(2) 方程是显著的, 因为 检验的 p 值是 0.0001<0.05, 拒绝原假设. 对应的原假设和备择假设是