上海交通大学-432统计学-2022年
一、选择题
- 从一个 600 人的小区里抽住户,先按单元分,抽取若干单元的住户,再从抽取的若干个单元中,按完全随机的办法抽取 60 户,这种是什么抽样方法? ( )
A. 整群抽样
B. 分层抽样
C. 系统抽样
D. 多阶段抽样
- 进行一个调查,从一个老年人倶乐部入手,先调查几个老人,再让他们推荐其他人,再调查他们推荐的人,扩大调查范围,这种是什么抽样方法? ( )
A. 方便抽样
B. 判断抽样
C. 滚雪球抽样
D. 整群抽样
- 为研究两种稻谷的产量差异,分别种植了 10 个和 7 个样本,假设两种稻谷的产量分布为 ,计算样本可知: ,求 的 置信区间()
A.
B.
C.
D.
- 若一个三元线性回归,线性关系检验显著, 的回归系数检验显著,但 的回归系数 t 检验不通过,则()
A. 若使用 构建二元回归方程,则有可能 检验通过
B. 若使用 构建二元回归方程,则不可能 检验通过
C. 若使用 各自作为单独变量构建一元回归方程,则 检验一定不通过
D. 若使用 、 各自作为单独变量构建一元回归方程,则有可能 检验通过
- 一个机构对上交学生的 2021 年 9 月消费情况进行调查,但是只能收集到 2020 年 9 月的数据,该误差是什么误差? ( )
A. 抽样框误差
B. 无回答误差
C. 回答误差
D. 调查员误差
- 自填式问卷调查的弱点是什么? ( )
A. 回收率低
B. 成本太高
C. 只适合结构复杂的问卷
D. 调查周期短
- 一枚均匀的硬币,抛 20 次,求正面次数大于反面次数的概率 ( )
A.
B.
C.
D.
- 某厂宣称自己的节能灯寿命大于 400 天,假设节能灯的寿命均值为 ,则收货商验贷时应做的原假设,备择假设为()
A. v.s.
B. v.s.
C. v.s.
D. v.s.
- 比例估计,已知总体比率为 ,可接受的最大误差为 ,求样本量 的公式
A.
B.
C.
D.
- 希思罗机场声称自己是甲级机场,机构为了验证说法是否属实,进行假设检验,则设立的原假设为()
A. 希思罗机场没有达到甲级机场的标准
B. 希思罗机场达到了甲级机场的标准
C. 希思罗机场的自我评级与机构评级一致
D. 希思罗机场的自我评级与机构评级不一致
- 设 相互独立, ,在 的条件下,求
A.
B.
C.
D.
- 一个月份或季度的季节指数指的是该月份或季度数值 ( )
A. 占全年月份或季度数值总和的比率
B. 占以往所有年份相应的月份或季度数值平均的比率
C. 占全年月份或季度数值的平均数的比率
D. 以上选项都不对
- 含交互项的双因素方差分析,行因素有 个水平,列因素有 个水平,每组重复 次,总共有 个样本. 下面的方差分析表中 (I) (II) (III) 处的值缺失, 则缺失值 (III) 应该是 ( )
来源 | df | SS | MS | F |
---|---|---|---|---|
因素A | 2 | 1.078 | 0.539 | 40.86 |
因素B | 2 | 0.052 | 0.026 | 1.96 |
A:B | (I) | 0.689 | (II) | (III) |
残差 | 18 | 0.238 | 0.013 | |
总计 | 26 | 2.057 |
A. 26.5
B. 13.25
C. 8.33
D. 5.89
- 置信区间的含义()
A. 一个特定样本算出的置信区间有 的概率包含参数真值
B. 一个特定样本算出的置信区间有 的概率包含参数真值
C. 100 个置信区间包含参数真值的个数大约为 95 个
D. 100 个置信区间包含参数真值的个数大约为 5 个
- 箱线图显示: 众数<中位数<平均数,则该分布
A. 左偏
B. 右偏
C. 对称
D. 无法判断
- 利用 p 值决策的优势 ( )
A. p 值可以精确度量原假设和备则假设不一致的程度
B. p 值反映拒绝真实一个原假设的风险度
C. p 值有明确的决策界限
D. p 值反映接受一个错误的原假设的风险度
- 设随机变量 ,则()
A. 比 更有效
B. 比 更有效
C. 和 一样有效
D. 因为两者的均值不同,所以无法进行比较
- 某含季节成分的数据是 84,季节指数为 1.2, 则消除季节指数的数据是()
A. 70
B. 84
C. 100.8
D. 100
- 假如新冠肺炎恵者,用医学影像分析确诊的概率为 ,没有得新冠肺炎但是确诊的概率为 。现在已知一个城市得新冠的概率为 ,如果一个人确诊了,那么 他得新冠的概率是多少 ( )
A.
B.
C.
D.
- 设 ,关于 的极大似然估计,下列说法正确的是( )
A.
B.
C. 极大似然估计不存在
D. 极大似然估计不唯一
- 以下用哪种图表用来比较三个地区的销售情况最好?( )
A. 直方图
B. 气泡图
C. 雷达图
D. 环形图
- 以下哪些情况暗示回归模型可能存在多重共线性()
A. 模型中两个自变量显著不相关
B. 某个自变量容忍度小于
C. 某个自变量 VIF 小 于 10
D. 检验通过,至少有一个 检验通过
- 多元回归中,用 的目的是 ( )
A. 自动调整自变量个数对误差平方和的影响
B. 自动调整自变量个数对回归平方和的影响
C. 防止由于增加统计不显著的自变量而低估
D. 防止由于增加统计不显著的自变量而高估
- 设随机变量 独立同分布于一个正态分布 ,记 ,则统计量 服从什么分布? ( )
A.
B.
C.
D.
- 一个假设检验,如果在 的时候拒绝了 ,说明()
A. 判断 为真, 错误的概率不超过
B. 判断 为真, 错误的概率超过
C. 判断 为假, 错误的概率不超过
D. 判断 为真, 错误的概率不超过
- 设标准正态分布的超额峰度为 0 ,若一个分布的超额峰度为 ,则该分布为()
A. 左偏分布
B. 右偏分布
C. 尖峰分布
D. 扁平分布
- 双因素方差分析,相比较单因素方差分析有什么好处,是因为()
A. 双因素方差分析的 值一定比任一单因素方差分析中的 值大
B. 双因青方差分析的 值一定比任一单因素方差分析中的 值小
C. 双因素方差分析的残差效应更大
D. 双因素方差分析的联合效应更小
- 回归方程中的,相同置信水平下, 的预测区间以及其平均值的置信区间的关系是( )
A. 平均值的置信区间更短
B. 预测区间更短
C. 平均值的置信上限严格大于预测上限
D. 平均值的置信上限有可能大于预测上限
- 设连续型随机变量 的密度函数为 服从 , 则 ( )
A.
B.
C.
D.
- 在进行多元回归的F检验时, 如果接受原假设, 那么以下选项错误的是( )
A. 任何一个自变量都不显著
B. 回归方程的线性关系不显著
C. 没有找到充分的理由推翻原假设
D. 自变量和因变量之间不可能有非线性关系
二、简答题
- 设随机变量 ,且 相互独立, ,取拒绝域 。
(1) 求第一类错误概率 (3分)
(2) 求第二类错误 , 并求出 上限的最小值 (3分)
(3) 是否成立 (2分)
(4) 若要求 , 应该满足什条件 (2分)
- 某种商品价格的4年环比增长率
(1) 求年平均增长率 .
(2) 表示哪种增长率,用来描述什么 ?
(3) 增长率分析需要注意哪些问题.
- 非线性趋势曲线有哪些,写出他们的名称,用来描述何种趋势,写出趋势方程,用什么方法计算模型里的参数。
- 随机变量 是大于 0 的连续型随机变量, 的均值方差都存在, 设 是来自总体 的简单随机样本,试求 的渐近分布?
三、计算题
- 为估计两种肥料的差异,在土壤上分别使用两种不同的肥料各随机施肥10次,得到两组简单随机样本 , 分别来自 .
(1) 假设 ,求 的 95% 置信下限.
(2) 在 的显著性水平下,试检验是否有 .
- 货车的运输时间 ( , 单位:小时) 与运输路程 ( , 单位: 英里) 有关,取 10 个样本,考虑运输时间与运输路程的一元回归模型. 给出下面一些统计量. 试解决以下问题:
.
(1) 补全方差分析表:
df | SS | MS | F | |
---|---|---|---|---|
回归 | ||||
残差 | 15.3 | - | ||
总和 | 9 | - | - |
(2) 设回归模型 ,求 ,并说明 的实际意义.
(3) 计算多重判定系数 ,并说明它的实际意义;
(4) 给定 ,判断线性关系是否显著;
(5) 在 的显著性水平下, 给定 , 求 的预测区间.
四. 证明题 (1小题, 共10分)
- 定义连续型随机变量 的密度函数为 ,且 的定义域 相同,定义Kullback-Leibler散度:
(1) 求证: ;
(2) 若 ,求 ,并说明 变化时, 的变化。