上海交通大学-432统计学-2021年
一.选择题 (30小题,每小题 2 分,共60分)
- 为调查全国疫情情况,调查组先从全国所有省份中随机抽取了八个省份,再对每个省份中的所有单位进行调查,这种抽样方法属于().
A.分层抽样
B.系统抽样
C.整群抽样
D.方便抽样
- 当一组数据呈对称分布时,在平均数加减 2 个标准差的范围之内大约有()的数据.
A.
B.
C.
D.
- 为调查群众戴口罩的频率, 调查者采用问卷调查, 问卷中的一个问题为"您戴口罩的频繁吗?", 选项为“从来不戴”、“极少戴”、“偶尔戴”、“经常戴”. 这一调查包含的误差类型是( )
A.记忆误差
B.理解误差
C.无回答误差
D.有意识误差
- 某奶粉生产企业欲了解消费者对奶粉成分的需求,选译调亘对奶粉购买力高、对奶粉成分有更高要求的年轻母亲,这种抽样方法属于( ).
A.随机抽样
B.方便抽样
C.重点抽样
D.代表抽样
- 在多元线性回归的线性关系检验与回归系数检验中,若 检验不通过,则某个系数的 检验 ().
A.可能通过也可能不通过
B.也不通过
C.一定通过
D.以上都不正确
- 计算机辅助电话调查的特点是 ().
A.可以利用有形辅助物
B.调查过程难以控制
C.问卷难度可以复杂
D.调查速度快
- 区间估计中 的置信水平是指 ( ).
A.总体参数落在一个特定的样本所构造的区间内的概率为
B.总体参数落在一个特定的样本所构造的区间内的概率为
C.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为
D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为
- 假设检验中使用 值进行决策的优势是 () .
A.可以精确地反映诀策的风险度
B.手工计算简便
C.进行决策的界限清晰
D.以上都不正确
- 设 是来自正态总体 的一个样本,设 是来自正态总体 的一个样 本,且 与 相互独立,已知 ,通过查表可知 . 则方差之比 的置信区间为( ).
A.
B.
C.
D.
- 多变量数据的图示中,用于展示三个变量之间关系的是().
A.散点图
B.气泡图
C.雷达图
D.饼图
- 在假设检验中,不拒绝原假设意味着().
A.原假设肯定是正确的
B.原假设肯定是错误的
C.没有证据证明原假设是正确的
D.没有证据证明原假设是错误的
- 随机变量 独立同分布于正态分布 ,则 服从于 ().
A.
B.
C.
D.
- 将 个球随机放入 个箱子内 ,每个球放入各个箱子的概率相等,则每个箱子至多有一个球的概率为 () .
A.
B.
C.
D.
- 设 是来自总体 的样本, 则() 是 的最有效估计.
A.
B.
C.
D.
- 下列情况中,可能存在多重共线性的是().
A.某个自变量的方差扩大因子 小于 10
B.模型中各个自变量显著不相关
C.回归系数的正负号与预期相同
D.某个自变量的容忍度小于
- 多元线性回归中残差图的作用是().
A.检验线性关系是否显著
B.检验回归系数是否显著
C.判断自变量之间是否存在多重共线性
D.判断对误差项 的假定是否成立
- 时间序列中逐期环比值(也称环比发展速度)的几何平均数减1后的结果是().
A.平均增长率
B.环比增长率
C.定基增长率
D.年度化增长率
- 如果一组数据分布的偏态系数是 ,则表明(.
A.该组数据呈右偏,且偏斜程度很高
B.该组数据呈右偏,且偏斜程度不高
C.该组数据呈左偏,且偏斜程度很高
D.该组数据呈左偏,且偏斜程度不高
- 根据以往的生产统计,某种产品的合格率约为 ,现要求估计误差为 ,在 的显著性水平下,应抽取 ( ) 个产品作为样本.
A. 138
B. 139
C. 384
D. 385
- 估计的回归方程为 ,其中在 的显著度下, 未通过 检验, 通过了 检验,则在 下我们可以认为().
A.
B.
C.
D. $ \beta_2, \beta_3 \neq 0 ; \beta_1=0$
- 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了
30 名工人,并指定每个人使用其中一种方法. 通过对每个工人生产的产品数进行方差分析得到下面的结果:
方差分析表
来源 | $F $ crit | |||||
---|---|---|---|---|---|---|
组间 | 210 | |||||
组内 | 3836 | |||||
总计 | 29 |
补全上面的方差分析表 ( ).
A. $ a=420, b=4256, c=2, d=27, e=142.07, f-1.478$
B.
C.
D.
- 关于方差分析中的多重比较方法中的最小显著差异 (LSD) 方法下列说法错误的是 ().
A. 方法用于当自变量对因变量有显著影响时的进一步分析
B. 方法通过两两配对来进一步检验哪些总体的方差之间有显著差异
C. 方法的原假设通常为
D.
- 下列关于调整的多重判定系数 说法错误的是().
、是度量多元回归方程拟合程度的一个统计量
B.相比较多重判定系数 ,可剔除变量个数对拟合优度的影响
C. 的值不一定小于 的值
D. 的值不会由于模型中自变量的个数的增加而越来越接近1
- 利用估计的回归方程进行区间估计时,关于平均值的置信区间和个别值预测区间,下面说法正确的是 ().
A.置信区间比预测区间宽
B.预测区间比置信区间宽
C.二者一样宽
D.不一定
- 在使用指数平滑法进行预测时,如果时间序列有较大的随机波动,则平滑系数的取值().
A.应该小些
B.应该大些
C.应该等于 0
D.应该等于1
- 在比较计量单位不同的两组数据离散程度时,应该使用().
A.离散系数
B.标准差
C.平均差
D.全距
- 已知随机变量 ,其中 是一个连续型随机变量,则随机变量 的概率 密度函数 为 () .
A.
B.
C.
D.
- 随机变量 相互独立且均服从于标准正态分布,则随机变量 的概率密度函数为 () .
A.
B.
C.
D.
- 且相互独立, ,则 的联合密度函数为().
A.
B.
C.
D. 以上都不正确
- 某一商场 30 分钟内到达的人数服从参数为 6 的泊松分布,则 10 分钟内来商场的人数等于 3 的概率为().
A.
B.
C.
D.
二、简答题
- 随机变量 相互独立,且均服从于均值为 1 的指数分布,现有假设检验 . 当拒绝域为 ,犯第一类错误和第二类错误的概率分别为 ; 当拒绝域为 ,其中 ,犯第 一类错误和第二类错误的概率分别为 .
(1) 求
(2) 求
(3) 说明随着样本量的增加 怎样变化,以及 是否成立.
-
阐述季节指数的计算方法.
-
建立多元回归模型时,为什么需要进行变量选择? 并阐述向前选择法的步骤.
- 随机变量 独立同分布,且 ,则当 时, 服从什么分布,并说明概率密度函数的形态变化.
三、计算题
- 为估计两种方法组装产品所需时间的差异, 分别对两种不同的组装方法随机安排12名工人, 每个工人独立组装一件产品所需的时间见下表:
假定两种方法组装产品的时间服从正态分布,且方差相等.
(1) 试以95%的置信水平建立两种方法组装产品所需平均时间之差的置信区间 ;
(2) 这两种方法组装产品所需时间有无显著差别?
- 一家房地产评估公司想对某城市的房地产销售价格 与地产评估价值 、房产评估价值 和使用面积 建 立一个模型,以便对销售价格进行合理预测. 为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果
(1) 补全方差分析表,写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;
(2) 检验回归方程的线性关系是否显著;
(3) 检验各回归系数是否显著;
(4) 计算多重判定系数 ,并说明它的实际意义;
(5) 计算估计标准误差 ,并说明它的实际意义
四. 证明题 (1小题, 共10分)
- 已知一列随机变量 相互独立,且都服从 上的均匀分布,令 , 其中.
(1) 证明 ;
(2) 求 .