上海交通大学-432统计学-2024年
一、选择题(1-15题每题2分, 16-25题每题3分, 共60分)
- 从某车厂抽了20辆同一类型的车进行测是, 根据这20车的数据得出结论, 表明这类型车百公里油耗小于 L, 这句话是( )
A. 对样本的描述
B. 对样本的推断
C. 对总体的描述
D. 对总体的推断
Solution: D.
这是通过样本数据对总体的推断.
- 某大学的马克思学院的老师对大学生玩手机的时间比较感兴趣, 因此从马克思学院的大一、大二、大三、大四, 各抽了20个人( )
A. 多阶段抽样
B. 配额抽样
C. 简单随机抽样
D. 整群抽样
Solution: B.
- 为研究不同人的甘油三酯和血糖的关系, 应该用什么图表( )
A. 条形图
B. 对比条形图
C. 散点图
D. 饼图
Solution: C.
- 淘宝调查某产品评价, 有人恶意差评, 请问这是什么误差( )
A. 随机误差
B. 回答误差
C. 无回答误差
D. 抽样框误差
Solution: B.
- 一组数据的均值是 0.078, 标准差是 0.03, 下列哪一个是异常值( )
A. 0.089
B. 0.074
C. 0.072
D. 0.082
Solution: A.
- 现有某大学的学生分数, 分数均值是 78 , 中位数是 83 , 标准差是8, 则样本的分布是( )
A. 左偏
B. 右偏
C. 对称
D. 不确定
Solution: A.
- 假设 的分布列为 , , 问 的均值和方差, 以下错误的是( )
A. 众数和中位数均为 0
B. 期望为 0.4
C. 方差为 0.44
D. 标准差为 0.2
Solution: D.
- 总体 , 随机变量 是 分布, 求 的参数
A.
B.
C. 1
D.
Solution: 选 A.
我们知道 , , 因此 , 对应系数得到 .
- 设 , 求 的概率密度函数( )
A. , .
B. , .
C. , .
D. , .
Solution: A.
微分法.
- 下列四个说法中, 哪个说法是错误的( )
A. 离散系数越小, 数据越分散
B. 异众比率越小, 数据越集中
C. 极差会受极端值影响
D. 四分位差不是用于分类数据
Solution: A.
- 研究在雨天的路上和晴天的路上的刹车距离, 20辆车在两个路上进行测试, 测得雨天的刹车标准差是 45 , 晴天的是 25 , 假设刹车距离均为正态分布, 且雨天刹车距离的方差为 , 晴天刹车距离的方差为 , 检验问题:
则 (分位数: )
A. 拒绝原假设
B. 不拒绝原假设
C. 拒绝不拒绝都可以
D. 无法确定
Solution: B.
, 因此不拒绝原假设, 选 B.
- 假设随机变量 , 求 =( ).
A. 73
B. 144
C. 25
D. 169
Solution: A.
直接计算, 有
- 假设总体正态, 样本量是 16 , 样本均值是 7.3 , 样本方差是 0.64 , 想要研究均值是否显著小于7.5, 下列正确的是( )
A. 原假设是大于等于7.5, 检验统计量的形式是
B. 原假设是小于等于 7.5 , 检验统计量的形式是
C. 原假设是小于等于 7.5 , 检验统计量的形式是
D. 原假设是大于等于 7.5 , 检验统计量的形式是
Solution: A.
D虽然数据对上了, 但检验统计量的形式不是统一形式.
- 假设总体 , 样本均值和样本方差分别为 和 , 下列正确的是( )
A. 是 的无偏估计
B. 是 的极大似然估计
C. 是 的一致估计
D. 与 独立
Solution: C.
我们知道 无偏, 故根据 Jensen不等式, 不是无偏的, A 错;
题目没有给分布, B 错;
D 只有在正态情形正确, 故 D 错.
对于 C, 首先 , 利用依概率收敛对连续函数保持不变, 有 .
- 假设 , 常数 , 求
A.
B.
C.
D.
Solution: A.
直接计算
- 泊松分布 的C-R下界是多少? ( )
A.
B.
C.
D.
Solution: C. , 故 CR 下界为 .
- 总体 , 要求满足 的最小样本量( ) (分位数: )
A. 68
B. 67
C. 97
D. 96
Solution: C.
令 , 因此 , 解得 , 选 C.
-
(暂无题目, 有回忆者可以联系大师兄)
-
(暂无题目, 有回忆者可以联系大师兄)
-
进行满意度调查, 结果如下:
性别/满意度 | 满意 | 一般 | 行和 |
---|---|---|---|
男生 | 180 | 120 | |
女生 | 130 | 70 | |
列和 | 310 | 190 |
求男生女生满意的行百分比( )
A. ,
B. ,
C. ,
D. ,
Solution: A.
- 关于列联表, 下列说法正确的是( )
A. 相关系数适用于所有的列联表
B. 相关系数是 相关系数的特殊情况
C. 相关系数取值在 的所有值
D. 相关系数取值在 的所有值
Solution: B.
- 调整后的多重判定系数为 , , , 则 =( ).
A. 0.85
B. 0.75
C. 0.25
D. 0.8
Solution: D.
, 解出 .
- 样本量 , 回归方程 , 得到估计的回归方程:
, 且 的标准误是 , , 则
A. 线性关系显著
B. 无多重共线性
C. 对 显著
D. 对 显著
Solution: A, C.
这里 , 拒绝原假设, 因此 对 是显著的. 如果模型中至少有一个变量显著, 则模型自身也是显著的. 而对于 B 和 D, 没有其他信息的情况下无法判断.
- 某品牌手机销售量是先增长缓慢, 再突然暴增, 再增长缓慢至饱和, 请问用什么曲线进行拟合?( )
A. 指数曲线
B. 修正过后的指数曲线
C. 三次曲线
D. 逻辑斯蒂曲线
Solution: D.
这种曲线符合种群人口增长的模型, 同时可以发现 A、B、C都是无界的, 只有 D 有界满足题设的饱和.
- 季节指数, , 预测方程 , 2023年第三季度的值是 9000, 求2024年第一季度的预测值是( )
A. 11440
B. 7000
C. 10340
D. 9400
Solution: A.
, 再乘上季节指数 1.1 得 A.
二、简答题(每题10分, 共40分)
- 序列 预测: 什么是指数平滑? 什么是二次指数平滑? 结合指数平滑和二次指数平滑, 以序列举例进行预测.
Solution: 指数平滑和二次指数平滑是时间序列分析中用于预测的两种技术. 它们通过给历史数据不同的权重来预测未来的值.
一次指数平滑(Simple Exponential Smoothing):
指数平滑是一种预测技术,适用于没有明显趋势和季节性的时间序列. 它通过对最近的数据给予更大的权重,并对更早的数据给予递减的权重来计算平滑值. 指数平滑的公式
其中, 是时刻 的平滑值, 是时刻 的实际观测值, 是平滑参数().
二次指数平滑(Double Exponential Smoothing):
二次指数平滑适用于有趋势但没有季节性的时间序列. 它的公式包括两个方程:
其中, 是时刻 的平滑值, 是时刻 的趋势项, 是时刻 的实际观测值, 和 是平滑参数.
- 为了研究户型、房价指数、房东收入对二手房价的影响, 其中如果户型是三室两厅记作 , 两室两厅记作 , 请你建立线性回归方程并检验模型是否显著.
Solution: 为了研究二手房价()与户型 、房价指数()和房东收入()的关系,我们建立以下多元线性回归模型:
其中, 是一个虚拟变量,表示户型, 模型中, 是截距, 分别是与 相关的系数,而 代表误差项. 为了检验模型的显著性,我们通常进行以下两种检验:(i) F检验(整体显著性检验):检验模型中所有自变量对因变量的联合影响是否显著. (ii) t检验(单个系数的显著性检验):检验模型中每个自变量对因变量的独立影响是否显著.
- 设有总体指数分布 的三个样本 , 找出 使 是 的无偏估计.
Solution: 对于指数分布, 我们有结论: , , 因此这里 , , 故有 .
- 似然比检验,假设总体 , 给出检验问题:
的似然比检验.
Solution: 茆书例题 7.4.1 原题.
三、计算题(前2题每题15分, 第3题20分, 共50分)
- 设 , , 求 .
Solution: 这是复旦432-2022-第五题原题. 利用 与 同分布, 有
这两个事件并起来恰好意味着 , 同号. 因此 , 作独立变换, 找合适的 使得 , 同时恰好 , 因此有
这里 是标准柯西分布分布函数, 且用到了 , 因此不难求出
- 设有来自 的简单随机样本 , 记 , 求最优权重 使得 是无偏估计且的方差最小.
Solution: 首先 , . 因此需要满足 , 这也意味着: 令 , 其中 , 找最优权重 , 满足 , 使其方差最小.
实际上不难看出, 对于 i.i.d. 样本, 时, 方差最小, 证明是简单的: 用柯西-施瓦茨不等式,
当且仅当 时取等, 此时 .
当然, 也可以用拉格朗日乘数法.
- 有来自总体 的简单随机样本 . 其次序统计量是 .
(1) 求 的概率密度, 期望、方差.
(2) 证明 按分布收敛于 Exp.
(3) 求 的 的渐近置信区间. (用渐近分布)
(4) 给出 的渐近拒绝域.
Solution: (1) 利用均匀分布次序统计量结论, 有 , 因此有
期望是 , .
(2) 直接求分布函数即可, 有
因此 , 这确实是 Exp.
(3) 单侧双侧都可以, 最好是单侧, 因为 应该在形如 的区间中更合理. 我们有
通过反解得到置信区间
(4) 拒绝域形式应是 , 注意原假设时 , 我们表示为
因此为使得水平为 , 应有 , 即 , 故拒绝域可以是
或者直接是 .