上海交通大学-432统计学-2024年

一、选择题(1-15题每题2分, 16-25题每题3分, 共60分)

  1. 从某车厂抽了20辆同一类型的车进行测是, 根据这20车的数据得出结论, 表明这类型车百公里油耗小于 7.17.1 L, 这句话是( \quad )
    A. 对样本的描述
    B. 对样本的推断
    C. 对总体的描述
    D. 对总体的推断

  1. 某大学的马克思学院的老师对大学生玩手机的时间比较感兴趣, 因此从马克思学院的大一、大二、大三、大四, 各抽了20个人( \quad )
    A. 多阶段抽样
    B. 配额抽样
    C. 简单随机抽样
    D. 整群抽样

  1. 为研究不同人的甘油三酯和血糖的关系, 应该用什么图表( \quad )
    A. 条形图
    B. 对比条形图
    C. 散点图
    D. 饼图

  1. 淘宝调查某产品评价, 有人恶意差评, 请问这是什么误差( \quad )
    A. 随机误差
    B. 回答误差
    C. 无回答误差
    D. 抽样框误差

  1. 一组数据的均值是 0.078, 标准差是 0.03, 下列哪一个是异常值( \quad )
    A. 0.089
    B. 0.074
    C. 0.072
    D. 0.082

  1. 现有某大学的学生分数, 分数均值是 78 , 中位数是 83 , 标准差是8, 则样本的分布是( \quad )
    A. 左偏
    B. 右偏
    C. 对称
    D. 不确

  1. 假设 XX 的分布列为 P(X=1)=0.2,P(X=0)=0.7\mathbb{P}(X=1)=0.2 , \mathbb{P}(X=0)=0.7 , P(X=2)=0.1\mathbb{P}(X=2)=0.1 , 问 XX 的均值和方差, 以下错误的是( \quad )
    A. 众数和中位数均为 0
    B. 期望为 0.4
    C. 方差为 0.44
    D. 标准差为 0.2

  1. 总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) , 随机变量 F=k(Xˉμ)2i=1n(XiXˉ)2F=\frac{k (\bar{X}-\mu)^2}{\sum_{i=1}^n\left(X_i-\bar{X}\right)^2}FF 分布, 求 kk 的参数 ()(\quad)
    A. n(n1)n (n-1)
    B. n1n\frac{n-1}{n}
    C. 1
    D. nn1\frac{n}{n-1}

  1. XN(0,1)X \sim N(0, 1), 求 Y=X4Y=X^4 的概率密度函数( \quad )
    A. 122πy3/4exp(y1/22)\frac{1}{2 \sqrt{2 \pi}} y^{-3 / 4} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.
    B. 12πy3/4exp(y1/22)\frac{1}{\sqrt{2 \pi}} y^{-3 / 4} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.
    C. 14πy3/4exp(y1/22)\frac{1}{4\sqrt{\pi}} y^{-3 / 4} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.
    D. 12πy3/2exp(y1/22)\frac{1}{2\sqrt{\pi}} y^{-3 / 2} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.

  1. 下列四个说法中, 哪个说法是错误的( \quad )
    A. 离散系数越小, 数据越分散
    B. 异众比率越小, 数据越集中
    C. 极差会受极端值影响
    D. 四分位差不是用于分类数据

  1. 研究在雨天的路上和晴天的路上的刹车距离, 20辆车在两个路上进行测试, 测得雨天的刹车标准差是 45 , 晴天的是 25 , 假设刹车距离均为正态分布, 且雨天刹车距离的方差为 σ12\sigma_1^2 , 晴天刹车距离的方差为 σ22\sigma_2^2 , 检验问题:

H0:σ12σ221H1:σ12σ22>1H_0: \frac{\sigma_1^2}{\sigma_2^2} \leq 1 \leftrightarrow H_1: \frac{\sigma_1^2}{\sigma_2^2}>1

()(\quad) (分位数: F0.05(19,19)=2.17F_{0.05}(19, 19)=2.17 )
A. 拒绝原假设
B. 不拒绝原假设
C. 拒绝不拒绝都可以
D. 无法确定


  1. 假设随机变量 XN(0,36),YN(1,25),ρ(X,Y)=0.8X \sim N(0, 36) , Y \sim N(1, 25) , \rho(X, Y)=0.8 , 求 Var(2XY)\operatorname{Var}(2 X-Y)=( \quad ).
    A. 73
    B. 144
    C. 25
    D. 169

  1. 假设总体正态, 样本量是 16 , 样本均值是 7.3 , 样本方差是 0.64 , 想要研究均值是否显著小于7.5, 下列正确的是( \quad )
    A. 原假设是大于等于7.5, 检验统计量的形式是 4xˉ7.5s4 \frac{\bar{x}-7.5}{s}
    B. 原假设是小于等于 7.5 , 检验统计量的形式是 4xˉ7.5s4 \frac{\bar{x}-7.5}{s}
    C. 原假设是小于等于 7.5 , 检验统计量的形式是 xˉ7.50.8\frac{\bar{x}-7.5}{0.8}
    D. 原假设是大于等于 7.5 , 检验统计量的形式是 xˉ7.50.2\frac{\bar{x}-7.5}{0.2}

  1. 假设总体 XX , 样本均值和样本方差分别为 Xˉ\bar{X}S2S^2 , 下列正确的是( \quad )
    A. SSσ\sigma 的无偏估计
    B. SSσ\sigma 的极大似然估计
    C. SSσ\sigma 的一致估计
    D. SSσ\sigma 独立

  1. 假设 XN(0,1)X \sim N(0, 1), 常数 x<0x<0 , 求 P(x<XX0)=()\mathbb{P}(x<X \mid X \leq 0)=(\quad)
    A. 2Φ(x)12\Phi \left( -x \right) -1
    B. Φ(x)1\Phi \left( -x \right) -1
    C. Φ(x)1/2\Phi \left( -x \right) -1/2
    D. 2Φ(x)1/22\Phi \left( -x \right) -1/2

  1. 泊松分布 P\mathcal{P} 的C-R下界是多少? ( \quad )
    A. nλ\frac{n}{\lambda}
    B. 1nλ\frac{1}{n \lambda}
    C. λn\frac{\lambda}{n}
    D. 1nλ2\frac{1}{n \lambda^2}

  1. 总体 XN(μ,14)X \sim N\left(\mu, \frac{1}{4}\right) , 要求满足 P(Xˉμ<0.1)0.95\mathbb{P}(|\bar{X}-\mu|<0.1) \geq 0.95 的最小样本量( \quad ) (分位数: z0.95=1.64,z0.975=1.96z_{0.95}=1.64, z_{0.975}=1.96 )
    A. 68
    B. 67
    C. 97
    D. 96

  1. (暂无题目, 有回忆者可以联系大师兄)

  1. (暂无题目, 有回忆者可以联系大师兄)

  1. 进行满意度调查, 结果如下:

    性别/满意度 满意 一般 行和
    男生 180 120 300\mathbf{3 0 0}
    女生 130 70 200\mathbf{2 0 0}
    列和 310 190 500\mathbf{5 0 0}

    求男生女生满意的行百分比( \quad )
    A. 60%60 \%, 65%65 \%
    B. 33.3%33.3 \%, 30%30 \%
    C. 58%58 \%, 42%42 \%
    D. 62.07%62.07 \%, 37.93%37.93 \%


  1. 关于列联表, 下列说法正确的是( \quad )
    A. φ\varphi 相关系数适用于所有的列联表
    B. φ\varphi 相关系数是 VV 相关系数的特殊情况
    C. cc 相关系数取值在 [0,1][0, 1] 的所有值
    D. φ\varphi 相关系数取值在 [0,1][0, 1] 的所有值

  1. 调整后的多重判定系数为 0.70.7, n=10n=10, k=3k=3, 则 R2R^2=( \quad ).
    A. 0.85
    B. 0.75
    C. 0.25
    D. 0.8

  1. 样本量 n=36n=36, 回归方程 y=β0+β1x1+β2x2+β3x3+β4x4y=\beta_0+\beta_{1} x_1+\beta_2 x_{2}+\beta_3 x_{ 3}+\beta_4 x_4, 得到估计的回归方程:
    y^=6.8+β^1x1+1.2x2+β^3x3\hat{y}=6.8+\hat{\beta}_1 x_1+1.2 x_2+\hat{\beta}_3 x_3, 且 β^2\hat{\beta}_2 的标准误是 0.30.3, t0.025(32)=2.036933t_{0.025}(32)=2.036933 , 则 ()(\quad)
    A. 线性关系显著
    B. 无多重共线性
    C. X2X_2YY 显著
    D. X1X_1YY 显著

  1. 某品牌手机销售量是先增长缓慢, 再突然暴增, 再增长缓慢至饱和, 请问用什么曲线进行拟合?( \quad )
    A. 指数曲线
    B. 修正过后的指数曲线
    C. 三次曲线
    D. 逻辑斯蒂曲线

  1. 季节指数, 1.1,0.8,0.9,1.21.1 , 0.8 , 0.9 , 1.2 , 预测方程 Yt=6000+200tY_t=6000+200 t, 2023年第三季度的值是 9000, 求2024年第一季度的预测值是( \quad )
    A. 11440
    B. 7000
    C. 10340
    D. 9400

二、简答题(每题10分, 共40分)

  1. 序列 Y1,,YnY_1, \ldots, Y_n 预测: 什么是指数平滑? 什么是二次指数平滑? 结合指数平滑和二次指数平滑, 以序列举例进行预测.

  2. 为了研究户型、房价指数、房东收入对二手房价的影响, 其中如果户型是三室两厅记作 11, 两室两厅记作 00, 请你建立线性回归方程并检验模型是否显著.

  3. 设有总体指数分布 Xf(x;θ)=1θex/θX\sim f(x;\theta) = \frac{1}{\theta} e^{-x/\theta} 的三个样本 X1,X2,X3X_1,X_2,X_3, 找出 α\alpha 使 αX(1)+(1α)X(3)\alpha X_{(1)} + \left(1-\alpha\right) X_{(3)}θ\theta 的无偏估计.

  4. 似然比检验,假设总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right), 给出检验问题:

H0:μ=μ0vsH1:μμ0H_0: \mu=\mu_0 \quad \mathrm{vs} \quad H_1: \mu \neq \mu_0

的似然比检验.

三、计算题(前2题每题15分, 第3题20分, 共50分)

  1. (XY)N((00),(1ρρ4))\left( \begin{array}{c} X\\ Y\\ \end{array} \right) \sim N\left( \left( \begin{array}{c} 0\\ 0\\ \end{array} \right) ,\left( \begin{matrix} 1& \rho\\ \rho& 4\\ \end{matrix} \right) \right), ρ(2,2)\rho \in (-2,2), 求 P(X0,Y0)P(X \ge 0, Y \ge 0).

  2. 设有来自 N(0,σ2)N\left(0, \sigma^2\right) 的简单随机样本 X1,,XnX_1, \cdots, X_n, 记 σ^=i=1nwiXi\hat{\sigma}=\sum_{i=1}^n w_i\left|X_i\right|, 求最优权重 wiw_i 使得 σ^\hat{\sigma} 是无偏估计且的方差最小.

  3. 有来自总体 U(0,θ)U(0,\theta) 的简单随机样本 X1,,XnX_1,\cdots,X_n. 其次序统计量是 X(1)X(n)X_{(1)}\le \cdots \le X_{(n)}.
    (1) 求 X(k)X_{(k)} 的概率密度, 期望、方差.
    (2) 证明 n(1X(n)θ)n\left(1-\frac{X_{(n)}}{\theta}\right) 按分布收敛于 Exp(1)(1).
    (3) 求 θ\theta95%95 \% 的渐近置信区间. (用渐近分布)
    (4) 给出 H0:θ1vsH1:θ>1H_0: \theta \le 1 \quad \mathrm{vs} \quad H_1: \theta >1 的渐近拒绝域.