上海交通大学-432统计学-2019年

一.选择题 (10小题,每小题 6 分,共60分)

  1. 如果数据没有离群值, 箱线图显示的信息不包括( ).
    A. 平均数
    B. 四分位数
    C. 极差
    D. 中位数

  1. 已知 A,BA, B 两个随机事件满足 P(AB)=P(AˉBˉ)P(A \cap B)=P(\bar{A} \cap \bar{B}), 且 P(A)=pP(A)=p, 则 P(B)P(B) 等于()
    (A) pp
    (B) 1p1-p
    (C) (1p)p(1-p) p
    (D) p2p^{2}

  1. 下列关于直方图和箱线图不正确的是()
    A. 直方图柱形面积之和可以大于 1
    B. 箱线图可以展示更多数据
    C. 直方图分组时需要依据总体数量来分组
    D. 在绘制箱线图时, 需要的统计量有最小值、最大值、平均数、 x0.25x_{0.25} 分位数和 x0.75x_{0.75} 分位数

  1. 抽样推断的精确度与抽样误差的关系是( ).
    A. 前者提高说明后者变小
    B. 前者提高说明后者变大
    C. 前者提高说明后者不变
    D. 没有关系

  1. 如果你的水平略高于对手, 为保证比赛的胜利,你最期望以下哪种比赛规则()
    (A) 一局定输赢
    (B)三局两胜
    (C)五局三胜
    (D)不能确定

  1. 选择题有四个答案, 只有一个是正确的。懂的学生能够准确回答, 不懂的学生从中四个答案中随 机选择。假定一个学生懂与不懂的概率都是 0.50.5, 则答对的学生对该题不懂的概率为()
    (A) 0.10.1
    (B) 0.20.2
    (C) 0.40.4
    (D) 0.50.5

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自正态分布 N(μ,1)N(\mu, 1) 的简单随机样本。记 ZαZ_{\alpha} 为标准正态分布的 100α%100 \alpha \% 分位数, 则由 此样本所构造的置信水平分别为 95%95 \%90%90 \% 的双侧置信区间长度之比为()
    (A) 2×z0.975Z0.952 \times \frac{z_{0.975}}{Z_{0.95}}
    (B) z0.975z0.95\frac{z_{0.975}}{z_{0.95}}
    (C) 2×z0.95z0.902 \times \frac{z_{0.95}}{z_{0.90}}
    (D) z0.95z0.90\frac{z_{0.95}}{z_{0.90}}

  1. X,YX,Y 各自服从: XN(μ1,σ12),YN(μ2,σ22)X \sim N\left(\mu_1, \sigma_1^2\right), Y \sim N\left(\mu_2, \sigma_2^2\right), 当 P(Xμ1<1)>P(Yμ2<1)P\left( |X-\mu _1|<1 \right) >P\left( |Y-\mu _2|<1 \right) 时, 比较 ( ).
    A. μ1>μ2\mu_1>\mu_2
    B. μ1<μ2\mu_1<\mu_2
    C. σ1>σ2\sigma_1>\sigma_2
    D. σ1<σ2\sigma_1<\sigma_2

  1. 英国《观察家报》和 Opinium 公司 2016 年 6 月初进行的联合民意调查显示, 40%40 \% 英国民众支持留 在欧盟。考虑一个由 600 名英国民众组成的随机样本, 以 XX 表示这 600 人中支持留在欧盟的人数。记 Φ(x)\Phi(x) 是标准正态分布的分布函数, 则 222<X<258222<X<258 的概率大约是 ()
    (A) 2Φ(1.5)12 \Phi(1.5)-1
    (B) 2Φ(1.5)2 \Phi(1.5)
    (C) 2Φ(2)2 \Phi(2)
    (D) 2Φ(2)12 \Phi(2)-1

  1. X1,,XnX_{1}, \cdots, X_{n} 为正态分布 N(μ,σ2)\mathrm{N}\left(\mu, \sigma^{2}\right) 的样本, μ\mu 末知而 σ2\sigma^{2} 已知。 Xˉ\bar{X}S2=1n1i=1n(XiXˉ)2S^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2} 为样本均值 及样本方差。记, T1=xˉμσ/n,T2=xˉμs/n,T3=(n1)S2σ2T_{1}=\frac{\bar{x}-\mu}{\sigma / n}, T_{2}=\frac{\bar{x}-\mu}{s / n}, T_{3}=\frac{(n-1) S^{2}}{\sigma^{2}}, 则 T1,T2,T3T_{1}, T_{2}, T_{3} 中统计量的个数为 ()
    (A) 0
    (B) 1
    (C) 2
    (D) 3

二、简答题

  1. X1,,XnX_1, \ldots, X n 来自正态总体 N(μ,1)N(\mu, 1) 的简单随机样本, 对于简单假设检验问题 H0:μ=μ0H_0: \mu=\mu_0 H1:μ>μ0H_1: \mu>\mu_0, 设有拒绝域 W={(x1,,xn)(xˉ)>c}W=\left\{\left(x_1, \ldots, x_n\right) \mid(\bar{x})>c\right\}.
    (1) 当 c=μ0+1.96nc=\mu_0+\frac{1.96}{\sqrt{n}} , 求一类错误与二类错误概率 α\alphaβ\beta, 是否有 α+β=1\alpha+\beta = 1?
    (2) 若希望增加可靠性,应该增大 cc 还是减小 cc?

  1. 评价时间序列预测效果的方法有哪些? 请给出评价指标与计算表达式.

  1. 简述年度折叠时间序列图与季节多元回归模型的作用.

  1. X1,XnX_1, \ldots X_n 独立同分布,且 E(X3)=1,E(X6)=4\mathbb{E}\left(X^3\right)=1, \mathbb{E}\left(X^6\right)=4, 求 nn 趋于无穷的时候 Xi3n\frac{\sum X_i^3}{n} 的极限分布,并解释其的密度函数的形状将如何变化.

三. 计算题

  1. 某公司雇佣 3000 名推销员, 为了发放外出补贴, 需要估计推销员每年的平均乘车里程。从过去的经验可知, 通常每位推销员乘车里程的标准差为 4000 公里。随机选取 16 名推销员, 得到他们的年平均乘车里程是 12000 公里。
    (1) 总体均值 μ\mu 的估计量是多少?
    (2) 确定总体均值 μ\mu95%95 \% 置信区间;
    (3)公司经理们认为均值应介于11000到13000公里之间, 那么该估计的置信度是多少?
    (4) 如果在 (3) 的估计中希望有95%的置信水平,这时所要求的样本容量是多少?

  1. 作身高(xx)与臂展(yy)的一元线性回归: 总计有 n=1024n=1024 个样本, 回归结果如下表
Coefficient Estimate Std. Error t-stat Pr(>|t|)
(Intercept) 0.23835 1.91840 0.124 0.901
X 0.99882 0.01096 91.142 0.000

(1)(10分) 写出参数估计表达式, 根据分析结果写出经验回归方程.
(2)(5分) 写出误差方差估计的表达式.
(3)(5分) 说明最后一列 Pr(>|t|) 的含义, 分别写出对应 H0H_0, H1H_1, 并给出假设检验结果.


四. 证明题

(1) g(x)g(x) 单调不减,非负且连续,证明对于任意的 x>0x>0 ,不等式成立: P(Xx)E(g(X))g(x)\mathbb{P}(X \geq x) \leq \frac{\mathbb{E}(g(X))}{g(x)}

(2) XExp(λ)XiX \sim \operatorname{Exp}(\lambda) , X_i 独立同分布,证: P(i=1nXinx)2ne(nλx)2\mathbb{P}\left(\sum_{i=1}^n X_i \geq n x\right) \leq 2^n e^{-\frac{(n \lambda x)}{2}}