上海交通大学-432统计学-2017年

一.选择题 (10小题,每小题 6 分,共60分)

  1. 分布中位数小于平均数, 则一般来说, 该分布( ).
    A. 左偏
    B. 右偏
    C. 正偏
    D. 无偏

  1. 当一组数据呈对称分布时,在平均数加减 2 个标准差的范围之内大约有 ( ) 的数据.
    A. 68%68 \%
    B. 95%95 \%
    C. 99.7%99.7 \%
    D. 89%89 \%

  1. 抽样推断的精确度与抽样误差的关系是( ).
    A. 前者提高说明后者变小
    B. 前者提高说明后者变大
    C. 前者提高说明后者不变
    D. 没有关系

  1. 假设独立随机变量 X,YX, Y 服从同一名称的概率分布(二者的分布参数末必相同)。且 X+YX+Y 也服从 同一名称的概率分布。则 X,YX, Y 不可能服从()
    (A) 二项分布
    (B) 泊松分布
    (C) 正态分布
    (D) 指数分布

  1. Xχ2(1),Yχ2(n)X \sim \chi^{2}(1), Y \sim \chi^{2}(n), 则 F=nX/YF=n X / Y 的分布是 ()
    (A) t(n)t(n)
    (B) F(1,n)F(1, n)
    (C) F(n,1)F(n, 1)
    (D)不能确定

  1. X1,X2,Xn1X_1, X_2, \ldots X_{n_1} 是来自正态总体 N(μ1,σ12)N\left(\mu_1, \sigma_1^2\right) 的一个样本,设 Y1,Y2,,Yn2Y_1, Y_2, \ldots, Y_{n_2} 是来自正态总体 N(μ2,σ22)N\left(\mu_2, \sigma_2^2\right) 的一个样 本,且 Xi(i=1,2,3,,n1)X_i\left(i=1,2,3, \ldots, n_1\right)Yi(i=1,2,3,..,n2)Y_i\left(i=1,2,3, . ., n_2\right) 相互独立,已知 n1n2S12S22n_1 、 n_2 、 S_1^2 、 S_2^2 ,通过查表可知 Fα/2(n1,n2)Fα/2(n2,n1)Fα/2(n11,n21)Fα/2(n21,n11)F_{\alpha / 2}\left(n_1, n_2\right) 、 F_{\alpha / 2}\left(n_2, n_1\right) 、 F_{\alpha / 2}\left(n_1-1, n_2-1\right) 、 F_{\alpha / 2}\left(n_2-1, n_1-1\right) . 则方差之比 σ12/σ22\sigma_1^2 / \sigma_2^2 的置信区间为( ).
    A. S12/S22Fα/2(n1,n2)σ12σ22S12S22Fα/2(n2,n1)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1, n_2\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2}{S_2^2} F_{\alpha / 2}\left(n_2, n_1\right)
    B. S12/S22Fα/2(n11,n21)σ12σ22S12S22Fα/2(n21,n11)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1-1, n_2-1\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2}{S_2^2} F_{\alpha / 2}\left(n_2-1, n_1-1\right)
    C. S12/S22Fα/2(n1,n2)σ12σ22S12/S22Fα/2(n2,n1)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1, n_2\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_2, n_1\right)}
    D. S12/S22Fα/2(n11,n21)σ12σ22S12/S22Fα/2(n21,n11)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1-1, n_2-1\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_2-1, n_1-1\right)}

  1. 设总体分布为参数为 2 的指数分布 Exp(2)\operatorname{Exp}(2) (密度函数概率密度函数: f(x)={2e2xx>00 其他 f(x)=\left\{\begin{array}{ll}2 e^{-2 x} & x>0 \\ 0 & \text { 其他 }\end{array}\right.)。现分别有来自总体的容量 分别为 200 和 400 的两独立样本, 则此两样本均值之差的绝对值大于 3/20\sqrt{3} / 20 的概率大约是 ()
    (A) 2Φ(1.5)12 \Phi(1.5)-1
    (B) 2Φ(1.5)2 \Phi(1.5)
    (C) 2Φ(2)2 \Phi(2)
    (D) 22Φ(2)2-2 \Phi(2)

  1. 下面哪个选项不是随机事件 A,B(0<P(A),P(B)<1)A, B(0<P(A), P(B)<1) 相互独立的充要条件 ( )
    (A) P(AB)=P(ABˉ)P(A \mid B)=P(A \mid \bar{B})
    (B) P(AB)+P(AˉBˉ)=1P(A \mid B)+P(\bar{A} \mid \bar{B})=1
    (C) P(ABˉ)=P(A)P(Bˉ)P(A \cap \bar{B})=P(A) P(\bar{B})
    (D) P(AB)+P(ABˉ)=1P(A \mid B)+P(A \mid \bar{B})=1

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自正态分布 N(μ,1)N(\mu, 1) 的简单随机样本。记 ZαZ_{\alpha} 为标准正态分布的 100α%100 \alpha \% 分位数, 则由 此样本所构造的置信水平分别为 95%95 \%90%90 \% 的双侧置信区间长度之比为()
    (A) 2×z0.975Z0.952 \times \frac{z_{0.975}}{Z_{0.95}}
    (B) z0.975z0.95\frac{z_{0.975}}{z_{0.95}}
    (C) 2×z0.95z0.902 \times \frac{z_{0.95}}{z_{0.90}}
    (D) z0.95z0.90\frac{z_{0.95}}{z_{0.90}}

  1. X1,,XnX_{1}, \cdots, X_{n} 为来自均值为 0 , 方差为 σ2\sigma^{2} 的总体的简单随机样本, 令 Y=i=1nXi2,Q=Y=\sum_{i=1}^{n} X_{i}^{2}, Q= i=1n(XiXˉ)2\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}, 则下列说法正确的是 ()
    (A) Q/nQ / nσ2\sigma^{2} 的最大似然估计
    (B) Y/nY / nσ2\sigma^{2} 的最大似然估计
    (C) Q/nQ / nσ2\sigma^{2} 的无偏估计
    (D) Y/nY / nσ2\sigma^{2} 的无偏估计

二、简答题

  1. 总体 XN(μ1,σ02)X \sim N\left(\mu_1, \sigma_0^2\right), σ02\sigma_0^2 已知, 样本量为 n1n_1. 总体 YN(μ2,σ12)Y \sim N\left(\mu_2, \sigma_1^2\right), 样本量为 n2n_2. 两组样本独立.
    (1) 写出 μ1\mu_11α1-\alpha 置信区间;
    (2) 写出 μ2\mu_21α1-\alpha 置信区间;
    (3) 若 σ02=σ12\sigma_0^2=\sigma_1^2, 写出 (μ1μ2)\left(\mu_1-\mu_2\right)1α1-\alpha 置信区间.

  1. 建立多元回归模型时,为什么需要进行变量选择? 并阐述向前选择法的步骤.

  1. 随机变量 Xi(i=1,2,3,,n)X_i(i=1,2,3, \ldots, n) 独立同分布,且 E(Xi)=1,E(Xi2)=2,E(Xi4)=8E\left(X_i\right)=1, E\left(X_i^2\right)=2, E\left(X_i^4\right)=8 ,则当 nn \rightarrow \infty 时, i1nXi2n\frac{\sum_{i-1}^n X_i^2}{n} 服从什么分布,并说明概率密度函数的形态变化.

  1. 考虑一元线性回归 yi=β0+β1xi+ϵiy_i=\beta_0+\beta_1 x_i+\epsilon_i, 给出数据 (xi,yi)\left(x_i, y_i\right), 问什么 情况下可以使用极大似然估计求末知参数, 并且解释极大似然估计和最小二乘法的区别和联系。

三. 计算题

  1. 作身高(xx)与臂展(yy)的一元线性回归: 总计有 n=1024n=1024 个样本, 回归结果如下表
Coefficient Estimate Std. Error t-stat Pr(>|t|)
(Intercept) 0.23835 1.91840 0.124 0.901
X 0.99882 0.01096 91.142 0.000

(1) 写出参数估计表达式, 根据分析结果写出经验回归方程.
(2) 写出误差方差估计的表达式.
(3) 说明最后一列 Pr(>|t|) 的含义, 分别写出对应 H0H_0, H1H_1, 并给出假设检验结果.


  1. 一个不透明的箱子里有 aa 个白球和 bb 个红球, kk 个人不放回地抽球, 且 k<a+bk<a+b, 求第 ii 个人抽到红球的概率.

四. 证明题

  1. 证明:
    (1) P(X+Yx)P(Xx2)+P(Yx2)\mathbb{P}(X+Y \geq x) \leq \mathbb{P}\left(X \geq \frac{x}{2}\right)+\mathbb{P}\left(Y \geq \frac{x}{2}\right);
    (2) P(X+Yx)P(Xx2)+P(Yx2)\mathbb{P}(|X+Y| \geq x) \leq \mathbb{P}\left(|X| \geq \frac{x}{2}\right)+\mathbb{P}\left(|Y| \geq \frac{x}{2}\right).