上海交通大学-432统计学-2020年

一.选择题 (30小题,每小题 2 分,共60分)

  1. 某学院共有 1000 名男生和 2000 名女生, 为调查学生的平均生活支出费用, 将 全体男女学生以 1 比 2 抽样, 这种抽样方法是 ( ).
    A. 简单随机抽样
    B. 分层抽样
    C. 系统抽样
    D. 整体抽样

  1. 有一批灯泡共1000箱, 每箱200个, 现随机抽取20箱并检查这些箱中全部灯泡, 此种检验属于()
    A. 纯随机抽样
    B. 类型抽样
    C. 整群抽样
    D. 等距抽样

  1. 为了解小区居民对物业服务的意见和看法, 管理人员随机抽取了 50 户居民, 上门通过问卷进行调查, 这种数据收集方法是 ( )
    A. 面访式问卷调查
    B. 实验调查
    C. 观察式调查
    D. 自填式问卷调查

  1. 下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性问题 ( )
    A. 环形图
    B. 饼图
    C. 直方图
    D. 茎叶图

  1. 有四位同学的某一门课程成绩分别为 718287,9071 , 82 , 87,90 。则他们 成绩的中位数是 ( )
    A. 81
    B. 82.5
    C. 84.5
    D. 87

  1. 下列描述分布离散程度的统计量中, 哪一个具有稳健性 ( )
    A. 标准差
    B. 四分位差
    C. 极差
    D. 变异系数

  1. 在某公司进行的英语水平测试中, 新员工的平均得分是80分, 标准差是 5 分, 中 位数是85分, 则新员工得分的分布形状是 ( )
    A. 对称的
    B. 左偏的
    C. 右偏的
    D. 无法确定

  1. XiN(μ,σ2)i=1,2,3,,nX_i \sim N\left(\mu, \sigma^2\right) , i=1,2,3, \ldots, n ,其中 μ\mu 为已知常数,则 σ2\sigma^2 的充分无偏估计是 ( ).
    A. 110110(XiXˉ)2\frac{1}{10} \sum_1^{10}\left(X_i-\bar{X}\right)^2
    B. 110110(Xiμ)2\frac{1}{10} \sum_1^{10}\left(X_i-\mu\right)^2
    C. 19110(Xiμ)2\frac{1}{9} \sum_1^{10}\left(X_i-\mu\right)^2
    D. 1919(Xiμ)2\frac{1}{9} \sum_1^9\left(X_i-\mu\right)^2

  1. X1X2X3X4X_1 、 X_2 、 X_3 、 X 4 是来自总体 XX 的样本, EX=μE X=\mu 则 ( ) 是 μ\mu 的最有效估计.
    A. μ^1=15x1+15x2+15x3+25x4\hat{\mu}_1=\frac{1}{5} x_1+\frac{1}{5} x_2+\frac{1}{5} x_3+\frac{2}{5} x_4
    B. μ^2=13x1+13x2+16x3+16x4\hat{\mu}_2=\frac{1}{3} x_1+\frac{1}{3} x_2+\frac{1}{6} x_3+\frac{1}{6} x_4
    C. μ^3=14x1+14x2+14x3+14x4\hat{\mu}_3=\frac{1}{4} x_1+\frac{1}{4} x_2+\frac{1}{4} x_3+\frac{1}{4} x_4
    D. μ^4=19x1+29x2+39x3+49x4\hat{\mu}_4=\frac{1}{9} x_1+\frac{2}{9} x_2+\frac{3}{9} x_3+\frac{4}{9} x_4

  1. X1,X2,Xn1X_1, X_2, \ldots X_{n_1} 是来自正态总体 N(μ1,σ12)N\left(\mu_1, \sigma_1^2\right) 的一个样本,设 Y1,Y2,,Yn2Y_1, Y_2, \ldots, Y_{n_2} 是来自正态总体 N(μ2,σ22)N\left(\mu_2, \sigma_2^2\right) 的一个样 本,且 Xi(i=1,2,3,,n1)X_i\left(i=1,2,3, \ldots, n_1\right)Yi(i=1,2,3,..,n2)Y_i\left(i=1,2,3, . ., n_2\right) 相互独立,已知 n1n2S12S22n_1 、 n_2 、 S_1^2 、 S_2^2 ,通过查表可知 Fα/2(n1,n2)Fα/2(n2,n1)Fα/2(n11,n21)Fα/2(n21,n11)F_{\alpha / 2}\left(n_1, n_2\right) 、 F_{\alpha / 2}\left(n_2, n_1\right) 、 F_{\alpha / 2}\left(n_1-1, n_2-1\right) 、 F_{\alpha / 2}\left(n_2-1, n_1-1\right) . 则方差之比 σ12/σ22\sigma_1^2 / \sigma_2^2 的置信区间为( ).
    A. S12/S22Fα/2(n1,n2)σ12σ22S12S22Fα/2(n2,n1)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1, n_2\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2}{S_2^2} F_{\alpha / 2}\left(n_2, n_1\right)
    B. S12/S22Fα/2(n11,n21)σ12σ22S12S22Fα/2(n21,n11)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1-1, n_2-1\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2}{S_2^2} F_{\alpha / 2}\left(n_2-1, n_1-1\right)
    C. S12/S22Fα/2(n1,n2)σ12σ22S12/S22Fα/2(n2,n1)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1, n_2\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_2, n_1\right)}
    D. S12/S22Fα/2(n11,n21)σ12σ22S12/S22Fα/2(n21,n11)\frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_1-1, n_2-1\right)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{S_1^2 / S_2^2}{F_{\alpha / 2}\left(n_2-1, n_1-1\right)}

  1. 某公司宣称其产品质量大大高于标准,为检验其说法是否真实,应该建立原假设 ( ).
    A. 产品质量小于标准
    B. 产品质量等于标准
    C. 产品质量大于标准
    D. 产品质量不大于标准

  1. 方差分析的基本假设是 ( )
    A. 多个总体具有相等方差
    B. 多个总体具有等方差的相同分布
    C. 多个总体具有等方差的正态分布
    D. 多个总体具有相同的正态分布

  1. 根据以往的生产统计,某种产品的合格率约为 90%90 \% ,现要求估计误差为 5%5 \% ,在 5%5 \% 的显著性水平下,应抽取 ( ) 个产品作为样本.
    A. 138
    B. 139
    C. 384
    D. 385

  1. 以下关于 p\mathrm{p} 值的说法正确的是 ( ).
    A. 我们总是根据检验的 p\mathrm{p} 值来确定显著性水平;
    B. p\mathrm{p} 值是检验统计量大于统计量当前观测值的概率;
    C. p\mathrm{p} 值越小, 越倾向于拒绝原假设;
    D. p\mathrm{p} 值是检验统计量出现比当前观测值更极端的概率.

  1. 某一商场 30 分钟内到达的人数服从参数为 6 的泊松分布,则 10 分钟内来商场的人数等于 3 的概率为 ( ).
    A. 43e2\frac{4}{3} e^{-2}
    B. 699!e6\frac{6^9}{9 !} e^{-6}
    C. 223e2\frac{22}{3} e^{-2}
    D. 163e2\frac{16}{3} e^{-2}

  1. 假设 XN(μ,σ2)X\sim N\left( \mu ,\sigma ^2 \right), 则 Y=eXY=e^X 的密度函数是 ( ).
    A.12πσ2e(yμ)22σ2\frac{1}{\sqrt{2\pi \sigma ^2}}e^{-\frac{\left( y-\mu \right) ^2}{2\sigma ^2}}
    B.12πσ2e(lnyμ)22σ2\frac{1}{\sqrt{2\pi \sigma ^2}}e^{-\frac{\left( \ln y-\mu \right) ^2}{2\sigma ^2}}
    C.12πσ2ye(lnyμ)22σ2\frac{1}{\sqrt{2\pi \sigma ^2}y}e^{-\frac{\left( \ln y-\mu \right) ^2}{2\sigma ^2}}
    D.12πσ2y2e(lnyμ)22σ2\frac{1}{\sqrt{2\pi \sigma ^2}y^2}e^{-\frac{\left( \ln y-\mu \right) ^2}{2\sigma ^2}}

  1. 某科目学生的平均考分是110分, 标准差是5分。若该科目学生的考分为近似正态的对称分布, 则可判断考分在120分以上的学生人数大约占 ( )
    A. 95%95 \%
    B. 48%48 \%
    C. 5%5 \%
    D. 2.5%2.5 \%

  1. 在单因素方差分析中, 已知 SSA=156,SST=240,dfA=2,dfT=15SS_A=156, SS_T=240, df_A=2, df_T=15 , 则 FF 统计量为 ( )
    A. 0.080.08
    B. 0.930.93
    C. 1.861.86
    D. 12.0712.07

  1. 下列关于残差图的描述错误的是 ( )
    A. 残差图的纵坐标只能是残差 .
    B. 残差图的横坐标可以是编号、解释变量和预报变量 .
    C. 残差点分布的带状区域的宽度越窄残差平方和越小 .
    D. 残差点分布的带状区域的宽度越窄相关指数越小 .

  1. 在多元线性回归模型中检验方程的显著性、回归系数的显著性, 下面正确的是 ( )
    A.用 tt 分布检验方程显著性, 用 FF 分布检验回归系数的显著性
    B.用 FF 分布检验方程显著性,用 tt 分布检验回归系数的显著性
    C.用 FF 分布检验方程显著性, 用 FF 分布检验回归系数的显著性
    D.用 tt 分布检验方程显著性, 用 tt 分布检验回归系数的显著性

  1. 在多元线性回归分析中, 如果某个解释变量的回归系数不显著, 则意味着:该解释变量与被解释变量之间 ( )
    A. 不存在显著的线性关系
    B. 不存在显著的相关关系
    C. 不存在相关关系
    D. 可能存在显著的非线性关系

  1. 当模型存在严重的多重共线性时, OLS 估计量将不具备 ( )
    A. 线性
    B. 无偏性
    C. 有效性
    D. 一致性

  1. 设随机变量 XN(0,1),YN(1,4)X \sim N(0,1), Y \sim N(1,4), 则 X,YX, Y 的相关系数 ρXY=1\rho_{X Y}=1Y=2X+1Y=2 X+1
    A. 充要条件;
    B. 充分不必要条件;
    C. 必要不充分条件;
    D. 不充分不必要条件.

  1. 利用估计的回归方程进行区间估计时,关于平均值的置信区间和个别值预测区间,下面说法正确的是 ().
    A.置信区间比预测区间宽
    B.预测区间比置信区间宽
    C.二者一样宽
    D.不一定

  1. 设连续型随机变量 X\mathrm{X} 的密度函数为 f(x)=λ2xexp{λx},x>0,λ>0YXf(x)=\lambda^2 x \exp \{-\lambda x\}, x>0, \lambda>0 , Y \mid X 服从 U(0,X)U(0, X), 则 E[XY=y]=\mathbb{E}[X \mid Y=y] = ( )
    A. λ+y\lambda + y
    B. 1λ+y\frac{1}{\lambda} + y
    C. λ\lambda
    D. yλy \lambda

  1. 将一个骰子独立地掷两次。引进事件 : A1={A_{1}=\{ 郑第一次出现奇数点 },A2=\}, A_{2}= {掷第二次出现偶数点 },A3={\}, A_{3}=\{ 奇数点、偶数点各出现一次 },A4={\}, A_{4}=\{ 奇数点出现两次 }\}, 则 ( )
    A. A1,A2,A3A_{1}, A_{2}, A_{3} 两两独立
    B. A1,A2,A3A_{1}, A_{2}, A_{3} 相互独立
    C. A2,A3,A4A_{2}, A_{3}, A_{4} 两两独立
    D/ A2,A3,A4A_{2}, A_{3}, A_{4} 相互独立

  1. 一本书在交付印刷前, 作家和出版社先后对其进行校正。该书有 300 页, 每页的错误数相互独 立且都服从参数为 6 的泊松分布。在作家的校对过程中, 每个错误相互独立地以概率 0.80.8 被订正。
    在出版社进行的第二次校正中, 前一稿的打印错误相互独立地以概率 0.90.9 被订正。出版后整本书的 错误数大于等于 30 的概率 (用标准正态分布函数 Φ(x\Phi(\mathrm{x} )表示) 大约是( )
    A. Φ(1)\Phi(1)
    B. Φ(1.5)\Phi(1.5)
    C. Φ(2)\Phi(2)
    D. 2Φ(2)2-\Phi(2)

  1. X1,,XnX_{1}, \ldots, X_{n} 为正态分布 N(μ,σ2)\mathrm{N}\left(\mu, \sigma^{2}\right) 的简单随机样本, 其中 μ\mu 已知而 σ2\sigma^{2} 未知, 则下列不是统计量的 是( )
    A. i=1nXi/σ\sum_{i=1}^{n} X_{i} / \sigma
    B. X1X_{1}
    C. i=1nXi2/n\sum_{i=1}^{n} X_{i}^{2} / n
    D. i=1nXinμ\sum_{i=1}^{n} X_{i}-n \mu

  1. 从 5 双不同的鞋子中任取 4 只, 其中恰有一双配对的概率是( )
    A. 2/32 / 3
    B. 4/74 / 7
    C. 2/72 / 7
    D. 1/31 / 3

  1. 某一商场 30 分钟内到达的人数服从参数为 6 的泊松分布,则 10 分钟内来商场的人数等于 3 的概率为().
    A. 43e2\frac{4}{3} e^{-2}
    B. 699!e6\frac{6^9}{9 !} e^{-6}
    C. 223e2\frac{22}{3} e^{-2}
    D. 163e2\frac{16}{3} e^{-2}

二、简答题

  1. 为研究在旅游时候所花费在购物上的金额 YY (美元) 与性别 DD 的关系, 我们建立一个回归模型, 同时我们将旅客月收入 XX (美元) 也纳入考虑, 同时考虑 XXDD 的交互, 回归结果见下表:

coeff.std.errortstat.p.(Intercept)57.61133.5454166.24940.0001X0.01180.00139.02810.0008D31.87313.8318.31970.0011X:D0.00880.00136.6930.0027\begin{array}{c|c|c|c|c} & coeff. & std. error & t stat. & p. \\ \hline (Intercept) & 57.6113 &3.5454 &166.2494& 0.0001\\ X &0.0118 &0.0013 &9.0281& 0.0008\\ D &31.8731&3.831& 8.3197& 0.0011\\ X:D &-0.0088& 0.0013 &-6.693& 0.0027\\ \end{array}

其中 D=1D = 1 表示女性, D=0D = 0 表示男性.

(1) 解释 DD 的回归系数, 并说明其是否显著; (α=0.05\alpha = 0.05)
(2) 解释 X:DX:D 的回归系数, 并说明其是否显著. (α=0.05\alpha = 0.05)


  1. 阐述季节指数的计算方法.


  2. 时间序列中加法模型和乘法模型的基本假定分别是什么?


  1. X1,XnX_1, \ldots X_n 独立同分布,且 E(X3)=1,E(X6)=4\mathbb{E}\left(X^3\right)=1, \mathbb{E}\left(X^6\right)=4, 求 nn 趋于无穷的时候 Xi3n\frac{\sum X_i^3}{n} 的极限分布.

三、计算题

  1. 下面给出两种型号的计算器充电以后所能使用的时间 (单位:h) 的观测值

 型号 A 5.55.66.34.65.35.06.25.85.15.25.9 型号 B 3.84.34.24.04.94.55.24.84.53.93.74.6\begin{array}{lllllll} \text { 型号 A } & 5.5 & 5.6 & 6.3 & 4.6 & 5.3 & 5.0 & 6.2 & 5.8 & 5.1 & 5.2 & 5.9 \\ \hline \text { 型号 B } & 3.8 & 4.3 & 4.2 & 4.0 & 4.9 & 4.5 & 5.2 & 4.8 & 4.5 & 3.9 & 3.7 & 4.6 & \\ \end{array}

设两样本独立且数据所属的两正态总体的密度函数至多差一个平移量. 试问能否认为 型号 A 的计算器平均使用时间明显比型号 B 来得长 (取 α=0.01\alpha=0.01 )?


  1. 为考察某种维尼纶纤维的耐水性能, 安排了一组试验, 测得其甲醇浓度 xx 及相 应的 “缩醇化度” yy 数据如下:

x18202224262830y26.8628.3528.7528.8729.7530.0030.36\begin{array}{c|cccccccc} \hline x & 18 & 20 & 22 & 24 & 26 & 28 & 30 \\ \hline y & 26.86 & 28.35 & 28.75 & 28.87 & 29.75 & 30.00 & 30.36 \\ \hline \end{array}

(1) 求样本相关系数;
(2) 建立一元线性回归方程;
(3) 给出方差分析表, 对建立的回归方程作显著性检验 (α=0.01)(\alpha=0.01).


四. 证明题

(1) g(x)g(x) 单调不减,非负且连续,证明对于任意的 x>0x>0 ,不等式成立: P(Xx)E(g(X))g(x)\mathbb{P}(X \geq x) \leq \frac{\mathbb{E}(g(X))}{g(x)}

(2) XExp(λ)XiX \sim \operatorname{Exp}(\lambda) , X_i 独立同分布,证: P(i=1nXinx)2ne(nλx)2\mathbb{P}\left(\sum_{i=1}^n X_i \geq n x\right) \leq 2^n e^{-\frac{(n \lambda x)}{2}}