北京师范大学-432统计学-2020年

一、选择题(每题3分, 总计15分)

  1. 如果数据没有离群值, 箱线图显示的信息不包括( ).
    A. 平均数
    B. 四分位数
    C. 极差
    D. 中位数

  1. 某医生为写论文收集数据, 使用了他自己过往的病情经历, 这种抽样方式称为( ).
    A. 整群抽样
    B. 非随机的方便抽样
    C. 系统抽样
    D. 简单随机抽样

  1. 构造 θ\theta1α1-\alpha 置信区间 (θ^1,θ^2)(\hat{\theta}_1,\hat{\theta}_2), 正确的是( ).
    A. 总体参数一定在区间中
    B. 区间一定覆盖总体参数
    C. θ^1\hat{\theta}_1θ^2\hat{\theta}_2 是统计量
    D. 置信区间是唯一的

  1. 在线性回归模型 yi=a+bxi+εi,i=1,,ny_i = a +b x_i +\varepsilon_i, i=1,\cdots,n 中, 正确的是( ).
    A. (a,b)(a,b) 的最小二乘估计与最大似然估计等价
    B. 最小二乘法中的残差和为 00
    C. 参数显著性 tt 检验不需要假设正态分布
    D. 以上均错误

  1. nn 次硬币, XX 是正面向上次数, YY 是反面向上次数, 则 Corr(X,Y)=\mathrm{Corr}(X,Y)=( ).
    A. -1
    B. 1
    C. 0
    D. 0.5

二、计算题(总计135分)

  1. (10分) 简要给出该组数据统计分析报告(统计指标和统计图).
    甲的射击成绩: 81,88,84,80,90,83,80,90,81,8581,88,84,80,90,83,80,90,81,85
    乙的射击成绩: 92,85,88,81,81,86,81,76,81,8992,85,88,81,81,86,81,76,81,89

  1. (10分) 概率与频率的关系是什么? 频率的极限是概率吗?

  1. (10分) 一个不透明的袋子有 n1n-1 个黑球和 11 个白球, 每次从中取 11 个并放入 11 个黑球, 问第 nn 次取出的是黑球的概率.

  1. (10分) 甲乙进行一个 5 局 3 胜的比赛, 甲赢一局的概率是 0.60.6, 乙赢一局的概率是 0.40.4, 现在甲已经赢了2局, 问:甲最终获胜的概率.

  1. (10分) 某地质专家想测量某山的高度, 取多次测量取平均值作为实际高度估计值.假设各测量值 是独立同分布的随机变量, 已知测量方差为 22, 若想以 95%95 \% 的把握使误差控制在 ±1\pm 1 之内, 问: 至少需要测量多少次?

  1. (15分) 总体 XN(μ1,σ02)X \sim N\left(\mu_1, \sigma_0^2\right), σ02\sigma_0^2 已知, 样本量为 n1n_1. 总体 YN(μ2,σ12)Y \sim N\left(\mu_2, \sigma_1^2\right), 样本量为 n2n_2. 两组样本独立.
    (1)(5分) 写出 μ1\mu_11α1-\alpha 置信区间;
    (2)(5分) 写出 μ2\mu_21α1-\alpha 置信区间;
    (3)(5分) 若 σ02=σ12\sigma_0^2=\sigma_1^2, 写出 (μ1μ2)\left(\mu_1-\mu_2\right)1α1-\alpha 置信区间.

  1. (15分) X1,X2,XnX_1, X_2 \ldots, X_n 来自总体 X[0,2θ]X \sim[0,2 \theta] 的均匀分布.

(1)(8分) 分别求 θ\theta 的矩估计 θ~\tilde{\theta} 和极大似然估计 θ^\hat{\theta}.

(2)(7分) 讨论 θ^\hat{\theta} 的无偏性, 若非无偏, 则给出一个修正后的无偏估计.


  1. (15分) X1,,XnX_1,\cdots,X_n 独立同分布, E(X)=μE(X)=\mu, Var(X)=σ2Var(X)=\sigma^2.
    (1)(5分) 给出 μ\mu 的最小二乘估计值;
    (2)(5分) 如何判断是否有离群数据? 若有, (1) 的估计会怎样? 有何改进的想法?
    (3)(5分) 样本均值为 Xˉ\bar{X}, 样本方差为 S2=1n1i=1n(XiXˉ)2,SS^2=\frac{1}{n-1} \sum_{i=1}^n\left(X_i-\bar{X}\right)^2, Sσ\sigma 的无偏估计吗? 为什么?

  1. (20分) 作身高(xx)与臂展(yy)的一元线性回归: 总计有 n=1024n=1024 个样本, 回归结果如下表
Coefficient Estimate Std. Error t-stat Pr(>|t|)
(Intercept) 0.23835 1.91840 0.124 0.901
X 0.99882 0.01096 91.142 0.000

(1)(10分) 写出参数估计表达式, 根据分析结果写出经验回归方程.
(2)(5分) 写出误差方差估计的表达式.
(3)(5分) 说明最后一列 Pr(>|t|) 的含义, 分别写出对应 H0H_0, H1H_1, 并给出假设检验结果.