北京师范大学-432统计学-2022年

  1. P(A)=p1>0,0<P(B)=p2<1,AP(A)=p_1>0,0<P(B)=p_2<1, ABB 互不相容, 则 P(AB)=P(A \mid B)=( ).
    A. p1p_1
    B. p2p_2
    C. p1/p2p_1/p_2
    D. 0

  1. 关于古典概率, 下列说法一定错误的是().
    A. 所有样本点对应的基本事件和一定为 1
    B. 每个样本点对应的基本事件概率一定相同
    C. 样本点个数可以是无限个
    D. 某事件的概率一定与其所包含的基本事件个数成正比

  1. 某个班男生的平均身高标准差为 6 cm6 \mathrm{~cm}, 为估计全校男生的平均身高, 置信水平 95%95 \%, 允许误差为 1 , 请问所需要的样本个数至少为( ).
    A. 138
    B. 139
    C. 140
    D. 141

  1. 设圆的直径dU(a,b)d\sim U(a,b), 则圆面积的期望E(S)=E(S)=( ).
    A. (ba)212\frac{(b-a)^2}{12}
    B. a+b2\frac{a+b}{2}
    C. π(a2+ab+b2)12\frac{\pi(a^2+ab+b^2)}{12}
    D. π(a+b)12\frac{\pi(a+b)}{12}

  1. 如果 Var(X)\operatorname{Var}(X) 存在, 下面说法错误的是( ).
    A. EXE X 一定存在
    B. EX2>(EX)2E X^2>(E X)^2 一定成立
    C. 对于 CEX,Var(X)<E(XC)2C \neq E X, \operatorname{Var}(X)<E(X-C)^2
    D. 标准差 Var(X)\sqrt{\operatorname{Var}(X)} 一定存在

  1. 抽样推断的精确度与抽样误差的关系是( ).
    A. 前者提高说明后者变小
    B. 前者提高说明后者变大
    C. 前者提高说明后者不变
    D. 没有关系

  1. X1,,XnX_1, \ldots, X_n 独立同分布, 且 E(X1)=μ,Var(X1)=σ2E\left(X_1\right)=\mu, \operatorname{Var}\left(X_1\right)=\sigma^2, 则 limnP(k=1nXk<nμ)=\lim _{n \rightarrow \infty} P\left(\sum_{k=1}^n X_k<n \mu\right)=( ).
    A. 0.250.25
    B. 0.50.5
    C. 0.75
    D. 1

  1. XXYY 独立, 且 XYX 、 Y 均服从 B(1,0.4)B(1,0.4), 则 P(X=Y)=P(X=Y)=( ).
    A. 425\frac{4}{25}
    B. 625\frac{6}{25}
    C. 1325\frac{13}{25}
    D. 0

  1. S2S^2 是从 N(0,1)N(0,1) 中抽取的 n=16n=16 的样本方差, 则 Var(S2)=\operatorname{Var}\left(S^2\right)=( ).
    A. 115\frac{1}{15}
    B. 215\frac{2}{15}
    C. 216\frac{2}{16}
    D. 1

  1. X1,,XnX_1, \ldots, X_n 为来自 N(0,σ2)N\left(0, \sigma^2\right) 的简单随机样本, 为使得 Ci=1n1(Xi+1Xi)2C \sum_{i=1}^{n-1}\left(X_{i+1}-X_i\right)^2σ2\sigma^2 的无偏估 计, 则 C=C=( ).
    A. 1n1\frac{1}{n-1}
    B. 1n\frac{1}{n}
    C. 12(n1)\frac{1}{2(n-1)}
    D. 12n\frac{1}{2 n}

二、计算题(共120分)

  1. (10分) 给出 12 个数据 23、26、31、33、33、34、36、39、40、40、43、49, 用至少两种统计量和统计图进行统计分析.

  1. (15分) 一个不透明的箱子里有 aa 个白球和 bb 个红球, kk 个人不放回地抽球, 且 k<a+bk<a+b, 求第 ii 个人抽到红球的概率.

  1. (24分) X1,X2,XnX_1, X_2 \ldots, X_n 相互独立, X1N(β+γZi,σ2),i=1,2,,nX_1 \sim N\left(\beta+\gamma Z_i, \sigma^2\right), i=1,2, \ldots, n, 且 Zi++Zn=0Z_i+\ldots+Z_n=0, Z12++Zn2>0Z_1^2+\ldots+Z_n^2>0, 其中 ZiZ_i 是已知数值; β,γ,σ\beta, \gamma, \sigma 为未知参数,

(1)(8分) 求 β,γ,σ2\beta, \gamma, \sigma^2 的极大似然估计.

(2)(8分) 分别求 β,γ,σ2\beta, \gamma, \sigma^21α1-\alpha 的置信区间,其中给定 α(0,1)\alpha \in(0,1).

(3)(8分) 假设 H0:γ=0H_0: \gamma=0 vs H1:γ0H_1: \gamma \neq 0, 构造 α\alpha 水平下的拒绝域.


  1. (20分) 已知 (X,Y)(X, Y) 服从二元正态分布, 且 XXYY 的边缘分布均服从 N(0,1),ρN(0,1), \rhoXYX 、 Y 的 相关系数, 则:

(1)(10分) X=U,Y=ρU+(1ρ2)12VX=U, Y=\rho U+\left(1-\rho^2\right)^{\frac{1}{2}} V, 求 (U,V)(U, V) 的联合密度函数.

(2)(10分) 记 α=P(X>0,Y>0)\alpha=P(X>0, Y>0), 证明 ρ=cos((12α)π)\rho=\cos ((1-2 \alpha) \pi).


  1. (15分) 抽检 NN 人血样本, 方案 1:对每个人进行检验; 方案 2:k2: k 个人一起混检. 已知阳性比例 为 pp, 证明当 pp 较小时, 以适当的 kk 按照方案 2 可减少化验次数, 并确定 kk 取何值时最适合.

  1. (16分) X1,X2,XnX_1, X_2 \ldots, X_n 来自总体 X[0,2θ]X \sim[0,2 \theta] 的均匀分布.

(1)(8分) 分别求 θ\theta 的矩估计 θ~\tilde{\theta} 和极大似然估计 θ^\hat{\theta}.

(2)(8分) 讨论 θ^\hat{\theta} 的无偏性, 若非无偏, 则给出一个修正后的无偏估计.


  1. (20分) 厂商称白糖平均每包重量 m500gm \geq 500 g, 抽取 100 包测得数据如下:
i 每包克重 包数
1 498-499 10
2 499-500 20
3 500-501 50
4 501-502 20
100

(1)(5分) 求均值和标准差.

(2)(5分) 构造均值的99%置信区间 (t0.005(99)2.626)\left(t_{0.005}(99) \approx 2.626\right)

(3)(5分) 在 α=0.01\alpha=0.01 水平下, 检验厂商说法是否可信 (t0.01(99)2.364)\left(t_{0.01}(99) \approx 2.364\right)

(4)(5分) 利用正态分布近似, 以 95%95 \% 概率对该批糖达 500 g500 \mathrm{~g} 的比例作区间估计 (z0.025=1.96)(z_{0.025}=1.96)