中国科学技术大学-432统计学-2019年

一、填空题(每题5分, 共50分)

  1. 有一个信号系统, 输入 0 而输出 1 的可能性为 0.040.04, 输入 1 而输出 0 的可能性为 0.02; 输入 0 和 1 的概率都是 0.50.5, 那么输出结果为 0 时, 这个信号是真实的概率是 _____\text{\_\_\_\_\_}.

  1. f(x)=a/(1+x2)f(x)=a /\left(1+x^{2}\right) 是密度函数, 则 a=a= _____\text{\_\_\_\_\_}

  1. 甲乙对弈, 任意一局甲赢的概率是 p{p}, 乙赢的概率是 1p01-{p}_{0}. 若赢一局得一分, 谁先比另一人多得两分谁就是赢家, 则甲赢的概率是 _____\text{\_\_\_\_\_}.

  1. 一根绳子长 4 米, 剪成两段 X和 Y, 则 XXYY 的相关系数是_____\text{\_\_\_\_\_}.

  1. 已知泊松分布的参数是 λ\lambda, 若 E(X1)(X2)=5{E}({X}-1)({X}-2)=5, 则λ=\lambda= _____\text{\_\_\_\_\_}.

  1. 某个班级有 6 个女生和 10 个男生, 随机组成 8 个小队进行比赛, 每个小队两个人, 记 XX 为两个人都是女生的小队个数, 则 E(X)=E(X)= _____\text{\_\_\_\_\_}.

  1. Xi(i=1,2,,9){X_i}({i}=1,2, \cdots, 9) 服从标准正态分布, 若记F(x)F(x)为其分布函数, 令Z=max{F(X1),F(X2),,F(X9)}Z=\max \left\{ F\left( X_1 \right) ,F\left( X_2 \right) ,\cdots ,F\left( X_9 \right) \right\}, 则 EZ=EZ= _____\text{\_\_\_\_\_}.

  1. 一组简单随机样本 X1,X2,X3,X4X_1, X_2, X_3, X_4 的观测值如下:

2,1,0,2-2,-1,0,2

Y=X3{Y}={X}^{3} 服从正态分布 N(μ,1){N}(\mu, 1), 则 μ\mu95%95\%水平置信区间是_____\text{\_\_\_\_\_}.


  1. Xi(i=1,2,,n){X_i}({i}=1,2, \cdots, {n}) 是来自正态分布 N(μ,25){N}(\mu, 25)的简单随机样本, 在 α=0.05\alpha=0.05 下, 使得样本落入拒绝域P(Xˉμ0>2.5)P (\mid \bar{X}-\mu_0 \mid>2.5) 的最小样本容量 n{n}_____\text{\_\_\_\_\_}.

  1. Xi(i=1,2,,5){X}_{i} ({i}=1,2, \cdots, 5) 是来自同一正态分布的简单随机样本, Z=13i=13Xi,Y=12i=45Xi,s2=12i=13(XiZ){Z}=\frac{1}{3} \sum_{i=1}^{3} X_i, {Y}=\frac{1}{2} \sum_{i=4}^{5} X_i, s^2=\frac{1}{2}\sum_{i=1}^3{\left( X_i-Z \right)}, 则 2(ZY)s\frac{\sqrt{2}\left( Z-Y \right)}{s} 服从的分布是_____\text{\_\_\_\_\_}.

二、(20分) 设随机变量YY有概率密度函数 f(y)={2y0<y<10 其他 ,X{f}({y})=\left\{\begin{array}{ll}2 y & 0<y<1 \\ 0 & \text { 其他 }\end{array}, {X}\right. 服从两点分布, X=0{X}=0 的概率为 0.5,X=20.5, {X}=2的概率为 0.50.5, 设 Z=X+Y{Z}={X}+{Y}.

(1) P(Y<EY)P(Y<EY);

(2) Z{Z} 的概率密度函数.


三、(20分) Xi(i=1,2,,n){X_i}({i}=1,2, \cdots, {n}) 是来自均匀分布 U(0,θ)U(0, \theta)总体的简单随机样本, 有以下几个估计量 θ1^=Anxˉ\hat{\theta_1}=A_n \bar{x},θ2^=Bnx(1),θ3^=Cnx(n)\hat{\theta_2}=B_n x_{(1)}, \hat{\theta_3}={C_n}x_{(n)}.

(1) 若上述三个估计量都是 θ\theta 的无偏估计, 试求 An,Bn,CnA_n,B_n,C_n;

(2) 在(1) 的条件下, 哪个估计量最有效.


四、(20分) 秋名山车队测试了7辆AE86过弯时的速度, XX为普通漂移过弯时的速度, YY为采用排水渠过弯的速度, 考虑到车性能的差异和车手水平以及测量误差等因素, 我们可以假设 XiN(μ1,σ2)X_i\sim N(\mu_1,\sigma^2), YiN(μ2,σ2)Y_i\sim N(\mu_2,\sigma^2), 其中参数均未知, 并且诸Xi,YiX_i, Y_i 独立.

车辆号 1 2 3 4 5 6 7
X{X} 15.315.3 20.120.1 18.518.5 21.321.3 17.817.8 19.619.6 16.316.3
Y{Y} 17.217.2 19.219.2 20.020.0 20.820.8 19.119.1 20.420.4 17.717.7

(1) 尝试建立成对数据的假设检验, 并判断采用排水渠过弯是否可以显著增加车速(选取显著性水平 α=0.05\alpha = 0.05);

(2) 令di=I{Yi>Xi}d_i=\mathbf{I}_{\left\{ Y_i>X_i \right\}}, 证明 did_i服从伯努利分布, 若假设其参数为 pp, 考虑假设检验问题:

H0:p=0.5vsH1:p>0.5H_0: p = 0.5 \quad vs \quad H_1: p > 0.5

给出该检验的拒绝域, 并判断采用排水渠过弯是否可以显著增加车速(选取显著性水平 α=0.05\alpha = 0.05).


五、(20分) 以下是甲乙工厂生产的同一零件的数据, 其中零件质量分为差, 一般, 好三个等级.

一般
56 40 14
42 40 18

(1) 试给出甲乙两个工厂生产该零件的差品率的极大似然估计;

(2) 在0.05的显著性水平下, 判断甲乙两个工厂的生产水平是否一致.


六、(20分) 考虑一元线性回归模型 Yi=α+βxi+εi,i=1,,Y_{i}=\alpha + \beta x_{i}+\varepsilon_{i}, i=1, \cdots, 其中 Eεi=0,Var(εi)=σ2,Cov(εi,εj)=0,ijE \varepsilon_{i}=0, {Var}\left(\varepsilon_{i}\right)=\sigma^{2}, {Cov}\left(\varepsilon_{i}, \varepsilon_{j}\right)=0, \forall i \neq j , 采集到的数据如下表:

1 2 3 4 5 6 7
XX 17.117.1 10.510.5 13.813.8 15.715.7 11.911.9 10.410.4 15.015.0
YY 16.716.7 10.410.4 13.513.5 15.715.7 11.611.6 10.210.2 14.514.5

(1) 试求 α\alpha 以及 β\beta 的最小二乘估计, 并给出σ2\sigma^2 的估计;

(2) 若 x0=15.3x_0 = 15.3, 在 显著性水平 α=0.05\alpha = 0.05下求 Y0Y_0 的区间估计.