清华大学-432统计学-2018年

一、(20分) 设有独立的随机变量序列 {Xn},\left\{X_{n}\right\}, 其中 P(Xn=1)=1n,P(Xn=0)=11nP\left(X_{n}=1\right)=\frac{1}{n}, P\left(X_{n}=0\right)=1-\frac{1}{n},

(1)(6分) 当 n+n \rightarrow+\infty,EXn, E X_{n}DXnD X_{n} 是否趋于0,0, 请说明理由;

(2)(7分) 当 n+n \rightarrow+\infty 时, 是否有 XnP0,X_{n} \stackrel{P}{\rightarrow} 0, 请说明理由;

(3)(7分) 当 n+n \rightarrow+\infty 时, 是否有 Xna.s.0,X_{n} \stackrel{\text {a.s.}}{\rightarrow} 0, 请说明理由.


二、(20分) 设有一批产品100件,其中4件次品. 现从中任取3件, 若检验出其中有次品, 则认为该批次产品不合格. 检验时, 正品误判成次品的概率是0.05, 次品误判成正品的概率0.01. 试求该批产品检验结果合格的概率.


三、(20分) 某班级成员一星期迟到共计 50 次, 其中星期一 12 次, 星期二 11 次, 星期三 9 次, 星期四 10 次, 星期五 8 次. 问迟到是否与星期几有关?(注 : 记 fχ2(n)(x)f_{\chi^{2}(n)}(x) 是卡方分布 χ2(n)\chi^{2}(n) 的密度函数, 且 09.48fχ2(4)(x)dx0.95,011.07fχ2(5)(x)dx0.95\int_{0}^{9.48} f_{\chi^{2}(4)}(x) d x \approx 0.95, \int_{0}^{11.07} f_{\chi^{2}(5)}(x) d x \approx 0.95)


四、(50分) 随机变量 XX 的密度函数为 f(xθ)=θ(22x)(2xx2)θ1,f(x | \theta)=\theta(2-2 x)\left(2 x-x^{2}\right)^{\theta-1}, 其中 0<x<1,θ>00<x<1, \theta>0 . 现有简单随机样本 X1,X2,,XnX_{1}, X_{2}, \cdots, X_{n}.

(1)(10分) 记 Y=ln(2XX2)Y=-\ln \left(2 X-X^{2}\right),试求 YY 的密度函数;

(2)(10分) 求 XX 分布的中位数, 以及 EY;E Y ;

(3)(10分) 求 θ\theta 的极大似然估计 θ^L;\widehat{\theta}_{L} ;

(4)(10分) 求 θ^L\hat{\theta}_{L} 的密度函数;

(5)(10分) 求 θ\theta 的充分统计量.


五、(40分) 有观测数据 (x1,Y1),(x2,Y2),,(xn,Yn)\left(x_{1}, Y_{1}\right),\left(x_{2}, Y_{2}\right), \cdots,\left(x_{n}, Y_{n}\right). 并有线性回归模型 Yi=βxi+εi;i=1,2,n,Y_{i}=\beta x_{i}+\varepsilon_{i} ; i=1,2, \cdots n, xix_{i} 为不为 0 的随机设置点.不可观测的随机误差变量 εiN(0,xi2σ2)β,σ2\varepsilon_{i} \sim N\left(0, x_{i}{ }^{2} \sigma^{2}\right)_{\circ} \beta, \sigma^{2} 为未知参数, 则 :

(1)(20分) 求 β\beta 的最小二乘估计 β^LSE\widehat{\beta}_{L S E}β\beta 的极大似然估计 β^MLE,\widehat{\beta}_{M L E}, 以及 σ2\sigma^{2} 的极大似然估计;

(2)(10分) β^LSE,β^MLE\widehat{\beta}_{L S E}, \widehat{\beta}_{M L E} 是否为 β\beta 的无偏估计? 并比较二者的有效性 ;

(3)(10分) 利用似然比检验法给出假设检验问题 H0:β=1H_{0}: \beta=1 vs H1:β1H_{1}: \beta \neq 1 的检验拒绝域.