中国科学技术大学-432统计学-2025年

一、填空题

  1. AA发生的概率为pp,BB发生的概率为qq,A,BA,B为两个基本事件,且p+q1p+q\le1,求AA先于BB发生的概率.(6分)

Solution:

P(A先于B)=i=0(1pq)ip=pp+qP(A先于B)= \sum_{i=0}(1-p-q)^ip = \frac{p}{p+q}

  1. X,Y,ZX,Y,Z为相互独立的标准正态分布,且相互独立,求E(X+YX+Y+Z)E(X+Y|X+Y+Z).(6分)

Solution:

第一种方法运用正态分布的条件分布。
第二种方法运用对称轮换性,注意到:

E(ZX+Y+Z)=E(YX+Y+Z)=E(XX+Y+Z)E(Z|X+Y+Z) = E(Y|X+Y+Z) =E(X|X+Y+Z)

而:

E(X+Y+ZX+Y+Z)=X+Y+ZE(X+Y+Z|X+Y+Z) = X+Y+Z

所以:

E(X+YX+Y+Z)=23(X+Y+Z)E(X+Y|X+Y+Z) = \frac{2}{3}(X+Y+Z)

  1. a(X1+X2)X32+X42+X52\frac{a(X_1+X_2)}{\sqrt{X_3^2+ X_4^2+ X_5^2}}服从tt分布,且XiN(0,σ2),iidX_i \sim N(0,\sigma^2),iid,求aa.(6分)

Solution:

凑就完啦!有点小坑,因为负的也行,t分布的对称性 ,a=±32a = \pm\sqrt{\frac{3}{2}}

  1. (X,Y)N(0,0,1,4,0.5)(X,Y) \sim N(0,0,1,4,-0.5),求Z=aX+(1a)YZ = aX +(1-a)Y的方差最小时,aa的取值.(6分)

Solution:

算就完啦!a=57a=\frac{5}{7}

  1. XPossion(3)X \sim Possion(3),求P(nXˉ3(n+1))P(\sqrt{n}\bar{X} \le 3(\sqrt{n}+1))(用标准正态分布函数表示)(6分)
Solution:

做就完啦!Φ(3)\Phi(\sqrt{3})

二、选择题

  1. α\alpha是显著性水平,pppp值,则(\quad)(6分)
    A. pp小于α\alpha应拒绝原假设。
    B. pp值与α\alpha有关
    C.pp值与原假设无关。
    D.pp值与备择假设无关。

Solution:

pp值是在给定原假设的时候计算,而pp值极端的方向的衡量是由备择假设决定的。

  1. Xˉ\bar{X}N(u,σ2)N(u,\sigma^2)的样本均值,S2S^2是样本方差,则(\quad)(6分)
    A. ssσ\sigma的无偏估计。
    B. ssσ\sigma的MLE。
    C.Xˉ\bar{X}SS独立。
    D.nS2σ2χn2\frac{nS^2}{\sigma^2}\sim\chi^2_n
Solution:

B.n1nS2\frac{n-1}{n}S^2才是σ2\sigma^2的MLE
C.由fisher引理,易知

  1. F(X)F(X)是分布函数,则下面(\quad)可能不是分布函数(6分)
    A. (F(X))2(F(X))^2
    B.F(X)(1F(X))ln(1F(X))F(X) - (1-F(X))ln(1-F(X))
    C.
    D.2(F(X))2F(X)2(F(X))^2-F(X)

Solution:

D.在[0,1][0,1]上都不是单增的

  1. θU(0,π)\theta\sim U(0,\pi),X=cosθ,Y=sinθX=cos\theta, Y = sin\theta, 则X,YX,Y(\quad):(6分)
    A.不独立,不相关。
    B.独立,不相关。
    C.不独立,相关。
    D.

Solution:

独立性很好验证:

P(X[22,1],Y[22,1])=0P(X[22,1])0,P(Y[22,1])0\begin{aligned} P(X\in[\frac{\sqrt{2}}{2},1],Y\in [\frac{\sqrt{2}}{2},1]) = 0\\ P(X\in[\frac{\sqrt{2}}{2},1])\ne 0 , P(Y\in[\frac{\sqrt{2}}{2},1])\ne 0 \end{aligned}

不相关性由对称性很容易计算。

  1. uu置信区间(95%)为[0.25,0.95][0.25,0.95],XN(u,1)X\sim N(u,1),求P(X0)P(X\le 0)相同置信度的区间()(6分)
    A.[Φ(0.25),Φ(0.95)][\Phi(0.25),\Phi(0.95)]
    B.[1Φ(0.95),1Φ(0.25)][1-\Phi(0.95),1-\Phi(0.25)]
    C.[0.25,0.95][0.25,0.95]
    D.

Solution:

我们有:

P(X0)=P(Xuu)=Φ(u)P(X\le0) = P(X-u\le-u) = \Phi(-u)

因为Φ\Phi为严格单增函数,所以我们有 Φ(u)\Phi(-u)的置信区间为:

[Φ(0.95),Φ(0.25)][\Phi(-0.95),\Phi(-0.25)]

三、计算题

  1. f(x,y)=12(x+y)e(x+y),x,y>0f(x,y) = \frac{1}{2}(x+y)e^{-(x+y)},x,y>0.
    (1)X,YX,Y同分布吗,独立吗.(5分)
    (2)求fX(xY)f_X(x|Y)(5分)
    (3)Z=X+YZ=X+Y,求fZ(z)f_Z(z)(5分)

Solution:

(1)由对称轮换性,我们显然可以看出来X,YX,Y是同分布的。
对于X的分布:

fX(x)=0+12(x+y)e(x+y)dy=12xex+12ex,x>0f_X(x) = \int_{0}^{+\infty}\frac{1}{2}(x+y)e^{-(x+y)}dy = \frac{1}{2}xe^{-x} + \frac{1}{2}e^{-x}, x>0

所以X,YX,Y并不相互独立。

(2)

fX(xY)=f(x,Y)fY(Y)=(x+Y)exY+1\begin{aligned} f_X(x|Y) &= \frac{f(x,Y)}{f_Y(Y)} \\ & = \frac{(x+Y)e^{-x}}{Y+1} \end{aligned}

(3)

fZ(z)=0z12zezdx=12z2ez,z>0f_Z(z) = \int_{0}^{z}\frac{1}{2}ze^{-z}dx = \frac{1}{2}z^2e^{-z} , z>0

  1. X1,X2,X3X_1, X_2, X_3U(0,1)U(0,1)三个统计量.
    (1)求P(X1=X(1),X2=X(2),X3=X(3))P(X_1 = X_{(1)}, X_2=X_{(2)}, X_3=X_{(3)})(2分)
    (2)求fX(2)(x(2))f_{X_{(2)}}(x_{(2)})(3分)
    (3)Y=ln(X(3))Y = -ln(X_{(3)}),求其分布(5分)
    (4)E(X(3)X(1))E(X_{(3)}- X_{(1)})(5分

Solution:

(1)由对称轮换性,我们知道:

P(X1=X(1),X2=X(2),X3=X(3))=13!P(X_1 = X_{(1)}, X_2=X_{(2)}, X_3=X_{(3)}) = \frac{1}{3!}

(2)

fX(2)(x(2))=6x(2)(1x(2)),0<x(2)<1f_{X_{(2)}}(x_{(2)}) =6x_{(2)}(1-x_{(2)}), 0< x_{(2)} < 1

(3)

fX(3)(x(3))=3x(3)2,0<x(3)<1f_{X_{(3)}}(x_{(3)}) =3x_{(3)}^2 ,0< x_{(3)} < 1

fY(y)=fX(3)(ey)dx(3)dy=3e3yf_Y(y) = f_{X_{(3)}}(e^{-y})|\frac{\mathrm{d} x_{(3)}}{\mathrm{d} y}| = 3e^{-3y}

(4)
我们知道X(1)beta(1,3)X(3)beta(3,1)X_{(1)}\sim beta(1,3),X_{(3)}\sim beta(3,1)

E(X(3)X(1))=3414=12E(X_{(3)}- X_{(1)}) = \frac{3}{4} - \frac{1}{4}=\frac{1}{2}

  1. f(x)=θxlnθ,θ(0,1)f(x) = -\theta^xln\theta, \theta\in(0,1),X1,...XnX_1,...X_n为样本。
    (1)求θ\theta的矩估计。(5分)
    (2)1lnθ\frac{1}{ln\theta}的MLE估计g^\hat{g}。(5分)
    (3)若limnP(n(g^a)bx)=Φ(x)lim_{n\to\infty}P(\frac{\sqrt{n}(\hat{g}-a)}{\sqrt{b}}\le x) = \Phi(x),求a,ba,b。(5分)

Solution:

注意到f(x)=(lnθ)e(lnθ)xf(x) = (-ln\theta)e^{-(-ln\theta)x},所以XExp(lnθ)X \sim Exp(-ln\theta)
(1)

E(X)=1lnθE(X) = \frac{1}{-ln\theta}

所以

θ^m=e1xˉ\hat{\theta}_{m} = e^{-\frac{1}{\bar{x}}}

(2)
我们知道lnθ-ln\theta的MLE是1Xˉ\frac{1}{\bar{X}},所以由MLE的不变性,我们有:

g^=Xˉ\hat{g} = -\bar{X}

(3)
由中心极限定理我们有:

n(Xˉ+1lnθ)(1lnθ)2dN(0,1)\frac{\sqrt{n}(-\bar{X} + \frac{1}{ln\theta})}{\sqrt{(\frac{1}{ln\theta})^2}} \xrightarrow{d}N(0,1)

所以有a=1lnθ,b=(1lnθ)2a = \frac{1}{ln\theta}, b =(\frac{1}{ln\theta})^2

  1. X1,X2,...X100N(u,1)X_1, X_2,...X_{100} \sim N(u, 1)
    (1)H0:u=0H1:u0H_0:u=0 \Leftrightarrow H_1:u\ne0,求拒绝域,显著水平为0.05。(7分)
    (2)若真实值为0.4,求检验功效(保留俩位小数).(Φ(1.645)=0.95,Φ(1.96)=0.975,Φ(2.04)=0.98)(\Phi(1.645) =0.95, \Phi(1.96)=0.975,\Phi(2.04)=0.98)(8分)

Solution:

(1)

T=Xˉu1100N(0,1)T = \frac{\bar{X} - u}{\sqrt{\frac{1}{100}}} \sim N(0,1)

所以其拒绝域为:

W={Xˉ0.196Xˉ0.196}W = \{\bar{X} \le -0.196或 \bar{X} \ge 0.196\}

(2)
功效函数为:

g(0.4)=Pu(XˉW)=1Φ(5.96)+Φ(2.04)=0.98\begin{aligned} g(0.4) &= P_u(\bar{X} \in W) \\ &= 1-\Phi(5.96) + \Phi(2.04) \\ & = 0.98 \end{aligned}

  1. 有一家公司,其提供的信息是他的产品中会随机含有6种糖中的一种,出现概率为:A:0.2, B:0.2, C:0.2, D:0.15, E:0.15, F:0.10.买了1000粒,经过统计得到含各种糖的个数为:A:180, B:190, C:185, D:165, E:160, F:120.问信息是否准确。(15分)

Solution:

拟合优度检验

K=400200+100200+225200+225150+100150+400100=9.792χ52(0.975)K = \frac{400}{200} + \frac{100}{200}+ \frac{225}{200} + \frac{225}{150}+ \frac{100}{150}+ \frac{400}{100} = 9.792 \le \chi^2_{5}(0.975)

所以在显著水平α=0.25\alpha=0.25时,会认为信息是准确的。

  1. y=Xβ+ϵ,ϵN(0,σ2In)y=X\beta + \epsilon, \epsilon \sim N(0,\sigma^2I_n)XX为设计矩阵。
    (1)OLS与MSE是否一样,说明理由。(7分)
    (2)X0X_0是新得到的,y0=X0Tβ+ϵ0y_0 = X_0^T\beta + \epsilon_0,ϵ0\epsilon_0ϵ\epsilon独立,预测值y0^=X0Tβ^\hat{y_0} = X_0^T\hat{\beta},问预测值的均方误差。(8分)

Solution:

(1) 在当前条件下,MLE与OLS求得的β\beta是一样的,因为二者的核心都是最小化(yXβ)T(yXβ)(y-X\beta)^T(y-X\beta).

(2) 根据多元回归的结论, 我们有

β^=(XTX)1XTYN(β,σ2(XTX)1),\hat{\beta} = (X^TX)^{-1}X^TY \sim N(\beta, \sigma^2(X^TX)^{-1}),

这个 β^\hat{\beta} 是由旧数据估计的, 而 X0X_0 是新得到的, 他们独立, 因此

E(X0Tβ^yo)2=Var(X0Tβ^)+E(ϵ0)2=σ2(1+X0T(XTX)1X0).E(X_0^T\hat{\beta}-y_o)^2 = Var(X_0^T\hat{\beta}) + E(\epsilon_0)^2 = \sigma^2 \left( 1 + X_0^T(X^TX)^{-1}X_0 \right).