中国科学技术大学-812概率论与数理统计-2025年

  1. 甲乙两队比赛,3局2胜制,每局结果相互独立,甲每局获胜概率0.6,甲队现有只能使用 1次的战术,使当局获胜的概率提升至0.65,但若此局失败,之后每局获胜概率降至0.5,试计算甲最终获胜的概率,并以此说明在第几局使用该战术最佳.(15分)
Solution:

1)当不使用战术时,甲最终获胜的概率是:

P(甲赢)=0.62+20.620.4=0.648P(甲赢) = 0.6^2 + 2*0.6^2*0.4 =0.648

2)
在第一句使用战术:

P(甲赢)=0.60.65+0.650.60.4+0.350.52=0.6335P(甲赢) = 0.6*0.65 + 0.65*0.6*0.4 + 0.35*0.5^2 = 0.6335

在第二局使用战术:

P(甲赢)=0.60.65+0.60.350.5+0.40.650.6=0.651P(甲赢) = 0.6*0.65 + 0.6*0.35*0.5 + 0.4*0.65*0.6 = 0.651

在第三局使用战术:

P(甲赢)=0.60.6+0.60.40.65+0.40.60.65=0.672P(甲赢) = 0.6*0.6 + 0.6*0.4*0.65 + 0.4*0.6*0.65= 0.672

所以应该在第三局使用战术。

  1. XiN(u,σi2),iidi=1,2,3,4X_i \sim N(u,\sigma_i^2),iid,i=1,2,3,4,σi2\sigma_i^2各不相同.
    (1)求X1+X2X_1+X_2的分布密度.(7分)
    (2)求X1X2X3X4\frac{X_1-X_2}{X_3-X_4}的分布密度.(8分)
Solution:

(1).由正态分布的性质,我们易知:

X1+X2N(2u,σ12+σ22)X_1+X_2\sim N(2u, \sigma^2_1+\sigma^2_2)

(2)茆书习题我们可以知道这是一个柯西分布,我们设T=X1X2X3X4σ32+σ42σ22+σ12T =\frac{X_1-X_2}{X_3-X_4}\sqrt{\frac{\sigma^2_3+\sigma^2_4}{\sigma^2_2+\sigma^2_1}},Y=X1X2σ12+σ22Y = \frac{X_1-X_2}{\sqrt{\sigma^2_1+\sigma^2_2}},X=X3X4σ32+σ42X=\frac{X_3-X_4}{\sqrt{\sigma^2_3+\sigma^2_4}}我们有:

P(Tt)=P(YtX,X0)+P(XtX,X0)=20+dx0tx12πex2+y22dyfT(t)=dP(Tt)dt因为是指数族分布,积分和求导可交换顺序=1π0+xet2+12x2dx=1π(t2+1)\begin{aligned} P(T\le t) &= P(Y\le tX, X \ge0) + P(X\ge tX, X\le0) \\ &=2\int_{0}^{+\infty}dx\int_{0}^{tx}\frac{1}{2\pi}e^{-\frac{x^2+y^2}{2}}dy \\ f_T(t) &=\frac{dP(T\le t)}{dt} \\ &因为是指数族分布,积分和求导可交换顺序\\ &=\frac{1}{\pi}\int_{0}^{+\infty}xe^{-\frac{t^2+1}{2}x^2}dx\\ &=\frac{1}{\pi(t^2+1)} \end{aligned}

所以X1X2X3X4Cauchy(σ32+σ42σ22+σ12,0)\frac{X_1-X_2}{X_3-X_4}\sim Cauchy(\sqrt{\frac{\sigma^2_3+\sigma^2_4}{\sigma^2_2+\sigma^2_1}},0)

  1. X,YX,Y是两电子器件寿命分布,分别为:XExp(1),YExp(2)X\sim Exp(1), Y\sim Exp(2),X,YX,Y独立。求(1)串联,(5分)(2)并联,(5分)(3)备用,(5分)三种结构下的分布、期望,以及串联和并联下的协方差.
Solution:

(1)串联,设整体寿命为T1=min{X,Y}T_1=min\{X,Y\},则:

P(T1>t)=P(X>t)P(Y>t)=e3tFT1(t)=1e3tE(T1)=13\begin{aligned} P(T_1>t) &= P(X>t)P(Y>t)\\ &=e^{-3t} \\ F_{T_1}(t) &= 1-e^{-3t}\\ E(T_1) &= \frac{1}{3} \end{aligned}

(2)并联,设整体寿命为T2=max{X,Y}T_2=max\{X,Y\},则:

P(T2t)=P(Xt)P(Yt)=1ete2t+e3tE(T3)=76\begin{aligned} P(T_2\le t) &=P(X\le t)P(Y\le t)\\ & = 1-e^{-t}-e^{-2t} + e^{-3t} \\ E(T_3) &= \frac{7}{6} \end{aligned}

(3)备用,设整体寿命为T3T_3,我们易知T3=X+YT_3 = X+Y,则:

P(T3t)=P(X+Yt)=0texdx0tx2e2ydy=12et+e2tE(T3)=32\begin{aligned} P(T_3\le t) &= P(X+Y\le t) \\ & = \int_{0}^{t} e^{-x}dx\int_{0}^{t-x}2e^{-2y}dy\\ & = 1-2e^{-t} + e^{-2t}\\ E(T_3) &= \frac{3}{2} \end{aligned}

串联和并联下的协方差Cov(T1,T2)Cov(T_1,T_2):

Cov(T1,T2)=E(T1T2)E(T1)E(T2)=E(max{X,Y}min{X,Y})718=E(XY)718=19\begin{aligned} Cov(T_1,T_2) &= E(T_1T_2) -E(T_1)E(T_2) \\ &= E(max\{X,Y\} min\{X,Y\}) - \frac{7}{18} \\ & = E(XY) - \frac{7}{18}\\ & = \frac{1}{9} \end{aligned}

  1. {Xi},i=1,2,..,n\{ X_i\},i =1,2,..,n独立,服从期望为uu,方差各不相同但最大方差为bb.证明:S=X1+X2+...XnnS = \frac{X_1+X_2+...X_n}{n}uu的相合估计.(20分)
Solution:

由条件我们有:

Var(S)=Var(X1+...Xn)n2bnVar(S) = \frac{Var(X_1+...X_n)}{n^2} \le \frac{b}{n}

由切比雪夫不等式,我们有:

P(Suϵ)Var(S)ϵ2bnϵ20P(|S-u|\ge\epsilon) \le \frac{Var(S)}{\epsilon^2} \le \frac{b}{n\epsilon^2} \to0

所以SSuu的相合估计

  1. 双参数指数分布Exp(1λ,u)Exp(\frac{1}{\lambda}, u), X1,...XnX_1,...X_n为样本,证明:(X(1),i=2nX(i))(X_{(1)}, \sum_{i=2}^{n}X_{(i)})u,λu,\lambda的充分统计量.(20分)
Solution:

我们有:

f(X1,...Xn)=1λnei=1n(Xiu)λI(X(1)>u)=1λnenuλei=1nXiλI(X(1)>u)\begin{aligned} f(X_1,...X_n) &= \frac{1}{\lambda^n}e^{\frac{\sum_{i=1}^{n}(X_i-u)}{\lambda}} I(X_{(1)}>u) \\ & = \frac{1}{\lambda^n}e^{\frac{-nu}{\lambda}} \cdot e^{\frac{\sum_{i=1}^{n}X_i}{\lambda}}I(X_{(1)}>u) \end{aligned}

由因子分解定理,我们有(X(1),i=1nXi)(X_{(1)},\sum_{i=1}^{n}X_{i})u,λu,\lambda的充分统计量,同时我们注意到有i=1nXi=i=1nX(i)\sum_{i=1}^{n}X_{i} = \sum_{i=1}^{n}X_{(i)},我们又注意到(X(1),i=1nX(i))(X_{(1)}, \sum_{i=1}^{n}X_{(i)})(X(1),i=2nX(i))(X_{(1)}, \sum_{i=2}^{n}X_{(i)})是一一对应的关系,所以(X(1),i=1nX(i))(X_{(1)}, \sum_{i=1}^{n}X_{(i)})u,λu,\lambda的充分统计量。

  1. (X1,X2,X3,X4)M(n;12+θ4,14θ4,14θ4,θ4)(X_1,X_2,X_3,X_4) \sim M(n;\frac{1}{2}+\frac{\theta}{4},\frac{1}{4}-\frac{\theta}{4},\frac{1}{4}-\frac{\theta}{4},\frac{\theta}{4}),样本(x1,x2,x3,x4),i=14xi=n(x_1,x_2,x_3,x_4),\sum_{i=1}^{4} x_i=n,潜变量Z:(X1Z,Z,X2,X3,X4)M(n;12θ4,θ2,14θ4,14θ4,θ4)Z:(X_1-Z,Z,X_2,X_3,X_4) \sim M(n;\frac{1}{2}-\frac{\theta}{4},\frac{\theta}{2},\frac{1}{4}-\frac{\theta}{4},\frac{1}{4}-\frac{\theta}{4},\frac{\theta}{4}).
    (1)求(x1,x2,x3,x4)(x_1,x_2,x_3,x_4)的对数似然函数.(5分)
    (2)求ZZ(X1,X2,X3,X4)(X_1,X_2,X_3,X_4)下的条件分布.(5分)
    (3)不清楚(5分)
    (4)求θt\mathcal{\theta}^t(10分)
Solution:

(1)

对数似然函数为:

l(θ)=x1ln(12+θ4)+x2ln(14θ4)+x3ln(14θ4)+x4ln(θ4)l(\theta) = x_1ln(\frac{1}{2}+\frac{\theta}{4}) + x_2ln(\frac{1}{4}-\frac{\theta}{4}) + x_3ln(\frac{1}{4}-\frac{\theta}{4})+x_4ln(\frac{\theta}{4})

(2)

P(ZX1,X2,X3,X4)=X1!(X1Z)!Z!(2θ2+θ)X1Z(2θ2+θ)ZP(Z|X_1,X_2,X_3,X_4) =\frac{X_1!}{(X_1-Z)!Z!}(\frac{2-\theta}{2+\theta})^{X_1-Z}(\frac{2\theta}{2+\theta})^{Z}

(3)
我们有:

l(θ(X1,X2,X3,X4,Z))=a+(X1Z)ln(12θ4)+Zln(θ2)+X2ln(14θ4)+X3ln(14θ4)+X4ln(θ4)l(\theta|(X_1,X_2,X_3,X_4,Z)) = a+(X_1-Z)ln(\frac{1}{2}-\frac{\theta}{4})+ Zln(\frac{\theta}{2})+X_2ln(\frac{1}{4}-\frac{\theta}{4}) + X_3ln(\frac{1}{4}-\frac{\theta}{4}) + X_4ln(\frac{\theta}{4})

于是,对于:

Q(θ,θt1)=Eθt(l(θ(X1,X2,X3,X4,Z))(X1,X2,X3,X4))=(x1x1p)ln(12θ4)+x1pln(θ2)+x2ln(14θ4)+x3ln(14θ4)+x4ln(θ4)其中p=2θt12+θt1dQdθ=x1x1p2θ+x1pθ+x21θ+x31θ+x4θ=0a=x1x1p,b=x1p+x4,c=x2+x3,我们解得:θt=(a+2c3b)±(a+2c3b)28b(bac)2(bac)(舍去在(0,1)外的值)\begin{aligned} Q(\theta,\theta^{t-1}) &= E_{\theta^{t}}(l(\theta|(X_1,X_2,X_3,X_4,Z))|(X_1,X_2,X_3,X_4))\\ &= (x_1-x_1p)ln(\frac{1}{2}-\frac{\theta}{4})+ x_1pln(\frac{\theta}{2})+x_2ln(\frac{1}{4}-\frac{\theta}{4}) + x_3ln(\frac{1}{4}-\frac{\theta}{4}) + x_4ln(\frac{\theta}{4}) \\ 其中&:p = \frac{2\theta^{t-1}}{2+\theta^{t-1}} \\ \frac{dQ}{d\theta}& =\frac{x_1-x_1p}{2-\theta}+\frac{x_1p}{\theta} +\frac{x_2}{1-\theta} +\frac{x_3}{1-\theta} + \frac{x_4}{\theta} = 0\\ 设&:a =x_1-x_1p,\quad b=x_1p+x_4,\quad c=x_2+x_3,我们解得:\\ \theta^{t} &= \frac{-(a+2c-3b) \pm \sqrt{(a+2c-3b)^{2}-8b(b-a-c)}}{2(b-a-c)}(舍去在(0,1)外的值) \end{aligned}

  1. X1,...,XnX_1,...,X_n,Y1,...YnY_1,... Y_n独立, XiN(u1,σ2),YiN(u2,σ2),σX_i \sim N(u_1, \sigma^2), Y_i \sim N(u_2, \sigma^2),\sigma已知.$$H_0:u_1= u_2 \Leftrightarrow H_1:u_1-u_2 \ne \delta _n$$
    nn\to \infty时,δn0\delta_n \to 0.
    (1)水平α\alpha下的拒绝域,功效函数,第二类错误.(10分)
    (2)δn\delta_n以多大速度趋于0时,第二类错误趋于0.(10分)
Solution:

(1)
对于简单假设,其ump拒绝域其实是由δn\delta_n的值决定的,且为单边拒绝域,但是这里并没有明确表明δn\delta_n的范围,所以我们采用双边拒绝域:

W={xˉyˉu1α/22σ2nxˉyˉu1α/22σ2n}W = \{\bar{x}-\bar{y}\le -u_{1-\alpha/2}\sqrt{\frac{2\sigma^2}{n}} 或\bar{x}-\bar{y}\ge u_{1-\alpha/2}\sqrt{\frac{2\sigma^2}{n}} \}

其功效函数:

P(XWu1u2=k)=Φ(u1α/2kn2σ2)+Φ(u1α/2+kn2σ2)P(X\in W|u_1-u_2=k) = \Phi(-u_{1-\alpha/2}-k\sqrt{\frac{n}{2\sigma^2}}) +\Phi(-u_{1-\alpha/2}+k\sqrt{\frac{n}{2\sigma^2}})

第二类错误是:

P(XWˉu1u2=δn)=Φ(u1α/2+δnn2σ2)Φ(u1α/2+δnn2σ2)P(X \in \bar{W}|u_1-u_2 =\delta_n) = \Phi(u_{1-\alpha/2}+\delta_n\sqrt{\frac{n}{2\sigma^2}}) -\Phi(-u_{1-\alpha/2}+\delta_n\sqrt{\frac{n}{2\sigma^2}})

(2):
显然易见,当limnδnn=lim_{n\to\infty}\delta_n\sqrt{n} = \infty时,第二类错误趋于0。

  1. 多元线性模型:

    y=b0+x1b1+...+xpbp+e,eN(0,σ2)y = b_0 + x_1b_1+...+x_pb_p+e, \quad e\sim N(0,\sigma^2)

    样本:{yi,xi1,...,xip},i=1,2,...,n\{y_i, x_{i1},...,x_{ip}\}, i=1,2,...,n.
    XX为第i,ji,j元素为Xi,jX_{i,j}的矩阵,(XTX)(X^TX)(p+1)×(p+1)(p+1)\times (p+1)的可逆矩阵.
    (1)(b0,b1,...bp)(b_0,b_1,...b_p)的最小二乘表达式.(5分)
    (2)求σ2\sigma^2的相合估计表达式.(7分)
    (3)基于(2)给出以下检验问题的统计量,及拒绝域.(8分)

    H0:σ2cH1:σ2<cH_0:\sigma^2\ge c \Leftrightarrow H_1:\sigma^2 <c

Solution:

(1)
因为(XTX)(X^TX)为可逆矩阵,所以OLS的损失函数为强凸函数,所以我们有:

(b0,b1,...bp)T=(XTX)1XTY(b_0,b_1,...b_p)^T =(X^{T}X)^{-1}X^{T}Y

(2)
由Cochran定理,我们知道:

(YY^)T(YY^)σ2χn1p2(Y-\hat{Y})^T(Y-\hat{Y}) \sim \sigma^2\chi^{2}_{n-1-p}

因此我们有:

E((YY^)T(YY^)n1p)=σ2Var((YY^)T(YY^)n1p)=2σ4n1p\begin{aligned} E(\frac{(Y-\hat{Y})^T(Y-\hat{Y})}{n-1-p}) &= \sigma^2\\ Var(\frac{(Y-\hat{Y})^T(Y-\hat{Y})}{n-1-p}) &=\frac{2\sigma^4}{n-1-p} \end{aligned}

所以由切比雪夫不等式,我们知道(YY^)T(YY^)n1p\frac{(Y-\hat{Y})^T(Y-\hat{Y})}{n-1-p}σ2\sigma^2的相合估计。

(3)
我们选定检验统计量为T=(YY^)T(YY^)T=(Y-\hat{Y})^T(Y-\hat{Y}),所以其拒绝域为:

{Tcχn1p2(α)}\{T \le c \chi^{2}_{n-1-p}(\alpha)\}