中国科学技术大学-432统计学-2019年

一、填空题(每题5分, 共50分)

  1. 有一个信号系统, 输入 0 而输出 1 的可能性为 0.040.04, 输入 1 而输出 0 的可能性为 0.02; 输入 0 和 1 的概率都是 0.50.5, 那么输出结果为 0 时, 这个信号是真实的概率是 _____\text{\_\_\_\_\_}.

Solution: 4849\frac{48}{49}
用事件 AA 表示“输入 0 ”, 用事件 BB 表示“输出 0”, 则根据题意有

P(BˉA)=0.04,P(BAˉ)=0.02,P(A)=P(Aˉ)=0.5P(\bar{B} \mid A)=0.04, P(B \mid \bar{A})=0.02, P(A)=P(\bar{A})=0.5

所以信号真实的概率为

P(AB)=P(BA)P(A)P(BA)P(A)+P(BAˉ)P(Aˉ)=0.96×0.50.96×0.5+0.02×0.5=4849P(A \mid B)=\frac{P(B \mid A) P(A)}{P(B \mid A) P(A)+P(B \mid \bar{A}) P(\bar{A})}=\frac{0.96 \times 0.5}{0.96 \times 0.5+0.02 \times 0.5}=\frac{48}{49}

  1. f(x)=a/(1+x2)f(x)=a /\left(1+x^{2}\right) 是密度函数, 则 a=a= _____\text{\_\_\_\_\_}.

Solution: 1π\frac{1}{\pi}
根据概率密度函数的正则性有

+a11+x2dx=a(arctanx)+=aπ=1\int_{-\infty}^{+\infty} a \frac{1}{1+x^{2}} d x=\left.a(\arctan x)\right|_{-\infty} ^{+\infty}=a \pi=1

解得 a=1πa=\frac{1}{\pi}.

  1. 甲乙对弈, 任意一局甲赢的概率是 p{p}, 乙赢的概率是 1p01-{p}_{0}. 若赢一局得一分, 谁先比另一人多得两分谁就是赢家, 则甲赢的概率是 _____\text{\_\_\_\_\_}.

Solution: p212p+2p2\frac{p^{2}}{1-2 p+2 p^{2}}
由于比赛规则要求多赢两分即为获胜, 那么总局数一定为偶数局, 所以可以两局一起考
虑: 甲赢两局的概率为 p2p^{2}, 乙赢两局的概率为 (1p)2(1-p)^{2}, 两局为平局的概率为 2p(1p)2 p(1-p) 设甲经过 nn 次平局后胜利, 则甲胜的概率为

n=0+[2p(1p)]np2=p2112p(1p)=p212p+2p2\sum_{n=0}^{+\infty}[2 p(1-p)]^{n} p^{2}=p^{2} \cdot \frac{1}{1-2 p(1-p)}=\frac{p^{2}}{1-2 p+2 p^{2}}

  1. 一根绳子长 4 米, 剪成两段 X和 Y, 则 XXYY 的相关系数是_____\text{\_\_\_\_\_}.

Solution: -1
由题意 X+Y=4X+Y=4, 则两者几乎处处存在负的线性关系, 所以两者的相关系数为 1-1.

  1. 已知泊松分布的参数是 λ\lambda, 若 E(X1)(X2)=5{E}({X}-1)({X}-2)=5, 则λ=\lambda= _____\text{\_\_\_\_\_}.

Solution: 3
已知 XP(λ)X \sim \mathcal{P}(\lambda), 所以 E(X)=λ,EX2=λ+λ2E(X)=\lambda, E X^{2}=\lambda+\lambda^{2}. 根据 E(X23X+2)=5E\left(X^{2}-3 X+2\right)=5, 即 E(X2)3E(X)+2=5λ2+λ3λ3=0E\left(X^{2}\right)-3 E(X)+2=5 \Rightarrow \lambda^{2}+\lambda-3 \lambda-3=0, 考虑到 λ>0\lambda>0, 解得 λ=3\lambda=3.

  1. 某个班级有 6 个女生和 10 个男生, 随机组成 8 个小队进行比赛, 每个小队两个人, 记 XX 为两个人都是女生的小队个数, 则 E(X)=E(X)= _____\text{\_\_\_\_\_}.

Solution: 1
Xi={1, 第 i 队中两个都是女生, 0, 否则. X_{i}=\left\{\begin{array}{ll}1, & \text { 第 } i \text { 队中两个都是女生, } \\ 0, & \text { 否则. }\end{array}\right., 则 E(Xi)=P(Xi=1)=(62)(162)=18,E\left(X_{i}\right)=P\left(X_{i}=1\right)=\frac{\left(\begin{array}{l}6 \\ 2\end{array}\right)}{\left(\begin{array}{c}16 \\ 2\end{array}\right)}=\frac{1}{8},,
所以

E(X)=i=18E(Xi)=1E(X)=\sum_{i=1}^{8} E\left(X_{i}\right)=1

  1. Xi(i=1,2,,9){X_i}({i}=1,2, \cdots, 9) 服从标准正态分布, 若记F(x)F(x)为其分布函数, 令Z=max{F(X1),F(X2),,F(X9)}Z=\max \left\{ F\left( X_1 \right) ,F\left( X_2 \right) ,\cdots ,F\left( X_9 \right) \right\}, 则 EZ=EZ= _____\text{\_\_\_\_\_}.

Solution: 910\frac{9}{10}
正态分布是连续性分布, 于是 F(Xi)F\left(X_{i}\right) i.i.d U(0,1)\sim U(0,1), 所以

Z=max{F(X1),,F(X9)}Beta(9,1)Z=\max \left\{F\left(X_{1}\right), \ldots, F\left(X_{9}\right)\right\} \sim \operatorname{Beta}(9,1)

EZ=910E Z=\frac{9}{10}.

  1. 一组简单随机样本 X1,X2,X3,X4X_1, X_2, X_3, X_4 的观测值如下:

2,1,0,2-2,-1,0,2

Y=X3{Y}={X}^{3} 服从正态分布 N(μ,1){N}(\mu, 1), 则 μ\mu95%95\%水平置信区间是_____\text{\_\_\_\_\_}.

Solution: [1.23,0.73][-1.23,0.73]
μ\mu 的置信区间是

Yˉ±snuα2=Yˉ±12uα2=14±121.96=[1.23,0.73]\bar{Y} \pm \frac{s}{\sqrt{n}} u_{\frac{\alpha}{2}}=\bar{Y} \pm \frac{1}{2} u_{\frac{\alpha}{2}}=\frac{1}{4} \pm \frac{1}{2} \cdot 1.96=[-1.23,0.73]

  1. Xi(i=1,2,,n){X_i}({i}=1,2, \cdots, {n}) 是来自正态分布 N(μ,25){N}(\mu, 25)的简单随机样本, 在 α=0.05\alpha=0.05 下, 使得样本落入拒绝域P(Xˉμ0>2.5)P (\mid \bar{X}-\mu_0 \mid>2.5) 的最小样本容量 n{n}_____\text{\_\_\_\_\_}.

Solution: 16

P(Xˉμ>2.5)=1P(2.525/nXˉμ25/n2.525/n)=1Φ(n2)+Φ(n2)0.05\begin{aligned} P(|\bar{X}-\mu|>2.5) &=1-P\left(-\frac{2.5}{\sqrt{25 / n}} \leqslant \frac{\bar{X}-\mu}{\sqrt{25 / n}} \leqslant \frac{2.5}{\sqrt{25 / n}}\right) \\ &=1-\Phi\left(\frac{\sqrt{n}}{2}\right)+\Phi\left(-\frac{\sqrt{n}}{2}\right) \leqslant 0.05 \end{aligned}

解得 n15.366n \geqslant 15.366, 则最小样本容量为 16 .

  1. Xi(i=1,2,,5){X}_{i} ({i}=1,2, \cdots, 5) 是来自同一正态分布的简单随机样本, Z=13i=13Xi,Y=12i=45Xi,s2=12i=13(XiZ){Z}=\frac{1}{3} \sum_{i=1}^{3} X_i, {Y}=\frac{1}{2} \sum_{i=4}^{5} X_i, s^2=\frac{1}{2}\sum_{i=1}^3{\left( X_i-Z \right)}, 则 2(ZY)s\frac{\sqrt{2}\left( Z-Y \right)}{s} 服从的分布是_____\text{\_\_\_\_\_}.

Solution: t(2)t(2)
根据 Fisher 引理知, ZN(μ,σ23),YN(μ,σ22),2s2σ2χ2(2)Z \sim N\left(\mu, \frac{\sigma^{2}}{3}\right), Y \sim N\left(\mu, \frac{\sigma^{2}}{2}\right), \frac{2 s^{2}}{\sigma^{2}} \sim \chi^{2}(2), 且它们都是 独立的, 于是 ZYN(0,56σ2)Z-Y \sim N\left(0, \frac{5}{6} \sigma^{2}\right).
进一步, 有 ZY5/6σ22s2/2σ2=65ZYst(2)\frac{\frac{Z-Y}{\sqrt{5 / 6 \sigma^{2}}}}{\sqrt{2 s^{2} / 2 \sigma^{2}}}=\sqrt{\frac{6}{5}} \frac{Z-Y}{s} \sim t(2).

二、(20分) 设随机变量YY有概率密度函数 f(y)={2y0<y<10 其他 ,X{f}({y})=\left\{\begin{array}{ll}2 y & 0<y<1 \\ 0 & \text { 其他 }\end{array}, {X}\right. 服从两点分布, X=0{X}=0 的概率为 0.5,X=20.5, {X}=2的概率为 0.50.5, 设 Z=X+Y{Z}={X}+{Y}.

(1) P(Y<EY)P(Y<EY);

(2) Z{Z} 的概率密度函数.

Solution: (1) 先计算得 E(Y)=012yydy=23E(Y)=\int_{0}^{1} 2 y \cdot y d y=\frac{2}{3}, 所以

P(Y<23)=0232ydy=49P\left(Y<\frac{2}{3}\right)=\int_{0}^{\frac{2}{3}} 2 y d y=\frac{4}{9}

(2)
先计算 ZZ 的分布函数, 根据全概率公式

P(Zz)=P(X+Yz)=P(Yz)P(X=0)+P(2+Yz)P(X=2)\begin{aligned} P(Z \leqslant z) &=P(X+Y \leqslant z) \\ &=P(Y \leqslant z) P(X=0)+P(2+Y \leqslant z) P(X=2) \end{aligned}

再根据 zz 的取值进行分类:
(i) z0,P(Zz)=0z \leqslant 0, P(Z \leqslant z)=0;
(ii) 0<z1,P(Zz)=12z20<z \leqslant 1, P(Z \leqslant z)=\frac{1}{2} z^{2};
(iii) 1<z2,P(Zz)=121<z \leqslant 2, P(Z \leqslant z)=\frac{1}{2};
(iv) 2<z3,P(Zz)=12[1+(z2)2]=12z22z+522<z \leqslant 3, P(Z \leqslant z)=\frac{1}{2}\left[1+(z-2)^{2}\right]=\frac{1}{2} z^{2}-2 z+\frac{5}{2};
(v) z>3,P(Zz)=1z>3, P(Z \leqslant z)=1.
ZZ 的密度函数是 f(z)={z,0<z1,z2,2<z3.f(z)= \begin{cases}z, & 0<z \leqslant 1, \\ z-2, & 2<z \leqslant 3 .\end{cases}

三、(20分) Xi(i=1,2,,n){X_i}({i}=1,2, \cdots, {n}) 是来自均匀分布 U(0,θ)U(0, \theta)总体的简单随机样本, 有以下几个估计量 θ1^=Anxˉ\hat{\theta_1}=A_n \bar{x},θ2^=Bnx(1),θ3^=Cnx(n)\hat{\theta_2}=B_n x_{(1)}, \hat{\theta_3}={C_n}x_{(n)}.

(1) 若上述三个估计量都是 θ\theta 的无偏估计, 试求 An,Bn,CnA_n,B_n,C_n;

(2) 在(1) 的条件下, 哪个估计量最有效.

Solution: (1) 作总体变换, 令 Yi=XiθU(0,1)Y_{i}=\frac{X_{i}}{\theta} \sim U(0,1) 则有 Y(i)Beta(i,ni+1)Y_{(i)} \sim \operatorname{Beta}(i, n-i+1).
由于三个估计量都是 θ\theta 的无偏估计, 则
E(AnXˉ)=Anθ2=θAn=2E\left(A_{n} \bar{X}\right)=A_{n} \cdot \frac{\theta}{2}=\theta \Rightarrow A_{n}=2 E(BnX(1))=BnE(θY(1))=Bn1n+1θ=θBn=n+1E\left(B_{n} X_{(1)}\right)=B_{n} E\left(\theta Y_{(1)}\right)=B_{n} \cdot \frac{1}{n+1} \theta=\theta \Rightarrow B_{n}=n+1 E(CnX(n))=CnE(θY(n))=Cnnn+1θ=θCn=n+1nE\left(C_{n} X_{(n)}\right)=C_{n} E\left(\theta Y_{(n)}\right)=C_{n} \cdot \frac{n}{n+1} \theta=\theta \Rightarrow C_{n}=\frac{n+1}{n}

(2) Var(θ^1)=Var(2Xˉ)=4Var(Xˉ)=4Var(X)n=41nθ212=θ23n\operatorname{Var}\left(\hat{\theta}_{1}\right)=\operatorname{Var}(2 \bar{X})=4 \operatorname{Var}(\bar{X})=4 \cdot \frac{\operatorname{Var}(X)}{n}=4 \cdot \frac{1}{n} \cdot \frac{\theta^{2}}{12}=\frac{\theta^{2}}{3 n}

Var(θ^2)=(n+1)2Var(X(1))=(n+1)2θ2n(n+1)2(n+2)=nn+2θ2\operatorname{Var}\left(\hat{\theta}_{2}\right)=(n+1)^{2} \operatorname{Var}\left(X_{(1)}\right)=(n+1)^{2} \cdot \theta^{2} \cdot \frac{n}{(n+1)^{2}(n+2)}=\frac{n}{n+2} \theta^{2}

Var(θ^3)=(n+1n)2Var(X(1))=(n+1)2n2θ2n(n+1)2(n+2)=1n(n+2)θ2\operatorname{Var}\left(\hat{\theta}_{3}\right)=\left(\frac{n+1}{n}\right)^{2} \operatorname{Var}\left(X_{(1)}\right)=\frac{(n+1)^{2}}{n^{2}} \cdot \theta^{2} \cdot \frac{n}{(n+1)^{2}(n+2)}=\frac{1}{n(n+2)} \theta^{2}Var(θ^2)Var(θ^1)Var(θ^3)\operatorname{Var}\left(\hat{\theta}_{2}\right) \geqslant \operatorname{Var}\left(\hat{\theta}_{1}\right) \geqslant \operatorname{Var}\left(\hat{\theta}_{3}\right) 知, θ^3\hat{\theta}_{3} 最有效.

Var(θ^2)Var(θ^1)Var(θ^3)\operatorname{Var}\left(\hat{\theta}_{2}\right) \geqslant \operatorname{Var}\left(\hat{\theta}_{1}\right) \geqslant \operatorname{Var}\left(\hat{\theta}_{3}\right) 知, θ^3\hat{\theta}_{3} 最有效.

四、(20分) 秋名山车队测试了7辆AE86过弯时的速度, XX为普通漂移过弯时的速度, YY为采用排水渠过弯的速度, 考虑到车性能的差异和车手水平以及测量误差等因素, 我们可以假设 XiN(μ1,σ2)X_i\sim N(\mu_1,\sigma^2), YiN(μ2,σ2)Y_i\sim N(\mu_2,\sigma^2), 其中参数均未知, 并且诸Xi,YiX_i, Y_i 独立.

车辆号 1 2 3 4 5 6 7
X{X} 15.315.3 20.120.1 18.518.5 21.321.3 17.817.8 19.619.6 16.316.3
Y{Y} 17.217.2 19.219.2 20.020.0 20.820.8 19.119.1 20.420.4 17.717.7

(1) 尝试建立成对数据的假设检验, 并判断采用排水渠过弯是否可以显著增加车速(选取显著性水平 α=0.05\alpha = 0.05);

(2) 令di=I{Yi>Xi}d_i=\mathbf{I}_{\left\{ Y_i>X_i \right\}}, 证明 did_i服从伯努利分布, 若假设其参数为 pp, 考虑假设检验问题:

H0:p=0.5vsH1:p>0.5H_0: p = 0.5 \quad vs \quad H_1: p > 0.5

给出该检验的拒绝域, 并判断采用排水渠过弯是否可以显著增加车速(选取显著性水平 α=0.05\alpha = 0.05).

Solution: (1) 记 Zi=YiXiN(μ,2σ2)Z_{i}=Y_{i}-X_{i} \sim N\left(\mu, 2 \sigma^{2}\right), 考虑假设检验问题 H0:μ=0H1:μ>0H_{0}: \mu=0 \longleftrightarrow H_{1}: \mu>0
检验统计量是 T=Zˉμ0s/n=0.78601.0717=5.14T=\frac{\bar{Z}-\mu_{0}}{s / \sqrt{n}}=\frac{0.786-0}{\frac{1.071}{7}}=5.14,
检验的拒绝域为 W={Ttα(6)}={Tt0.05(6)}={T1.943}W=\left\{T \geqslant t_{\alpha}(6)\right\}=\left\{T \geqslant t_{0.05}(6)\right\}=\{T \geqslant 1.943\}.
所以 TWT \in W, 应拒绝原假设, 即可以认为使用排水渠过弯可以增加速度.
(2)

di=I{Yi>Xi}={1,Yi>Xi,0,YiXi., 所以 dib(1,P(Xi<Yi)), 该检验的拒绝域是 W={i=17dic}\begin{gathered} d_{i}=\mathbf{I}_{\left\{Y_{i}>X_{i}\right\}}=\left\{\begin{array}{ll} 1, & Y_{i}>X_{i}, \\ 0, & Y_{i} \leqslant X_{i} . \end{array} \text {, 所以 } d_{i} \sim b\left(1, P\left(X_{i}<Y_{i}\right)\right),\right. \text { 该检验的拒绝域是 } \\ W=\left\{\sum_{i=1}^{7} d_{i} \geqslant c\right\} \end{gathered}

这里 c=inf{k:P(i=17dik)0.05dib(1,12)}c=\inf \left\{k: P\left(\sum_{i=1}^{7} d_{i} \geqslant k\right) \leqslant 0.05 \mid d_{i} \sim b\left(1, \frac{1}{2}\right)\right\}. 计算此时的 pp

p=P(i=17di5dib(1,12))=i=57C7i(12)7=0.227>0.05p =P\left(\sum_{i=1}^{7} d_{i} \geqslant 5 \mid d_{i} \sim b\left(1, \frac{1}{2}\right)\right)=\sum_{i=5}^{7} C_{7}^{i}\left(\frac{1}{2}\right)^{7}=0.227>0.05

所以我们无法拒绝原假设, 即认为排水渠过弯不能显著增加车速.

五、(20分) 以下是甲乙工厂生产的同一零件的数据, 其中零件质量分为差, 一般, 好三个等级.

一般
56 40 14
42 40 18

(1) 试给出甲乙两个工厂生产该零件的差品率的极大似然估计;

(2) 在0.05的显著性水平下, 判断甲乙两个工厂的生产水平是否一致.

Solution: (1) 用 n1,n2,n3n_{1}, n_{2}, n_{3} 分别表示设甲工厂生产的的零件中质量为差、一般、好的个数. 则样本的似 然函数以及对数似然函数为

L(p)=p1n1p2n2p3n3lnL(p)=n1lnp1+n2lnp2+n3lnp3\begin{aligned} &L(p)=p_{1}^{n_{1}} p_{2}{ }^{n_{2}} p_{3}{ }^{n_{3}} \\ &\ln L(p)=n_{1} \ln p_{1}+n_{2} \ln p_{2}+n_{3} \ln p_{3} \end{aligned}

其中, p1,p2,p3p_{1}, p_{2}, p_{3} 分别表示甲工厂生产出差、一般、好的零件的比率; 于是注意到 p1+p2+p3=1p_{1}+p_{2}+p_{3}=1, 则该模型中可变参数仅仅为 2 个, 令

{lnLp1=n1p1n31p2p1=0lnLp2=n2p2n31p2p1=0\left\{\begin{array}{l} \frac{\partial \ln L}{\partial p_{1}}=\frac{n_{1}}{p_{1}}-\frac{n_{3}}{1-p_{2}-p_{1}}=0 \\ \frac{\partial \ln L}{\partial p_{2}}=\frac{n_{2}}{p_{2}}-\frac{n_{3}}{1-p_{2}-p_{1}}=0 \end{array}\right.

解得 {p^1=n1n1+n2+n3=2855p^2=n2n1+n2+n3=411\left\{\begin{array}{l}\hat{p}_{1}=\frac{n_{1}}{n_{1}+n_{2}+n_{3}}=\frac{28}{55} \\ \hat{p}_{2}=\frac{n_{2}}{n_{1}+n_{2}+n_{3}}=\frac{4}{11}\end{array}\right., 而 p^3=1p^1p^2=755\hat{p}_{3}=1-\hat{p}_{1}-\hat{p}_{2}=\frac{7}{55}.

同理对于乙工厂, 用 q1,q2,q3q_{1}, q_{2}, q_{3} 分别表示甲工厂生产出差、一般、好的零件的比率,可以 解得极大似然估计, q^1=0.42,q^2=0.4,q^3=0.18\hat{q}_{1}=0.42, \hat{q}_{2}=0.4, \hat{q}_{3}=0.18.

(2) 考虑假设检验问题
H0H_{0} : 甲、乙两工厂产品质量一致
这其实意味着: 产品质量与加工工厂是独立的. 对应的检验统计量 χ2=n(i=12j=13nij2ninj1)=2.028\chi^{2}=n\left(\sum_{i=1}^{2} \sum_{j=1}^{3} \frac{n_{i j}^{2}}{n_{i} \cdot n_{\cdot j}}-1\right)=2.028, 检验的拒绝域是

W={χ2χα2((r1)(s1))}={χ2χ0.052(2)}={χ25.991}W=\left\{\chi^{2} \geqslant \chi_{\alpha}^{2}((r-1)(s-1))\right\}=\left\{\chi^{2} \geqslant \chi_{0.05}^{2}(2)\right\}=\left\{\chi^{2} \geqslant 5.991\right\}

因此 χ2W\chi^{2} \notin W, 故没有充分理由拒绝原假设, 可以认为甲、乙两工厂产品质量一致.

六、(20分) 考虑一元线性回归模型 Yi=α+βxi+εi,i=1,,Y_{i}=\alpha + \beta x_{i}+\varepsilon_{i}, i=1, \cdots, 其中 Eεi=0,Var(εi)=σ2,Cov(εi,εj)=0,ijE \varepsilon_{i}=0, {Var}\left(\varepsilon_{i}\right)=\sigma^{2}, {Cov}\left(\varepsilon_{i}, \varepsilon_{j}\right)=0, \forall i \neq j , 采集到的数据如下表:

1 2 3 4 5 6 7
XX 17.117.1 10.510.5 13.813.8 15.715.7 11.911.9 10.410.4 15.015.0
YY 16.716.7 10.410.4 13.513.5 15.715.7 11.611.6 10.210.2 14.514.5

(1) 试求 α\alpha 以及 β\beta 的最小二乘估计, 并给出σ2\sigma^2 的估计;

(2) 若 x0=15.3x_0 = 15.3, 在 显著性水平 α=0.05\alpha = 0.05下求 Y0Y_0 的区间估计.

Solution:

(1) α,β\alpha, \beta 的最小二乘估计是

{α^=yˉxˉβ^β^=lxylxx=i=1nxiyinxˉyˉi=1n(xixˉ)2\left\{\begin{array}{l} \hat{\alpha}=\bar{y}-\bar{x} \hat{\beta} \\ \hat{\beta}=\frac{l_{x y}}{l_{x x}}=\frac{\sum_{i=1}^{n} x_{i} y_{i}-n \bar{x} \bar{y}}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}} \end{array}\right.

σ^2\hat{\sigma}^2 的无偏估计是 σ^2=i=1n(yiy^i)2n2=i=1n(yiα^β^xi)2n2\hat{\sigma}^{2}=\frac{\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}{n-2}=\frac{\sum_{i=1}^{n}\left(y_{i}-\hat{\alpha}-\hat{\beta} x_{i}\right)^{2}}{n-2}.
代入数据计算 α^=0.0385,β^=0.9781,σ^2=0.0315\hat{\alpha}=0.0385, \hat{\beta}=0.9781, \hat{\sigma}^{2}=0.0315.

(2) 由于 y^0y0N(0,(1+1n+(x0xˉ)2lxx)σ2)\hat{y}_{0}-y_{0} \sim N\left(0,\left(1+\frac{1}{n}+\frac{\left(x_{0}-\bar{x}\right)^{2}}{l_{x x}}\right) \sigma^{2}\right), 选取

T=y^0E(y0)σ^1+1n+(x0xˉ)2lxxt(n2)T=\frac{\hat{y}_{0}-E\left(y_{0}\right)}{\hat{\sigma} \sqrt{1+\frac{1}{n}+\frac{\left(x_{0}-\bar{x}\right)^{2}}{l_{x x}}}} \sim t(n-2)

作为枢轴量, 则可解得 y0y_{0} 的置信区间为 [y^0δ0,y^0+δ0]\left[\hat{y}_{0}-\delta_{0}, \hat{y}_{0}+\delta_{0}\right], 其中

δ0=tα2(n2)σ^1+1n+(x0xˉ)2lxx=2.57060.03151+17+3.2552289.16=0.495y^0=α^+β^x0=0.0385+0.978115.3=15.0034\begin{aligned} \delta_{0} &=t_{\frac{\alpha}{2}}(n-2) \hat{\sigma} \sqrt{1+\frac{1}{n}+\frac{\left(x_{0}-\bar{x}\right)^{2}}{l_{x x}}} \\ &=2.5706 \cdot \sqrt{0.0315} \cdot \sqrt{1+\frac{1}{7}+\frac{3.255^{2}}{289.16}}=0.495 \\ \hat{y}_{0} &=\hat{\alpha}+\hat{\beta} x_{0}=0.0385+0.9781 \cdot 15.3=15.0034 \end{aligned}

y0y_{0}0.950.95 水平的置信区间为 [15.0034±0.329]=[14.6744,15.3324][15.0034 \pm 0.329]=[14.6744,15.3324].