北京大学数院-431金融学综合-2019年

一、(10分) 盒中有 10 个乒乓球,2 个被用过,其余的都是新的.第一次比赛时从中任取 3 个球用,比赛结束后放回.第二次比赛再取 3 个.

(1)(5分) 求第二次比赛取得都是新球的概率;

(2)(5分) 已知第二次比赛取得都是新球, 求第一次取得都是新球的概率.

Solution:
(1) 首先计算第一次比赛后, 盒中新球数量的分布情况:

P(X1=5)=8761098=715,P(X1=6)=38721098=715,P(X1=7)=115.P\left(X_{1}=5\right)=\frac{8 \cdot 7 \cdot 6}{10 \cdot 9 \cdot 8}=\frac{7}{15}, \quad P\left(X_{1}=6\right)=\frac{3 \cdot 8 \cdot 7 \cdot 2}{10 \cdot 9 \cdot 8}=\frac{7}{15}, \quad P\left(X_{1}=7\right)=\frac{1}{15} .

根据全概率公式:

P(A)=7155431098+7156451098+1157651098=0.136111P(A)=\frac{7}{15} \cdot \frac{5 \cdot 4 \cdot 3}{10 \cdot 9 \cdot 8}+\frac{7}{15} \cdot \frac{6 \cdot 4 \cdot 5}{10 \cdot 9 \cdot 8}+\frac{1}{15} \cdot \frac{7 \cdot 6 \cdot 5}{10 \cdot 9 \cdot 8}=0.136111

故第二次比赛取得都是新球的概率是 13.61%13.61 \%.

(2) 根据贝叶斯公式:

P(X1=5A)=7155431098P(A)=0.285714P\left(X_{1}=5 \mid A\right)=\frac{\frac{7}{15} \cdot \frac{5 \cdot 4 \cdot 3}{10 \cdot 9 \cdot 8}}{P(A)}=0.285714

故已知第一次比赛取得都是新球, 则第一次取得的都是新球的概率是 28.57%28.57 \%.

二、(10分) 已知随机变量 XX 的概率密度 f(x)=1bex2+2x,xRf(x)=\frac{1}{b} e^{-x^{2}+2 x}, x \in R ,

(1)(5分) 求 bb;

(2)(5分) 求 E(e1X2)E\left(e^{1-X^{2}}\right).

Solution:
(1) f(x)=1be×e(x1)2212f(x)=\frac{1}{b} e \times e^{-\frac{(x-1)^{2}}{2 \cdot \frac{1}{2}}}, 因此为满足概率的正则性, 1be=12π12\frac{1}{b} e=\frac{1}{\sqrt{2 \pi \cdot \frac{1}{2}}}, 因为

+12π12e(x1)2212dx=1, 故 b=πe\int_{-\infty}^{+\infty} \frac{1}{\sqrt{2 \pi \cdot \frac{1}{2}}} e^{-\frac{(x-1)^{2}}{2 \cdot \frac{1}{2}}} d x=1 \text {, 故 } b=\sqrt{\pi} e

(2)

E(e1X2)=+e1x21eπex2+2xdx=+1πe2x2+2xdx=+1πe2(x2x+14)+12dx=e122+12π14e(x12)2214dx=e2\begin{aligned} E\left(e^{1-X^{2}}\right)&= \int_{-\infty}^{+\infty} e^{1-x^{2}} \frac{1}{e \sqrt{\pi}} e^{-x^{2}+2 x} d x=\int_{-\infty}^{+\infty} \frac{1}{\sqrt{\pi}} e^{-2 x^{2}+2 x} d x \\ &=\int_{-\infty}^{+\infty} \frac{1}{\sqrt{\pi}} e^{-2\left(x^{2}-x+\frac{1}{4}\right)+\frac{1}{2}} d x=\frac{e^{\frac{1}{2}}}{\sqrt{2}} \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2 \pi \cdot \frac{1}{4}}} e^{-\frac{\left(x-\frac{1}{2}\right)^{2}}{2 \cdot \frac{1}{4}}} d x=\sqrt{\frac{e}{2}} \end{aligned}

三、(10分) (X,Y)N(μ1,μ2;σ12,σ22;ρ),(X, Y) \sim N\left(\mu_{1}, \mu_{2} ; \sigma_{1}^{2}, \sigma_{2}^{2} ; \rho\right), 指出 X+YX+YXYX-Y 相互独立的充要条件.

Solution:
首先, 二维正态分布各分量的线性组合仍然是正态分布, 所以 X+Y,XYX+Y, X-Y 都仍然是 正态分布. 其次,正态分布的独立与不相关是等价的,我们去考虑其协方差.

Cov(X+Y,XY)=σ12σ22,\operatorname{Cov}(X+Y, X-Y)=\sigma_{1}^{2}-\sigma_{2}^{2},

因此我们可以认为 X+Y,XYX+Y, X-Y 相互独立的充要条件是 X,YX, Y 的方差相等.
(1) X+Y,XYX+Y, X-Y 相互独立 Cov(X+Y,XY)=0σ12=σ22\Rightarrow \operatorname{Cov}(X+Y, X-Y)=0 \Rightarrow \sigma_{1}^{2}=\sigma_{2}^{2}.
(2) σ12=σ22Cov(X+Y,XY)=0X+Y,XY\sigma_{1}^{2}=\sigma_{2}^{2} \Rightarrow \operatorname{Cov}(X+Y, X-Y)=0 \Rightarrow X+Y, X-Y 相互独立.

四、(10分) 独立序列 {Xn},\left\{X_{n}\right\}, 其子列 {X2n1}\left\{X_{2 n-1}\right\} 独立同分布, EX1=0,DX1=1,E X_{1}=0, D X_{1}=1, 子列 {X2n}\left\{X_{2 n}\right\} 独立同分布 ,P(X2=1)=P(X2=1)=12, P\left(X_{2}=1\right)=P\left(X_{2}=-1\right)=\frac{1}{2} .证明

Sn=1ni=1nX2i1X2iS_{n}=\frac{1}{\sqrt{n}} \sum_{i=1}^{n} X_{2 i-1} X_{2 i}

按分布收敛到标准正态分布.

Solution:
Yn=X2n1X2nY_{n}=X_{2 n-1} X_{2 n}, 很显然 {Yn}\left\{Y_{n}\right\} 是独立同分布序列,

EYn=EX2n1EX2n=0,DYn=EYn2=EX2n12EX2n2=1,E Y_{n}=E X_{2 n-1} E X_{2 n}=0, D Y_{n}=E Y_{n}^{2}=E X_{2 n-1}^{2} E X_{2 n}^{2}=1,

根据独立同分场合的中心极限定理,

Sn=1ni=1nYidN(0,1).S_{n}=\frac{1}{\sqrt{n}} \sum_{i=1}^{n} Y_{i} \stackrel{d}{\rightarrow} N(0,1) .

五、(10分) 公司 1 和公司 2 是否违约相互独立,发生违约的次数都是强度为 λ\lambda 的泊松过程, 记公司 ii 第一次发生违约的时间为 TiT_{i}.

(1)(2分) 到 tt 时刻未发生违约的概率;

(2)(2分) 求违约风险 hi(t)=limΔt0P{Ti<t+ΔtTi>t}Δth_{i}(t)=\lim _{\Delta t \rightarrow 0} \frac{P\left\{T_{i}<t+\Delta t \mid T_{i}>t\right\}}{\Delta t};

(3)(3分) 求 Cov(min{T1,T2},max{T1,T2})\operatorname{Cov}\left(\min \left\{T_{1}, T_{2}\right\}, \max \left\{T_{1}, T_{2}\right\}\right);

(4)(3分) 已知 T1+T2=t,T_{1}+T_{2}=t,T1T_{1} 的条件分布.

Solution:
(1)

P{N(t)=0}=P{min{T1,T2}>t}=e2λt.P\{N\left( t \right) =0\}= P\left\{ \min \left\{ T_1,T_2 \right\} >t \right\} = e^{-2\lambda t}.

(2) P{T1<t+ΔtT1>t}=P{t<T1<t+Δt}P{T1>t}=1eλΔtP\left\{T_{1}<t+\Delta t \mid T_{1}>t\right\}=\frac{P\left\{t<T_{1}<t+\Delta t\right\}}{P\left\{T_{1}>t\right\}}=1-e^{-\lambda \Delta t}, 故违约风险 hi(t)=limΔt01eλΔtΔt=λh_{i}(t)=\lim _{\Delta t \rightarrow 0} \frac{1-e^{-\lambda \Delta t}}{\Delta t}=\lambda.

(3) 想计算 Cov(min{T1,T2},max{T1,T2})\operatorname{Cov}\left(\min \left\{T_{1}, T_{2}\right\}, \max \left\{T_{1}, T_{2}\right\}\right), 就是要计算 E(min{T1,T2}max{T1,T2})E\left(\min \left\{T_{1}, T_{2}\right\} \max \left\{T_{1}, T_{2}\right\}\right)E(min{T1,T2})E(max{T1,T2})E\left(\min \left\{T_{1}, T_{2}\right\}\right) E\left(\max \left\{T_{1}, T_{2}\right\}\right), 而

E(min{T1,T2}max{T1,T2})=0+x+λ2xyeλ(x+y)dydx+0+0xλ2xyeλ(x+y)dydxE\left(\min \left\{T_{1}, T_{2}\right\} \max \left\{T_{1}, T_{2}\right\}\right)=\int_{0}^{+\infty} \int_{x}^{+\infty} \lambda^{2} x y e^{-\lambda(x+y)} d y d x+\int_{0}^{+\infty} \int_{0}^{x} \lambda^{2} x y e^{-\lambda(x+y)} d y d x

实际上, E(min{T1,T2}max{T1,T2})=ET1T2=ET1ET2=1λ2E\left(\min \left\{T_{1}, T_{2}\right\} \max \left\{T_{1}, T_{2}\right\}\right)=E T_{1} T_{2}=E T_{1} E T_{2}=\frac{1}{\lambda^{2}}. 同时, min{T1,T2}Exp(2λ)\min \left\{T_{1}, T_{2}\right\} \sim \operatorname{Exp}(2 \lambda), E(min{T1,T2})=12λE\left(\min \left\{T_{1}, T_{2}\right\}\right)=\frac{1}{2 \lambda}, 而

E(min{T1,T2}+max{T1,T2})=E(T1+T2)=2λ, 故 E(max{T1,T2})=32λE\left(\min \left\{T_{1}, T_{2}\right\}+\max \left\{T_{1}, T_{2}\right\}\right)=E\left(T_{1}+T_{2}\right)=\frac{2}{\lambda} \text {, 故 } E\left(\max \left\{T_{1}, T_{2}\right\}\right)=\frac{3}{2 \lambda} \text {, }

因此 Cov(min{T1,T2},max{T1,T2})=1λ234λ2=14λ2\operatorname{Cov}\left(\min \left\{T_{1}, T_{2}\right\}, \max \left\{T_{1}, T_{2}\right\}\right)=\frac{1}{\lambda^{2}}-\frac{3}{4 \lambda^{2}}=\frac{1}{4 \lambda^{2}}.

(4) P{T1=t1,T1+T2=t}=P{T1=t1,T2=tt1}=λ2eλtdt1dt,t>t1>0P\left\{T_{1}=t_{1}, T_{1}+T_{2}=t\right\}=P\left\{T_{1}=t_{1}, T_{2}=t-t_{1}\right\}=\lambda^{2} e^{-\lambda t} d t_{1} d t, t>t_{1}>0
所以 (T1,T1+T2)\left(T_{1}, T_{1}+T_{2}\right) 的联合概率密度是 λ2eλt\lambda^{2} e^{-\lambda t}, 将 t1t_{1} 积分后得到 T1+T2T_{1}+T_{2} 的边缘密度,

f(t)=0tλ2eλtdt1=λ2teλt,t>0,f(t)=\int_{0}^{t} \lambda^{2} e^{-\lambda t} d t_{1}=\lambda^{2} t e^{-\lambda t}, t>0,

故条件分布为

fT1T1+T2(t1t)=1t,t>t1>0.f_{T_{1} \mid T_{1}+T_{2}}\left(t_{1} \mid t\right)=\frac{1}{t}, t>t_{1}>0 .

六、(10分) 总体 Xf(x)=θxθ1I[0<x<1],X \sim f(x)=\theta x^{\theta-1} I[0<x<1], 求矩估计并证明其强相合性.

Solution:

EX=01θxθdx=θθ+1,θ=EX1EX, 用样本矩代替总体矩得到矩估计: θ^=Xˉ1Xˉ,Xˉ=1ni=1nXi\begin{aligned} E X=\int_{0}^{1} \theta x^{\theta} d x=\frac{\theta}{\theta+1}, \Rightarrow \theta &=\frac{E X}{1-E X}, \text { 用样本矩代替总体矩得到矩估计: } \\ \hat{\theta} &=\frac{\bar{X}}{1-\bar{X}}, \bar{X}=\frac{1}{n} \sum_{i=1}^{n} X_{i} \end{aligned}

现验证其相合性, 根据强大数律, XˉEX\bar{X} \rightarrow E X, a.s., 故 θ^EX1EX=θ\hat{\theta} \rightarrow \frac{E X}{1-E X}=\theta, a.s.

七、(10分) 人群中支持某政策的比例为 p,p, 未知. 随机抽 nn 人,设有 xx 人支持, p^=xn\hat{p}=\frac{x}{n} 为 样本支持率.

(1)(5分) 用正态近似法给出 pp95%95 \% 置信区间 ;;

(2)(5分) 要求置信区间长度小于 0.2, nn 至少需要多大.

Solution:
(1) 根据独立同分布场合的中心极限定理, 当 nn 较大时, 近似地有

p^N(p,p(1p)n), 即 np^pp(1p)N(0,1)\widehat{p} \sim N\left(p, \frac{p(1-p)}{n}\right) \text {, 即 } \sqrt{n} \frac{\hat{p}-p}{\sqrt{p(1-p)}} \sim N(0,1) \text {, }

但是由于 pp 是末知的, 故用 p^\hat{p} 取代分母的 pp (根据强大数律, p^p,a.s\hat{p} \rightarrow p, a . s, 因此该取
代是合理的), 故近似地有 np^pp^(1p^)N(0,1)\sqrt{n} \frac{\hat{p}-p}{\sqrt{\hat{p}(1-\hat{p})}} \sim N(0,1), 因此 pp95%95 \% 置信区间是

[p^1.96p^(1p^)n,p^+1.96p^(1p^)n].\left[\hat{p}-1.96 \frac{\sqrt{\hat{p}(1-\hat{p})}}{\sqrt{n}}, \hat{p}+1.96 \frac{\sqrt{\hat{p}(1-\hat{p})}}{\sqrt{n}}\right] .

(2) 置信区间长度 L=3.92p^(1p^)n1.96nL=3.92 \frac{\sqrt{\hat{p}(1-\hat{p})}}{\sqrt{n}} \leq \frac{1.96}{\sqrt{n}} (注意到 p^(1p^)14\hat{p}(1-\hat{p}) \leq \frac{1}{4} ), 令 1.96n0.2\frac{1.96}{\sqrt{n}} \leq 0.2, 解得 n(1.960.2)2=9.82=96.04n \geq\left(\frac{1.96}{0.2}\right)^{2}=9.8^{2}=96.04, 故至少需要 97 个调查对象.

八、(10分) 叙述2×2 的列联表独立性检验.

Solution:
假设有两个离散分布总体 X,YX, Y, 分别有 m,nm, n 种取值, 根据样本得到的信息: 事件 (X=xi,Y=yj)\left(X=x_{i}, Y=y_{j}\right) 被观测到的次数是 NijN_{i j} 次, i=1,2,,m,j=1,2,,ni=1,2, \ldots, m, j=1,2, \ldots, n. 根据样本 信息来判断 X,YX, Y 是否独立.其被称为列联表的原因就是该问题可以被写成一个类 似二元离散分布的列联表.

我们知道, 如果 X,YX, Y 独立, 那么应该可以在样本种观察到 NijN=NiNN.jN\frac{N_{i j}}{N}=\frac{N_{i}}{N} \cdot \frac{N_{. j}}{N} 对所有 i,ji, j 都近似成立, 也就是在直观上讲如果 i=1mj=1n(NijNiN.j/N)2\sum_{i=1}^{m} \sum_{j=1}^{n}\left(N_{i j}-N_{i} \cdot N_{. j}/N\right)^{2} 越小, 我们就认为越 有可能是独立的. 但实际上, 每个事件的偏离程度是不一样的, 也就是 NiNjN_{i\cdot} N_{\cdot j} 的量级越大,则它本身发生偏差的可能性就越大, 故我们要标准化每个事件的偏离程度, 即用 1NiNj\frac{1}{N_{i} \cdot N_{\cdot j}} 作为每个事件的权重, 如果 i=1mj=1n(NijNiNj/N)2NiNj\sum_{i=1}^{m} \sum_{j=1}^{n} \frac{\left(N_{i j}-N_{i} \cdot N_{\cdot j}/N \right)^{2}}{N_{i} \cdot N_{\cdot j}} 越小, 我们就认为越有可 能是独立的.
恰好, 统计量 i=1mj=1n(NijNiNj/N)2NiNj\sum_{i=1}^{m} \sum_{j=1}^{n} \frac{\left(N_{i j}-N_{i} \cdot N_{\cdot j}/N\right)^{2}}{N_{i} \cdot N_{\cdot j}} 近似服从 χ2((m1)(n1))\chi^{2}((m-1)(n-1)) (可以自己思考一下自由度的问题, 课程和书本都有), 这就给了我们一个很好的用来检验独立性的统计量. 这就是 m×nm \times n 的列联表独立性检验的方法.

九、(10分) 设有线性回归模型

Yij=αi+βXij+εij,i=1,2,,m,j=1,2,n,Y_{ij} = \alpha_i + \beta X_{ij} + \varepsilon_{ij},\quad i=1,2,\cdots,m,\quad j = 1,2\cdots,n,

其中误差项εij\varepsilon_{ij}独立同服从正态N(0,σ2)N(0,\sigma^2), α1,,αm,β\alpha_1,\cdots,\alpha_m,\betaσ2\sigma^2是未知参数. 求(α1,,αm,β)(\alpha_1,\cdots,\alpha_m,\beta)的最大似然估计.

Solution: 对数似然函数为

(α1,,αm,β,σ2)=Amn2lnσ212σ2i=1mj=1n(YijαiβXij)2,\ell \left( \alpha _1,\cdots ,\alpha _m,\beta ,\sigma ^2 \right) =A-\frac{mn}{2}\ln \sigma ^2-\frac{1}{2\sigma ^2}\sum_{i=1}^m{\sum_{j=1}^n{\left( Y_{ij}-\alpha _i-\beta X_{ij} \right) ^2}},

欲求(α1,,αm,β)(\alpha_1,\cdots,\alpha_m,\beta)的最大似然估计, 等价于极小化残差平方和

Q(α1,,αm,β)=i=1mj=1n(YijαiβXij)2,Q\left( \alpha _1,\cdots ,\alpha _m,\beta \right) =\sum_{i=1}^m{\sum_{j=1}^n{\left( Y_{ij}-\alpha _i-\beta X_{ij} \right) ^2}},

求导得

Qαi=2j=1n(YijαiβXij),Qβ=2i=1mj=1nXij(YijαiβXij),\frac{\partial Q}{\partial \alpha _i}=-2\sum_{j=1}^n{\left( Y_{ij}-\alpha _i-\beta X_{ij} \right)},\quad \frac{\partial Q}{\partial \beta}=-2\sum_{i=1}^m{\sum_{j=1}^n{X_{ij}\left( Y_{ij}-\alpha _i-\beta X_{ij} \right)}},

解得

{β^=lxylxx=i=1mj=1n(XijXˉi)(YijYˉi)i=1mj=1n(XijXˉi)2,α^i=Yˉiβ^Xˉi,i=1,2,,m.\begin{cases} \hat{\beta}=\frac{l_{xy}}{l_{xx}}=\frac{\sum_{i=1}^m{\sum_{j=1}^n{\left( X_{ij}-\bar{X}_{i\cdot} \right) \left( Y_{ij}-\bar{Y}_{i\cdot} \right)}}}{\sum_{i=1}^m{\sum_{j=1}^n{\left( X_{ij}-\bar{X}_{i\cdot} \right) ^2}}},\\ \hat{\alpha}_i=\bar{Y}_{i\cdots}-\hat{\beta}\bar{X}_{i\cdot},\quad i=1,2,\cdots ,m.\\ \end{cases}

十、(10分) x1,,xnx_{1}, \ldots, x_{n} 不全为 0,εi,0, \varepsilon_{i}, i.i.d. N(0,σ2),\sim N\left(0, \sigma^{2}\right), 有观测值 (xi,yi)\left(x_{i}, y_{i}\right) 满足 yi=bxi+εi,b,σ2y_{i}=b x_{i}+\varepsilon_{i}, b, \sigma^{2} 未知.

(1) 求 b,σ2b, \sigma^{2} 最大似然估计;

(2) 求 b^\hat{b} 的分布;

(3) H0:b=0H_{0}: b=0 vs H1:b0,H_{1}: b \neq 0, 构造水平为 α\alpha 的拒绝域.

Solution:
(1) 首先由于 yi=bxi+εiN(bxi,σ2)y_{i}=b x_{i}+\varepsilon_{i} \sim N\left(b x_{i}, \sigma^{2}\right), 记 δ=σ2\delta=\sigma^{2}, 我们写出似然函数

L(y1,,yn;b,δ)=(2πδ)n2exp{12δi=1n(yibxi)2}δn2exp{12δi=1n(yibxi)2}= let L1L\left(y_{1}, \ldots, y_{n} ; b, \delta\right)=(2 \pi \delta)^{-\frac{n}{2}} \exp \left\{-\frac{1}{2 \delta} \sum_{i=1}^{n}\left(y_{i}-b x_{i}\right)^{2}\right\} \propto \delta^{-\frac{n}{2}} \exp \left\{-\frac{1}{2 \delta} \sum_{i=1}^{n}\left(y_{i}-b x_{i}\right)^{2}\right\} \stackrel{\text { let }}{=} L_{1}

取对数, lnL1=n2lnδ12δi=1n(yibxi)2\ln L_{1}=-\frac{n}{2} \ln \delta-\frac{1}{2 \delta} \sum_{i=1}^{n}\left(y_{i}-b x_{i}\right)^{2}, 求偏导得到方程组:

{lnL1b=1δi=1n(yibxi)xi=0lnL1δ=n2δ+12δ2i=1n(yibxi)2=0\left\{\begin{array}{l} \frac{\partial \ln L_{1}}{\partial b}=\frac{1}{\delta} \sum_{i=1}^{n}\left(y_{i}-b x_{i}\right) x_{i}=0 \\ \frac{\partial \ln L_{1}}{\partial \delta}=-\frac{n}{2 \delta}+\frac{1}{2 \delta^{2}} \sum_{i=1}^{n}\left(y_{i}-b x_{i}\right)^{2}=0 \end{array}\right.

解得, b^=i=1nxiyii=1nxi2,σ^2=1ni=1n(yib^xi)2\hat{b}=\frac{\sum_{i=1}^{n} x_{i} y_{i}}{\sum_{i=1}^{n} x_{i}^{2}}, \hat{\sigma}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(y_{i}-\hat{b} x_{i}\right)^{2}.

(2) 由于多元正态分布分量的线性组合还是正态分布, 而

Ei=1nxiyi=bi=1nxi2,Di=1nxiyi=σ2i=1nxi2,E \sum_{i=1}^{n} x_{i} y_{i}=b \sum_{i=1}^{n} x_{i}^{2}, D \sum_{i=1}^{n} x_{i} y_{i}=\sigma^{2} \sum_{i=1}^{n} x_{i}^{2},

Ei=1nxiyii=1nxi2=b,Di=1nxiyii=1nxi2=σ2i=1nxi2E \frac{\sum_{i=1}^{n} x_{i} y_{i}}{\sum_{i=1}^{n} x_{i}^{2}}=b, D \frac{\sum_{i=1}^{n} x_{i} y_{i}}{\sum_{i=1}^{n} x_{i}^{2}}=\frac{\sigma^{2}}{\sum_{i=1}^{n} x_{i}^{2}}, 这意味着 b^N(b,σ2i=1nxi2)\hat{b} \sim N\left(b, \frac{\sigma^{2}}{\sum_{i=1}^{n} x_{i}^{2}}\right).

(3) 根据第二题的结论, 我们知道

i=1nxi2b^bσN(0,1),\sqrt{\sum_{i=1}^{n} x_{i}^{2} \frac{\hat{b}-b}{\sigma} \sim N(0,1),}

σ\sigma 是末知的, 但根据 σ^2=1ni=1n(yib^xi)2,nσ^2σ2χ2(n1)\hat{\sigma}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(y_{i}-\hat{b} x_{i}\right)^{2}, \frac{n \hat{\sigma}^{2}}{\sigma^{2}} \sim \chi^{2}(n-1), 因此用 σ~2=nn1σ^2\widetilde{\sigma}^{2}=\frac{n}{n-1} \widehat{\sigma}^{2}
σ2\sigma^{2} 后, 有统计量

T=i=1nxi2b^bσ~t(n1).T=\sqrt{\sum_{i=1}^{n} x_{i}^{2}} \frac{\hat{b}-b}{\tilde{\sigma}} \sim t(n-1) .

当原假设成立时, T=i=1nxi2b^t(n1)T=\sqrt{\sum_{i=1}^{n} x_{i}^{2}} \hat{b} \sim t(n-1), 而且由于 b^\hat{b}bb 的估计量, TT 的绝对值应 该相当小才对, 如果 TT 的绝对值很大, 我们有理由拒绝原假设, 因此拒绝域为

W={i=1nxi2b^σ~>t1α2(n1)}W=\left\{\left|\sqrt{\sum_{i=1}^{n} x_{i}^{2}} \frac{\hat{b}}{\widetilde{\sigma}}\right|>t_{1-\frac{\alpha}{2}}(n-1)\right\}