北京大学数院-431金融学综合-2021年

一、(10分) 某袋中有4红球、2白球, 从中取2次球, 请求:

(1)(5分) 有放回取球, 第二次取到红球的概率;

(2)(5分) 无放回取球, 第二次取到红球的概率.

Solution:
(1) P(A)=23\mathrm{P}(A)=\frac{2}{3}.

(2) 运用全概率公式, P(A)=4635+2645=23\mathrm{P}(A)=\frac{4}{6} \cdot \frac{3}{5}+\frac{2}{6} \cdot \frac{4}{5}=\frac{2}{3}. 实际上, 抽签概率与顺序无关.

二、(10分) 随机变量XX只取三个值0,1,2,取到它们的概率分别是0.4,0.3,0.3; 随机变量YB(3,13)Y\sim B(3,\frac{1}{3}), 它们相互独立, 令S=X+YS=X+Y, 求

(1)(5分) P(S=4)\mathrm{P}(S=4)P(X=2S=4)\mathrm{P}(X=2|S=4);

(2)(5分) ES\mathrm{E}SVar(S)\mathrm{Var}(S).

Solution:
(1) 由全概率公式

P(S=4)=i=02P(Y=4iX=i)P(X=i)=0.4×0+0.3×(13)3+0.3×3×23×(13)2=790\begin{aligned} \mathrm{P}(S=4) &=\sum_{i=0}^{2} \mathrm{P}(Y=4-i \mid X=i) \mathrm{P}(X=i) \\ &=0.4 \times 0+0.3 \times\left(\frac{1}{3}\right)^{3}+0.3 \times 3 \times \frac{2}{3} \times\left(\frac{1}{3}\right)^{2} \\ &=\frac{7}{90} \end{aligned}

由贝叶斯公式, P(X=2S=4)=0.3×3×23×(13)2790=67\mathrm{P}(X=2 \mid S=4)=\frac{0.3 \times 3 \times \frac{2}{3} \times\left(\frac{1}{3}\right)^{2}}{\frac{7}{90}}=\frac{6}{7}.

(2)由期望线性性, ES=EX+EY=910+1=1910\mathrm{E} S=\mathrm{E} X+\mathrm{E} Y=\frac{9}{10}+1=\frac{19}{10};
由和的方差公式, Var(S)=Var(X)+Var(Y)=69100+32=407300\operatorname{Var}(S)=\operatorname{Var}(X)+\operatorname{Var}(Y)=\frac{69}{100}+\frac{3}{2}=\frac{407}{300}.

三、(10分) 随机变量X,YX,Y独立同服从标准正态分布, 令Z=min{X,Y},W=max{X,Y}Z=\min \{X,Y\},W=\max \{X,Y\}, 试求

(1)(5分) ZZWW的概率密度;

(2)(5分) Cov(Z,W)\mathrm{Cov}(Z,W).

Solution:
(1) 由次序统计量的分布公式, (Z,W)(Z, W) 的联合密度函数是

g(z,w)=2!f(z,w)=1πez2+w22,z<wg(z, w)=2 ! f(z, w)=\frac{1}{\pi} e^{-\frac{z^{2}+w^{2}}{2}}, z<w

ZZ 的生存函数 (1-分布函数)是: P(Zz)=P2(Xz)=[1Φ(z)]2\mathrm{P}(Z \geq z)=\mathrm{P}^{2}(X \geq z)=[1-\Phi(z)]^{2}, 故密度函数是: 2[1Φ(z)]φ(z)2[1-\Phi(z)] \varphi(z).
WW 的分布函数 是: P(Ww)=P2(Xw)=Φ(w)2\mathrm{P}(W \leq w)=\mathrm{P}^{2}(X \leq w)=\Phi(w)^{2}, 故密度函数是: 2Φ(w)φ(w)2 \Phi(w) \varphi(w).

(2) 由协方差公式, 有

Cov(Z,W)=E(ZW)EZEW=E(XY)EZEW=EZEW=(EW)2\begin{aligned} \operatorname{Cov}(Z, W) &=\mathrm{E}(Z W)-\mathrm{E} Z \mathrm{EW} \\ &=\mathrm{E}(X Y)-\mathrm{E} Z \mathrm{E} W \\ &=-\mathrm{E} Z \mathrm{E} W \\ &=(\mathrm{E} W)^{2} \end{aligned}

注意到, W=XY+(X+Y)2W=\frac{|X-Y|+(X+Y)}{2}, 其中由于 XYN(0,2)X-Y \sim N(0,2), 故

EXY=2π,EW=1π, 故 Cov(Z,W)=1π.\mathrm{E}|X-Y|=\frac{2}{\sqrt{\pi}}, \mathrm{E} W=\frac{1}{\sqrt{\pi}} \text {, 故 } \operatorname{Cov}(Z, W)=\frac{1}{\pi} .

四、(10分) 随机向量(X,Y)(X,Y)的联合概率密度是f(x,y)=c(x2+12xy)f(x,y)=c(x^2+\frac{1}{2}xy),其中x(0,1),y(0,2)x\in(0,1),y\in(0,2),

(1)(3分) 求cc;

(2)(3分) 问X,YX,Y是否独立;

(3)(4分) 求P(X+Y1)P(X+Y\le 1).

Solution:
(1) 利用概率的正则性,由于

0201(x2+12xy)dxdy=02(13+14y)dy=23+12=76, 故 c=67\int_{0}^{2} \int_{0}^{1}\left(x^{2}+\frac{1}{2} x y\right) d x d y=\int_{0}^{2}\left(\frac{1}{3}+\frac{1}{4} y\right) d y=\frac{2}{3}+\frac{1}{2}=\frac{7}{6} \text {, 故 } c=\frac{6}{7} \text {. }

(2) fX(x)=6702(x2+12xy)dy=12x2+6x7,x(0,1)f_{X}(x)=\frac{6}{7} \int_{0}^{2}\left(x^{2}+\frac{1}{2} x y\right) d y=\frac{12 x^{2}+6 x}{7}, x \in(0,1),

fY(y)=6701(x2+12xy)dx=67(13+14y)=27+314y,y(0,2),f_{Y}(y)=\frac{6}{7} \int_{0}^{1}\left(x^{2}+\frac{1}{2} x y\right) d x=\frac{6}{7}\left(\frac{1}{3}+\frac{1}{4} y\right)=\frac{2}{7}+\frac{3}{14} y, y \in(0,2),

显然, X,YX, Y 不独立.

(3) 直接计算积分, 有

P(X+Y1)=556.\begin{aligned} P(X+Y\le 1)=\frac{5}{56}. \end{aligned}

五、(10分) 随机变量XX的分布函数是F(x)=11x3,x1F(x)=1-\frac{1}{x^3},x\ge 1, 令Y=XY=\sqrt{X}.

(1)(5分) 求EY\mathrm{E}YVar(Y)\mathrm{Var}(Y);

(2)(5分) 有来自总体YYnn个随机样本Y1,,YnY_1,\cdots,Y_n, 求ana_nbnb_n使得

i=1nYianbndN(0,1).\frac{\sum_{i=1}^n{Y_i}-a_n}{b_n}\xrightarrow{d}N\left( 0,1 \right) .

Solution:
(1) 利用非负随机变量期望公式, 有

EY=0+P(Y>y)dyEY2=1+1+P(Y2>y)dy=1+1+P(X>y2)dy=1+1+P(X>y)dy=1+1+1y6 dy=1+1+1y3 dy=65=32\begin{aligned} \mathrm{E} Y &=\int_{0}^{+\infty} \mathrm{P}(Y>y) \mathrm{d} y & \mathrm{E} Y^{2} &=1+\int_{1}^{+\infty} \mathrm{P}\left(Y^{2}>y\right) \mathrm{d} y \\ &=1+\int_{1}^{+\infty} \mathrm{P}\left(X>y^{2}\right) \mathrm{d} y & &=1+\int_{1}^{+\infty} \mathrm{P}(X>y) \mathrm{d} y \\ &=1+\int_{1}^{+\infty} \frac{1}{y^{6}} \mathrm{~d} y & &=1+\int_{1}^{+\infty} \frac{1}{y^{3}} \mathrm{~d} y \\ &=\frac{6}{5} & &=\frac{3}{2} \end{aligned}

故有EX=6/5EX = 6/5, Var(X)=3/236/25=3/50Var(X) = 3/2 - 36/25 = 3/50.

(2) 取 an=65n,bn=350na_{n}=\frac{6}{5} n, b_{n}=\sqrt{\frac{3}{50} n}, 由中心极限定理得

i=1nYianbndN(0,1).\frac{\sum_{i=1}^{n} Y_{i}-a_{n}}{b_{n}} \stackrel{d}{\rightarrow} N(0,1) .

六、(10分) 有来自总体Xf(x)=12σexσX\sim f\left( x \right) =\frac{1}{2\sigma}e^{-\frac{\left| x \right|}{\sigma}}nn个随机样本X1,,XnX_1,\cdots,X_n, 令

S2=1n1i=1n(XiXˉ)2S^2=\frac{1}{n-1}\sum_{i=1}^n{\left( X_i-\bar{X} \right) ^2}

求证:ES2=2σ2\mathrm{E}S^2=2\sigma^2.

Solution:
样本方差 S2S^{2} 一定是总体方差的无偏估计, 因此只需计算总体方差, 显然总 体密度函数关于原点对称, 而

EX2=+12σx2exσdx=σ20+(xσ)2exσd(xσ)=σ2Γ(3)=2σ2\begin{aligned} \mathrm{E} X^{2} &=\int_{-\infty}^{+\infty} \frac{1}{2 \sigma} x^{2} e^{-\frac{|x|}{\sigma}} d x \\ &=\sigma^{2} \int_{0}^{+\infty}\left(\frac{x}{\sigma}\right)^{2} e^{-\frac{x}{\sigma}} d\left(\frac{x}{\sigma}\right) \\ &=\sigma^{2} \Gamma(3)=2 \sigma^{2} \end{aligned}

ES2=Var(X)=EX2=2σ2\mathrm{E} S^{2}=\operatorname{Var}(X)=\mathrm{E} X^{2}=2 \sigma^{2}.

七、(10分) X1,,XnX_1,\cdots,X_n是来自总体N(μ,σ2)N(\mu,\sigma^2)的随机样本, μ,σ2\mu,\sigma^2是未知参数,

(1)(5分) 求μ\mu的置信度为1α1-\alpha的置信区间;

(2)(5分) 设上述置信区间长度为LL, 求EL2\mathrm{E}L^2.

Solution:
(1) 用枢轴量法, 构造 t\mathrm{t} 统计量

T=nXˉμst(n1),T=\sqrt{n} \frac{\bar{X}-\mu}{s} \sim t(n-1),

其中 s2=1n1i=1n(XiXˉ)2s^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2} 是样本方差, ss 是样本标准差, 因此

[Xˉsnt1α2(n1),Xˉ+snt1α2(n1)]\left[\bar{X}-\frac{s}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1), \bar{X}+\frac{s}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1)\right]

μ\mu 的置信度为 1α1-\alpha 的置信区间.

(2) 显然 L=2snt1α2(n1),L2=4s2nt1α22(n1)L=\frac{2 s}{\sqrt{n}} t_{1-\frac{\alpha}{2}}(n-1), L^{2}=\frac{4 s^{2}}{n} t^2_{1-\frac{\alpha}{2}}(n-1), 又样本方差是总体方差的无偏估计, 因此

EL2=4σ2nt1α22(n1)\mathrm{E} L^{2}=\frac{4 \sigma^{2}}{n} t^2_{1-\frac{\alpha}{2}}(n-1)

八、(10分) X1,,XnX_1,\cdots,X_n是来自总体N(μ,σ2)N(\mu,\sigma^2)的随机样本, 求kk使得统计量

T=ki=1nXiXˉT=k\sum_{i=1}^n{\left| X_i-\bar{X} \right|}

构成σ\sigma的无偏估计.

Solution:
由于 E(X1Xˉ)=0,Cov(X1,Xˉ)=1nσ2\mathrm{E}\left(X_{1}-\bar{X}\right)=0, \operatorname{Cov}\left(X_{1}, \bar{X}\right)=\frac{1}{n} \sigma^{2}, 故

Var(X1Xˉ)=Var(X1)+Var(Xˉ)2Cov(X1,Xˉ)=n1nσ2,\operatorname{Var}\left(X_{1}-\bar{X}\right)=\operatorname{Var}\left(X_{1}\right)+\operatorname{Var}(\bar{X})-2 \operatorname{Cov}\left(X_{1}, \bar{X}\right)=\frac{n-1}{n} \sigma^{2},

我们知道, 对于标准正态分布 ZZ, 有 EZ=2π\mathrm{E}|Z|=\sqrt{\frac{2}{\pi}}, 故 EX1Xˉ=2(n1)nπσ\mathrm{E}\left|X_{1}-\bar{X}\right|=\sqrt{\frac{2(n-1)}{n \pi}} \sigma, 因 此有

ET=k2n(n1)πσ\mathrm{E} T=k \sqrt{\frac{2 n(n-1)}{\pi}} \sigma

为使其为无偏估计, k=π2n(n1)k=\sqrt{\frac{\pi}{2 n(n-1)}}.

九、(10分)现有甲、乙两种工艺, 挑选30名工人测试他们完成两种工艺所花费的时间, 分别记作Xi,YiX_i,Y_i. 若欲探究两种工艺所需工时的差异, 请叙述应使用的模型与检验法.

Solution:
配对样本 t\mathrm{t} 检验, 由于样本个数一致且每组样本都源于同一工人, 故令

Zi=XiYi,Z_{i}=X_{i}-Y_{i},

假定: Z1,Z2,,Z30Z_{1}, Z_{2}, \cdots, Z_{30} 是来自总体 ZN(μ,σ2)Z \sim N\left(\mu, \sigma^{2}\right) 的随机样本, 因为样本量很大, 可以 近似认为正态分布是合理的, 考虑假设检验问题

H0:μ=0 vs H1:μ0\mathrm{H}_{0}: \mu=0 \quad \text { vs } \quad \mathrm{H}_{1}: \mu \neq 0

由于在原假设成立时, 有

T=30Zˉst(29),T=\sqrt{30} \frac{\bar{Z}}{s} \sim t(29),

其中 ss 是样本标准差, s2=129i=130(ZiZˉ)2s^{2}=\frac{1}{29} \sum_{i=1}^{30}\left(Z_{i}-\bar{Z}\right)^{2}, 如果原假设为真, TT 的绝对值应很 小, 如果 TT 的绝对值很大, 我们就会考虑拒绝原假设, 故拒绝域是:

W={T>t1α2(29)}W=\left\{|T|>t_{1-\frac{\alpha}{2}}(29)\right\}

即如果观测到的 T0T_{0} 使得 T0>t1α2(29)\left|T_{0}\right|>t_{1-\frac{\alpha}{2}}(29), 我们就认为两种工艺所需工时有显著差 异.
[其他思路]: 非参数检验, 如 Kolmogorov 秩和检验. 论述题合理即可, 但切勿写 成先检验方差再检验均值, 因为这里是配对样本.

十、(10分) 已知yij=μ+ai+εijy_{ij}=\mu+a_i+\varepsilon_{ij}, 其中i=1,,r,j=1,,si=1,\cdots,r,j=1,\cdots,s, i=1nai=0\sum_{i=1}^{n}a_i=0, 残差εij\varepsilon_{ij}独立同服从N(0,σ2)N(0,\sigma^2), 令

yi=1sj=1syij,i=1,,r,yˉ=1ri=1ryi,\overline{y_{i\cdot}}=\frac{1}{s}\sum_{j=1}^s{y_{ij}},i=1,\cdots ,r,\bar{y}=\frac{1}{r}\sum_{i=1}^r{\overline{y_{i\cdot}}},

(1)试证明:

i=1rj=1s(yijyˉ)2=i=1rj=1s(yijyi)2+ri=1r(yiyˉ)2;\sum_{i=1}^r{\sum_{j=1}^s{\left( y_{ij}-\bar{y} \right) ^2}}=\sum_{i=1}^r{\sum_{j=1}^s{\left( y_{ij}-\overline{y_{i\cdot}} \right) ^2}}+r\sum_{i=1}^r{\left( \overline{y_{i\cdot}}-\bar{y} \right) ^2};

(2)证明: i=1rj=1s(yijyi)2\sum_{i=1}^r{\sum_{j=1}^s{\left( y_{ij}-\overline{y_{i\cdot}} \right) ^2}}i=1r(yiyˉ)2\sum_{i=1}^r{\left( \overline{y_{i\cdot}}-\bar{y} \right) ^2}相互独立.

Solution:
(1) 平方和分解问题

i=1sj=1r(yijyˉ)2=i=1sj=1r[(yijyi)+(yiyˉ)]2=i=1sj=1r[(yijyi)2+(yiyˉ)2+2(yijyi.)(yiyˉ)]=i=1sj=1r(yijyi)2+ri=1s(yiyˉ)2\begin{aligned} \sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\bar{y}\right)^{2} &=\sum_{i=1}^{s} \sum_{j=1}^{r}\left[\left(y_{i j}-\overline{y_{i}}\right)+\left(\overline{y_{i}}-\bar{y}\right)\right]^{2} \\ &=\sum_{i=1}^{s} \sum_{j=1}^{r}\left[\left(y_{i j}-\overline{y_{i}}\right)^{2}+\left(\overline{y_{i}}-\bar{y}\right)^{2}+2\left(y_{i j}-\overline{y_{i} .}\right)\left(\overline{y_{i} \cdot}-\bar{y}\right)\right] \\ &=\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}+r \sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right)^{2} \end{aligned}

因为 i=1sj=1r(yijyi)(yiyˉ)=i=1s(yiyˉ)j=1r(yijyi)=0\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)\left(\overline{y_{i}}-\bar{y}\right)=\sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right) \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)=0.

(2) 由 Fisher 引理, 对任意 i,j=1r(yijyi)2i, \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}yi\overline{y_{i}}. 相互独立, 而对 kik \neq i, j=1r(ykjyk)2\sum_{j=1}^{r}\left(y_{k j}-\overline{y_{k}}\right)^{2}yi\overline{y_{i}}. 一定相互独立, 因此有 i=1sj=1r(yijyi)2\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}yi\overline{y_{i}}. 相互独立. 又根据 ii 的任意性, 有 i=1sj=1r(yijyi)2\sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}}\right)^{2}i=1s(yi.yˉ)2\sum_{i=1}^{s}\left(\overline{y_{i} .}-\bar{y}\right)^{2} 相互独立.
易知, 1σ2i=1sj=1r(yijyi.)2χ2(s(r1))\frac{1}{\sigma^{2}} \sum_{i=1}^{s} \sum_{j=1}^{r}\left(y_{i j}-\overline{y_{i}} .\right)^{2} \sim \chi^{2}(s(r-1)), 当原假设成立时, yiN(μ,σ2r)\overline{y_{i}} \sim N\left(\mu, \frac{\sigma^{2}}{r}\right), 因 此 rσ2i=1s(yiyˉ)2χ2(s1)\frac{r}{\sigma^{2}} \sum_{i=1}^{s}\left(\overline{y_{i}}-\bar{y}\right)^{2} \sim \chi^{2}(s-1). 又因为它们独立, 故可以构造 FF 统计量.