北京大学数院-431金融学综合-2022年

一、(5分) 季度名义利率6%, 求利息力

Solution: eδ=(1+0.064)4=1.06136,δ=ln1.06136=0.0595511e^{\delta}=\left(1+\frac{0.06}{4}\right)^{4}=1.06136, \delta=\ln 1.06136=0.0595511.

二、(15分) i=0.05,n=20i=0.05, n=20, 期末年金, 现金流分别为 100,110,,200,200,100,110, \cdots, 200,200, \cdots, 求现值.

Solution: 最基本的贴现题型. 答案: P=100a20i+10Ia10i=2036.79P=100 a_{20 \mid i}+10 I a_{10 \mid i}=2036.79.

三、(15分) 月名义 6%,306 \%, 30 年, 月初还款, L=100L=100 万, 第几次还款后末结余额首次小于 30 万元.

Solution: A=1000000a¨36000.5%=1000000167.6256=5965.68A=\frac{1000000}{\ddot{a}_{36000.5 \%}}=\frac{1000000}{167.6256}=5965.68, 令 Aa¨360n0.5%300000A \ddot{a}_{360-n \mid 0.5 \%} \leq 300000, 解得 n=303n=303.

四、(15分) F=100,15F=100,1-5 年时 r=0.04,610r=0.04,6-10 年时 r=0.06,i=0.05r=0.06, i=0.05, 债券有 50%50 \% 可能在 5 年底赎 回, 也有 50%50 \% 可能在 10 年底赎回, 求 PP.

Solution: 如果早赎, 则 P1=100(1+0.05)5+4a50.05=95.6705P_{1}=100(1+0.05)^{-5}+4 a_{5 \mid 0.05}=95.6705; 如果不早赎, 则 P2=100v10+P_{2}=100 v^{-10}+ 4a50.05+6a50.05v5=99.06284 a_{5 \mid 0.05}+6 a_{5 \mid 0.05} v^{-5}=99.0628. 故 P=97.37P=97.37.

五、(10分) MM 人分组做核酸, 每组 nn 人, k=M/nk=M / n 是整数. 先将每组混合在一起进行检查, 若阳性则 对组中每个人进行检查. 设每个人是阳性的概率为 pp. 求:

(1) 某个人被测 2 次的概率;

(2) 某个人被检测次数的期望, 求它关于 nnpp 的单调关系.

Solution: (1) 某个人被测两次意味着他这一组有阳性, 对应的概率是 1(1p)n1-(1-p)^{n};

(2) 某个人要么被检测一次(概率 (1p)n(1-p)^n), 要么两次, 因此期望是

E(X)=2(1p)n.E(X) = 2-(1-p)^{n}.

显然关于 pp 单调递增, 而关于 nn 单调递增.

六、(10分) NN 是只取非负整数的随机变量, 试证明: EN2=2n=0(n+12)P(N>n)E N^{2}=2 \sum_{n=0}^{\infty}\left(n+\frac{1}{2}\right) P(N>n).

Solution:
n=0(2n+1)P(N>n)=n=0k=n+1(2n+1)pk=k=1n=0k1(2n+1)pk=\sum_{n=0}^{\infty}(2 n+1) P(N>n)=\sum_{n=0}^{\infty} \sum_{k=n+1}^{\infty}(2 n+1) p_{k}=\sum_{k=1}^{\infty} \sum_{n=0}^{k-1}(2 n+1) p_{k}= k=1k2pk=EN2\sum_{k=1}^{\infty} k^{2} p_{k}=E N^{2}

七、(15分) f(x,y)=1/x,0<y<x<1f(x, y)=1 / x, 0<y<x<1.

(1) 验证为 pdf;

(2) 求 X,YX, Y 边际分布;

(3) 求两个条件分布函数.

Solution:

(1) 非负性显然. 直接积分, 有

010x1xdydx=011dx=1.\int_0^1{\int_0^x{\frac{1}{x}dydx}}=\int_0^1{1dx}=1.

(2) 求边际密度, 有

fX(x)=0x1xdy=I{0<x<1},fY(y)=y11xdx=lnyI{0<y<1}.f_X\left( x \right) =\int_0^x{\frac{1}{x}dy}=I_{\left\{ 0<x<1 \right\}},\quad f_Y\left( y \right) =\int_y^1{\frac{1}{x}dx}=-\ln yI_{\left\{ 0<y<1 \right\}}.

(3) 先求条件密度, 有

fXY(xy)=1xlnyI{0<y<x<1},fYX(yx)=1xI{0<y<x<1},f_{X|Y}\left( x|y \right) =-\frac{1}{x\ln y}I_{\left\{ 0<y<x<1 \right\}},\quad f_{Y|X}\left( y|x \right) =\frac{1}{x}I_{\left\{ 0<y<x<1 \right\}},

积分得到条件分布函数是

FXY(xy)={0,xy1lnxlny,y<x<1,1x1FYX(yx)={0,y0yx,0<y<x1,yxF_{X \mid Y}(x \mid y)=\left\{\begin{array}{ll} 0, & x \leq y \\ 1-\frac{\ln x}{\ln y}, & y<x<1, \\ 1 & x \geq 1 \end{array} \quad F_{Y \mid X}(y \mid x)= \begin{cases}0, & y \leq 0 \\ \frac{y}{x}, & 0<y<x \\ 1, & y \geq x\end{cases}\right.

八、(15分) R1,,RnR_{1}, \cdots, R_{n} 是 i.i.d. 随机变量 (收益率), ER1=μ,Var(R1)=σ2<+,1+Rt>0E R_{1}=\mu, \operatorname{Var}\left(R_{1}\right)=\sigma^{2}<+\infty, 1+R_{t}>0.

(1) 什么条件下, (t=1n(1+Rt))1n\left(\prod_{t=1}^{n}\left(1+R_{t}\right)\right)^{\frac{1}{n}} 几乎必然收敛;

(2) 当收敛时, 比较 (1) 中极限与 μ\mu 大小.

Solution:
(1) 记 Sn=(t=1n(1+Rt))1nS_{n}=\left(\prod_{t=1}^{n}\left(1+R_{t}\right)\right)^{\frac{1}{n}}. 由于 1+R1>01+R_{1}>0, 故存在 ε>0\varepsilon>0, 使得 1+R1>ε1+R_{1}>\varepsilon, 故 Sn>(εn)1n=ε>0S_{n}>\left(\varepsilon^{n}\right)^{\frac{1}{n}}=\varepsilon>0. 因此 SnS_{n} 几乎必然收敛于 a>0a>0 等价于 lnSn=1nt=1nln(1+Rt)\ln S_{n}=\frac{1}{n} \sum_{t=1}^{n} \ln \left(1+R_{t}\right) 几乎 必然收敛于 lna\ln a \neq \infty, 而由强大数律, 这要求 E(ln(1+R1))E\left(\ln \left(1+R_{1}\right)\right) 存在, 即

1+ln(1+x)dF(x)<\int_{-1}^{+\infty}|\ln (1+x)| d F(x)<\infty

此时, 有

Sn=(t=1n(1+Rt))1na.s.exp{E(ln(1+R1))}.S_n=\left( \prod_{t=1}^n{\left( 1+R_t \right)} \right) ^{\frac{1}{n}}\rightarrow _{a.s.}\exp \left\{ E\left( \ln \left( 1+R_1 \right) \right) \right\} .

(2) 用 Jensen 不等式. 有

E(ln(1+R1))ln(1+E(R1))=ln(1+μ),E\left( \ln \left( 1+R_1 \right) \right) \le \ln \left( 1+E\left( R_1 \right) \right) =\ln \left( 1+\mu \right) ,

因此我们有

exp{E(ln(1+R1))}exp{ln(1+μ)}=μ+1.\exp \left\{ E\left( \ln \left( 1+R_1 \right) \right) \right\} \le \exp \left\{ \ln \left( 1+\mu \right) \right\} =\mu +1.

九、(15分) 正态总体 nn 样本方差已知, 求 μ3\mu^{3}μ4\mu^{4} 的 UMVUE.

Solution:
注意到

0=E(Xˉμ)3=E(Xˉ33μXˉ2+3μ2Xˉμ3)=E(Xˉ3)3μσ2/nμ3,0=E(\bar{X}-\mu)^{3}=E\left(\bar{X}^{3}-3 \mu \bar{X}^{2}+3 \mu^{2} \bar{X}-\mu^{3}\right)=E\left(\bar{X}^{3}\right)-3 \mu \sigma^{2} / n-\mu^{3},

我们有

E[Xˉ3(3σ2/n)Xˉ]=E(Xˉ3)3μσ2/n=μ3.E\left[\bar{X}^{3}-\left(3 \sigma^{2} / n\right) \bar{X}\right]=E\left(\bar{X}^{3}\right)-3 \mu \sigma^{2} / n=\mu^{3} .

因此由 Lehmann-Scheffé 定理可知 Xˉ33σ2nXˉ\bar{X}^{3}-\frac{3 \sigma^{2}}{n} \bar{X}μ3\mu^{3} 的 UMVUE.
类似地注意到

3σ4n2=E(Xˉμ)4=E[Xˉ(Xˉμ)3]=E[Xˉ43μXˉ3+3μ2Xˉ2μ3Xˉ]=E(Xˉ4)3μ(3μσ2/n+μ3)+3μ2(σ2/n+μ2)μ4=E(Xˉ4)6μ2σ2/nμ4=E(Xˉ4)(6σ2/n)E(Xˉ2σ2/n)μ4,\begin{aligned} \frac{3\sigma ^4}{n^2}&=E(\bar{X}-\mu )^4\\ &=E\left[ \bar{X}(\bar{X}-\mu )^3 \right]\\ &=E\left[ \bar{X}^4-3\mu \bar{X}^3+3\mu ^2\bar{X}^2-\mu ^3\bar{X} \right]\\ &=E\left( \bar{X}^4 \right) -3\mu \left( 3\mu \sigma ^2/n+\mu ^3 \right) +3\mu ^2\left( \sigma ^2/n+\mu ^2 \right) -\mu ^4\\ &=E\left( \bar{X}^4 \right) -6\mu ^2\sigma ^2/n-\mu ^4\\ &=E\left( \bar{X}^4 \right) -\left( 6\sigma ^2/n \right) E\left( \bar{X}^2-\sigma ^2/n \right) -\mu ^4,\\ \end{aligned}

我们有 Xˉ46σ2n(Xˉ2σ2n)3σ4n2\bar{X}^4-\frac{6\sigma ^2}{n}\left( \bar{X}^2-\frac{\sigma ^2}{n} \right) -\frac{3\sigma ^4}{n^2}μ4\mu^{4} 的 UMVUE.

十、(10分) 有来自泊松总体 P(λ)\mathcal{P}(\lambda)nn 个样本 x1,x2,,xnx_1,x_2,\cdots,x_n, 对显著性水平 α,\alpha, 求检验问题 H0:λ1H1:λ<1H_{0}: \lambda \geq 1 \longleftrightarrow H_{1}: \lambda<1 的一致最优检验.

Solution: 考虑简单假设 H0:λ=λ0vsH1:λ=λ1<1H_{0}: \lambda=\lambda_{0} \quad v s \quad H_{1}: \lambda=\lambda_{1}<1, 根据 NPN-P 引理, 似然比检验是其最 一致最大功效检验, 似然比为

Λ=λ1i=1i=1nXinXλ1!λ0=1i=1nXi=(λ1λ0)λ0i=1nXieλ0λ1\Lambda=\frac{\frac{\lambda_{1}^{i=1} \sum_{i=1}^{n} X_{i}}{n} X^{-\lambda_{1}} !}{\frac{\lambda_{0}=1}{\sum_{i=1}^{n} X_{i}}}=\left(\frac{\lambda_{1}}{\lambda_{0}}\right)^{-\lambda_{0}} \sum_{i=1}^{n} X_{i} e^{\lambda_{0}-\lambda_{1}}

可以看出该似然比关于统计量 T=i=1nXiT=\sum_{i=1}^{n} X_{i} 是单调递减的, 所以原问题的一致 最大功效检验为 ϕ(T)={1,T<ca,T=c0,T>c\phi(T)=\left\{\begin{array}{ll}1, & T<c \\ a, & T=c \\ 0, & T>c\end{array}\right. 其中常数 a,ca, c 使得 Eϕ(T)=αE \phi(T)=\alpha, 可以取

c=inf{m:k=0mnkk!en>α},a=(αk=0m1nkk!en)/nmm!en.c=\inf \left\{m: \sum_{k=0}^{m} \frac{n^{k}}{k !} e^{-n}>\alpha\right\}, \quad a=\left(\alpha-\sum_{k=0}^{m-1} \frac{n^{k}}{k !} e^{-n}\right) / \frac{n^{m}}{m !} e^{-n} .

十一、(10分) 设有 logist 函数 logist(p)=log(p1p)\operatorname{logist}(p)=\log \left(\frac{p}{1-p}\right). 有数据 (X1,Y1),,(Xn,Yn)\left(X_{1}, Y_{1}\right), \cdots,\left(X_{n}, Y_{n}\right), 其中 Xi1×pX_{i} \in 1 \times p, Yi{0,1}Y_{i} \in\{0,1\}, 假设有 logist(P(Yi=1Xi))=Xiβ\operatorname{logist}\left(P\left(Y_{i}=1 \mid X_{i}\right)\right)=X_{i} \beta, 其中 βp×1\beta \in p \times 1. 求:

(1) 对数似然函数 lnL(β)\ln L(\beta);

(2) 当 p=1p=1, 说明 lnL(β)\ln L(\beta) 是凹函数(二阶导为负)及其对求 β\beta 的 MLE 的意义.

Solution:
(1) 当给定 Xi=xiX_i=x_i, YY是两点分布, Y=1Y=1 的概率可由下式(代入logist函数)解出

log(P(Yi=1Xi=xi)1P(Yi=1Xi=xi))=xiβ,\log \left( \frac{P\left( Y_i=1|X_i=x_i \right)}{1-P\left( Y_i=1|X_i=x_i \right)} \right) =x_i\beta ,

即有

P(Yi=1Xi=xi)=11+exiβ,P(Yi=0Xi=xi)=exiβ1+exiβ,P\left( Y_i=1|X_i=x_i \right) =\frac{1}{1+e^{-x_i\beta}},\quad P\left( Y_i=0|X_i=x_i \right) =\frac{e^{-x_i\beta}}{1+e^{-x_i\beta}},

对应的概率质量函数是

pYX(yixi)=(11+exiβ)yi(exiβ1+exiβ)1yi.p_{Y|X}\left( y_i|x_i \right) =\left( \frac{1}{1+e^{-x_i\beta}} \right) ^{y_i}\left( \frac{e^{-x_i\beta}}{1+e^{-x_i\beta}} \right) ^{1-y_i}.

考虑从 i=1,2,...,ni=1,2,...,n 累乘的似然函数, 有

LYX(β;YX)=i=1n(11+exiβ)yi(exiβ1+exiβ)1yi,L_{Y|X}\left(\beta; Y|X \right) =\prod_{i=1}^n{\left( \frac{1}{1+e^{-x_i\beta}} \right) ^{y_i}\left( \frac{e^{-x_i\beta}}{1+e^{-x_i\beta}} \right) ^{1-y_i}},

假设 XiX_i 的密度是 pi(xi)p_i(x_i), 因此似然函数是

L(β;Y,X)=i=1n(11+exiβ)yi(exiβ1+exiβ)1yipi(xi),L\left( \beta ;Y,X \right) =\prod_{i=1}^n{\left( \frac{1}{1+e^{-x_i\beta}} \right) ^{y_i}\left( \frac{e^{-x_i\beta}}{1+e^{-x_i\beta}} \right) ^{1-y_i}}p_i\left( x_i \right) ,

则对数似然函数为

lnL(β)=i=1nyiln(11+exiβ)+i=1n(1yi)ln(exiβ1+exiβ)+i=1nlnpi(xi).\ln L(\beta)=\sum_{i=1}^{n} y_{i} \ln \left(\frac{1}{1+e^{-x_{i} \beta}}\right)+\sum_{i=1}^{n}\left(1-y_{i}\right) \ln \left(\frac{e^{-x_{i} \beta}}{1+e^{-x_{i} \beta}}\right)+\sum_{i=1}^{n} \ln p_{i}\left(x_{i}\right).

(2) 当维度 p=1p=1, 化简上式, 得

lnL(β)=i=1nln(1+exiβ)βi=1n(1yi)xi+i=1nlnpi(xi).\ln L(\beta )=-\sum_{i=1}^n{\ln}\left( 1+e^{-x_i\beta} \right) -\beta \sum_{i=1}^n{\left( 1-y_i \right)}x_i+\sum_{i=1}^n{\ln}p_i\left( x_i \right) .

而对任意 ii, 对 ln(1+exiβ)-\ln \left(1+e^{-x_{i} \beta}\right) 求二阶导发现为负, 故 lnL(β)\ln L(\beta) 的二阶导为负, 即凹函数. 由于似然函数复杂难以求解析解, 故只能求数值解, 而对于二阶导恒为负的函数而言, 如果找到了函数的驻点, 则该驻点一定是唯一驻点且是最大值点, 即 MLE. 这一事实确保了我们用数值算法求 logist 回归参数 MLE 时的有效性.

十二、(15分) 考虑被解释变量 Y1,,YnY_{1}, \cdots, Y_{n}, 解释变量 X1,,Xn,Z1,,ZnX_{1}, \cdots, X_{n}, Z_{1}, \cdots, Z_{n}, 其中 ZiZ_{i} 只有 R,BR, B 两种取 值. 有下述三种最小二乘回归结果, 注意考虑 ZiZ_{i} 时只探讨其对应的 0-1 变量 Ii=I{Zi=R}I_i=I_{\left\{ Z_i=R \right\}}.

回归表(i):

自变量 回归系数 标准误差 tt统计量 pp-value
intercept 56.0919 8.8197 6.5074 0.0000
II 0.9774 0.1660 5.8880 0.0000
模型检验 R2R^2 FF统计量 pp-value n
0.81 34.66 0.0000 32

回归表(ii):

自变量 回归系数 标准误差 tt统计量 pp-value
intercept 51.2146 7.61967 6.5074 0.0000
XX 1.2354 0.46604 2.6508 0.0012
模型检验 R2R^2 FF统计量 pp-value n
0.43 9.66 0.0023 32

回归表(iii):

自变量 回归系数 标准误差 tt统计量 pp-value
intercept 49.2146 9.61967 5.1160 0.0000
II 0.9574 0.06604 14.4972 0.0000
XX 0.9967 1.12211 0.8882 0.7209
模型检验 R2R^2 FF统计量 pp-value n
0.98 39.45 0.0000 32

(1) 在回归表 (i) 中, 求回归系数的表达式;

(2) 给出 R2R^{2} 的表达式, 解释其含义;

(3) 为什么三张 表中同一变量的回归系数不一致? 并说出是否有其他回归模型, 可以解释 Y,X,ZY, X, Z 之间的关系.

Solution:
(1) 这是最小二乘回归结果, 因此有 β^C=Yˉβ^IIˉ,β^I=i=1n(YiYˉ)(IiIˉ)i=1n(IiIˉ)2\hat{\beta}_{C}=\bar{Y}-\hat{\beta}_{I} \bar{I}, \hat{\beta}_{I}=\frac{\sum_{i=1}^{n}\left(Y_{i}-\bar{Y}\right)\left(I_{i}-\bar{I}\right)}{\sum_{i=1}^{n}\left(I_{i}-\bar{I}\right)^{2}};

(2) R2=SSRSSTR^{2}=\frac{S S R}{S S T}, 表示回归模型的拟合优度, 拟合优度越大, 则解释变量对被解释变量的解释力度 越大;

(3) 如表 (i) 和表 (iii) 中的自变量 II 和常数 CC, 它们的回归系数不可能相同, 因为最小二乘的原 理导致了增加越多的解释变量将使得拟合优度 R2R^{2} 越大 ((i) 中的 0.810.81 到 (iii) 中的 0.98). 反过 来看, 如果增加变量后原先变量的回归系数是不变的, 那么只能加入新变量不会使得 R2R^{2} 增加, 但这与 (i) 中的 0.810.81 到 (iii) 中的 0.980.98 的事实不符.
我认为还可以增加模型 Y=βC+βII+Y=\beta_{C}+\beta_{I} I+ βIXIX\beta_{I X} I X, 因为从回归表 (i), (ii) 来看, XXIIYY 都有解释能力 (模型显著), 但在表 (iii) 中 XX 的回归系数不显著, 说明当我们用 (I,X)(I, X) 联合对 YY 作解释时 YYXX 并不成立线性关系, 考虑 到 II 是 0-1 变量的事实, 故我认为可以采用Y=βC+βII+βIXIXY=\beta_{C}+\beta_{I} I+\beta_{I X} I X.
此外, 还可以尝试例如: Y=βC+βII+βXX2Y=\beta_{C}+\beta_{I} I+\beta_{X} X^{2} 等, 但尽量不改动已显著的变量 II.