北京大学-431金融学综合-2016年

2016统计部分解析

一、 收集同一个公司两个市场的日回报率, 其中 (x1,x2,x3,,xn)\left(\mathrm{x}_1, \mathrm{x}_2, \mathrm{x}_3, \cdots, \mathrm{x}_{\mathrm{n}}\right)A\mathrm{A} 市场的股票的回报率, (y1,y2,y3,,yn)\left(y_1, y_2, y_3, \cdots, y_n\right)BB 市场的股票的回报率

(1)描述如何检验 A\mathrm{A} 的回报率是否比 B\mathrm{B} 的高。
(2)如何检验 A\mathrm{A} 的回报率方差和 B\mathrm{B} 的是否一样。
(3)如何检验 AABB 的股票日回报是否相关。
(4)如果 (x1,x2,x3,,xn)\left(x_1, x_2, x_3, \cdots, x_n\right)AA 市场的股票的价格, (y1,y2,y3,,yn)\left(y_1, y_2, y_3, \cdots, y_n\right)BB 市场的股票的价格。如何检验 A\mathrm{A} 的股价是否高于 B\mathrm{B}

Solution:

(1) 由于是同一个公司两个市场,从而我们使用配对样本t检验,令
zi=xiyi,i=1,2,,nz_i=x_i-y_i, i=1,2,\cdots,n.

作如下检验

H0:μz=0H1:μz>0H_{0}: \mu_z=0 \leftrightarrow H_{1}: \mu_z > 0

考虑大样本情况, 计算t-统计量为

t=nzˉszt=\frac{\sqrt{n}\bar z}{s_z}

在给定显著性水平α\alpha下,该检验的拒绝域为

W={t>t1α(n1)}.W=\{t>t_{1-\alpha}(n-1)\}.

(2) 要检验 A\mathrm{A} 的回报率方差是否与 B\mathrm{B} 的方差相等,可以使用方差比较检验,通常使用 F-检验来执行。

  1. 提出假设:

    • H0H_0A\mathrm{A}B\mathrm{B} 的回报率方差相等,即 σx2=σy2\sigma_x^2 = \sigma_y^2,其中 σx2\sigma_x^2A\mathrm{A} 的回报率方差,σy2\sigma_y^2B\mathrm{B} 的回报率方差。
    • H1H_1A\mathrm{A}B\mathrm{B} 的回报率方差不相等,即 σx2σy2\sigma_x^2 \neq \sigma_y^2
  2. 计算样本方差: 分别计算 A\mathrm{A} 市场和 B\mathrm{B} 市场的回报率样本方差 (sx2s_x^2sy2s_y^2)。

  3. 计算 F-统计量: 使用以下公式计算 F-统计量:

F=sx2sy2F=\frac{s_{x}^{2}}{s_{y}^{2}}

其中,sx2s_x^2sy2s_y^2 分别是 A\mathrm{A} 市场和 B\mathrm{B} 市场的回报率样本方差。

  1. 确定自由度: 确定 F-检验的自由度,其中自由度分别为 nx1n_x - 1ny1n_y - 1,其中 nxn_xnyn_y 分别是 A\mathrm{A} 市场和 B\mathrm{B} 市场的样本大小, 本题中二者均为 nn.

  2. 查找临界值: 根据显著性水平(假设0.05)和自由度,查找 F0.025(n1,n1),F0.975(n1,n1)F_{0.025}(n- 1, n-1), F_{0.975}(n-1, n-1);

  3. 做出决策: 如果 F<F0.025(n1,n1)F < F_{0.025}(n- 1, n-1)F>F0.975(n1,n1)F > F_{0.975}(n-1, n-1), 则拒绝原假设, 反之接受原假设.

(3) 要检验 AABB 的股票日回报是否相关,可以使用相关性分析方法,其中最常用的是皮尔逊相关系数和斯皮尔曼秩相关系数。

  1. 提出假设:

    • H0H_0AABB 的股票日回报不相关,即相关系数为0。
    • H1H_1AABB 的股票日回报相关,相关系数不为0。
  2. 计算相关系数: 根据你的需求选择使用皮尔逊相关系数或斯皮尔曼秩相关系数来度量相关性。计算相关系数的值,这个值可以为正数(正相关)、负数(负相关)或接近0(不相关)。

    • 皮尔逊相关系数用于度量线性相关性,计算公式为:

rxy=(xixˉ)(yiyˉ)(xixˉ)2(yiyˉ)2r_{xy}=\frac{\sum{\left( x_i-\bar{x} \right) \left( y_i-\bar{y} \right)}}{\sqrt{\sum{\left( x_i-\bar{x} \right) ^2}\sum{\left( y_i-\bar{y} \right) ^2}}}

其中,rxyr_{xy} 是皮尔逊相关系数,xix_iyiy_i 分别是 AABB 的回报数据点,xˉ\bar{x}yˉ\bar{y} 分别是它们的均值。

  • 斯皮尔曼秩相关系数用于度量非线性相关性,它将数据转化为秩,并计算秩的相关性。这种方法对于不满足正态分布假设的数据更合适。
  1. 计算 p 值: 使用相关系数的值和样本大小来计算 p 值。通常,相关性检验的 p 值可以用来评估相关系数是否显著不为0。

  2. 做出决策: 根据计算得到的相关系数和 p 值,以及选择的显著性水平,做出是否拒绝零假设的决策。如果 p 值小于显著性水平,可以拒绝零假设,表示 AABB 的股票日回报存在相关性。

(4) 我们令zi=xiyiz_i=\frac{x_i}{y_i}, 作如下检验

H0:μz=1H1:μz>1H_{0}: \mu_z=1 \leftrightarrow H_{1}: \mu_z > 1

考虑大样本情况下的t-检验, 计算t-统计量为

t=n(zˉ1)szt= \frac{\sqrt{n}(\bar{z}-1)}{s_z}

在给定显著性水平α\alpha下,该检验的拒绝域为

W={t>t1α(n1)}.W=\{t>t_{1-\alpha}(n-1)\}.

注: 如果利用作差消除量级的影响。如:某天A市场股价100,B市场股价90元;一年后A市场股价10元,B市场股价1元。
通过作差我们发现一年前两市场股价差距为10元,一年后两市场差距为9元,但是否能说一年后两个市场股价更接近?显然不行。可以看出采取作商的方式更能有效检验该问题。

二、 考虑泊松分布 P(X=x)=eλx!λx\mathrm{P}(X=\mathrm{x})=\frac{\mathrm{e}^{-\lambda}}{\mathrm{x} !} \lambda^{\mathrm{x}}, 搜集到样本 x1,x2,,xnx_1, x_2, \cdots, x_n, 请估计参数 λ\lambda 并检验其统计性质。

Solution:

对于泊松分布,要估计参数 λ\lambda 并检验其统计性质,通常使用最大似然估计(Maximum Likelihood Estimation, MLE)来估计 λ\lambda,并进行假设检验来评估其统计性质。下面是具体的步骤:

估计参数 λ\lambda

对于泊松分布,似然函数为:

L(λ)=i=1neλλxixi!L\left( \lambda \right) =\prod_{i=1}^n{\frac{e^{-\lambda}\lambda ^{x_i}}{x_i!}}

对数似然函数为:

l(λ)=lnL(λ)=i=1n(λ+xiln(λ)ln(xi!))l\left( \lambda \right) =\ln L\left( \lambda \right) =\sum_{i=1}^n{\left( -\lambda +x_i\ln \left( \lambda \right) -\ln \left( x_i! \right) \right)}

然后,通过对 l(λ)l(\lambda) 关于 λ\lambda 求导数,并令导数等于零,解得 λ\lambda 的估计值

λ^MLE=1ni=1nxi\hat{\lambda}_{\text{MLE}}=\frac{1}{n}\sum_{i=1}^n{x_i}

假设检验 λ\lambda 是否等于某个特定值的假设。 例如,检验 λ\lambda 是否等于某个理论值 λ0\lambda_{0}。这可以通过计算估计值 λ^\hat{\lambda}λ0\lambda_{0} 的差异的标准差来进行假设检验。

根据泊松分布的性质及中心极限定理,在原假设成立的条件下(λ=λ0\lambda = \lambda_0)有

nλ^λ0λ^dN(0,1)\sqrt{n}\frac{\hat{\lambda}-\lambda _0}{\sqrt{\hat{\lambda}}}\rightarrow _dN\left( 0,1 \right)

于是可以构建检验统计量

Z=λ^λ0λ^/nZ=\frac{\hat{\lambda}-\lambda _0}{\sqrt{\hat{\lambda}/n}}

其中,nn 是样本大小。标准化值 ZZ 近似服从标准正态分布。如果 Zz1α2\left| Z \right|\ge z_{1-\frac{\alpha}{2}} 则拒绝原假设, 其中 α\alpha 是显著性水平.

三、 某老师做研究生成绩 grade 对平时成绩 CGPA 和逃课率 Skipped 的回归如下: grade =α0+α1=\alpha_0+\alpha_1 CGPA +α2+\alpha_2 Skipped +ε+\varepsilon, 其中样本容量为 n=141,R2=0.234,α2\mathrm{n}=141, \mathbf{R}^2=0.234, \alpha_2 的估计值为 α^2=0.36\widehat{\alpha}_2=0.36 。三个变量 α0,α1,α2\alpha_0, \alpha_1, \alpha_2 的显著性检验pp值分别是 0.33,0.094,0.0210.33, 0.094, 0.021;

(1) 为什么要选择 CGPA\mathrm{CGPA} 做自变量?
(2) 在显著性水平为 1%1 \% 时, Skipped 对 grade 是否没有影响?
(3) 在显著性水平为 1%时, CGPA 和 Skipped 是否对 grade 同时没有影响?

Solution:

(1) 选择 CGPA\mathrm{CGPA} 做自变量可能是基于研究的理论假设或经验分析。一般来说,研究者应该那些理论上或经验上与因变量(这里是成绩 grade)有关的自变量。在这种情况下,选择 CGPA\mathrm{CGPA} 作为自变量可能是因为有理论或经验支持表明学生的平均绩点(CGPA\mathrm{CGPA})与他们的总体成绩(grade)之间存在某种关系。CGPA\mathrm{CGPA} 可能被视为一个潜在的影响因素,可以用来解释成绩的变化。

(2) 要判断Skipped 对grade是否有影响,我们可以进行如下的假设检验:

  • 零假设 H0H_0:Skipped 对grade没有影响,即 α2=0\alpha_2 = 0
  • 备择假设 H1H_1:Skipped 对grade有影响,即 α20\alpha_2 \neq 0

根据给定的pp值为 0.0210.021,显著性水平为 1%1\%, 因为 0.021>0.010.021 > 0.01,所以在 1%1\% 的显著性水平下,我们不可以拒绝零假设 H0H_0,即不能认为Skipped 对grade有显著影响。

(3) 为同时检验这两个假设, 可以使用波恩弗罗尼(Bonferroni)法来进行同时检验问题的多重比较校正。

具体步骤如下:

  1. 将整体显著性水平 α\alpha 分成两个部分,每个部分为 α/2\alpha / 2

  2. 对每个单独的假设进行假设检验,使用单个部分的显著性水平 α/2\alpha / 2。即对 α1\alpha_1 进行检验时,显著性水平为 α/2\alpha / 2,对 α2\alpha_2 进行检验时,同样显著性水平为 α/2\alpha / 2。在本问题中 α/2=0.05\alpha / 2 = 0.05; 而 α1\alpha_1 的显著性检验 pp 值超过了 0.05. α2\alpha_2 的显著性检验 pp 值不超过 0.05.

  3. 而只有当两个检验的 pp 值都不超过 0.05时,我们才能拒绝原假设, 因此现在不能同时拒绝原假设,也不能同时接受原假设,即没有理由支持 CGPA 和 Skipped 对 grade 同时没有影响。

注:此题还有另一种题干,即变量 α0,α1,α2\alpha_0, \alpha_1, \alpha_2 的估计标准误分别是 0.33,0.094,0.0210.33, 0.094, 0.021

(2)在显著性水平为 1%1 \% 时, Skipped 对 grade 是否没有影响?

检验假设为:

  • 原假设(H0H_0α2=0\alpha_2 = 0 (Skipped 对 grade 没有影响)。
  • 备择假设(H1H_1α20\alpha_2 \neq 0 (Skipped 对 grade 有影响)。

检验统计量为 tt 值:

t=α^2SE(α^2)=0.360.02117.14t = \frac{\widehat{\alpha}_2}{\text{SE}(\widehat{\alpha}_2)} = \frac{0.36}{0.021} \approx 17.14

临界值查标准正态分布表或 tt 分布表(自由度 n3=138n-3 = 138,接近标准正态分布):

  • 显著性水平为 1%1 \%,双侧检验的临界值为 z0.0052.576z_{0.005} \approx 2.576

由于 t17.142.576|t| \approx 17.14 \gg 2.576,我们拒绝原假设 H0H_0,说明在 1%1 \% 显著性水平下,Skipped 对 grade 有显著影响。

(3) 在显著性水平为 1%时, CGPA 和 Skipped 是否对 grade 同时没有影响?

检验假设为:

  • 原假设(H0H_0α1=0\alpha_1 = 0α2=0\alpha_2 = 0 (CGPA 和 Skipped 对 grade 同时没有影响)。
  • 备择假设(H1H_1α10\alpha_1 \neq 0α20\alpha_2 \neq 0(至少一个变量对 grade 有影响)。

使用 FF 检验,统计量公式为:

F=(R2/k)[(1R2)/(nk1)]F = \frac{(\mathbf{R}^2 / k)}{[(1 - \mathbf{R}^2) / (n - k - 1)]}

其中:

  • R2=0.234\mathbf{R}^2 = 0.234k=2k = 2(自变量个数),n=141n = 141(样本容量)。

代入计算:

F=0.234/2(10.234)/(14121)=0.1170.0056120.85F = \frac{0.234 / 2}{(1 - 0.234) / (141 - 2 - 1)} = \frac{0.117}{0.00561} \approx 20.85

FF 分布表(自由度 df1=2,df2=138df_1 = 2, df_2 = 138):

  • 显著性水平为 1%1 \%,临界值为 F0.01,2,1384.79F_{0.01, 2, 138} \approx 4.79

由于 F20.854.79F \approx 20.85 \gg 4.79,我们拒绝原假设 H0H_0,说明在 1%1 \% 显著性水平下,CGPA 和 Skipped 至少有一个对 grade 有显著影响。

四、 两只股票收益率分布如下: εN(μ1,σ12),θN(μ2,σ22)\varepsilon \sim N\left(\mu_1, \sigma_1^2\right), \theta \sim N\left(\mu_2, \sigma_2^2\right), 假定这两只股票的收益率是独立的, 方差相等。现有两只股票收益率的样本, (ε1,ε2,ε3,,εn)\left(\varepsilon_1, \varepsilon_2, \varepsilon_3, \cdots, \varepsilon_n\right)(θ1,θ2,θ3,,θm)\left(\theta_1, \theta_2, \theta_3, \cdots, \theta_{\mathrm{m}}\right)
试求 i=1n(εiεˉ)2i=1n(εiεˉ)2+j=1m(θjθˉ)2\frac{\sum_{i=1}^n\left(\varepsilon_i-\bar{\varepsilon}\right)^2}{\sum_{i=1}^n\left(\varepsilon_i-\bar{\varepsilon}\right)^2+\sum_{j=1}^m\left(\theta_j-\bar{\theta}\right)^2} 的概率分布。

Solution: 参加茆书习题 3.3.18.

记样本均值为 εˉ\bar{\varepsilon}θˉ\bar{\theta}。 记 σ2=σ12=σ22\sigma^2 = \sigma_1^2 = \sigma_2^2.

接下来,我们考虑随机变量:

X=i=1n(εiεˉ)2σ2X=\frac{\sum_{i=1}^n{\left( \varepsilon _i-\bar{\varepsilon} \right)}^2}{\sigma ^2}

Y=j=1m(θjθˉ)2σ2Y=\frac{\sum_{j=1}^m{\left( \theta _j-\bar{\theta} \right)}^2}{\sigma ^2}

这两个随机变量相互独立,分别服从自由度为 n1n-1m1m-1 的卡方分布。则记目标随机变量

T=σ2Xσ2(X+Y)=XX+YT=\frac{\sigma ^2X}{\sigma ^2\left( X+Y \right)}=\frac{X}{X+Y}

作变量变换,记

{T=XX+YU=X+Y\left\{ \begin{array}{l} T=\frac{X}{X+Y}\\ U=X+Y\\ \end{array} \right.

则反变换为 {X=UTY=UUT\left\{ \begin{array}{l} X=UT\\ Y=U-UT\\ \end{array} \right., 雅各比行列式

J=(x,y)(t,u)=utu1t=u(1t)+tu=uJ=\frac{\partial \left( x,y \right)}{\partial \left( t,u \right)}=\left| \begin{matrix} u& t\\ -u& 1-t\\ \end{matrix} \right|=u\left( 1-t \right) +tu=u

又由于 (X,Y)(X,Y) 的联合密度函数是

fX,Y(x,y)=(12)n12Γ(n12)xn121ex2(12)m12Γ(m12)ym121ey2,x>0,y>0=(12)m+n22Γ(n12)Γ(m12)xn121ym121ex+y2,x>0,y>0\begin{aligned} f_{X,Y}\left( x,y \right) &=\frac{\left( \frac{1}{2} \right) ^{\frac{n-1}{2}}}{\Gamma \left( \frac{n-1}{2} \right)}x^{\frac{n-1}{2}-1}e^{-\frac{x}{2}}\frac{\left( \frac{1}{2} \right) ^{\frac{m-1}{2}}}{\Gamma \left( \frac{m-1}{2} \right)}y^{\frac{m-1}{2}-1}e^{-\frac{y}{2}},x>0,y>0 \\ &=\frac{\left( \frac{1}{2} \right) ^{\frac{m+n-2}{2}}}{\Gamma \left( \frac{n-1}{2} \right) \Gamma \left( \frac{m-1}{2} \right)}x^{\frac{n-1}{2}-1}y^{\frac{m-1}{2}-1}e^{-\frac{x+y}{2}},x>0,y>0 \end{aligned}

(T,U)(T, U) 的联合密度函数是

fT,U(t,u)=fX,Y(ut,uut)u,0<ut<u=(12)n+m22Γ(n12)Γ(m12)(ut)n121(uut)m121eu2u,u>0,0<t<1={(12)n+m22Γ(n+m22)un+m221eu2}{Γ(n+m22)Γ(n12)Γ(m12)tn121(1t)m121},u>0,0<t<1\begin{aligned} f_{T,U}\left( t,u \right) &=f_{X,Y}\left( ut,u-ut \right) \cdot u,\quad 0<ut<u \\ & =\frac{\left( \frac{1}{2} \right) ^{\frac{n+m-2}{2}}}{\Gamma \left( \frac{n-1}{2} \right) \Gamma \left( \frac{m-1}{2} \right)}\left( ut \right) ^{\frac{n-1}{2}-1}\left( u-ut \right) ^{\frac{m-1}{2}-1}e^{-\frac{u}{2}}u,\quad u>0,0<t<1 \\ & =\left\{ \frac{\left( \frac{1}{2} \right) ^{\frac{n+m-2}{2}}}{\Gamma \left( \frac{n+m-2}{2} \right)}u^{\frac{n+m-2}{2}-1}e^{-\frac{u}{2}} \right\} \left\{ \frac{\Gamma \left( \frac{n+m-2}{2} \right)}{\Gamma \left( \frac{n-1}{2} \right) \Gamma \left( \frac{m-1}{2} \right)}t^{\frac{n-1}{2}-1}\left( 1-t \right) ^{\frac{m-1}{2}-1} \right\} ,\quad u>0,0<t<1 \end{aligned}

Uχ2(n+m2)U\sim \chi ^2\left( n+m-2 \right), TBeta(n12,m12)T\sim Beta\left( \frac{n-1}{2},\frac{m-1}{2} \right) 且二者独立.

五、 记 rt=α+βrmt+εt\mathrm{r}_{\mathrm{t}}={\alpha}+\beta \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}+\varepsilon_{\mathrm{t}} 为股票市场回报的回归方程, 试求:

(1) 在什么假设下 β\beta 的 OLS 估计量是无偏的? 请给出严格的数学证明。
(2)上述假设在实际中成立么? 为什么?

Solution:

(1) OLS(最小二乘法)估计量 β^\hat{\beta} 是无偏的,当以下假设成立时:

  • 零条件均值:E(εtrmt)=0\mathrm{E}(\varepsilon_{\mathrm{t}} | \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}) = 0,这表示在给定 rmt\mathrm{r}_{\mathrm{m}_{\mathrm{t}}} 的条件下,误差 εt\varepsilon_{\mathrm{t}} 的条件期望为零。

为了证明 β^\hat{\beta} 在假设下是无偏的,我们可以利用条件期望的性质来进行推导:

首先,回归方程可以重写为误差项的形式:

εt=rtαβrmt\varepsilon _t=r_t-\alpha -\beta r_{m_t}

然后,我们可以计算 β^\hat{\beta} 的期望值:

E(β^)=E(t=1T(rtrˉ)(rmtrmˉ)t=1T(rmtrmˉ)2)=t=1TE[(rtrˉ)(rmtrmˉ)]t=1TE[(rmtrmˉ)2]\begin{aligned} E\left( \hat{\beta} \right) &=E\left( \frac{\sum_{t=1}^T{\left( r_t-\bar{r} \right)}\left( r_{m_t}-\bar{r_m} \right)}{\sum_{t=1}^T{\left( r_{m_t}-\bar{r_m} \right)}^2} \right)\\ &=\frac{\sum_{t=1}^T{E}\left[ \left( r_t-\bar{r} \right) \left( r_{m_t}-\bar{r_m} \right) \right]}{\sum_{t=1}^T{E}\left[ \left( r_{m_t}-\bar{r_m} \right) ^2 \right]}\\ \end{aligned}

在上述步骤中,我们使用了样本均值 rˉ\bar{\mathrm{r}}rmˉ\bar{\mathrm{r_m}},它们分别是 rt\mathrm{r}_{\mathrm{t}}rmt\mathrm{r}_{\mathrm{m}_{\mathrm{t}}} 的均值。

根据无偏性的定义,E(εtrmt)=0\mathrm{E}(\varepsilon_{\mathrm{t}} | \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}) = 0 的假设,我们可以得到:

E[(rtrˉ)(rmtrmˉ)]=E[(α+βrmt+εt(α+βrmˉ))(rmtrmˉ)]=E[(βrmtβrmˉ+εt)(rmtrmˉ)]=E{E[(βrmtβrmˉ+εt)(rmtrmˉ)rmt]}=βE((rmtrmˉ)2)\begin{aligned} \text{E}\left[ \left( \mathrm{r}_{\mathrm{t}}-\mathrm{\bar{r}} \right) \left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right) \right] &=\mathrm{E}\left[ \left( \alpha +\beta \mathrm{r}_{\mathrm{m}_t}+\varepsilon _t-\left( \alpha +\beta \mathrm{\bar{r_m}} \right) \right) \left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right) \right] \\ &=\mathrm{E}\left[ \left( \beta \mathrm{r}_{\mathrm{m}_t}-\beta \mathrm{\bar{r_m}}+\varepsilon _t \right) \left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right) \right] \\ &=\mathrm{E}\left\{ \mathrm{E}\left[ \left( \beta \mathrm{r}_{\mathrm{m}_t}-\beta \mathrm{\bar{r_m}}+\varepsilon _t \right) \left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right) \mid \mathrm{r}_{\mathrm{m}_t} \right] \right\} \\ &=\beta \mathrm{E}\left( \left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right) ^2 \right) \end{aligned}

因此,β^\hat{\beta} 的期望值为:

E(β^)=E(t=1T(rtrˉ)(rmtrmˉ)t=1T(rmtrmˉ)2)=βt=1TE((rmtrmˉ)2)t=1TE[(rmtrmˉ)2]=β\begin{aligned} \mathrm{E}\left( \hat{\beta} \right) &=\mathrm{E}\left( \frac{\sum_{t=1}^T{\left( \mathrm{r}_{\mathrm{t}}-\mathrm{\bar{r}} \right)}\left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right)}{\sum_{t=1}^T{\left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right)}^2} \right)\\ &=\frac{\beta \sum_{t=1}^T{\mathrm{E}\left( \left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right) ^2 \right)}}{\sum_{t=1}^T{\mathrm{E}}\left[ \left( \mathrm{r}_{\mathrm{m}_{\mathrm{t}}}-\mathrm{\bar{r_m}} \right) ^2 \right]}=\beta\\ \end{aligned}

这表明线性模型在零条件均值假设成立的情况下,β^\hat{\beta} 是无偏的估计量。

(2) 上述假设在实际中成立么? 为什么?

在实际中,上述假设通常是近似成立的,但不一定完全成立。

  • 零条件均值假设:这个假设是OLS估计量无偏性的关键。在一些情况下,它可能成立,特别是当误差项满足条件期望为零的正态分布时。然而,在实际应用中,误差项的条件期望为零可能不总是成立,可能存在遗漏变量、自相关或异方差性等问题,这可能导致零条件均值假设的破裂。在这种情况下,需要对模型进行进一步的诊断和改进。零条件均值假设假定了误差项的条件期望在给定市场回报的情况下为零。在实际股票市场中,这个假设可能不严格成立,因为股票市场的回报通常受到多种因素的影响,包括经济状况、政治事件、利率变化等。此外,股票市场可能存在长期趋势或波动,这也可能违反了零条件均值假设。

2016微观部分解析

一、(15分)甲、乙两名消费者考虑消费两种商品:饼饼(其消费量记为 X1X_1)与其他商品(其消费量记为 X2X_2)。两种商品价格分别为 P1=10P_1 = 10P2=1P_2 = 1 元。甲乙二人有相同的效用函数:

U(X1,X2)=X10.5X20.5U(X_1, X_2) = X_1^{0.5} X_2^{0.5}

同时,二人的收入相同为 I=100I = 100 元。甲乙二人的唯一区别在于,乙有一张饼饼的折扣券,使用该折扣券能以 50% 的价格购买任何数量的饼饼(折扣券只能使用一次),甲没有折扣券。

  1. 计算两名消费者各自对于两种商品的最优消费量。
  2. 假设在实际购买商品之前,甲和乙商量能否以一定的价格将乙的折扣券卖给甲。甲为了得到折扣券,最高愿意付多少小钱?
  3. 乙为了出让折扣券,至少应得到多少小钱?
  4. 乙能否与甲达成一定的协议,从而将手中的折扣券转让给甲?
Solution:

(1)消费者 iii=,i = \text{甲}, \text{乙})的决策问题是:

maxUi(X1,X2)=X10.5X20.5s.t.P1X1+X2=I\max U_i(X_1, X_2) = X_1^{0.5} X_2^{0.5} \\ \text{s.t.} \quad P_1 X_1 + X_2 = I

拉格朗日函数为:

L=X10.5X20.5+λ[IP1X1X2]\mathcal{L} = X_1^{0.5} X_2^{0.5} + \lambda \left[ I - P_1 X_1 - X_2 \right]

LX1=0.5X10.5X20.5λP1=0\frac{\partial \mathcal{L}}{\partial X_1} = 0.5 X_1^{-0.5} X_2^{0.5} - \lambda P_1 = 0

LX2=0.5X10.5X20.5λ=0\frac{\partial \mathcal{L}}{\partial X_2} = 0.5 X_1^{0.5} X_2^{-0.5} - \lambda = 0

Lλ=IP1X1X2=0\frac{\partial \mathcal{L}}{\partial \lambda} = I - P_1 X_1 - X_2 = 0

解得

X1=0.5IP1,X2=0.5IX_1 = \frac{0.5I}{P_1}, \quad X_2 = 0.5I

对于甲,P1=10P_1 = 10, I=100I = 100,代入得:

X1=5,X2=50X_1 = 5, \quad X_2 = 50

对于乙,P1=5P_1 = 5, I=100I = 100,代入得:

X1=10,X2=50X_1 = 10, \quad X_2 = 50

(2)由 (1) 分析,间接效用函数为:

Ui=0.5IPiU_i = \frac{0.5I}{\sqrt{P_i}}

设甲愿意支付的最高金额为 kk,购买折扣券后,以每单位 5 元购买商品 1。购买折扣券后,最低应满足效用相等,即:

U=0.510010=0.5(100k)5U_{\text{甲}} = \frac{0.5 \cdot 100}{\sqrt{10}} = \frac{0.5 \cdot (100 - k)}{\sqrt{5}}

解得

k=10050230k = 100 - 50\sqrt{2} \approx 30

因此,甲愿意支付的最高金额为 30 元。

(3)分析道理如上。 记乙出让折扣券的最低索取金额为 ww,出让折扣券后,以每单位 10 元购买商品 1。出让折扣券后,应满足效用相等,即:

U=0.51005=0.5(100+w)10U_{\text{乙}} = \frac{0.5 \cdot 100}{\sqrt{5}} = \frac{0.5 \cdot (100 + w)}{\sqrt{10}}

解得

w=100210040w = 100\sqrt{2} - 100 \approx 40

因此,乙为了出让折扣券至少要卖 40 元。

(4) 甲愿意支付的最高金额(30)小于乙最低索取的金额(40),故无法达成交易。

二、(15分) 一个垄断经营者同时销售两种产品。第一种产品的需求曲线是:

D1(p1,p2)=3p2p12,D_1(p_1, p_2) = \frac{3 - p_2}{p_1^2},

第二种产品的需求曲线是:

D2(p1,p2)=3p1p22,D_2(p_1, p_2) = \frac{3 - p_1}{p_2^2},

这个垄断经营者在销售了 y1y_1 个第一种产品和 y2y_2 个第二种产品以后,成本曲线是:

C(y1,y2)=y1+y2.C(y_1, y_2) = y_1 + y_2.

  1. 这两种产品是彼此的替代品还是彼此的互补品?
  2. 求出这个垄断经营者的利润(使用变量 p1p_1p2p_2 表述)。
  3. 假设这个垄断经营者在第二种产品上被强制定价 p2=1p_2 = 1,但是他可以在 0 到 3 之间任意选择第一种产品的价格 p1p_1,求出可以使这个垄断经营者利润最大化的价格 p1p_1
  4. 假设这个垄断经营者必须给两种产品选择一样的价格,而这个价格介于 0 到 3 之间。求出可以使这个垄断经营者利润最大化的价格。
Solution:

(1) 根据题中产品 1 和 2 的需求函数,

D1p2=1p12<0,\frac{\partial D_1}{\partial p_2} = -\frac{1}{p_1^2} < 0,

因此产品 1 是产品 2 的互补品。同理分析,两种产品是彼此的互补品

(2) 垄断厂商的利润表达式为:

π(p1,p2)=p1D1+p2D2C(y1,y2)=(p11)3p2p12+(p21)3p1p22.\pi(p_1, p_2) = p_1 D_1 + p_2 D_2 - C(y_1, y_2) = (p_1 - 1) \frac{3 - p_2}{p_1^2} + (p_2 - 1) \frac{3 - p_1}{p_2^2}.

(3) 当 p2=1p_2 = 1 时,垄断厂商的决策是:

maxp1π(p1)=2(p11)p12,\max_{p_1} \pi(p_1) = \frac{2(p_1 - 1)}{p_1^2},

其中 0<p1<30 < p_1 < 3

dπdp1=2(1p12+2p13)=0,\frac{d\pi}{dp_1} = 2 \left( -\frac{1}{p_1^2} + \frac{2}{p_1^3} \right) = 0,

解得 p1=2p_1 = 2,此时垄断厂商利润 π=0.5\pi = 0.5

(4) 此时为统一定价,垄断厂商的决策是:

π(p)=pD1+pD2C(y1,y2)=2(p1)3pp2,\pi(p) = p D_1 + p D_2 - C(y_1, y_2) = 2 (p - 1) \frac{3 - p}{p^2},

其中 0<p<30 < p < 3

dπdp=2(3pp2+(p1)(6p3+1p2))=0,\frac{d\pi}{dp} = 2 \left( \frac{3 - p}{p^2} + (p - 1) \left( -\frac{6}{p^3} + \frac{1}{p^2} \right) \right) = 0,

解得 p=1.5p = 1.5,此时垄断厂商利润 π=23\pi = \frac{2}{3}

三、 (15分) 某消费者面临跨期消费选择问题。假设此消费者在今天的消费量为 c0c_0,在明天的消费量为 c1c_1,两期的价格均为 1。假设该消费者今天的收入为 I0=100I_0 = 100,设明天的收入为 I1I_1。消费者的效用函数是:

U(c0,c1)=ln(c0)+ln(c1)U(c_0, c_1) = \ln(c_0) + \ln(c_1)

消费者可以选择储蓄,但不能向他人借款,假设利率水平为 r=0r = 0,求:

  1. 若明天的收入 I1=34I_1 = 34,求此消费者的消费决策。
  2. 若明天的收入存在两种可能,分别是 I1=100I_1 = 100I1=0I_1 = 0,两种可能性发生的概率各为 50%50\%,求此消费者的消费决策。
Solution:

(1) 明天的消费量为 c1=134c0c_1 = 134 - c_0
消费者效用最大化的决策是:

maxU(c0,c1)=ln(c0)+ln(134c0)\max U(c_0, c_1) = \ln(c_0) + \ln(134 - c_0)

计算导数并令其为零,得到:

dUdc0=1c01134c0=0\frac{dU}{dc_0} = \frac{1}{c_0} - \frac{1}{134 - c_0} = 0

解得:

c0=67,c1=67c_0 = 67, \quad c_1 = 67

(2) 消费者在明天的消费量是不确定的:

c1=(I0c0)+I1={200c0,p=0.5100c0,1p=0.5c_1 = (I_0 - c_0) + I_1 = \begin{cases} 200 - c_0, & p = 0.5 \\ 100 - c_0, & 1 - p = 0.5 \end{cases}

消费者期望效用最大化的决策是:

maxEU(c0,c1)=ln(c0)+12[ln(100c0)+ln(200c0)]\max EU(c_0, c_1) = \ln(c_0) + \frac{1}{2} \left[ \ln(100 - c_0) + \ln(200 - c_0) \right]

约束条件0c01000 \leq c_0 \leq 100(消费量非负且不超过第一期收入),对 c0c_0 求导:

dEUdc0=1c0+12(1100c0+1200c0)=0\frac{dEU}{dc_0} = \frac{1}{c_0} + \frac{1}{2} \left( \frac{-1}{100 - c_0} + \frac{-1}{200 - c_0} \right) = 0

化简后得到:

c02225c0+10000=0c_0^2 - 225 c_0 + 10000 = 0

解得:

c0=112.512.51761(符合题意)c_0 = 112.5 - 12.5 \sqrt{17} \approx 61 \quad \text{(符合题意)}

c0=112.5+12.517164(不符合题意)c_0 = 112.5 + 12.5 \sqrt{17} \approx 164 \quad \text{(不符合题意)}

明天的消费 c1c_1 或为 139,或为 39,概率为 0.5。

四、 (15分) 谷歌和百度在市场进行质量竞争,谷歌的质量为 r1r_1,百度的质量为 r2r_2。质量 r1r_1r2r_2 介于 0055 之间。谷歌的收入函数为:

200[0.5+0.05(r1r2)],200[0.5 + 0.05(r_1 - r_2)],

成本函数为 c1=r12c_1 = r_1^2;百度的收入函数为:

200[0.5+0.05(r2r1)],200[0.5 + 0.05(r_2 - r_1)],

成本函数为 c2=1.25r22c_2 = 1.25r_2^2。试求:

  1. 若百度收购了谷歌,那么利润最大化时的质量 r1r_1r2r_2 分别为多少?
  2. 若百度和谷歌进行寡头竞争,r1r_1r2r_2 分别为多少?各自的利润分别为多少?总的质量为多少?和 (1) 中的总质量相比如何?
  3. 若谷歌有一个投资计划,投入 60 单位的费用进行宣传和市场推广,投资之后的市场结构会发生变化:即谷歌的收入函数变为:

200[0.75+0.05(r1r2)],200[0.75 + 0.05(r_1 - r_2)],

百度的收入函数变为:

200[0.25+0.05(r2r1)],200[0.25 + 0.05(r_2 - r_1)],

假设各自成本不变。请问谷歌会做该项投资么?

Solution:
(1) 百度收购谷歌之后的总利润为:

π=200[0.5+0.05(r1r2)]+200[0.5+0.05(r2r1)]r121.25r22\pi = 200[0.5 + 0.05(r_1 - r_2)] + 200[0.5 + 0.05(r_2 - r_1)] - r_1^2 - 1.25r_2^2

不难发现r1=r2=0r_1=r_2=0时总利润最大。

(2) 寡头竞争时,各自的决策分别如下:

谷歌:

max π1=200[0.5+0.05(r1r2)]r12\max \ \pi_1 = 200[0.5 + 0.05(r_1 - r_2)] - r_1^2

π1r1=102r1=0\frac{\partial \pi_1}{\partial r_1} = 10 - 2r_1 = 0

解得 r1=5r_1 = 5

百度:

max π2=200[0.5+0.05(r2r1)]1.25r22\max \ \pi_2 = 200[0.5 + 0.05(r_2 - r_1)] - 1.25r_2^2

π2r2=102.5r2=0\frac{\partial \pi_2}{\partial r_2} = 10 - 2.5r_2 = 0

解得 r2=4r_2 = 4

谷歌和百度的利润分别为 π1=85\pi_1 = 85π2=70\pi_2 = 70,总质量为 99,大于(1)中的总质量 00

(3) 若谷歌执行该投资计划,则在寡头竞争时,各自的决策分别如下:

谷歌:

max π1=200[0.75+0.05(r1r2)]r1260\max \ \pi_1 = 200[0.75 + 0.05(r_1 - r_2)] - r_1^2 - 60

π1r1=102r1=0\frac{\partial \pi_1}{\partial r_1} = 10 - 2r_1 = 0

解得 r1=5r_1 = 5

百度:

max π2=200[0.25+0.05(r2r1)]1.25r22\max \ \pi_2 = 200[0.25 + 0.05(r_2 - r_1)] - 1.25r_2^2

π2r2=102.5r2=0\frac{\partial \pi_2}{\partial r_2} = 10 - 2.5r_2 = 0

解得 r2=4r_2 = 4

均衡质量与(2)相同;双方利润为:π1=75,π2=20\pi_1 = 75, \pi_2 = 20

可见,若实施该计划,谷歌利润相较不实施会减少 10 单位。因此,该计划不会被谷歌执行。

五、 (15分) 在一个完全竞争的钢铁市场,市场的需求函数为 Pd=20QP_d = 20 - Q,市场的供给函数为 Ps=2+QP_s = 2 + Q。炼钢企业的污染边际损耗是 MD=0.5QMD = 0.5Q

  1. 画出需求曲线、供给曲线、边际损耗曲线以及社会的边际成本曲线。
  2. 如果企业不对污染采取措施,那么市场的均衡价格和产量是多少?
  3. 请问社会最优的产量是什么?相应的污染成本为多少?
  4. 请问污染的外部性造成的社会福利损失为多少?
  5. 政府能否通过对产量征税从而达到社会最优产量水平?如果可以,如何征税?

Solution
(1) 如图展示了需求 (Demand)、供给 (Supply)、边际损耗 (MD)、社会边际成本 (SMC) 的曲线与关系。

(2) 如不对污染采取措施,完全竞争均衡满足市场需求等于市场供给,有:

20Q=2+Q,20 - Q = 2 + Q,

解得 Q=9Q = 9, P=11P = 11

(3) 社会最优意味着社会边际成本 (SMC) 与需求曲线相交,即:

20Q=2+1.5Q20 - Q = 2 + 1.5Q

解得

Q=7.2,P=12.8Q^* = 7.2, \quad P^* = 12.8

因此,社会最优时,污染成本

D=07.20.5QdQ=12.96.D = \int_0^{7.2} 0.5Q \, \mathrm{d}Q = 12.96.

(4) 社会福利损失是 SMC 曲线与 PdP_d 曲线在 [7.2,9][7.2,9] 之间的差值,即

ΔW=7.29[(2+1.5Q)(20Q)]dQ=4.05.\Delta W = -\int_{7.2}^9 \left[ \left( 2 + 1.5Q \right) - \left( 20 - Q \right) \right] \, \mathrm{d}Q = -4.05.

因此社会福利损失了 4.05。

(5) 政府可以通过对产量征税来达到社会最优产量。
最优税额应等于边际损害在社会最优产量的水平。
对于 Q=7.2Q = 7.2, 边际损害为 MD=3.6MD = 3.6
因此,政府可以对每单位产量征收 3.6 的税,使得生产者的边际私人成本加上税额等于社会边际成本,完全竞争最优即为社会最优。