清华大学-432统计学-2025年

1.设有只取非负整数值的独立随机变量X,YX,Y,定义U=min{X,Y},V=XYU= min\{X,Y\}, V=X-Y,试证明:U,VU,V独立的充分必要条件是X,YX,Y服从几何分布且参数相同。(30分)

注: 见《应坚刚划题》6.4, 6.17, 需要用到下述柯西方程, 在整数处的取值也显然成立.

[柯西方程 I] 如果f(x)f(x)单调或连续 (x0x\ge 0), 且满足f(x+y)=f(x)f(y)f(x+y)=f(x)\cdot f(y), 则存在aa, 使得f(x)=f(0)axf(x)=f(0)\cdot a^{x}.

[柯西方程 II] 如果f(x)f(x)g(y)g(y)是单调或连续函数(x0x\ge 0, y0y\ge 0), 且 f(x)g(y)=h(x+y)f(x)g(y)=h(x+y), 则f(x)=f(0)axf(x)=f(0)\cdot a^x, g(y)=g(0)ayg(y)=g(0)\cdot a^y, h(z)=h(0)azh(z)=h(0)\cdot a^z.

[Solution]:

“必要性”: 先假设 v0v\ge 0, 运用独立性, 有

pX(u+v)pY(u)=P(X=u+v,Y=u)=P(U=u,V=v)=pU(u)pV+(v).\begin{aligned} p_X\left( u+v \right) p_Y\left( u \right) &=P\left( X=u+v,Y=u \right)\\ &=P\left( U=u,V=v \right) =p_U\left( u \right) p_{V^+}\left( v \right).\\ \end{aligned}

因此有

pX(u+v)=pU(u)pY(u)pV+(v),u0,v0,p_X\left( u+v \right) =\frac{p_U\left( u \right)}{p_Y\left( u \right)}\cdot p_{V^+}\left( v \right), \quad u\ge 0, v\ge 0,

这是柯西方程, 因此有 P(X=x)=pX(x)=k1a1xP(X=x)=p_X(x) = k_1 \cdot a_1^x, 是几何分布.

再看 YY, 仍然假设 v0v\ge 0, 运用独立性, 有

pX(u)pY(u+v)=P(X=u,Y=u+v)=P(U=u,V=v)=pU(u)pV(v),\begin{aligned} p_X\left( u \right) p_Y\left( u+v \right) &=P\left( X=u,Y=u+v \right)\\ &=P\left( U=u,V=-v \right) =p_U\left( u \right) p_{V^-}\left( v \right) ,\\ \end{aligned}

其中我们用 pV(v)p_{V^-}(v) 来表示 P(V=v)P(V=-v), 这样使得 pV(v)p_{V^-}(v) 的定义域还是正半轴.
我们得到柯西方程

pY(u+v)=pU(u)pX(u)pV(v),u0,v0,p_Y\left( u+v \right) =\frac{p_U\left( u \right)}{p_X\left( u \right)}\cdot p_{V^-}\left( v \right), \quad u\ge 0, v\ge 0,

同理, YY 也是几何分布, 有 P(Y=y)=k2a2yP(Y=y)=k_2 \cdot a_2^y.

此外, 根据柯西方程, 有 pV+(v)a1vp_{V^+}(v) \propto a_1^v, pV(v)a2vp_{V^-}(v) \propto a_2^{v}, 那么如果有 VV 是对称分布 (即 V+V^+VV^- 同分布), 则 a1=a2a_1 = a_2, 则进一步有 XX, YY 参数相同.

2.离散总体X,分布为P(X=k)=cλkk!,k=1,2...,P(X=k) = c\frac{\lambda^k}{k!},k=1,2...,未知参数λ>0,c>0\lambda>0, c>0,x1,x2,...xnx_1,x_2,...x_n为总体XX的随机样本.
(1)求cc。(10分)
(2)求E(X),Var(X)E(X), Var(X)。(10分)
(3)证明:λ\lambda最大似然估计λn^\hat{\lambda_n}存在且唯一。(10分)
(4)求出λ\lambda最大似然估计λn^\hat{\lambda_n}的渐进分布。(10分)

Solution:

(1)由分布的归一性:

k=1P(X=k)=1\sum_{k=1}^{\infty}P(X=k) = 1

我们求得c=1eλ1c=\frac{1}{e^{\lambda} -1}
(2)

E(X)=λeλeλ1Var(X)=λeλ(eλλ1)(eλ1)2E(X) = \lambda \frac{e^{\lambda}}{e^{\lambda}-1}\\ Var(X) = \frac{\lambda e^{\lambda}(e^{\lambda}-\lambda-1)}{(e^{\lambda}-1)^2}

(3)

P(x1,...xn)=λxixi!(1eλ1)nl(λ)=xilnλnln(eλ1)dldλ=nxˉλneλeλ1=0\begin{aligned} P(x_1, ...x_n) &= \frac{\lambda^{\sum x_i}}{\prod x_i!}(\frac{1}{e^{\lambda}-1})^n\\ l(\lambda) &= \sum x_i ln\lambda -n ln(e^{\lambda}-1) \\ \frac{\mathrm{d} l}{\mathrm{d} \lambda} &= \frac{n\bar{x}}{\lambda}-n\frac{e^{\lambda}}{e^{\lambda}-1} = 0 \\ \end{aligned}

由上式我们可以得到

(xˉλ)eλxˉ=0 (\bar{x}-\lambda)e^{\lambda} -\bar{x} = 0

设:

f(λ)=(xˉλ)eλxˉf(0)=0,f(+)=dfdλ=(xˉ1λ)eλ\begin{aligned} f(\lambda) = (\bar{x}-\lambda)e^{\lambda} -\bar{x}\\ f(0) = 0, f(+\infty) = -\infty \\ \frac{\mathrm{d} f}{\mathrm{d} \lambda} = (\bar{x} - 1- \lambda)e^{\lambda} \end{aligned}

因为xˉ1\bar{x} \ge1所以f(λ)f(\lambda)与0有且仅有一个交点。

(4)
很显然上述分布依旧属于指数族,所以其极大似然估计的渐进分布有:

n(λMLEλ)dN(0,I1(λ))\sqrt{n}(\lambda_{MLE} - \lambda) \xrightarrow{d}N(0, I^{-1}(\lambda))

n(λMLEλ)dN(0,λ(eλ1)2(eλλ1)eλ)\sqrt{n}(\lambda_{MLE} - \lambda) \xrightarrow{d}N(0, \frac{\lambda(e^{\lambda}-1)^2}{(e^{\lambda}-\lambda-1)e^{\lambda}})

3.x1,x2,...xnx_1,x_2,...x_n为总体是B(1,p)B(1,p)的随机样本,n2n\ge2,p(0,1)p\in(0,1),定义σp2=p(1p),xˉ=1nxi,Sn=1n1(xixˉ)2,Vn=1n(xi,xˉ)\sigma_p^2 = p(1-p),\bar{x} = \frac{1}{n}\sum x_i, S_n = \frac{1}{n-1}\sum(x_i - \bar{x})^2, V_n = \frac{1}{n}\sum(x_i, \bar{x}),其中d\xrightarrow{d}为分布收敛。
(1)Sn2,Vn2S_n^2, V_n^2是否为σp2\sigma_p^2的无偏估计。(10分)
(2)Sn2,Vn2S_n^2, V_n^2是否为σp2\sigma_p^2的相合估计。(10分)
(3)取p=12p=\frac{1}{2},证明:存在非退化随机变量Z1,Z2Z_1, Z_2使n(Sn214)dZ1n(S_n^2 - \frac{1}{4})\xrightarrow{d}Z_1,n(Vn214)dZ1,nn(V_n^2 - \frac{1}{4})\xrightarrow{d}Z_1, n \to \infty,给出具体的分布。(20分)

Solution:

(1)很显然Sn2S_n^2是无偏估计,Vn2V_n^2不是无偏估计。

(2)Sn2S_n^2Vn2V_n^2都是相合估计:
对于Sn2S_n^2:

Var(Sn2)=na(n1)20Var(S_n^2) = \frac{na}{(n-1)^2} \to 0

所以由马尔可夫大数定律,我们有:

Sn2pσp2S_n^2 \xrightarrow{p} \sigma_p^2

对于Vn2V_n^2:

Vn2=1ni=1nxi2xˉ2V_n^2 = \frac{1}{n}\sum_{i=1}^{n} x_i^2 - \bar{x}^2

由辛钦大数定律,我们有:

1ni=1nxi2pp,xˉpp \frac{1}{n}\sum_{i=1}^{n} x_i^2 \xrightarrow{p} p , \bar{x} \xrightarrow{p} p

所以我们有:

Vn2pσp2V_n^2 \xrightarrow{p} \sigma_p^2

(3)
对于Vn2V_n^2:

Vn2=1ni=1nxi2xˉ2=xˉxˉ2V_n^2 = \frac{1}{n}\sum_{i=1}^{n} x_i^2 - \bar{x}^2 = \bar{x} - \bar{x}^2

由中心极限定理,我们知道:

n(xˉ12)dN(0,14)\sqrt{n}(\bar{x} - \frac{1}{2}) \xrightarrow{d} N(0,\frac{1}{4})

由delta引理(值得注意的是这里的一阶导为0,我们要用到二阶的delta方法),我们有:

n(Vn214)d14χ12n(V_n^2 - \frac{1}{4}) \xrightarrow{d} -\frac{1}{4}\chi^2_1

对于Sn2S_n^2,我们有:

n(Sn214)=n(Vn214)+nn1Vn2n(S_n^2 - \frac{1}{4}) = n(V_n^2 - \frac{1}{4}) +\frac{n}{n-1} V_n^2

因为Vn2pσp2V_n^2 \xrightarrow{p} \sigma_p^{2},所以:

n(Sn214)d14χ12+14n(S_n^2 - \frac{1}{4}) \xrightarrow{d} -\frac{1}{4}\chi^2_1 + \frac{1}{4}

4.设x1,...xmx_1,...x_m为来自均匀分布U(0,θ1)U(0,\theta_1)总体的随机样本,y1,...yny_1,...y_n为来自均匀分布U(0,θ2)U(0,\theta_2)总体的随机样本,两样本随机样本相互独立,θ1>0,θ2>0\theta_1>0,\theta_2>0
(1)求H0:θ1=θ2H1:θ1θ2,α(0,1)H_0:\theta_1 = \theta_2 \leftrightarrow H_1:\theta_1 \ne \theta_2, \alpha \in(0,1)的似然比检验。(15分)
(2)U=max{x1,..xm}U=max\{x_1,.. x_m\},是否分别存在θ1\theta_1形成[aU,bU][aU,bU][c+U,d+U][c+U,d+U]置信水平位1α1-\alpha的置信区间,1a<b,0c<d1\le a< b, 0\le c<d,其中a,b,c,da,b,c,d为常数,α(0,1)\alpha \in (0,1)(15分)
(3)若(2)中置信区间存在,当m=1m=1时,求出置信区间长度的期望最小时对应的a,ba,bc,dc,d的值。(10分)

Solution:

(1)

我们设参数空间为Θ1={θ1=θ2,θ1>0,θ2>0}\Theta _1 = \{\theta_1 =\theta_2, \theta_1>0, \theta_2>0 \}Θ0={θ1>0,θ2>0}\Theta _0= \{ \theta_1>0, \theta_2>0 \},Z=max{X(m),Y(n)}Z= max\{ X_{(m)}, Y_{(n)}\}
则我们有:

Λ=argminθΘ1L(θ,x)argminθΘ0L(θ,x)=X(m)mY(n)nZm+n拒绝域:W={X(m)mY(n)nZm+na}={max{(X(m)Y(n))n,(Y(n)X(m))m}1a}\begin{aligned} \Lambda &= \frac{argmin_{\theta \in \Theta_1 }L(\theta, x)}{argmin_{\theta \in \Theta_0}L(\theta, x)} \\ & = \frac{X_{(m)}^mY_{(n)}^n}{Z^{m+n}} \\ \text{拒绝域}:W &=\{\frac{X_{(m)}^mY_{(n)}^n}{Z^{m+n}} \le a\} \\ &= \{max\{(\frac{X_{(m)}}{Y_{(n)}})^n, (\frac{Y_{(n)}}{X_{(m)}})^m\} \ge \frac{1}{a}\} \end{aligned}

我们有:

P(XWH0)=αP(XWH0)=01dx0a1nxmnyn1xm1dy+01dy0a1mymnyn1xm1dx=a\begin{aligned} P(X\in W|H_0) &= \alpha \\ P(X\in W|H_0) & = \int_{0}^{1}dx \int_{0}^{a^{\frac{1}{n}}x} mny^{n-1}x^{m-1}dy + \int_{0}^{1}dy \int_{0}^{a^{\frac{1}{m}}y} mny^{n-1}x^{m-1}dx \\ &= a \end{aligned}

解得a=αa = \alpha

(2)
1).并不存在[c+U,d+U][c+U,d+U]置信水平位1α1-\alpha的置信区间,反证法:
假设存在[c+U,d+U][c+U,d+U]这样的区间使得置信水平为1α1-\alpha,我们就有:

P(Uθ1[d,c])=1αP(U-\theta_1 \in [-d,-c]) = 1-\alpha

然而,

P(Uθ1[d,c])=dcmxm1(1θ1)mdx=dmcmθ1m\begin{aligned} P(U-\theta_1 \in [-d,-c]) &=\int_{-d}^{-c}mx^{m-1}(\frac{1}{\theta_1})^mdx \\ &= \frac{d^m-c^m}{\theta_1^m} \end{aligned}

可以看到这个概率是随着θ1\theta_1的变动而变动的,所以并不存在。
2) 很显然存在[aU,bU][aU,bU]置信水平位1α1-\alpha的置信区间,因为Uθ1\frac{U}{\theta_1}的分布与参数无关了。

P(Uθ1[1b,1a])=1b1amxm1dx=1am1bm\begin{aligned} P(\frac{U}{\theta_1} \in [\frac{1}{b},\frac{1}{a}]) &= \int_{\frac{1}{b}}^{\frac{1}{a}}mx^{m-1}dx \\ & = \frac{1}{a}^m - \frac{1}{b}^m \end{aligned}

所以只要1am1bm=α\frac{1}{a}^m - \frac{1}{b}^m = \alpha的区间都满足条件。
(3)
要使得[aU,bU][aU,bU]置信区间的期望最小,就是要是bab-a长度最小,由拉格朗日法,我们很容易得到a=1,b=(1α)1ma=1,b=(1-\alpha)^{-\frac{1}{m}}, 这在基础课程茆书例题6.6.2中完整讲解过.