复旦大学-432统计学-2025年

  1. (10分) 你和李四一起玩骰子,一共有 AA,BB, CC 三种骰子,分别为AA= “115555”, BB = “333444”, CC = “222266”, 李四先从中选,你从剩下的里面再选,请问你的策略是什么?(即李四选AA,BB,CC其中一个,你如何应对使得投出来的点数大于他的概率更大?

Solution:

情况1,李四选择骰子AA
选骰子BB: AA掷出1时,BB掷出3或4;AA掷出5时,BB不可能比他大,于是点数大于AA的概率: 13×1=13\frac{1}{3} \times 1= \frac{1}{3}
选骰子CC: AA掷出1时,CC掷出2或6;AA掷出5时,CC掷出6才比他大,于是点数大于AA的概率: $$\frac{1}{3} \times 1 + \frac{2}{3} \times \frac{1}{3} = \frac{1}{3} + \frac{2}{9} = \frac{5}{9}$$
情况2,李四选择骰子BB
选骰子AA:BB掷出3时,AA掷出5;BB掷出4时,AA掷出5才比他大,于是点数大于BB的概率: $$\frac{1}{2} \times \frac{2}{3} + \frac{1}{2} \times \frac{2}{3} = \frac{2}{3}$$
选骰子CC:BB掷出3时,CC掷出6才比他大;BB掷出4时,CC掷出6才比他大,于是点数大于BB的概率: $$\frac{1}{2} \times \frac{1}{3} + \frac{1}{2} \times \frac{1}{3} = \frac{1}{3}$$
情况3,李四选择骰子CC
选骰子AA: CC掷出2时,AA掷出5才比他大;CC掷出6时,AA不可能比他大,于是点数大于CC的概率: $$\frac{2}{3} \times \frac{2}{3} + \frac{1}{3} \times 0 = \frac{4}{9}$$
选骰子BB: CC掷出2时,BB掷出3或4才比他大;CC掷出6时,BB不可能比他大,于是点数大于CC的概率: $$\frac{2}{3} \times 1 = \frac{2}{3}$$
所以策略是:如果李四选择骰子AA,你选择骰子CC;如果李四选择骰子BB,你选择骰子AA; 如果李四选择骰子CC,你选择骰子BB

  1. (10分) XX, YY 服从两点分布,则它们独立的充要条件是:Cov(X,Y)=0Cov(X,Y)=0.

Solution: 见 2016 年第五题, 原题重现.

  1. (10分) 设概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P) 中的 Ω\Omega 的元素个数为 nn ,是古典概型,非平凡事件 A,BA, B 独立.
    (1)证明: ABAcBc=AcBABc|A \cap B||A^c \cap B^c| = |A^c \cap B||A \cap B^c|;
    (2)证明: nn 为合数.

Solution:(1)由于 AABB 是独立的,我们有:

P(A \cap B) = P(A)P(B) $$ $$ P(A) = \frac{|A|}{n}, \quad P(B) = \frac{|B|}{n}, \quad P(A \cap B) = \frac{|A \cap B|}{n} $$ $$ \frac{|A \cap B|}{n} = \frac{|A|}{n} \cdot \frac{|B|}{n} ,|A \cap B| = \frac{|A||B|}{n}

由于 AcA^cBcB^c 也是独立的:

P(A^c \cap B^c) = P(A^c)P(B^c) $$ $$ P(A^c) = 1 - P(A) = 1 - \frac{|A|}{n} = \frac{n - |A|}{n} $$ $$ P(B^c) = 1 - P(B) = 1 - \frac{|B|}{n} = \frac{n - |B|}{n} $$ $$ P(A^c \cap B^c) = \frac{n - |A|}{n} \cdot \frac{n - |B|}{n} = \frac{(n - |A|)(n - |B|)}{n^2} $$ $$ |A^c \cap B^c| = \frac{(n - |A|)(n - |B|)}{n}

接下来,考虑事件 AcBA^c \cap BABcA \cap B^c

P(A^c \cap B) = P(A^c)P(B) = \frac{n - |A|}{n} \cdot \frac{|B|}{n} = \frac{(n - |A|)|B|}{n^2} $$ $$ |A^c \cap B| = \frac{(n - |A|)|B|}{n} $$ $$ P(A \cap B^c) = P(A)P(B^c) = \frac{|A|}{n} \cdot \frac{n - |B|}{n} = \frac{|A|(n - |B|)}{n^2} $$ $$ |A \cap B^c| = \frac{|A|(n - |B|)}{n} $$ $$ |A \cap B||A^c \cap B^c| = \left(\frac{|A||B|}{n}\right)\left(\frac{(n - |A|)(n - |B|)}{n}\right) = \frac{|A||B|(n - |A|)(n - |B|)}{n^2} $$ $$ |A^c \cap B||A \cap B^c| = \left(\frac{(n - |A|)|B|}{n}\right)\left(\frac{|A|(n - |B|)}{n}\right) = \frac{|A||B|(n - |A|)(n - |B|)}{n^2}

因此:ABAcBc=AcBABc|A \cap B||A^c \cap B^c| = |A^c \cap B||A \cap B^c|
(2)假设 nn 是一个质数。那么 nn 的唯一正因数是 1 和 nn 本身。由于 AABB 是非平凡事件,它们的个数 A|A|B|B| 必须在 1 和 n1n-1 之间。因此, A|A|B|B| 都不是 nn 的因数。
从第一部分的等式 ABAcBc=AcBABc|A \cap B||A^c \cap B^c| = |A^c \cap B||A \cap B^c| ,我们知道:

ABn(nA)(nB)n=(nA)BnA(nB)n\frac{|A||B|}{n} \cdot \frac{(n - |A|)(n - |B|)}{n} = \frac{(n - |A|)|B|}{n} \cdot \frac{|A|(n - |B|)}{n}

这个等式成立,但如果我们假设 nn 是质数,那么 A|A|B|B| 都不能整除 nn ,这将导致等式两边的分子不能被 n2n^2 整除,从而导致矛盾。因此nn 不能是质数,它必须是合数。

  1. (10分) 若 P(Xx,Yy)=F(min(x,y))P(X \leq x, Y \leq y) = F(\min(x, y)),证明:P(X=Y=1P(X = Y)= 1.

Solution: 《应坚刚》第六章划题. 对任意 xRx \in \mathbb{R} ,有 :

P(X \leq x < Y) = P(X \leq x,Y < \infty) - P(X \leq x, Y \leq x) = 0, $$ 因此容易说明 $\{X < Y\} = \bigcup_{x \in \mathbb{Q}} \{X \leq x < Y\}$ 是零测集,同理 $\{X > Y\}$ 是零测集,结论成立。 </font> 5. (15分) $X$, $Y$独立同分布于$F$,二阶矩存在,证明: (1) $E|X-Y|^2 = 2Var(X)$ (2) $Var(\sin x) \leq Var(x)$ <font color=#6495ED> Solution:(1)由于 $X$ 和 $Y$ 独立同分布于 $F$ ,我们有: $$ E(X) = E(Y), Var(X) = Var(Y) $$ $$ E((X-Y)^2) = E(X^2 - 2XY + Y^2) = E(X^2) - 2E(XY) + E(Y^2)

由于 XXYY独立,我们有 E(XY)=E(X)E(Y)E(XY) = E(X)E(Y) 。因此:

\begin{align*} E((X - Y)^2) &= E(X^2) - 2E(X)E(Y) + E(Y^2) \\ &= E(X^2) - 2E(X)^2 + E(X^2) \\ &= 2E(X^2) - 2E(X)^2 \\ &= 2(E(X^2) - E(X)^2) \\ \end{align*}

根据方差的定义, Var(X)=E(X2)E(X)2Var(X) = E(X^2) - E(X)^2 ,因此:

E((XY)2)=2Var(X)E((X-Y)^2) = 2Var(X)

(2)庞加莱不等式证法重现. 对任意 x0x_0, 有 :

\begin{aligned} Var\left( f\left( X \right) \right) &\le E\left[ \left( f\left( X \right) -f\left( x_0 \right) \right) ^2 \right] =E\left[ \left( \int_{x_0}^X{f'\left( t \right) \mathrm{d}t} \right) ^2 \right]\\ &\le E\left[ \left( \int_{x_0}^X{\left( f'\left( t \right) \right) ^2\mathrm{d}t} \right) \left( \int_{x_0}^X{1^2\mathrm{d}t} \right) \right] =E\left[ \left( X-x_0 \right) \left( \int_{x_0}^X{\left( f'\left( t \right) \right) ^2\mathrm{d}t} \right) \right]\\ &\le \mathop {\mathrm{sup}} \limits_{t}\left| \left( f'\left( t \right) \right) ^2 \right|\cdot E\left[ \left( X-x_0 \right) ^2 \right] .\\ \end{aligned}$$ 这里 $f'(t)^2 =(\cos t )^2 \le 1$, 再选 $x_0 = E(X)$, 得证.(也可直接根据第一问的结论证明) </font> 6. (10分) $X_1, X_2$ 独立同分布于 $U(0,1)$ , 记 $Y_1 = \min(X_1, X_2), Y_2 = \max(X_1, X_2)$ , 计算 $E[X_1|Y_2]$. <font color=#6495ED> Solution: 由于 $\quad Y_2 \sim Be(2,1)$, $E(X_1) = \frac{1}{2}$, $E(Y_2) = \frac{2}{3}$, $$ E(X_1Y_2) = E[E(X_1Y_2 \mid Y_2)] = E[Y_2 E(X_1 \mid Y_2)] $$ 并且: $$ Y_1+ Y_2 = X_1 +X_2 $$ $$ E(X_1 \mid Y_2) = \frac{1}{2} E(X_1+X_2 \mid Y_2)

对于 0y1y210 \leq y_1 \leq y_2 \leq 1

f_{Y_1, Y_2}(y_1, y_2) = 2 $$ $$ f_{Y_2}(y_2) = \int_0^{y_2} f_{Y_1, Y_2}(y_1, y_2) \, dy_1 = \int_0^{y_2} 2 \, dy_1 = 2y_2 $$ $$ f_{Y_1|Y_2}(y_1|y_2) = \frac{f_{Y_1, Y_2}(y_1, y_2)}{f_{Y_2}(y_2)} = \frac{2}{2y_2} = \frac{1}{y_2} $$

\begin{align*}
E(Y_1|Y_2=y_2) &= \int_0^{y_2} y_1 f_{Y_1|Y_2}(y_1|y_2) , dy_1 = \int_0^{y_2} y_1 \frac{1}{y_2} , dy_1
\&
= \frac{1}{y_2} \int_0^{y_2} y_1 , dy_1 = \frac{1}{y_2} \left[ \frac{y_1^2}{2} \right]_0^{y_2} \&= \frac{1}{y_2} \cdot \frac{y_2^2}{2}= \frac{y_2}{2}\end{align*}

$$ E(X_1 \mid Y_2) = \frac{1}{2} E(X_1+X_2 \mid Y_2) = \frac{1}{2} E(Y_1+ Y_2 \mid Y_2) = \frac{1}{2} Y_2 + \frac{1}{2} E( Y_1 \mid Y_2) = \frac{Y_2}{2} + \frac{1}{2} \cdot \frac{Y_2}{2} = \frac{3Y_2}{4}.

7.(15分) 给定二元函数

f(x,y)=c(ex2+y22+xy(x2y2)eID(x,y))f(x,y)=c\left(e^{-\frac{x^2+y^2}{2}}+\frac{xy(x^2-y^2)}{\sqrt{e}}I_{D}(x,y)\right)

其中 D={(x,y)x2+y21}D=\{(x,y) \mid x^2+y^2 \leq 1\}cc >0。

(1) 证明: f(x,y)>0f(x,y) > 0

(2) 设 (X,Y)(X,Y) 的联合密度为 f(x,y)f(x,y) ,求 cc

(3) 求 X,YX,Y 的边缘分布,求 Cov(X,Y)\text{Cov}(X,Y)XXYY 是否独立?

Solution: (1) (x,y)D(x,y) \notin D 时显然大于0,(x,y)D(x,y) \in D 时,令 x=ρcosθx = \rho\cos\thetay=ρsinθy = \rho\sin\theta

f(x,y)=c(eρ22+ρ2sinθcosθ(cos2θsin2θ)e)>(112ρ2+ρ2sin4θ4e)>c(11214e)>0\begin{aligned} f(x,y) &= c\left(e^{-\frac{\rho^2}{2}} + \frac{\rho^2 \cdot \sin \theta \cos \theta (\cos^2 \theta - \sin^2 \theta)}{\sqrt{e}}\right)\\ &> \left(1 - \frac{1}{2} \rho^2 + \frac{\rho^2 \cdot \sin 4\theta}{4\sqrt{e}}\right) \\ &> c \cdot \left(1 - \frac{1}{2} - \frac{1}{4\sqrt{e}}\right) \\ &>0 \end{aligned}

(2) 由正则性

f(x,y)dxdy=1.\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x,y) \, dx \, dy = 1.

我们将积分分为两部分: (x,y)D(x,y) \in D(x,y)D(x,y) \notin D
对于 (x,y)D(x,y) \notin D , $$ \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} c e{-\frac{x2+y^2}{2}} , dx , dy - \int_{D} c e{-\frac{x2+y^2}{2}} , dx , dy. $$
对于 (x,y)D(x,y) \in D ,$$ \int_{D} c \left( e{-\frac{x2+y^2}{2}} + \frac{xy(x2-y2)}{\sqrt{e}} \right) , dx , dy. $$
将这两部分合并,我们得到, $$ c \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e{-\frac{x2+y^2}{2}} , dx , dy = 1. $$
x=rcosθx = r\cos\thetay=rsinθy = r\sin\theta ,则 x2+y2=r2x^{2}+y^{2}=r^{2}
r0,0θ2πr \geq 0,0 \leq \theta \leq 2\pi

\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} e^{-\frac{x^2+y^2}{2}} \, dx \, dy= \int_{0}^{2\pi}\int_{0}^{\infty} e^{-\frac{r^{2}}{2}}r drd\theta$$ 令 $u = r^{2}$ , $du = 2r dr$ 。 $$ \int_{0}^{2\pi}d\theta\int_{0}^{\infty} e^{-\frac{r^{2}}{2}}r dr = \int_{0}^{2\pi}d\theta\int_{0}^{\infty}\frac{1}{2}e^{-\frac{u}{2}}du=\int_{0}^{2\pi}d\theta\left[- e^{-\frac{u}{2}}\right]_{0}^{\infty} = \int_{0}^{2\pi}d\theta= 2\pi $$ (也可直接根据二元正态分布的联合密度函数得出), 于是: $$c = \frac{1}{2\pi}

(3) 首先,我们求 XX 的边缘分布。由于 f(x,y)f(x,y) 关于 yy 对称,所以 XX 的边缘分布为

fX(x)=f(x,y)dy=12π(ex2+y22+xy(x2y2)e1D(x,y))dy.f_X(x) = \int_{-\infty}^{\infty} f(x,y) \, dy = \int_{-\infty}^{\infty} \frac{1}{2\pi} \left( e^{-\frac{x^2+y^2}{2}} + \frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) \right) \, dy.

由于 xy(x2y2)e1D(x,y)\frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) 关于 yy 是奇函数,所以

xy(x2y2)e1D(x,y)dy=0.\int_{-\infty}^{\infty} \frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) \, dy = 0.

因此: $$ f_X(x) = \frac{1}{2\pi} \int_{-\infty}^{\infty} e{-\frac{x2+y^2}{2}} , dy = \frac{1}{\sqrt{2\pi}} e{-\frac{x2}{2}}. $$
同理, yy 的边缘分布为:

fY(y)=12πey22.f_Y(y) = \frac{1}{\sqrt{2\pi}} e^{-\frac{y^2}{2}}.

由于: fY(y)fX(x)f(x,y)f_Y(y)f_X(x)≠ f(x,y),所以X,Y不独立。

E(XY)=xyf(x,y)dxdy=xy12π(ex2+y22+xy(x2y2)e1D(x,y))dxdy.E(XY) = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} xy f(x,y) \, dx \, dy = \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} xy \frac{1}{2\pi} \left( e^{-\frac{x^2+y^2}{2}} + \frac{xy(x^2-y^2)}{\sqrt{e}} 1_{D}(x,y) \right) \, dx \, dy.

由于 ex2+y22e^{-\frac{x^2+y^2}{2}} 关于 xxyy 都是对称的,所以

\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} xy e^{-\frac{x^2+y^2}{2}} \, dx \, dy = 0. $$ 令:$x=r\cos\theta$ 和 $y=r\sin\theta$ ,积分变为:

\int_{0}{2\pi}\int_{0}{1}\frac{(r\cos\theta)(r\sin\theta)(r2\cos2\theta-r2\sin2\theta)}{\sqrt{e}}r,dr,d\theta.

简化被积函数,我们得到:简化被积函数,我们得到:

\int_{0}{2\pi}\int_{0}{1}\frac{r5\cos\theta\sin\theta(\cos2\theta-\sin^2\theta)}{\sqrt{e}},dr,d\theta.

注意到 $\cos\theta\sin\theta(\cos^2\theta-\sin^2\theta)$ 是一个奇函数,因此:

\int_{0}{2\pi}\cos\theta\sin\theta(\cos2\theta-\sin^2\theta),d\theta=0.

所以: $Cov(X,Y)=E(XY) -E(X)E(Y)=0$ </font> 8. (10分) 打怪物会爆装备1和2,爆出装备1的概率是0.2 ,爆出装备2的概率是 0.2,不获得任何装备的概率是0.6,设 $\tau$ 是集齐装备所用的次数,求 $E\tau$ , $Var\tau$. <font color=#6495ED> Solution: 令:$\xi_1$ 表示收集到第一件装备所需的次数,其成功概率为 0.4(因为获得装备1或装备2的概率为 0.2 + 0.2 = 0.4)。$\xi_2$ 表示在收集到第一件装备后,收集到第二件装备所需的次数,其成功概率为 0.2(因为获得第2个装备的概率为 0.2)。 对于几何分布随机变量 $\xi \sim Ge(p)$ ,其期望 $E\xi = \frac{1}{p}$ 。因此:$E\xi_1 = \frac{1}{0.4} = 2.5$,$E\xi_2 = \frac{1}{0.2} = 5$ $$ E\tau = E\xi_1 + E\xi_2 = 2.5 + 5 = 7.5

对于几何分布随机变量 ξGe(p)\xi \sim Ge(p) ,其方差 Varξ=1pp2Var\xi = \frac{1-p}{p^2} 。因此:

\begin{aligned} Var\xi_1 &= \frac{1-0.4}{0.4^2} = \frac{0.6}{0.16} = 3.75\\ Var\xi_2 &= \frac{1-0.2}{0.2^2} = \frac{0.8}{0.04} = 20\\ Var\tau &= Var\xi_1 + Var\xi_2 = 3.75 + 20 = 23.75 \end{aligned} $$ 因此,收集到两件装备所需的期望次数为 7.5 次,方差为 23.75。 </font> 9. (15分) 设 $X_1, \cdots, X_n$ 独立同分布于连续函数 $F$, 样本 $Y_i = \mu + \sigma[-\ln F(X_i)]^{-\frac{1}{2}}$ ,$\mu>0,\sigma>0$ (1) 求 $(\mu,\sigma)$ 的最大似然估计。 (2) 若 $\mu$ 已知,求 $\sigma^2$ 的充分统计量。 <font color=#6495ED> Solution: (1) 令 \( Z_i = F(X_i) \),则 \( Z_i \sim U(0,1) \)。 \[ Y_i = \mu + \sigma \left[ -\ln Z_i \right]^{-\frac{1}{2}} \] 由于 \( Z_i \sim U(0,1) \), \( -\ln Z_i \) 服从参数为 1 的指数分布,即 \( -\ln Z_i \sim \text{Exp}(1) \)。 设 \( W_i = \left[ -\ln Z_i \right]^{-\frac{1}{2}} \) : \[ P(w_i \leq w) = P\left( \left( -\ln z_i \right)^{-\frac{1}{2}} \leq w \right) = P\left( z_i \leq e^{-w^{-2}} \right) = e^{-w^{-2}} \] \[ f_{w_i}(w) = 2w^{-3} e^{-w^{-2}}, \quad y_i = \mu + \sigma \cdot w_i \] \[ f_{Y_i}(y_i) = f_{w_i}\left( \frac{y_i - \mu}{\sigma} \right) \cdot \frac{1}{\sigma} = 2\sigma^2 \cdot (y_i - \mu)^{-3} \cdot e^{-\left( \frac{\sigma}{y_i - \mu} \right)^2} \] \[ f(y_1, \cdots, y_n) = \prod_{i = 1}^{n} 2\sigma^2 (y_i - \mu)^{-3} e^{-\left( \frac{\sigma}{y_i - \mu} \right)^2} \] \[ \ln f = \sum_{i = 1}^{n} \left[ -3\ln(y_i - \mu) - \left( \frac{\sigma}{y_i - \mu} \right)^2 \right] + 2n\ln\sigma + n\ln 2 \] 对 \( \mu \) 的偏导数为: \[ \frac{\partial \ln f}{\partial \mu} = \sum_{i = 1}^{n} \left[ \frac{3}{y_i - \mu} - \frac{2\sigma^2}{(y_i - \mu)^3} \right] = 0 \] \[ \Rightarrow \sum_{i = 1}^{n} \frac{3(y_i - \mu)^2 - 2\sigma^2}{(y_i - \mu)^3} = 0 \quad (1) \] 对 \( \sigma \) 的偏导数为: \[ \frac{\partial \ln f}{\partial \sigma} = \sum_{i = 1}^{n} \frac{-2\sigma}{(y_i - \mu)^2} + \frac{2n}{\sigma} = 0 \] \[ \Rightarrow \sum_{i = 1}^{n} \frac{1}{(y_i - \mu)^2} = \frac{n}{\sigma^2} \quad (2) \] 设 \( S_1(\mu) = \sum_{i = 1}^{n} \frac{1}{y_{i} - \mu} \), \( S_2(\mu) = \sum_{i = 1}^{n} \frac{1}{(y_{i} - \mu)^{2}} \), \( S_3(\mu) = \sum_{i = 1}^{n} \frac{1}{(y_{i} - \mu)^{3}} \),则: \[ 3S_1(\mu) - 2\sigma^2 S_3(\mu) = 0, \quad S_2(\mu) - \frac{n}{\sigma^2} = 0 \] \(\mu, \sigma\) 的极大似然估计即为满足上式的值。 (由于 \( \ln f \) 关于 \( \mu, \sigma \) 并不单调,所以不能直接取 \( \mu = y_{(1)} \)) (2) 根据因子分解定理,如果似然函数可以写成 \( L(\sigma^2) = g(T(Y), \sigma^2) h(Y) \) 的形式,其中 \( T(Y) \) 是样本的函数,\( g \) 和 \( h \) 是两个函数,那么 \( T(Y) \) 是 \( \sigma^2 \) 的充分统计量。似然函数为: \[ L(\sigma^2) = \prod_{i=1}^n 2(y_i - \mu)^{-3} \exp \left\{ \sum_{i=1}^n \left[ - \left( \frac{\sigma}{y_i - \mu} \right)^2 \right] + 2n \ln(\sigma) \right\} \] 这里, \( T(Y) = \sum_{i=1}^n \frac{1}{(y_i - \mu)^2} \) 是 \( \sigma^2 \) 的充分统计量。 </font> 10. (15分)设总体为对数正态分布 $LN(\mu, \sigma^2)$ ,简单样本为 $X_1, \cdots, X_n$. (1) 求 $\mu$ 的矩估计、最大似然估计。 (2) 求 $\theta = e^{\mu + \frac{1}{2}}$ 的最大似然估计,并分析其是否无偏。 <font color=#6495ED> Solution: (1) 对于对数正态分布 $LN(\mu, \sigma^2)$ ,其均值 $E(X) = e^{\mu + \frac{\sigma^2}{2}}$ 。样本均值 $\bar{X}$ 可作为 $E(X)$ 的估计,因此: $$ \bar{X} = e^{\mu + \frac{\sigma^2}{2}}

解出 μ\mu 得到矩估计:

\hat{\mu1} = \ln(\bar{X}) - \frac{\sigma^2}{2} $$ $$ L(\mu, \sigma) = \prod_{i=1}^n \frac{1}{X_i \sigma \sqrt{2\pi}} e^{-\frac{(\ln X_i - \mu)^2}{2\sigma^2}} $$ $$ \ln L(\mu, \sigma) = -n\ln(\sigma) - \frac{n}{2}\ln(2\pi) - \sum_{i=1}^n \frac{(\ln X_i - \mu)^2}{2\sigma^2} - \sum_{i=1}^n \ln X_i $$ 对 $\mu$ 求偏导数:

\begin{aligned}
\frac{\partial \ln L}{\partial \mu} &= \sum_{i=1}^n \frac{\ln X_i - \mu}{\sigma^2} = 0 \
\hat{\mu}{\text{MLE}} &= \frac{1}{n} \sum{i=1}^n \ln X_i
\end{aligned}

(2) 由极大似然估计的不变性:若 $(\hat{\mu}, \hat{\sigma})$ 是 $(\mu, \sigma)$ 的极大似然估计,则对于任何函数 $T(\mu, \sigma)$ , $T$ 的极大似然估计为 $T(\hat{\mu}, \hat{\sigma})$ 。因此, $\theta$ 的最大似然估计为:$\hat{\theta}_{\text{MLE}} = e^{\hat{\mu} + \frac{1}{2}}$,由于$\hat{\mu}_{\text{MLE}}$ 是 $\mu$ 的无偏估计,我们有:$E(\hat{\mu}_{\text{MLE}}) = \mu$。$$E(e^{\mu})>e^{E(\mu)}=e^{\mu}$$所以$\theta$不是无偏估计。 </font> 11. (15分) 设随机变量 $X$ 的概率密度函数为: $$ f(x; \theta) = \begin{cases} \theta x^{\theta -1}, & 0 < x < 1, \\ 0, & \text{其他} \end{cases}

X1,X2X_1, X_2 来自该总体的样本,考虑假设检验问题:

H0:θ=1H1:θ=2,H_0: \theta = 1 \leftrightarrow H_1: \theta = 2,

其否定域为 W={(X1,X2)X1X2>34}W = \{(X_1, X_2) \mid X_1 X_2 > \frac{3}{4}\} ,求第一、二类错误的概率.

Solution: 1.第一类错误:弃真。即在 θ=1\theta = 1 的情况下, X1X2>34X_1 X_2 > \frac{3}{4} 的概率。
θ=1\theta = 1 时, XX 的概率密度函数为 f(x;1)=1f(x; 1) = 10<x<10 < x < 1 。因此, X1X_1X2X_2 都是 (0,1)(0, 1) 上的均匀分布, 34x1<1\frac{3}{4x_1}<1, 求出x1>34x_1> \frac{3}{4}

P(X1X2>34θ=1)=34134x111dx2dx1=14+3ln343ln22P(X_1 X_2 > \frac{3}{4}, \theta = 1) = \int_{\frac{3}{4}}^1 \int_{\frac{3}{4x_1}}^1 1 \, dx_2 \, dx_1 =\frac{1}{4}+\frac{3 \ln 3}{4}-\frac{3\ln 2}{2}

因此,第一类错误的概率为: $$\alpha =\frac{1}{4}+\frac{3 \ln 3}{4}-\frac{3\ln 2}{2}

2.第二类错误:取伪,即在 $H_1$ 为真时接受 $H_0$ 的概率。即在 $\theta = 2$ 的情况下, $X_1 X_2 \leq \frac{3}{4}$ 的概率。当 $x_1 < \frac{3}{4}$ 时, $x_2$ 的积分范围是 $(0, 1)$,而当 $x_1 \geq \frac{3}{4}$ 时, $x_2$ 的积分范围是 $(0, \frac{3}{4x_1})$ 。因此:

P(X_1 X_2 \leq \frac{3}{4}, \theta = 2) = \int_0^{\frac{3}{4}} 2x_1 , dx_1 + \int_{\frac{3}{4}}^1 \frac{9}{8x_1} , dx_1=\frac{9}{16}+\frac{9\ln2}{4}-\frac{9\ln3}{8}

因此,第二类错误的概率为: 因此,第二类错误的概率为:

\beta =\frac{9}{16}+\frac{9\ln2}{4}-\frac{9\ln3}{8}

</font> 12. (15分) 设总体 $X$ 满足 $P(X > x | \theta) = e^{-(\theta x)^k}$ ,参数 $\theta$ 的先验分布满足 $\theta^k\sim \Gamma(\alpha, \beta)$ ,这里 $\alpha = 2$ , $\beta = 1$ , $k = 2$ ,给定样本 $x_1, \ldots, x_n$ ,求 $\theta$ 的后验分布. <font color=#6495ED> Solution: 由于 \( P(X > x | \theta) = e^{-(\theta x)^2} \),我们可以得到 \( P(X \leq x | \theta) = 1 - e^{-(\theta x)^2} \) 。 \[ f(x_i | \theta) = \frac{d}{dx_i} P(X \leq x_i | \theta) = 2 \theta^2 x_i e^{-(\theta x_i)^2} \] 因此: \[ L(x_1, \ldots, x_n | \theta) = \prod_{i=1}^{n} 2 \theta^2 x_i e^{-(\theta x_i)^2} = 2^n \theta^{2n} \left( \prod_{i=1}^{n} x_i \right) e^{-\sum_{i=1}^{n} (\theta x_i)^2} \] 参数 \( \theta^2 \) 的先验分布为: \[ \theta^2 \sim \Gamma(2, 1) \] \[ g(\theta^2) = \frac{1^2}{\Gamma(2)} (\theta^2)^{2-1} e^{-1 \cdot \theta^2} = \theta^2 e^{-\theta^2} \] 根据贝叶斯定理,后验分布 \( \pi(\theta^2 | x_1, \ldots, x_n) \) 与似然函数和先验分布的乘积成正比: \[ \pi(\theta^2 | x_1, \ldots, x_n) \propto L(\theta | x_1, \ldots, x_n) \cdot g(\theta^2) \] 代入似然函数和先验分布,得到: \[ \pi(\theta^2 | x_1, \ldots, x_n) \propto 2^n \theta^{2n} \left( \prod_{i=1}^{n} x_i \right) e^{-\sum_{i=1}^{n} (\theta x_i)^2} \cdot \theta^2 e^{-\theta^2} \] \[ \pi(\theta^2 | x_1, \ldots, x_n) \propto \theta^{2n+2} e^{-\theta^2 \left( \sum_{i=1}^{n} x_i^2 + 1 \right)} \] 说明 \( \theta^2 \) 后验分布依旧还是伽马分布,参数 \( \theta^2 \) 的后验分布为: \[ \theta^2 | x_1, \ldots, x_n \sim \Gamma(n+2, \sum_{i=1}^{n} x_i^2 + 1) \] 于是: \[ f(\theta^2 | x_1, \ldots, x_n) = \frac{\theta^{2(n+1)}}{\Gamma(n+2)} (\sum_{i=1}^{n} x_i^2 + 1)^{n+2} e^{-(\sum_{i=1}^{n} x_i^2 + 1) \theta^2} \] \[ f(\theta | x_1, \ldots, x_n) = \left\{ \begin{array}{ll} f(\theta^2 | x_1, \ldots, x_n) \theta = \frac{\theta^{2n+3}}{\Gamma(n+2)} (\sum_{i=1}^{n} x_i^2 + 1)^{n+2} e^{-(\sum_{i=1}^{n} x_i^2 + 1) \theta^2}, & \theta > 0 \\ -f(\theta^2 | x_1, \ldots, x_n) \theta = - \frac{\theta^{2n+3}}{\Gamma(n+2)} (\sum_{i=1}^{n} x_i^2 + 1)^{n+2} e^{-(\sum_{i=1}^{n} x_i^2 + 1) \theta^2}, & \theta < 0 \end{array} \right. \] </font>