上海交通大学-432统计学-2024年

一、选择题(1-15题每题2分, 16-25题每题3分, 共60分)

  1. 从某车厂抽了20辆同一类型的车进行测是, 根据这20车的数据得出结论, 表明这类型车百公里油耗小于 7.17.1 L, 这句话是( \quad )
    A. 对样本的描述
    B. 对样本的推断
    C. 对总体的描述
    D. 对总体的推断

Solution: D.

这是通过样本数据对总体的推断.

  1. 某大学的马克思学院的老师对大学生玩手机的时间比较感兴趣, 因此从马克思学院的大一、大二、大三、大四, 各抽了20个人( \quad )
    A. 多阶段抽样
    B. 配额抽样
    C. 简单随机抽样
    D. 整群抽样

Solution: B.

  1. 为研究不同人的甘油三酯和血糖的关系, 应该用什么图表( \quad )
    A. 条形图
    B. 对比条形图
    C. 散点图
    D. 饼图

Solution: C.

  1. 淘宝调查某产品评价, 有人恶意差评, 请问这是什么误差( \quad )
    A. 随机误差
    B. 回答误差
    C. 无回答误差
    D. 抽样框误差

Solution: B.

  1. 一组数据的均值是 0.078, 标准差是 0.03, 下列哪一个是异常值( \quad )
    A. 0.089
    B. 0.074
    C. 0.072
    D. 0.082

Solution: A.

  1. 现有某大学的学生分数, 分数均值是 78 , 中位数是 83 , 标准差是8, 则样本的分布是( \quad )
    A. 左偏
    B. 右偏
    C. 对称
    D. 不确定

Solution: A.

  1. 假设 XX 的分布列为 P(X=1)=0.2,P(X=0)=0.7\mathbb{P}(X=1)=0.2 , \mathbb{P}(X=0)=0.7 , P(X=2)=0.1\mathbb{P}(X=2)=0.1 , 问 XX 的均值和方差, 以下错误的是( \quad )
    A. 众数和中位数均为 0
    B. 期望为 0.4
    C. 方差为 0.44
    D. 标准差为 0.2

Solution: D.

  1. 总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right) , 随机变量 F=k(Xˉμ)2i=1n(XiXˉ)2F=\frac{k (\bar{X}-\mu)^2}{\sum_{i=1}^n\left(X_i-\bar{X}\right)^2}FF 分布, 求 kk 的参数 ()(\quad)
    A. n(n1)n (n-1)
    B. n1n\frac{n-1}{n}
    C. 1
    D. nn1\frac{n}{n-1}

Solution: 选 A.

我们知道 U1=n(Xˉμ)2σ2χ2(1)U_1=n\left(\bar{X}-\mu\right)^2 \sim \sigma^2 \chi^2(1), U2=i=1n(XiXˉ)2σ2χ2(n1)U_2=\sum_{i=1}^n\left(X_i-\bar{X}\right)^2\sim \sigma^2 \chi^2(n-1), 因此 U1U2/(n1)F(1,n1)\frac{U_1}{U_2/(n-1)}\sim F(1, n-1), 对应系数得到 k=n(n1)k=n(n-1).

  1. XN(0,1)X \sim N(0, 1), 求 Y=X4Y=X^4 的概率密度函数( \quad )
    A. 122πy3/4exp(y1/22)\frac{1}{2 \sqrt{2 \pi}} y^{-3 / 4} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.
    B. 12πy3/4exp(y1/22)\frac{1}{\sqrt{2 \pi}} y^{-3 / 4} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.
    C. 14πy3/4exp(y1/22)\frac{1}{4\sqrt{\pi}} y^{-3 / 4} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.
    D. 12πy3/2exp(y1/22)\frac{1}{2\sqrt{\pi}} y^{-3 / 2} \exp \left(-\frac{y^{1 / 2}}{2}\right), y>0y>0.

Solution: A.

微分法.

P(Y=y)=P(X=y14)+P(X=y14)=2P(X=y14)=2p(y14)dy14=12y34p(y14)dy=122πy3/4exp(y1/22).\begin{aligned} P\left( Y=y \right) &=P\left( X=y^{\frac{1}{4}} \right) +P\left( X=-y^{\frac{1}{4}} \right) =2P\left( X=y^{\frac{1}{4}} \right) \\ &=2p\left( y^{\frac{1}{4}} \right) \mathrm{d}y^{\frac{1}{4}}=\frac{1}{2}y^{-\frac{3}{4}}p\left( y^{\frac{1}{4}} \right) \mathrm{d}y=\frac{1}{2\sqrt{2\pi}}y^{-3/4}\exp \left( -\frac{y^{1/2}}{2} \right) . \end{aligned}

  1. 下列四个说法中, 哪个说法是错误的( \quad )
    A. 离散系数越小, 数据越分散
    B. 异众比率越小, 数据越集中
    C. 极差会受极端值影响
    D. 四分位差不是用于分类数据

Solution: A.

  1. 研究在雨天的路上和晴天的路上的刹车距离, 20辆车在两个路上进行测试, 测得雨天的刹车标准差是 45 , 晴天的是 25 , 假设刹车距离均为正态分布, 且雨天刹车距离的方差为 σ12\sigma_1^2 , 晴天刹车距离的方差为 σ22\sigma_2^2 , 检验问题:

H0:σ12σ221H1:σ12σ22>1H_0: \frac{\sigma_1^2}{\sigma_2^2} \leq 1 \leftrightarrow H_1: \frac{\sigma_1^2}{\sigma_2^2}>1

()(\quad) (分位数: F0.05(19,19)=2.17F_{0.05}(19, 19)=2.17 )
A. 拒绝原假设
B. 不拒绝原假设
C. 拒绝不拒绝都可以
D. 无法确定

Solution: B.

F=S12S22=4525=1.8<F0.05(19,19)F=\frac{S_1^2}{S_2^2}=\frac{45}{25}=1.8<F_{0.05}(19, 19) , 因此不拒绝原假设, 选 B.

  1. 假设随机变量 XN(0,36),YN(1,25),ρ(X,Y)=0.8X \sim N(0, 36) , Y \sim N(1, 25) , \rho(X, Y)=0.8 , 求 Var(2XY)\operatorname{Var}(2 X-Y)=( \quad ).
    A. 73
    B. 144
    C. 25
    D. 169

Solution: A.

直接计算, 有

Var(2XY)=4Var(X)+Var(Y)4Cov(X,Y)=144+2540.856=73\begin{aligned} \operatorname{Var}(2 X-Y) & =4 \cdot \operatorname{Var}(X)+\operatorname{Var}(Y)-4 \operatorname{Cov}(X, Y) \\ & =144+25-4 \cdot 0.8 \cdot 5 \cdot 6 \\ & =73 \end{aligned}

  1. 假设总体正态, 样本量是 16 , 样本均值是 7.3 , 样本方差是 0.64 , 想要研究均值是否显著小于7.5, 下列正确的是( \quad )
    A. 原假设是大于等于7.5, 检验统计量的形式是 4xˉ7.5s4 \frac{\bar{x}-7.5}{s}
    B. 原假设是小于等于 7.5 , 检验统计量的形式是 4xˉ7.5s4 \frac{\bar{x}-7.5}{s}
    C. 原假设是小于等于 7.5 , 检验统计量的形式是 xˉ7.50.8\frac{\bar{x}-7.5}{0.8}
    D. 原假设是大于等于 7.5 , 检验统计量的形式是 xˉ7.50.2\frac{\bar{x}-7.5}{0.2}

Solution: A.

D虽然数据对上了, 但检验统计量的形式不是统一形式.

  1. 假设总体 XX , 样本均值和样本方差分别为 Xˉ\bar{X}S2S^2 , 下列正确的是( \quad )
    A. SSσ\sigma 的无偏估计
    B. SSσ\sigma 的极大似然估计
    C. SSσ\sigma 的一致估计
    D. SSσ\sigma 独立

Solution: C.

我们知道 S2S^2 无偏, 故根据 Jensen不等式, SS 不是无偏的, A 错;
题目没有给分布, B 错;
D 只有在正态情形正确, 故 D 错.
对于 C, 首先 S2Pσ2S^2 \xrightarrow{P} \sigma^2, 利用依概率收敛对连续函数保持不变, 有 SPσS \xrightarrow{P} \sigma.

  1. 假设 XN(0,1)X \sim N(0, 1), 常数 x<0x<0 , 求 P(x<XX0)=()\mathbb{P}(x<X \mid X \leq 0)=(\quad)
    A. 2Φ(x)12\Phi \left( -x \right) -1
    B. Φ(x)1\Phi \left( -x \right) -1
    C. Φ(x)1/2\Phi \left( -x \right) -1/2
    D. 2Φ(x)1/22\Phi \left( -x \right) -1/2

Solution: A.

直接计算

P(X>xX<0)=P(x<X<0)P(X<0)=2(Φ(0)Φ(x))=12Φ(x)=2Φ(x)1.P\left( X>x|X<0 \right) =\frac{P\left( x<X<0 \right)}{P\left( X<0 \right)}=2\left( \Phi \left( 0 \right) -\Phi \left( x \right) \right) =1-2\Phi \left( x \right) =2\Phi \left( -x \right) -1.

  1. 泊松分布 P\mathcal{P} 的C-R下界是多少? ( \quad )
    A. nλ\frac{n}{\lambda}
    B. 1nλ\frac{1}{n \lambda}
    C. λn\frac{\lambda}{n}
    D. 1nλ2\frac{1}{n \lambda^2}

Solution: C. I(λ)=E[2fλ2]=1λ\mathrm{I}(\lambda)=E\left[-\frac{\partial^2 f}{\partial \lambda^2}\right]=\frac{1}{\lambda}, 故 CR 下界为 λn\frac{\lambda}{n}.

  1. 总体 XN(μ,14)X \sim N\left(\mu, \frac{1}{4}\right) , 要求满足 P(Xˉμ<0.1)0.95\mathbb{P}(|\bar{X}-\mu|<0.1) \geq 0.95 的最小样本量( \quad ) (分位数: z0.95=1.64,z0.975=1.96z_{0.95}=1.64, z_{0.975}=1.96 )
    A. 68
    B. 67
    C. 97
    D. 96

Solution: C.

P(Xˉμ<0.1)=P(N(0,1)<0.2n)0.95P(|\bar{X}-\mu|<0.1)=P(|N(0, 1)|<0.2 \sqrt{n}) \geq 0.95 , 因此 0.2n1.960.2 \sqrt{n} \geq 1.96 , 解得 n96.04n \geq 96.04 , 选 C.

  1. (暂无题目, 有回忆者可以联系大师兄)

  2. (暂无题目, 有回忆者可以联系大师兄)

  3. 进行满意度调查, 结果如下:

性别/满意度 满意 一般 行和
男生 180 120 300\mathbf{3 0 0}
女生 130 70 200\mathbf{2 0 0}
列和 310 190 500\mathbf{5 0 0}

求男生女生满意的行百分比( \quad )
A. 60%60 \%, 65%65 \%
B. 33.3%33.3 \%, 30%30 \%
C. 58%58 \%, 42%42 \%
D. 62.07%62.07 \%, 37.93%37.93 \%

Solution: A.

  1. 关于列联表, 下列说法正确的是( \quad )
    A. φ\varphi 相关系数适用于所有的列联表
    B. φ\varphi 相关系数是 VV 相关系数的特殊情况
    C. cc 相关系数取值在 [0,1][0, 1] 的所有值
    D. φ\varphi 相关系数取值在 [0,1][0, 1] 的所有值

Solution: B.

  1. 调整后的多重判定系数为 0.70.7, n=10n=10, k=3k=3, 则 R2R^2=( \quad ).
    A. 0.85
    B. 0.75
    C. 0.25
    D. 0.8

Solution: D.

Ra2=1n1nk1R2R_a^2 = 1- \frac{n-1}{n-k-1} R^2, 解出 R2=0.8R^2=0.8.

  1. 样本量 n=36n=36, 回归方程 y=β0+β1x1+β2x2+β3x3+β4x4y=\beta_0+\beta_{1} x_1+\beta_2 x_{2}+\beta_3 x_{ 3}+\beta_4 x_4, 得到估计的回归方程:
    y^=6.8+β^1x1+1.2x2+β^3x3\hat{y}=6.8+\hat{\beta}_1 x_1+1.2 x_2+\hat{\beta}_3 x_3, 且 β^2\hat{\beta}_2 的标准误是 0.30.3, t0.025(32)=2.036933t_{0.025}(32)=2.036933 , 则 ()(\quad)
    A. 线性关系显著
    B. 无多重共线性
    C. X2X_2YY 显著
    D. X1X_1YY 显著

Solution: A, C.

这里 t2=1.20.3=4>t0.025(32)t_2=\frac{1.2}{0.3}=4>t_{0.025}(32), 拒绝原假设, 因此 X2X_2YY 是显著的. 如果模型中至少有一个变量显著, 则模型自身也是显著的. 而对于 B 和 D, 没有其他信息的情况下无法判断.

  1. 某品牌手机销售量是先增长缓慢, 再突然暴增, 再增长缓慢至饱和, 请问用什么曲线进行拟合?( \quad )
    A. 指数曲线
    B. 修正过后的指数曲线
    C. 三次曲线
    D. 逻辑斯蒂曲线

Solution: D.

这种曲线符合种群人口增长的模型, 同时可以发现 A、B、C都是无界的, 只有 D 有界满足题设的饱和.

  1. 季节指数, 1.1,0.8,0.9,1.21.1 , 0.8 , 0.9 , 1.2 , 预测方程 Yt=6000+200tY_t=6000+200 t, 2023年第三季度的值是 9000, 求2024年第一季度的预测值是( \quad )
    A. 11440
    B. 7000
    C. 10340
    D. 9400

Solution: A.

90000.9+2002=10400\frac{9000}{0.9} + 200 \cdot 2 = 10400, 再乘上季节指数 1.1 得 A.

二、简答题(每题10分, 共40分)

  1. 序列 Y1,,YnY_1, \ldots, Y_n 预测: 什么是指数平滑? 什么是二次指数平滑? 结合指数平滑和二次指数平滑, 以序列举例进行预测.

Solution: 指数平滑和二次指数平滑是时间序列分析中用于预测的两种技术. 它们通过给历史数据不同的权重来预测未来的值.

一次指数平滑(Simple Exponential Smoothing):
指数平滑是一种预测技术,适用于没有明显趋势和季节性的时间序列. 它通过对最近的数据给予更大的权重,并对更早的数据给予递减的权重来计算平滑值. 指数平滑的公式

St=αYt+(1α)St1 S_t = \alpha Y_t + (1 - \alpha) S_{t-1}

其中,StS_t 是时刻 tt 的平滑值,YtY_t 是时刻 tt 的实际观测值,α\alpha 是平滑参数(0<α10 < \alpha \leq 1).

二次指数平滑(Double Exponential Smoothing):
二次指数平滑适用于有趋势但没有季节性的时间序列. 它的公式包括两个方程:

St=αYt+(1α)(St1+Tt1)Tt=β(StSt1)+(1β)Tt1\begin{aligned} S_t &= \alpha Y_t + (1 - \alpha)(S_{t-1} + T_{t-1}) \\ T_t &= \beta (S_t - S_{t-1}) + (1 - \beta) T_{t-1} \end{aligned}

其中,StS_t 是时刻 tt 的平滑值,TtT_t 是时刻 tt 的趋势项,YtY_t 是时刻 tt 的实际观测值,α\alphaβ\beta 是平滑参数.

  1. 为了研究户型、房价指数、房东收入对二手房价的影响, 其中如果户型是三室两厅记作 11, 两室两厅记作 00, 请你建立线性回归方程并检验模型是否显著.

Solution: 为了研究二手房价(YY)与户型 X1X_1、房价指数(X2X_2)和房东收入(X3X_3)的关系,我们建立以下多元线性回归模型:

Y=β0+β1X1+β2X2+β3X3+ε Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3 + \varepsilon

其中,X1X_1 是一个虚拟变量,表示户型, 模型中,β0\beta_0 是截距,β1,β2,β3\beta_1, \beta_2, \beta_3 分别是与 X1,X2,X3X_1, X_2, X_3 相关的系数,而 ε\varepsilon 代表误差项. 为了检验模型的显著性,我们通常进行以下两种检验:(i) F检验(整体显著性检验):检验模型中所有自变量对因变量的联合影响是否显著. (ii) t检验(单个系数的显著性检验):检验模型中每个自变量对因变量的独立影响是否显著.

  1. 设有总体指数分布 Xf(x;θ)=1θex/θX\sim f(x;\theta) = \frac{1}{\theta} e^{-x/\theta} 的三个样本 X1,X2,X3X_1,X_2,X_3, 找出 α\alpha 使 αX(1)+(1α)X(3)\alpha X_{(1)} + \left(1-\alpha\right) X_{(3)}θ\theta 的无偏估计.

Solution: 对于指数分布, 我们有结论: E(X(1))=1nE(X)E(X_{(1)})=\frac{1}{n}E(X), E(X(n))=(1+12++1n)E(X)E(X_{(n)})=\left(1+\frac{1}{2}+\cdots+\frac{1}{n}\right)E(X), 因此这里 E(X(1))=13θE(X_{(1)}) = \frac{1}{3} \theta, E(X(3))=116θE(X_{(3)})=\frac{11}{6}\theta, 故有 α=59\alpha = \frac{5}{9}.

  1. 似然比检验,假设总体 XN(μ,σ2)X \sim N\left(\mu, \sigma^2\right), 给出检验问题:

H0:μ=μ0vsH1:μμ0H_0: \mu=\mu_0 \quad \mathrm{vs} \quad H_1: \mu \neq \mu_0

的似然比检验.

Solution: 茆书例题 7.4.1 原题.

三、计算题(前2题每题15分, 第3题20分, 共50分)

  1. (XY)N((00),(1ρρ4))\left( \begin{array}{c} X\\ Y\\ \end{array} \right) \sim N\left( \left( \begin{array}{c} 0\\ 0\\ \end{array} \right) ,\left( \begin{matrix} 1& \rho\\ \rho& 4\\ \end{matrix} \right) \right), ρ(2,2)\rho \in (-2,2), 求 P(X0,Y0)P(X \ge 0, Y \ge 0).

Solution: 这是复旦432-2022-第五题原题. 利用 (X,Y)(X,Y)(X,Y)(-X,-Y) 同分布, 有

P(X0,Y0)=P(X0,Y0),P\left( X\ge 0,Y\ge 0 \right) =P\left( -X\ge 0,-Y\ge 0 \right) ,

这两个事件并起来恰好意味着 XX, YY 同号. 因此 P(X0,Y0)=12P(XY0)=12P(YX0)P\left( X\ge 0,Y\ge 0 \right) =\frac{1}{2}P\left( XY\ge 0 \right) =\frac{1}{2}P\left( \frac{Y}{X}\ge 0 \right), 作独立变换, 找合适的 WW 使得 Y=ρX+4ρ2WY= \rho X +\sqrt{4-\rho^2} W, 同时恰好 (X,W)N(0,0;1,1;0)(X,W)\sim N(0,0;1,1;0), 因此有

P(YX0)=P(ρ+4ρ2WX0)=P(WXρ4ρ2)=F(ρ4ρ2),P\left( \frac{Y}{X}\ge 0 \right) =P\left( \rho +\sqrt{4-\rho ^2}\frac{W}{X}\ge 0 \right) =P\left( \frac{W}{X}\ge -\frac{\rho}{\sqrt{4-\rho ^2}} \right) =F\left( \frac{\rho}{\sqrt{4-\rho ^2}} \right) ,

这里 FF 是标准柯西分布分布函数, 且用到了 P(WXx)=P(WXx)P\left( \frac{W}{X}\ge -x\right)=P\left( \frac{W}{X}\le x\right), 因此不难求出

P(X0,Y0)=14+12πarctanρ4ρ2=14+12πarcsinρ.P\left( X\ge 0,Y\ge 0 \right) =\frac{1}{4}+\frac{1}{2\pi}\mathrm{arc}\tan \frac{\rho}{\sqrt{4-\rho ^2}}=\frac{1}{4}+\frac{1}{2\pi}\mathrm{arc}\sin \rho.

  1. 设有来自 N(0,σ2)N\left(0, \sigma^2\right) 的简单随机样本 X1,,XnX_1, \cdots, X_n, 记 σ^=i=1nwiXi\hat{\sigma}=\sum_{i=1}^n w_i\left|X_i\right|, 求最优权重 wiw_i 使得 σ^\hat{\sigma} 是无偏估计且的方差最小.

Solution: 首先 E(X)=2πσE(|X|)=\frac{\sqrt{2}}{\sqrt{\pi}}\sigma, E(X2)=σ2E(|X|^2)=\sigma^2. 因此需要满足 i=1nwi=2π\sum_{i=1}^n w_i = \frac{\sqrt{2}}{\sqrt{\pi}}, 这也意味着: 令 Zi=2πXiZ_i = \frac{\sqrt{2}}{\sqrt{\pi}} |X_i|, 其中 E(Z)=σE(Z)=\sigma, 找最优权重 lil_i, 满足 i=1nli=1\sum_{i=1}^n l_i =1, 使其方差最小.

实际上不难看出, 对于 i.i.d. 样本, l1=l2==ln=1/nl_1=l_2=\cdots=l_n=1/n 时, 方差最小, 证明是简单的: 用柯西-施瓦茨不等式,

Var(i=1nliZi)=σz2i=1nli2=σz21ni=1nli2i=1n12σz21n(i=1nli1)2=σz2n,Var\left( \sum_{i=1}^n{l_iZ_i} \right) =\sigma _{z}^{2}\sum_{i=1}^n{l_{i}^{2}}=\sigma _{z}^{2}\frac{1}{n}\sum_{i=1}^n{l_{i}^{2}}\sum_{i=1}^n{1^2}\ge \sigma _{z}^{2}\frac{1}{n}\left( \sum_{i=1}^n{l_i\cdot 1} \right) ^2=\frac{\sigma _{z}^{2}}{n},

当且仅当 l1=l2==ln=1/nl_1=l_2=\cdots=l_n=1/n 时取等, 此时 wi=2nπw_i=\frac{\sqrt{2}}{n\sqrt{\pi}}.

当然, 也可以用拉格朗日乘数法.

  1. 有来自总体 U(0,θ)U(0,\theta) 的简单随机样本 X1,,XnX_1,\cdots,X_n. 其次序统计量是 X(1)X(n)X_{(1)}\le \cdots \le X_{(n)}.
    (1) 求 X(k)X_{(k)} 的概率密度, 期望、方差.
    (2) 证明 n(1X(n)θ)n\left(1-\frac{X_{(n)}}{\theta}\right) 按分布收敛于 Exp(1)(1).
    (3) 求 θ\theta95%95 \% 的渐近置信区间. (用渐近分布)
    (4) 给出 H0:θ1vsH1:θ>1H_0: \theta \le 1 \quad \mathrm{vs} \quad H_1: \theta >1 的渐近拒绝域.

Solution: (1) 利用均匀分布次序统计量结论, 有 X(k)θBe(k,n+1k)\frac{X_{(k)}}{\theta} \sim Be(k,n+1-k), 因此有

pk(x)=n!(k1)!(nk)!1θnxk1(θx)nk,0<x<θ.p_k\left( x \right) =\frac{n!}{\left( k-1 \right) !\left( n-k \right) !}\frac{1}{\theta ^n}x^{k-1}\left( \theta -x \right) ^{n-k},\quad 0<x<\theta.

期望是 E(X(k))=kn+1θE(X_{(k)})=\frac{k}{n+1} \theta, Var(X(k))=k(nk+1)θ2(n+2)(n+1)2Var\left(X_{(k)}\right)=\frac{k(n-k+1) \theta^2}{(n+2)(n+1)^2}.

(2) 直接求分布函数即可, 有

P(n(1X(n)θ)>x)=P(1X(n)θ>xn)=P(X(n)θ<1xn)=(1xn)nex,P\left( n\left( 1-\frac{X_{\left( n \right)}}{\theta} \right) >x \right) =P\left( 1-\frac{X_{\left( n \right)}}{\theta}>\frac{x}{n} \right) =P\left( \frac{X_{\left( n \right)}}{\theta}<1-\frac{x}{n} \right) =\left( 1-\frac{x}{n} \right) ^n\rightarrow e^{-x},

因此 P(n(1X(n)θ)x)1exP\left( n\left( 1-\frac{X_{\left( n \right)}}{\theta} \right) \le x \right) \rightarrow 1-e^{-x}, 这确实是 Exp(1)(1).

(3) 单侧双侧都可以, 最好是单侧, 因为 θ\theta 应该在形如 [X(n),c][X_{(n)},c] 的区间中更合理. 我们有

P(0<n(1X(n)θ)<ln(0.05))0.95,P\left( 0<n\left( 1-\frac{X_{\left( n \right)}}{\theta} \right) <-\ln \left( 0.05 \right) \right) \approx 0.95,

通过反解得到置信区间

[X(n),X(n)1+1nln(0.05)].\left[ X_{\left( n \right)},\frac{X_{\left( n \right)}}{1+\frac{1}{n}\ln \left( 0.05 \right)} \right].

(4) 拒绝域形式应是 W={X(n)>c}W=\{X_{(n)}>c\}, 注意原假设时 θ=1\theta =1, 我们表示为

W={X(n)>c}={n(1X(n))<n(1c)},W=\left\{ X_{\left( n \right)}>c \right\} =\left\{ n\left( 1-X_{\left( n \right)} \right) <n\left( 1-c \right) \right\},

因此为使得水平为 α\alpha, 应有 n(1c)ln(1α)n(1-c)\approx -\ln (1-\alpha), 即 c1+ln(1α)nc \approx 1+\frac{\ln \left( 1-\alpha \right)}{n}, 故拒绝域可以是

W={X(n)1+ln(1α)n}W=\left\{ X_{\left( n \right)}\ge 1+\frac{\ln \left( 1-\alpha \right)}{n} \right\}

或者直接是 W={n(1X(n))ln(1α)}W=\left\{ n\left( 1-X_{\left( n \right)} \right) \le -\ln \left( 1-\alpha \right) \right\}.