中国科学技术大学-432统计学-2023年

一、填空题(每题5分,共50分)

  1. 投掷硬币 nn 次, 已知正面出现了 kk 次, 则前两次是正面的概率是 \underline{\qquad}.

  1. 设有三角形 ABCABC, 某人最开始站在 AA 点, 随机的向另外两个点走去, 随后每次如此, 问第 nn 次他走向 AA 点的概率是 \underline{\qquad}.

  1. 已知将 A,B,CA,B,C 三个子母输入信道, 输出正确的概率是 0.80.8, 输出为其他字母的概率是 0.1,0.10.1,0.1. 现在, 等概率地输入 AAAA,BBBB,CCCCAAAA,BBBB,CCCC, 且观测到 ACBAACBA, 问输入是 AAAAAAAA 的概率为 \underline{\qquad}.

  1. 检验的 pp 值是否为统计量? \underline{\qquad}.

  1. 下列说法正确的个数是 \underline{\qquad}.
    (1) R2R^2 越小说明方程的拟合越好;
    (2) R2R^2 越大说明方程的拟合越好;
    (3) 残差 e=y^ye=\hat{y}-y 越大说明方程的拟合越好;
    (4) 残差分析图中, 点的分布越平稳说明方程的拟合越好, 且点分布带状图越窄, 说明拟合精度越高.

  1. 对任意三角形 ABCABC 内部取一点 PP, 在 BCBC 上取 QQ, 则直线 PQPQABAB 相交的概率是 \underline{\qquad}.
    A. 12\frac{1}{2}
    B. BCAB+BC\frac{|BC|}{|AB|+|BC|}
    C. BC2AB+BC\frac{|BC|^2}{|AB|+|BC|}
    D. AB+AC+BC2AB+AC+BC\frac{|AB|+|AC|+\frac{|BC|}{2}}{|AB|+|AC|+|BC|} 不确定

  1. X1,,X9X_1,\cdots,X_9 是 i.i.d. 的 N(0,1)N(0,1) 随机变量, 下列正确的是 \underline{\qquad}.
    A. X12+X22+X32X42++X92F(3,6)\frac{X_1^2+X_2^2+X_3^2}{X_4^2+\cdots+X_9^2}\sim F(3,6)
    B. 2X12+X22+X32X42++X92F(3,6)2\frac{X_1^2+X_2^2+X_3^2}{X_4^2+\cdots+X_9^2}\sim F(3,6)
    C. X12X12+X22F(1,2)\frac{X_1^2}{X_1^2+X_2^2} \sim F(1,2)
    D. 2X12X12+X22F(1,2)\frac{2X_1^2}{X_1^2+X_2^2} \sim F(1,2)

  1. 已知 XP(λ)X\sim \mathcal{P}(\lambda), YP(μ)Y\sim \mathcal{P}(\mu), 且它们独立, 求 E(XX+Y=n)=E(X|X+Y=n)=\underline{\qquad}.

  1. CLT,忘了,比较简单

  1. 忘了

二、计算分析题

  1. (25分) 已知 Xf(x)=12e12x,x>0X\sim f(x)=\frac{1}{2}e^{-\frac{1}{2}x},x>0, YU(0,1)Y\sim U(0,1), 且它们独立.
    (1) 求联合密度 f(x,y)f(x,y);
    (2) 求 Z=X+YZ=X+Y 的密度函数;
    (3) 求 t2+2Xt+Y=0t^2+2Xt+Y=0 有实根的概率, 保留 3 位小数.

  1. (10分) 假设检验问题: 给出两组正态总体数据 X,YX,Y.
    (1) 检验 H0:σ12=σ22H_0:\sigma_1^2 =\sigma_2^2;
    (2) 检验 H0:μ1=μ2H_0:\mu_1=\mu_2.

  1. (25分) 有来自总体 f(x,a)=2xa2,0<x<af(x,a)=\frac{2x}{a^2},0<x<a 的 i.i.d. 样本 x1,,xnx_1,\cdots,x_n, 已知 a>1a>1.
    (1) 求 aa 的矩估计 a^1\hat{a}_1, 最大似然估计 a^2\hat{a}_2, 以及 P(0<X<a)P(0<X<\sqrt{a}) 的MLE;
    (2) a^1\hat{a}_1, a^2\hat{a}_2 是否为无偏估计, 若不是请修正;
    (3) 求 n(aa^2)n(a-\hat{a}_2)nn\to \infty 的渐近分布.

  1. (15分) 叙述题:(1) 叙述多重共线性的定义;
    (2) 如何判断多重共线性:
    (3) 如何消除多重共线性:
    (4) 叙述自变量的选择标准.

  1. (25分) 设有来自 f(x;λ)=λeλxf(x;\lambda)=\lambda e^{-\lambda x} 指数分布的 i.i.d. 样本 x1,,xnx_1,\cdots,x_n, 但由于某种原因只能观测到 Ai=I{ai<xi<bi}A_i=I_{\{a_i<x_i<b_i\}}, 其中 ai,bia_i,b_i 是给定常数, i=1,2,,ni=1,2,\cdots,n.
    (1) 写出 (A1,,An)(A_1,\cdots,A_n) 对应的对数似然函数 A(λ)\ell_A(\lambda), 同时写出完整样本 (x1,,xn)(x_1,\cdots,x_n) 对应的对数似然函数 X(λ)\ell_X(\lambda);
    (2) 写出基于 A(λ)\ell_A(\lambda) 所求 MLE 满足的等式;
    (3) 分别考虑两个步骤:
    (i) E 步: 考虑 XExp(λk)X\sim Exp(\lambda_k), 求条件期望

Q(λλk)=E[X(λ)A,λk],Q(\lambda|\lambda_k) = E[\ell_X(\lambda)|A,\lambda_k],

(ii) M 步: 极大化 Q(λ)Q(\lambda), 即

λk+1=argmaxλQ(λλk).\lambda_{k+1} =\underset{\lambda}{\mathrm{argmax}} Q(\lambda|\lambda_k).

(4) 证明: 通过两个步骤迭代得到的序列 λnλ^\lambda_n \to \hat{\lambda}, 其中 λ^\hat{\lambda} 是基于 A(λ)\ell_A(\lambda) 求得的 MLE. (提示:和 ai,bi,λk,λ0a_i,b_i,\lambda_k,\lambda_0 有关)