北京大学数院-856大数据-2025年

  1. nn 个人随机选三门课,求至少有一门课没人选的概率。(15分)

  2. 随机变量(X,Y)N(u1,u2,σ12,σ22,ρ)(X,Y)\sim N(u_1,u_2,\sigma_1^2,\sigma_2^2,\rho), U=X+CYU=X+CY,V=YCYV=Y-CY,求(U,V)(U,V)的分布,并求U,VU,V独立时,CC的值。(15分)

  3. X1,X2,,XniidN(u,1λ)X_1, X_2, \ldots, X_n \overset{\text{iid}}{\sim} N(u,\frac{1}{\lambda}),u已知,且有λGamma(α,β)\lambda \sim Gamma(\alpha,\beta),其中f(λα,β)=Γ(α+β)Γ(α)Γ(β)λα1exp(βλ)f(\lambda|\alpha,\beta) =\frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}\lambda^{\alpha-1}exp(-\beta\lambda) ,求λX\lambda |\vec{X}E(λX)E(\lambda| \vec{X})。(20分)

  4. X1,X2,,XmiidN(u1,σ2)X_1, X_2, \ldots, X_m \overset{\text{iid}}{\sim} N(u_1, \sigma^2),Y1,Y2,,YniidN(u2,σ2)Y_1, Y_2, \ldots, Y_n \overset{\text{iid}}{\sim} N(u_2, \sigma^2),其中σ2\sigma^2未知,求u1Cu2u_1-Cu_21α1-\alpha的置信区间,CC为常数。(20分)

  5. Yi=βxi+ϵiY_i = \beta x_i + \epsilon_i,i=1,...,ni =1,...,n,其中ϵiiidN(0,σ2)\epsilon_i \overset{\text{iid}}{\sim} N(0,\sigma^2)
    (1)求β^MSE\hat{\beta}_{MSE},给出σ2\sigma^2的一个无偏估计。(5分)
    (2)求β\beta1α1-\alpha的置信区间。(5分)
    (3)设y0=β^X0+ϵ0y_0 = \hat{\beta}X_0 + \epsilon_0ϵ0ϵi\epsilon_0 \text{与} \epsilon_i独立,给出y0y_01α1-\alpha的预测区间。(10分)

  6. (1)比较顺序查找、折半查找和散列查找,并说明为什么有散列和二分这种快速查找还需要顺序。(5分)
    \quad(2)比较栈和队列。(5分)
    \quad(3)说说B+B_{+}树与BB树相比的优点。(5分)

  7. 开放地址法建立散列表。(15分)

  8. 给出Kruskal建边的顺序。(15分)

  9. 写出堆排序的代码,并说明堆排序是否稳定。(15分)