北京师范大学-432统计学-2024年
一、(30分) 试卷中给出了一组数据.
(1) 求该组数据 分位数的表达式.
(2) 用两种盒形图描述以上数据, 并说明主要数值的具体含义.
(3) 设 , 且 , 定义 , 证明:
并解释该等式的含义.
二、(30分) 袋中有 个编号为 的小球, 随机取 个.
(1) 写出该问题的概率空间.
(2) 设 , 举例分别满足以下的事件 :
(a) ;
(b) ;
(c) ;
(d) 两两独立, 但不相互独立.
(3) 设袋中有 个红球, 个白球, 假设每次从袋中有放回去取一个球, 直到摸到第 个红球停止, 此时次数为 , 求 的分布列和期望.
三、(30分) 有来自 的随机样本 .
(1) 求 的 MLE, 判断其无偏性.
(2) 求 的矩估计.
(3) 在某次拍卖会, 甲、乙、丙对一件物品竞拍, 每人出价一次, 价高者得. 且已知甲如果买下该商品, 将以 8 万元转卖. 现在甲知道乙、丙的出价均独立服从 , 请问甲如何出价使得期望收益最大?
四、(30分) (1) 作出原假设的依据是什么? 原假设和备择假设的地位是否等同?
(2) 以正态分布为例, 简述置信区间和假设检验的区别和联系.
(3) 现有 81 个学生的成绩, 假设其来自于正态分布 , 且样本均值 , 样本标准差 , . (可能用到的分位数: , , ) 请回答下述问题:
(a) 能否认为 ?
(b) 求 的置信区间.
(c) 能否认为 ?
五、(20分) 现有回归模型 .
(1) 写出判定系数 的表达式并解释含义.
(2) 请画出方差分析表. (表中写出各种量的公式)
(3) 对于给定的第 组数据 , 如何判断它对模型的影响力?
(4) 对于样本 和 , 这两点连成的斜率是 , 其中 , , 证明: 的某一线性组合是 的最小二乘估?
六、(10分) 设 独立, 且期望都是 , 方差是 , 定义
(1) 求 的自协方差函数;
(2) 对于自协方差函数 , 如果对任意 , 对任意序列 , 有 , 则称自协方差函数非负定, 证明: (1) 中的自协方差函数非负定.
(3) 样本自协方差函数是
证明样本自协方差矩阵
是非负定的.