中国科学技术大学-432统计学-2018年
一、(12分) 设 是一个非负随机变量的概率密度函数, 定义
问 是否是一个二维随机向量的概率密度函数?
Solution: 由于 为非负随机变量的概率密度函数, 则有 , 且 , 所 以 满足非负性, 此外
所以 满足正则性, 综上所述 是一个二维随机向量的概率密度函数.
二、(14分) 设 为常数. 定义 求 的分布.
Solution: 先求 的分布函数, 由全概率公式, 有
按照 的取值进行分类:
(i) , 则
(ii) , 则
(iii) , 则
综上所述有 .
三、(14分) 一个盒子由 个白球, 个黑球和 个红球, 现不放回地依次取出一球, 求白球先于黑球被取出的概率,并证明该概率与 无关.
Solution: 用事件 表示初始时刻盒中有 个红球, 最终白球先于黑球被取出; 用事件 分别表示第一次抽出红、白、黑球, 则显然有 .
假设 , 则由全概率公式有
则由数学归纳法知 , 与 无关.
四、(16分) 设 是来自同一总体的简单随机样本, 总体的 概率密度是 ,
试证明: 对任意 与 相互独立, 并求他们各自的边缘概率密度函数.
Solution: 总体的密度函数是 , 根据次序统计量联合分布的公式, 的联合密度函数是, 对于
作变换 , 雅各比行列式 , 于是
的密度函数是, 对于 , 即 , 有
由于联合密度的变量可分离, 可看出 相互独立, 其中 的密度函数是
其中 是一个正则化常数, 由于
所以 , 这便是 的 密度函数. 而 的边际密度函数是好求的, 直接根据公式, 它是
五、(16分) 设 , 定义
(1) 求 ;
(2) 证明 .
Solution: (1) 由于 , 故 , 于是
所以 .
(2)构建正交矩阵
该矩阵仅给出了前 2 行, 后 行只需保证 满足正交性即可, 这样的矩阵是一定存 在的(因为我们可以任取其余 个与 的前 2 个行向量线性无关的向量, 再利用施密特 正交化的方法给出 的后 行).
记随机向量 , 作线性变换 , 由 于 , 则 , 其中特别的有
需要特别指出的是,从 的协方差矩阵可以看出, 的各个分量之间都是独立的,并 且除了 之外, 其余的 都服从均值为 0 , 方差为 的正态分 布, 其中方差为 是显然的, 关于均值为 0 , 记
其中 是与 的第二行向量正交的, 即 , 于是
同时, . 再由正交矩阵的性质注意到 , 就有
所以 , 它仅仅是 的函数, 所 以它与 (即 )独立, 并且 . 又 , 所以
六、(24分) 一种型号的电子元件寿命的分布函数是
均为未知参数.现取该型号原件 个进行独立测试, 测得寿命分别为
(1) 分别求 和 的矩估计和极大似然估计;
(2) 所求极大似然估计是否为无偏估计? 若不是无偏估计,则请基于该极大似然估计构造出 和 的无偏估计.
Solution: (1) 作总体变换, 有 i.i.d , 由指数分布性质:
用样本矩替代总体矩, 反解得参数的矩估计, 即
再求极大似然估计, 似然函数为
似然函数关于 是 上的单调递减函数, 因此可以看出 的极大似然估计 是 , 再将似然函数取对数并关于 求偏导置 0 , 可解得 的似然方程, 即
代入 解得, 是 的极大似然估计.
(2) 由指数最小值分布结论可知 , 故:
所以它们均不是无偏估计. 可构造出下面两个无偏估计,
七、(12分) 设 和 分别为未知参数 的两个无偏估计, 方差有限且大于 0, 假设 问是否可以基于 和 构造出一个 的无偏估计 , 且满足
Solution:
令 , 于是 为 的无偏估计, 则
为方便起见, 记
于是, 令 , 即
其中二次项系数 , 即二次函数 的开口向上,
又判别式
所以 有两个零点, 则我们取其对称轴, 即 , 就必定有 , 即 , 所以取
就有 .
八、(20分) 某减肥机构称其疗程可使参加者平均减少体重 以上,为检验广告是否可信,随机调查了 10 名参加者,数据 (kg):
假设参加前后体重均服从正态分布.
(1) 在显著性水平为 下检验宣传是否可信;
(2) 给出平均减少体重的 95%的置信区间.
Solution:
(1) 根据题意, 应采取成对数据的假设检验来消除个人差异引起的随机误差.
用随机变量 分别表示第 名参与者参加前后的体重, 并设
考虑假设检验问题,
检验统计量为: ;
检验的拒绝域是 .
则 , 所以我们不能拒绝原假设, 即宣传不可信.
(2)取枢轴量 , 由于
反解可得到 的置信区间 , 代入数据可得:
九、(22分)观察三种药物 A、B、C 治疗 200 例心绞痛的疗效,数据:
显著 | 有效 | 无效 | 合计 | |
---|---|---|---|---|
A | 15 | 37 | 7 | 59 |
B | 11 | 48 | 13 | 72 |
C | 16 | 39 | 14 | 69 |
合计 | 42 | 124 | 34 | 200 |
用列联表分析判断这三种药物的疗效有无显著性差异. 检验水平 )
Solution:
独立情况下的理论样本数
显著 | 有效 | 无效 | |
---|---|---|---|
A | |||
B | |||
C |
考虑假设检验问题
:三种药物无显著性差异 v.s. :三种药物有显著性差异
检验统计量 , 拒绝域为 , 所以 , 因此我们没有足够理由 拒绝原假设, 故可以认为三种药物无显著差异.