中国科学技术大学-432统计学-2019年
一、填空题(每题5分, 共50分)
- 有一个信号系统, 输入 0 而输出 1 的可能性为 , 输入 1 而输出 0 的可能性为 0.02; 输入 0 和 1 的概率都是 , 那么输出结果为 0 时, 这个信号是真实的概率是 .
Solution:
用事件 表示“输入 0 ”, 用事件 表示“输出 0”, 则根据题意有
所以信号真实的概率为
- 若 是密度函数, 则 .
Solution:
根据概率密度函数的正则性有
解得 .
- 甲乙对弈, 任意一局甲赢的概率是 , 乙赢的概率是 . 若赢一局得一分, 谁先比另一人多得两分谁就是赢家, 则甲赢的概率是 .
Solution:
由于比赛规则要求多赢两分即为获胜, 那么总局数一定为偶数局, 所以可以两局一起考
虑: 甲赢两局的概率为 , 乙赢两局的概率为 , 两局为平局的概率为 设甲经过 次平局后胜利, 则甲胜的概率为
- 一根绳子长 4 米, 剪成两段 X和 Y, 则 和 的相关系数是.
Solution: -1
由题意 , 则两者几乎处处存在负的线性关系, 所以两者的相关系数为 .
- 已知泊松分布的参数是 , 若 , 则 .
Solution: 3
已知 , 所以 . 根据 , 即 , 考虑到 , 解得 .
- 某个班级有 6 个女生和 10 个男生, 随机组成 8 个小队进行比赛, 每个小队两个人, 记 为两个人都是女生的小队个数, 则 .
Solution: 1
令 , 则 ,
所以
- 服从标准正态分布, 若记为其分布函数, 令, 则 .
Solution:
正态分布是连续性分布, 于是 i.i.d , 所以
则 .
- 一组简单随机样本 的观测值如下:
若 服从正态分布 , 则 的水平置信区间是.
Solution:
的置信区间是
- 设 是来自正态分布 的简单随机样本, 在 下, 使得样本落入拒绝域 的最小样本容量 为.
Solution: 16
令
解得 , 则最小样本容量为 16 .
- 设 是来自同一正态分布的简单随机样本, , 则 服从的分布是.
Solution:
根据 Fisher 引理知, , 且它们都是 独立的, 于是 .
进一步, 有 .
二、(20分) 设随机变量有概率密度函数 服从两点分布, 的概率为 的概率为 , 设 .
(1) ;
(2) 的概率密度函数.
Solution: (1) 先计算得 , 所以
(2)
先计算 的分布函数, 根据全概率公式
再根据 的取值进行分类:
(i) ;
(ii) ;
(iii) ;
(iv) ;
(v) .
故 的密度函数是
三、(20分) 是来自均匀分布 总体的简单随机样本, 有以下几个估计量 ,.
(1) 若上述三个估计量都是 的无偏估计, 试求 ;
(2) 在(1) 的条件下, 哪个估计量最有效.
Solution: (1) 作总体变换, 令 则有 .
由于三个估计量都是 的无偏估计, 则
(2)
由 知, 最有效.
由 知, 最有效.
四、(20分) 秋名山车队测试了7辆AE86过弯时的速度, 为普通漂移过弯时的速度, 为采用排水渠过弯的速度, 考虑到车性能的差异和车手水平以及测量误差等因素, 我们可以假设 , , 其中参数均未知, 并且诸 独立.
车辆号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
---|---|---|---|---|---|---|---|
(1) 尝试建立成对数据的假设检验, 并判断采用排水渠过弯是否可以显著增加车速(选取显著性水平 );
(2) 令, 证明 服从伯努利分布, 若假设其参数为 , 考虑假设检验问题:
给出该检验的拒绝域, 并判断采用排水渠过弯是否可以显著增加车速(选取显著性水平 ).
Solution: (1) 记 , 考虑假设检验问题
检验统计量是 ,
检验的拒绝域为 .
所以 , 应拒绝原假设, 即可以认为使用排水渠过弯可以增加速度.
(2)
这里 . 计算此时的 值
所以我们无法拒绝原假设, 即认为排水渠过弯不能显著增加车速.
五、(20分) 以下是甲乙工厂生产的同一零件的数据, 其中零件质量分为差, 一般, 好三个等级.
差 | 一般 | 好 | |
---|---|---|---|
甲 | 56 | 40 | 14 |
乙 | 42 | 40 | 18 |
(1) 试给出甲乙两个工厂生产该零件的差品率的极大似然估计;
(2) 在0.05的显著性水平下, 判断甲乙两个工厂的生产水平是否一致.
Solution: (1) 用 分别表示设甲工厂生产的的零件中质量为差、一般、好的个数. 则样本的似 然函数以及对数似然函数为
其中, 分别表示甲工厂生产出差、一般、好的零件的比率; 于是注意到 , 则该模型中可变参数仅仅为 2 个, 令
解得 , 而 .
同理对于乙工厂, 用 分别表示甲工厂生产出差、一般、好的零件的比率,可以 解得极大似然估计, .
(2) 考虑假设检验问题
: 甲、乙两工厂产品质量一致
这其实意味着: 产品质量与加工工厂是独立的. 对应的检验统计量 , 检验的拒绝域是
因此 , 故没有充分理由拒绝原假设, 可以认为甲、乙两工厂产品质量一致.
六、(20分) 考虑一元线性回归模型 其中 , 采集到的数据如下表:
1 | 2 | 3 | 4 | 5 | 6 | 7 | |
---|---|---|---|---|---|---|---|
(1) 试求 以及 的最小二乘估计, 并给出 的估计;
(2) 若 , 在 显著性水平 下求 的区间估计.
Solution:
(1) 的最小二乘估计是
的无偏估计是 .
代入数据计算 .
(2) 由于 , 选取
作为枢轴量, 则可解得 的置信区间为 , 其中
故 的 水平的置信区间为 .