南开大学-432统计学-2020年
一、选择题 (每题 4 分, 共 28 分)
- 随机变量在1-3的正整数中等概率取值, 随机变量在1-的正整数中等概率取值, 则( ).
A. 1;
B. 1/5
C. 11/18;
D. 1/2.
Solution: C
由全概率公式
- 已知服从以三点组成的三角形上的均匀分布, 则( ).
A. 1/2;
B. 2/3;
C. 1/3;
D. 1/6.
Solution: B
设题目所提区域为 , 则 , 于是 . 则
- 随机变量以0.5概率取1和-1, 服从标准正态分布且与独立, 则的分布函数的间断点个数是( ).
A. 0;
B. 1;
C. 2;
D. 3.
Solution: A
先求 的分布函数, 根据全概率公式有
于是 , 是连续性分布, 其分布函数没有间断点.
- 已知命题随机变量与相互独立; 命题 的特征函数是与特征函数的乘积, 则( ).
A. 成立可推出成立, 但反之不行;
B. 成立可推出成立, 但反之不行;
C. 它们互为充要条件;
D. 以上说法都不对.
Solution: A
推出 是显然的, 不能推 的反例是: , 则 的特征 函数 , 但 显然是不独立的.
- 如果总体的方差存在, 关于样本均值和样本方差, 说法正确的是( ).
A. 与相互独立;
B. 是总体期望的无偏估计, 但不是总体方差的无偏估计;
C. 不是总体期望的无偏估计, 是总体方差的无偏估计;
D. 它们分别是总体期望、方差的相合估计.
Solution: D
选项 A 仅正态分布时成立;
选项 B、C:分别是总体期望、总体方差的无偏估计;
由大数定律, 相合性是显然的.
- 有来自总体的随机样本, 问当服从何种分布时, 不是充分统计量? ( )
A. ;
B. ;
C. ;
D. .
Solution: D
对于选项 D, 由因子分解定理有, 为其充分统计量.
- 有来自总体的随机样本, 其中未知, 考虑假设检验问题
给定显著性水平, 则拒绝域的形式是( ).
A. ;
B. ;
C. ;
D. .
Solution: D
方差 末知,故使用 -检验,排除 , 又根据备择假设双侧,排除 选项.
二、填空题(每题4分, 共32分)
- 某班级有2001年出生的个同学, 则没有任何两个人在同一天生日的概率是________.
Solution:
- 标准正态分布的特征函数是________.
Solution:
- 甲投掷2019次硬币, 乙投掷2018次硬币, 则甲投掷出的正面次数大于乙的概率是________.
Solution:
根据对称性, 甲正 乙正 甲反 乙反 , 同时利用该离散型随机变量仅 能取整数, 得到
所以 甲正 乙正 甲反 乙反 , 因此 甲正 乙正 .
- 在单位圆上任取3点, 恰能连成锐角三角形的概率是________.
Solution:
本题可以用条件概率积分做, 解析给出另一种思路:
对于每一个锐角三角形来说,取任意顶点过圆心做射线与圆周相交, 可构成(三角形对 应顶点换成射线顶点)一个新的钝角三角形, 而锐角三角形有 3 个顶点, 由此对于每一个锐 角三角形对应三个钝角三角形, 又因为构成直角三角形的概率为 0 , 于是我们可得:
- 已知独立同服从分布函数, 则的分布是________.
Solution:
令 i.i.d , 而对于 , 有
即 i.i.d , 因此 , 根据卡方分布的可加性有
- 已知, 则的Fisher信息量是________.
Solution:
的密度函数是 , 取对数有
所以 Fisher 信息量是
- 有来自总体的个随机样本,为使得使得 的 95%置信区间长度不大于0.01, 则至少应为________.
Solution: 614656
置信区间是, , 区间长度是 .
令 , 得到 .
- 设是三个事件, 则其中不多于两个发生的事件可表示为________.
Solution:
多于两个事件发生即三个事件发生, 即 . 题目所提便是其对立事件.
三、解答题(90分)
1.(10分)在中随机取点, 求最远2点的距离不超过1/2的概率.
Solution:
即求 , 由于 , 于是根据标准均匀分布的极差的分 布 , 有
2.(10分)已知当时, 服从上的均匀分布, 又, 试求.
Solution:
由题意可知 , 于是根据重期望公式
3.(10分)有来自总体的个随机样本, 样本均值, 样本方差, 求证: .
Solution:
根据辛钦大数定律, , 所以
4.(10分) 设独立同服从, 独立同服从, 分别是这两个样本对应的样本方差, 求证
Solution:
根据 Fisher 引理知, , 并且二者 相互独立,再根据卡方分布的可加性可知
5.(15分) 现有甲、乙两种工艺, 挑选30名工人测试他们完成两种工艺所花费的时间, 分别记作. 若欲探究两种工艺所需工时的差异, 请回答:
(1) 若服从正态分布, 给出检验全过程;
(2) 若不知道的分布, 问应该怎么采取检验?
Solution:
(1) 为消除个人能力差异引起的误差, 本题应采取成对数据假设检验.
用 与 分别表示第 个工人在甲、乙工艺上的耗时,则有
考虑假设检验问题
检验统计量为 , 其中 是 的样木本差.
检验的拒绝域为 , 其中 . 再计算检验统计量的观 测值, 判断是否属于拒绝域, 再作出统计推断.
(2) 若 的分布末知, 大样本场合根据中心极限定理依然可采用近似 检验. 在小样本场合, 可采用符号检验或 Wilcoxon 符号秩和检验.
6.(15分) 有来自总体的个随机样本, 考虑假设检验问题:
有拒绝域, 问
(1) 时, 犯两类错误的概率分别是多少?
(2) 趋于无穷时, 犯两类错误的概率会有什么变化? 请说明.
Solution: (1) 根据泊松分布的可加性, 有 , 再计算两类错误
(2) 对于犯第一类错误的概率, 利用切比雪夫不等式, 有
对于犯第二类错误的概率, 利用中心极限定理, 有
7.(20分) 有来均匀分布总体的个随机样本, 求的
(1) 最大似然估计, 问其是否无偏, 并在形式的估计量中找出使得均方误差最小的估计;
(2) 基于给出的最短置信区间.
Solution: (1) 似然函数为 , 它是 在 上的单调递减函数, 因此 的极大似然估计是 , 同时容易求得 .
所以 , 则它不是无偏估计. 再考虑均方误差准则,
解得 .
(2)以 为枢轴量, 令 满足
反解得到置信区间 , 则我们需在 条件下求出使得 取到最小值的点.
用消元法, 即 , 则 可化为关 于 的一元函数, 即 .
自变量的取值范围为 即 .
因此 是单调递减函数, 则 时其取最小值, 此时 .
所以由该枢轴量构造的最短置信区间为 .