南开大学-432统计学-2019年
一、选择题 (每题 4 分, 共 28 分)
- 4 对夫妇任意地排成一列, 每一位丈夫都排在他妻子后面的概率为( ).
A. 1/2;
B. 1/8;
C. 1/16;
D. 1/70.
Solution: C
用事件 表示第 个丈夫排在其妻子后面, 则所求概率即 , 利用乘法 公式知 . 其中 , 而 等同于求共有 3 对夫妇的情况下, 每一名丈夫都在其妻子后面的概率, 可再次使用乘法公式. 如此多次利用乘法公式可得
- 设, 则下列说法正确的是( ).
A. 和 不相容;
B. 和 相容;
C. 是不可能事件;
D. 不一定是不可能事件.
Solution: D
考虑 , 排除选项 ; 考虑 是空集之外的零概率集, 则排除 选项.
- 学生在做一道有 4 个可选答案的单项选择题, 如果他不知道正确答案时就 随机猜测. 假设该学生知道正确答案的概率为 0.2. 现从卷面上看该题答 对了, 则在此情形下该学生确实知道正确答案的概率是( ).
A. 0.4;
B. 0.5;
C. 0.6;
D. 0.7.
Solution: B
用事件 表示学生确实知道正确答案, 事件 表示学生答对该题, 则由贝叶斯公式有
- 设 为来自正态总体 的简单随机样本, 其中 均为未知, 则关于假设 的显著性检验为( ).
A. 单侧 检验;
B. 单侧 检验;
C. 双侧 检验;
D. 双侧 检验.
Solution: A
方差末知, 备择检验是单侧, 因此采用单侧 检验.
- 设连续随机变量 的密度函数是一个偶函数, 为 的分布函数,则对任意实数 , 下列结论不成立的是( ).
A. ;
B. ;
C. ;
D. .
Solution: D
显然不成立.
- 设 为 来 自 正 态 总 体 的简单随机样本, 为使 为 的无偏估计, 则( ).
A. ;
B. ;
C. ;
D. .
Solution: C
由于 , 所以
于是 .
- 如果 以及 , 其中 是一个常数, 是一个随机变量, 那么以下说法不一定正确的是 ( ).
A. ;
B. ;
C. ;
D. .
Solution: B
按分布收敛弱于依概率收敛,当按分布收敛到退化分布时(此处常数可视为退化分布), 按分布收敛与依概率收敛等价, 因此B 错误.
选项 C,D 为 Slutsky 定理的推论.
二、填空题(每题4分, 共32分)
- 某地区居民的肝癌发病率为0.0004, 现用甲胎蛋白法进行普查.研究表明,化验结果是有错误的. 已知患有肝癌的人其化验结果99%呈阳性(有病),而没患肝癌的人其化验结果99.9%呈阴性(无病). 现某人的检查结果呈阳性,问他真的患有肝癌的概率为多少________.
Solution:
用事件 表示该人末患肝癌,用事件 表示该人的检验呈阳性.
首先我们知道先验概率以及确诊率 , 根据贝叶斯公式, 有
- 二维随机变量 服从区域 上的均匀分布,则 与 的相关系数为________.
Solution:
的联合密度函数是 , 于是
则 .
所以 .
- 设二维连续随机变量 ( ) 的联合密度函数为
则________.
Solution:
的边际密度函数是 .
则 关于 的条件密度函数是 .
因此 .
- 一份考卷由99 道题目组成, 并按由易到难的顺序排列. 某学生答对第一题的概率为0.99, 答对第二题的概率为0.98, 一般地, 他答对第道题的概率为.假如该学生回答各道题目是相互独立的, 并且要回答对60题及以上才算通过考试, 则该同学通过考试的概率为________.
Solution:
设
于是 相互独立, 且服从不同的二点分布:
而我们要求的是 , 考虑使用中心极限定理.
为使用中心极限定理, 我们可以设想从 开始的随机变量都与 同分布, 且相互.
独立. 由于
于是随机序列 满足李雅普诺夫条件, 所以可以使用中心极限定理. 又
所以该学生通过考试的可能性为
注: 若记得这是茆书例题, 再结合该题是填空题的事实, 则无需验证李雅普诺夫条件直 接使用中心极限定理即可.
- 设总体服从韦布尔分布 ,其密度函数为
则 服从________.
Solution:
总体的分布函数是 , 由最小值分布公式知
对比发现, 它就是 的密度函数.
- ________.
Solution:
取独立同分布皆服从 的随机变量序列 , 则根据中心极限定理
另一方面, 由泊松分布的可加性, , 所以
综上所述, 该极限收敛到 .
- 设总体 ,现从该总体中抽取容量为 10 的样本,样本值为:
则参数 的矩估计是________.
Solution:
, 所以 的矩估计是 .
- 设一组来自正态总体 的简单随机样本 , 样本值为
则关于 的置信水平为 的置信区间为________.
Solution:
的 置信区间是
三、解答题(90分)
1.(10分)设随机变量 与 相互独立, 且都服从 上的均匀分布. . 试证明:
(1) ;
(2) 和 是相互独立的标准正态分布随机变量.
Solution:
(1)
, 反解得到 . 所以 的密度函数是
所以 服从参数为 的指数分布, 即自由度为 2 的卡方分布. 的密度函数是
所以 .
(2)
但需要注意此时的变换并非是一一对应的关系, 一对 对应着 与 , 两种情况的雅各比行列式均为
所以 的联合密度函数是
最后一步补充了在 处的定义. 可以看出 .
2.(15分)设 是来自正态总体 的样本,其样本均值和样本方差分别为
试证明:
(1) 与 相互独立;
(2) ;
(3) .
Solution: 构造正交矩阵
记随机向量 , 则 服从 维正态分布, 令 , 则由正 态分布性质知, 也服从 维正态分布,其均值向量为
协方差矩阵为 . 同时注意到
其中第二点是由正交矩阵的性质得到的.
利用上述第一点可以得到 . 同时利用上述两点可以得到
且对于 , 有 i.i. , 所以 . 并且 注意到 仅仅依赖于 , 而 仅仅依赖于 . 由正态分布独立与不相关等价的 性质知道, 与 是独立的, 所以 与 也是相互独立的.
3.(10分)设总体 为来自该总体的简单随机样本,证明 是 的无偏估计.
Solution:
作总体变换, 令 i.i.d , 则有
所以
即 是 的无偏估计.
4.(10分)某电工器材厂生产一种保险丝, 测量其熔化时间, 依通常情况方差为 400, 今从某天产品中抽取容量为 25 的样本, 测量其熔化时间并计算 ,, 问这天保险丝熔化时间的方差与通常有无显著性差异(取 , 假定熔化时间服从正态分布).
Solution: 考虑假设检验问题 vs , 检验统计量是
检验的拒绝域是
由此 , 在显著性水平 下不能拒绝原假设, 可以认为当天保险丝熔化 时间的方差与通常无差异.
5.(10分) 设总体 的分布函数 是连续的, 为取自此总体的次序统计量, 设 , 试证:
(1) , 且它们是来自于总体 的次序统计量;
(2) .
Solution:
(1)
作总体变换 , 则 是总体 的次序统计量. 即 的次序统计量.
(2)
根据前一问的结论知, 是 的次序统计量, 则
所以 .
6.(15分) 设有随机变量 , 且 的方差均存在. 试证明:
(1) 相关系数 存在;
(2) ;
(3) 的充要条件为 与 之间几乎处处有线性关系, 即存在 与 使得 其中当 时有 ,当 时有 .
Solution:
首先证明协方差不等式成立, 记 , 它始终是 非负的,则
是一定成立的, 即判别式非正
移项得到 .
(1)
根据协方差不等式, 即 , 知随机变量 与 的协 方差一定存在, 同时它们的方差也存在, 所以它们的相关系数也一定存在.
(2)
对协方差不等式进行变形, 有
(3)
[充分性] 由于 , 则
就有 .
[必要性] 记 , 则
所以当 时, , 所以
当 时, , 所以
7.(10分) 设 i. i. d. , 求 的 UMVUE. 证明此 UMVUE 达不到 下界,即它不是有效估计.
Solution: 样本的联合分布是
由因子分解定理可知, 是 的充分统计量.而由正态分布的可加性知 , 又正态分布是完全族分布, 所以 是 的充分完全统计量. 那 么 也是 的充分完全统计量.
注意到 , 所以 是基于充分完全统计 量而构造的 的无偏估计, 根据 L-S 定理知它是 的 UMVUE.
下面先求 的 Fisher 信息量, , 则
所以 的无偏估计的 C-R 下界是 .
再计算 的方差, 即 的方差, 首先有 , 下面计算 , 由 于 , 尝试利用 Stein 引理
其中根据 Stein 引理, , 而对于 , 再次作拆分
其中再根据 Stein 引理, , 所以
全部代回 的式子, 有
所以
所以 不是 的有效估计.
注: 不使用Stein引理, 直接计算积分也可, 计算量也较大.
8.(10分) 设 为来自两点分布 的简单随机样本,其中 , 记 为上述 个样本中取值分别为1和0的个数 , 如 记, 证明 .
Solution: 由于 , 所以
而 , 根据中心极限定理
于是 .