南开大学-432统计学-2022年
一、选择题 (每题 4 分, 共 28 分)
- 关于经验分布函数 , 说法错误的是 ( )
(a) 它是分布函数
(b) 它是 的连续函数
(c) 它是随机变量
(d) 它依概率收敛于分布函数
Solution: B
A 正确, 它满足分布函数的定义; B错误, 它在每个样本点的取值上间断; C 正确, 它依赖于样本, 具有随机性; D 正确, 根据大数定律.
- 的密度函数是 , 则 的密度函数是 ( )
(a)
(b)
(c)
(d)
Solution: C
用微分法, 有
因此C正确.
- 袋中有黑球 个, 白球 个, 现摸 个球, 已知摸到的球都是一个颜色, 求摸到的是黑球 的概率 ( )
(a)
(b)
(c)
(d)
Solution: A
, , 因此
- 设随机变量 独立同分布, 且其方差为 , 令 , 则下述结论正确的是( )
(A)
(B)
(C) ;
(D) .
Solution: A
- 是 i.i.d. 是 随机样本, 定义
则下列服从 的是 ( )
(a)
(b)
(c)
(d)
Solution: B
B项可写作
其他选项均不正确.
- 依概率收敛于 按分布收敛于 , 下列错误的是 ( )
(a) 依概率收敛于
(b) 是实值函数, 则 依概率收敛于
(c) 按分布收敛于
(d) , 则 按分布收敛于
Solution: B
B选项仅对连续函数成立, 反例: 记 单点分布, a.s. 则 , 取实值函数 , 则显然 不依概率收敛于 .
- 下列哪个总体的样本之和不是参数的充分统计量 ( )
(a) 正态
(b) 泊松
(c) 指数
(d) 均匀
Solution: D
若支撑集与参数有关, 那么通常最大/最小次序统计量会是充分统计量.
二、填空题(每题4分, 共32分)
- 的特征函数是________.
Solution:.
- 有 封信, 对应 个信封, 现随机进行配对, 配对成功的信封数的期望是________.
Solution: 1
利用期望的线性性以及对称性, 第封信封匹配成功记作 , 否则 , 显然 , 因此匹配成功的信封数为 , 因此
- , 且 互不相容, , 则 ________.
Solution: .
- 服从由 和 围成区域上的均匀分布, 则 ________.
Solution: .
, 其中
因此 , 于是
- 已知气温均值为 20 , 标准差为 2 , 某天天气气温大于 16 小于 24 的概率至少为________.
Solution: 根据切比雪夫不等式 .
- 已知 , 则 的 Fisher 信息量是________.
Solution:
- 射击连射十次, 每次中的概率是 , 设 是射中次数, 则 ________.
Solution: 38.4
, 则 , 所以 .
- 服从泊松分布, 且 , 则 取偶数的概率是________.
Solution:
假设泊松分布的参数为 , 则 , 解得 .
而 取偶数的概率是
三、解答题(90分)
1.(10分)设 , 令 , 求:
(1) 联合分布;
(2) 相关系数.
Solution: (1) , 故 , .
(2) 有 , 以及 , 故 .
2.(10分) 某班级成员一星期迟到共计 50 次, 其中星期一 12 次, 星期二 11 次, 星期三 9 次, 星期四 10 次, 星期五 8 次. 问迟到是否与星期几有关?(注 : 记 是卡方分布 的密度函数, 且 )
Solution: 利用卡方拟合优度检验, 设 是某一次迟到可能发生在星期 的概率
, 建立假设检验问题:
构造卡方检验统计量 , 其中 表示随机变量可能的取值个数,
此处 为样本总数此时 为随机变量 的观测值总数, 等于
原假设中的 此处 . 而 , 此时
算得 . 所以不能拒绝原假设, 某一次 迟到可能发生在星期 的概率应该是相同的, 即迟到与星期几无关.
3.(15分)设 . 已知一个家庭有 个小孩的概率是
又设男婴和女婴的出生是等可能的. 回答:
(1) 求一个家庭有 个男孩的概率;
(2) 已知某家庭 没有女孩, 求该家庭有 1 个男孩的概率.
Solution: 分别用 和 表示一个家庭的男孩、女孩数量, 则
(1) 根据全概率公式, ,
若 , 则
当 , 则
注意这里我们用到了负二项分布公式, 即设 表示伯努利试验成功 次所需的总次数, 即 , 有分布列 , 则有公式 , 其中 . 利用该公式可计算前面式中
(2)
4.(15分)设某电子产品的寿命服从如下分布:
现测得个该电子产品的寿命为 试求未知参数的矩估计和极大似然估计.
Solution:
总体服从双参数指数分布 , 其中 是位置参数, 是尺度参数, 所 以 , 所以令 , 解得矩估计是
样本的似然函数是
显然它是关于 在 上的增函数, 于是 是 的极大似然估计. 再求 的极大似然估计, 考虑将对数似然函数的偏导置零, 即
解得 , 代入 , 得 是 的极大似然估计.
5.(10分)有一位市场调查员, 他感兴趣的是该地区成年人中购买某商品的比率 . 现他要事先确定需要 访问多少顾客 (样本量 ) 才能使 是 的 置信区间? 其中 是样本中购买 此种商品的顾客比例, 是事先给定的常数. 又假如事先知道 , 会对其产生什么影响?
Solution: 这是茆诗松补充题. 利用正态近似, 有
反过来解得
因此 一定要比 还大才行, 所以也要比右侧的最大值大, 考虑到二次函数
因此有
解得 .
再考虑如果已经有 的条件, 那么二次函数的最大值就是
因此有
解得 .
6.(10分)有来自总体 的简单随机样本 , 试求 的 水平区间估计.
Solution:
以 为枢轴量, 令 , 容易解得 置信区间为
7.(10分)对于总体 的两个随机样本 , 考虑假设检验问题:
对检验 , 试求出其势函数以及两类错误的概率.
Solution:
先求势函数,
所以两类错误概率分别是
8.(10分) 是来自期望为 的指数分布总体的随机样本. 试求 的 UMVUE.
Solution: 全体样本的联合分布为
它是一个完备指数族分布, 故统计量 是参数 的充分完备统计量, 而 . 即 是 的无偏估计. 根据 Lehamn-Scheffe定理, 知 是 的UMVUE.