中山大学-432统计学-2023年
一、选择题(每题 3 分, 共 12 空, 总 36 分)
1、设 , 则 ( )
A.;
B.;
C.;
D..
Solution: D
记 , 则
因此
2、 设随机变量 , 若常数 满足 , 则称常数 为 分位数, 则 的中位数是 ( )
a.
b.
c.
d.
Solution: C
令
发现恰好是 .
3、已知 , 以下结论正确的是 ( )
a.
b.
c. 和 独立
d. 和 不独立
都说明了 与 不相关.
4、以下说法中, 错误的是 ( )
a. 如果 , 那么
b. 如果 , 那么
c. 如果 , 那么
d. 如果 , 那么
Solution: B
B 错误, 依分布收敛推不出依概率收敛, 除非是收敛到常数(单点分布).
5、设 , 已知 和 均存在, 则以下关于 和 的大小关的说法, 正确的是 ( )
a.
b.
c.
d. 无法确定
用Jensen不等式, 取凸函数 , 则有 , 即 .
6、 设简单随机样本 , 方差 已知, 给定置信水平 , 关于 的置信区间, 以下说法不正确的是 ( )
a. 样本量增大, 区间长度变短
b. 总体均值范围增大, 区间长度变宽
c. 方差增大, 区间长度变宽
d. 增大, 区间长度变宽
的 水平置信区间是 . 区间长度是 , 显然与总体均值 无关, 因此 A C D 正确, B 错误.
7、 设 独立, 均服从伽马分布 , 则 服从的分布是 ( )
a. 伽马分布
b. 伽马分布
c. 贝塔分布
d. 贝塔分布
伽马分布 具有可加性, 前提是比率参数 参数相同, 其和只需将自由度相加.
8、 设有来自某总体的简单随机样本, 其样本均值为 , 样本方差为 , 则下列说法正确的是 ( )
a. 和 独立
b. 是 的最大似然估计量
c. 是 的无偏估计量
d. 是 的相合估计量
题目未说是正态分布, A 错误. 未指明具体分布, B 也错误. 未指明分布也无法计算期望, C 错误, 且通常也是有偏估计. 如果总体的方差存在, 则样本方差的相合性成立, 这是由大数定律保证的. 再根据连续映射定理, 样本标准差的相合性也得以保证.
8、 以下结论中, 与 互为充要条件的是 ( )
a. 以概率 1 能够用 线性表示
b.
c.
d.
根据条件方差恒等式, 即
根据题意, 有
10、 在假设检验问题中, 控制显著性水平 不变, 则增加样本容量, 发生的变化是 ( )
a. 一类错误概率减小
b. 一类错误概率增大
c. 二类错误概率减小
d. 二类错误概率增大
控制了显著性水平, 则第一类错误概率不变. 第二类错误的概率随样本量增大而减小.
11、 为研究某地区儿童的含铅量指标水平是否高于普通儿童,应该设定的假设检验问题为 ( )
a. 原假设 , 备择假设
b. 原假设 , 备择假设
c. 原假设 , 备择假设
d. 原假设 , 备择假设
通常将研究的问题放在备择假设, 想要拒绝的放在原假设.
12、 对于均匀分布总体 的一组简单随机样本, 以下说法正确的是 ( )
a. 是充分统计量
b. 是完备统计量
c. 是辅助统计量
d. 是辅助统计量
似然函数是
因此 才是充分统计量.
取函数 , 则根据对称性有 , 但显然没有 所以 不是完备统计量.
C 项是位置参数的辅助统计量, D 是尺度参数的辅助统计量, 该总体显然是个尺度族而不是位置族, 因此 D 正确.
二、填空题(每空 3 分, 共 14 空, 总 52 分)
1、 一个人是 型血的概率分别为 , 现任意在人群中选四个人, 则他们血型全不相同的概率为____.
Solution:
利用多项分布, 抽一个人即视为进行一次试验, 试验有四种结果, 每种结果发生的概率分别是 . 重复进行 4 次试验, 则每种结果恰出现一次的概率是
2、 袋中有 个白球 与 个黑球, 现有放回摸球直到摸到白球停止, 则摸到白球之前黑球的个数的数学期望是____.
Solution:
用 表示第一次摸到白球时的总摸球数, 则 , 所求即
3、 随机变量 的概率密度函数是 , 则 ____.
Solution:
由于
根据概率密度函数的正则性, 有 .
4、 随机变量 的概率密度函数为 , 则 ____.
Solution:
直接计算, .
5、 是来自总体 的简单随机样本, 其中 已知, 则对于假设检验问题 vs , 显著性水平为 的 UMP 拒绝域是____, 该检验在 时的功效是____.
Solution: ,
根据Karlin-Rubin定理, 该正态总体均值检验的UMP拒绝域是 .
当 时, 功效
6、 是来自泊松分布 总体的简单随机样本, 设 , 则 的最大似然估计是 ____, 的极限分布是 ____.
Solution: ,
的 MLE 是 , 根据 MLE 的不变性, 则 的 MLE 是 .
由于 , 用 Delta 方法, 取 , 则 , 即
7、现对一组数据进行描述性统计, 绘制出下面的箱线图, 则图中 三个纵坐标对应的统计量分别是 ____, ____, ____.
Solution: 下四分位数, 中位数, 上四分位数
8、 对于某项 重伯努利试验, 现观测到事件发生了 次, 则对于假设检验问题 , 当前的 值是 ____.
Solution:
直接计算 值:
9、 现有三组数据进行方差分析, 样本量均为 , 试用每一组的样本方差 和每一组的组内均值 以及总均值 来给出组内均方 (MSW) 和 组间均方 (MSB) 的表达式, 它们分别是 ____ 和 ____
Solution: ,
组内平方和是 , 自由度 , 因此组间均方
组间平方和是 , 自由度 , 因此组内均方
三、解答题(3 题, 共 72 分)
1(22 分)、 是来自两点分布 总体的简单随机样本, 记函数 , 已知样本量 , 则
(1) (4分) 证明 是 的无偏估计量
(2) (8分) 计算 的相对效率
(3) (10分) 试给出 的一致最小方差无偏估计
Solution:
(1) 计算期望, , 故 是 的无偏估计.
(2) 先计算 的 Fisher信息量, , 则 的无偏估计的方差的 C-R 下界是
再计算 的方差, 有
故
因此该估计量的效率是
(3) 样本的联合分布是
是一个完备的单参数指数族分布, 参数 的充分完备统计量是 . 而显然估计量 是基于 给出的 的无偏估计, 根据 L-S 定理, 它是 的UMVUE. 下面求 的具体分布:
注意到 当且仅当 , 否则 , 因此
显然当 时, , 当 时, 有
2、(26 分) 现有两组简单随机样本, 其中 , , 其中 均为末知参数, 记 , 试解决以下问题:
(1) (8分) 若 未知, 构建 的枢轴量 , 并推导它的分布;
(2) (8分) 若 未知, 对假设检验问题 vs , 给出一个显著性水平为 的拒绝域, 并利用反转接受域的方法给出 一个的 水平置信区间;
(3) (10分) 若 已知, 求 (2) 中假设检验问题的广义似然比检验(GLRT), 并判断该检验是否为一致最优势检验 (UMPT).
Solution:
(1) 枢轴量是 , 其中
, 并记 与 是两组样本的样本方差, 有
而枢轴量的分子, 根据正态分布的性质, 有 , 对于 , 根据 Fisher 引理, 它们二者之间是独立的. 因此有
当原假设成立时, 有
是自由度为 $n+m-2 $ 的中心 t 分布.
(2) 利用枢轴量给出拒绝域, 一个显著性水平为 的拒绝域是
反转接受域, 可以得到 水平的置信区间, 是
(3) 似然函数是
在原假设参数空间中 ( ), 有 , 在全参数空间中 .
因此广义似然比是
因此似然比拒绝域
注意到在原假设成立时 , 为使检验的水平恰为 , 取 .
该检验不是 UMP 检验, 当 时, 考虑另外一个拒绝域 该拒绝域是由 NP 引理给出的在 处唯一功效最大的拒绝域, 因此一定有 . 故该广义似然比检验不是 UMPT.
3、 (24分) 设 是来自均匀分布总体 的简单随机样本, 其中末知参数 , 考虑假设检验问题 vs .
(1) (6分) 求广义似然比检验统计量 ;
(2) (8分) 当原假设成立时, 求 的精确分布;
(3) (10分) 给出一个显著性水平为 的检验, 并写出功效函数.
Solution:
(1) 似然函数是
在原假设参数空间中, 的 MLE 是 . 在全参数空间中, 的 MLE 是 .
因此似然比统计量是
(2) 考虑 , 且 , 而 .
因此当原假设成立时
根据随机变量函数的分布, 可算得 的密度函数是
即参数为 的指数分布. 或自由度为 的卡方分布.
(3) 考虑似然比检验, 有似然比拒绝域
考虑到当 时恒有 , 因此可取 . 为使检验的水平是 , 即
取 . 综上所述, 似然比拒绝域是
再计算检验的功效, 当 时, 有
当 时, 有
当 时, 有