中国科学技术大学-812概率论与数理统计-2019年
一、(15分) 将个相同的球随机放入个不同的罐子,每个球放入各个罐子的可能性相同. 试求
(1)(7分) 指定的某个罐子恰有个球的概率
(2)(8分) 不空罐子数目的数学期望.
Solution:
(1) 指定的罐子中球的个数服从 , 因此恰有 个的概率是
(2) 用 表示第 个罐子无球, 若有球则记 , 显然有
空罐子数的数学期望是 , 因此不空罐子数的数学期望 是 .
二、(20分) 假设二维随机变量的联合概率密度函数为
(1)(7分) 求的概率密度函数;
(2)(8分) 求;
(3)(5分) 求.
Solution:
(1) 作变量变换, 令
注意到此时有两支反函数, 其雅可比行列式分别是 , 因此有
故有
(2) 先求的边际密度, 有
故条件分布是
故有
(3) 根据第(2)问得到的边际密度, 有
三、(15分) 设离散型随机变量和不相关, 分别服从如下分布律
-1 | 0 | 1 | |
---|---|---|---|
1/4 | 1/2 | 1/4 |
0 | 1 | |
---|---|---|
1/4 | 3/4 |
若 ,试求
(1)(8分) 的分布律;
(2)(7分) .
Solution: 我们先通过题目给定信息得出联合分布, 由于 , 因此得到 , 故有 , 结合 , 得 到 .
(1) 根据得到的联合分布列, 很快得到 的分布列是
-1 | 0 | 1 | 2 | |
---|---|---|---|---|
0 | 1/2 | 1/4 | 1/4 |
(2) 给定 , 的条件分布是
1/3 | 1/3 | 1/3 |
因此有 , 故 .
四、(15分) 设随机变量序列相互独立,且均服从上的均匀分布,试证明
(1)(7分) 即依概率收敛成立, 此处为自然常数;
(2)(8分) 证明即依分布收敛成立.
Solution:(1) 作变换, 令 , 则 是来自期望为 1 的指数分布的随 机变量序列, 由于 , 故根据大数定律, 得 , 因此有
(2) 同样利用 ,由中心极限定理知, , 令 , 借助 Delta 方法, 得 , 即
五、(20分) 设为来自总体的一组简单随机样本, 且其 中为未知参数. 试
(1)(10分) 求的最大似然估计, 并证明其是唯一的
(2)(10分) 证明低估但仍是的相合估计.
Solution: (1) 样本的似然函数是
求导有
考虑 , 它与似然函数的导数同正负, 因此考虑该函数就等同于考察似然函数的单调性. 使得 的根有两个, 左侧的根是导数由负转正点, 右侧的根是导数由正转负点, 故右侧的根是唯一的 MLE, 即
(2) 记 , 显然 , 由 Jensen 不等式得
故 低估 , 但由大数定律, , 因此也有
六、(15分) 设为服从如下分布的离散型随机变量
其中为未知参数. 试
(1)(7分) 求的最小方差无偏估计 ;
(2)(8分) 证明的最小方差无偏估计不存在.
Solution: (1) 我们先说明: 任意零的无偏估计都可以写为 的形式.
先证 :
(注意: )
如果 , s.t. , 则 .
再证 :
设 , 因为 是零的无偏估计, 所以有:
这个等式要求对于任意 成立, 等式右侧是关于 的一个幂级数, 幂级数要想恒为 0 就必须所有项系数都为 0 , 即 , 第二个式子意味着 是等差数列, 而又有 , 因此 .此外, 显然 是 的无偏估计, 实际它也是 UMVUE, 因为对于任意零的无偏估计 ,
因此 是 的 UMVUE.
(2) 用反证法: 如果 是 的无偏估计, 设
很明显可以看出 是零的无偏估计, 故存在 使得
对于任意一个零的无偏估计 ,
, 如果想要该式对于任意 恒为 0 , 就必须要求 线性相关, 这对于 来说, 很明显是不满足的. 故 的最小方差无偏估计不存在.
(注意: ,故 )
七、(25分) 设如下回归模型
其中i.i.di.i.d且诸和相互独立. 其中固定且已知. 给定观测数据则
(1)(15分) 求的最大似然估计
(2)(10分) 若假设对充分大的和均一致有界, 证明为相合估计.
Solution: 该模型为 error-in-variables model, 其与传统线性回归模型的不同在于观测变量是否为固定值. 在传统线性回归模型中, 观测变量 被视为已知常数, 而在该模型中, 观测变量为随机变量, 即 . 与 之间有着线性关系, 但我们观测不到, 只能观测到 , 因此这里也视作参数.
(1) 在的前提下, 似然函数为:
对于任意的 , 似然函数相对于 的最大值点是
将上式代入似然函数, 可将似然函数化简为:
记, 对数似然函数改写为
上式对 求导, 并令导数为 , 有似然方程
利用第一个式子可知 , 用其化简第二个式子, 有
其中
记 , 它与对数似然函数关于 的导数有着相同的正负号, 我们要找似然函数的极大值点, 就是找该函数的由正转负点, 即在该二次函数的两个零点处考虑, 而该二次函数的开口方向由 决定, 计算可得两种开口情况下的结果是一样的
由于
以及考虑到, 有
再利用似然方程的第一个式子可得 , 以及根据似然方程的第三个式子可得
(2)
其中 直接根据大数定律, 以及 .
其中同样 直接根据大数定律, 以及
上面三行和式中, 第一行三项均可根据大数定律得出依概率收敛到 0; 第二行中的第一项根据大数定律可知收敛到 0, 第三项可直接为 0; 第三行中的第一、三项可根据大数定律得知依概率收敛到 0, 第二项直接为0, 故仅剩第二行第二项保持不动, 即
综上, 根据依概率收敛的性质, 有
即 是 的相合估计, 因此 是 的相合估计. 再考虑 , 由于
其中
根据 的相合性以及 的有界性, 有 . 而
故 , 所以 , 综上有
即 是 的相合估计.
注: 特别需要指出的是, 该模型中 .
八、(25分) 假设为来自总体的简单随机样本,其中为未知参数. 记为样本均值,对
则
(1) (10分) 利用枢轴变量法, 分别基于和构造的置信区间.
(2) (8分) 上述两个置信区间何者更优?
(3) (7分) 试给出假设的一个水平检验, 其中为一已知数.
Solution:(1) 作总体变换, 令 , 则 是来自均值为 的指数分布的 样本, 故有结论 , 可以将其变为卡方分布, 即有
因此 和 是枢轴量, 对于 , 我们试 导出最短置信区间, 因为 意味着 , 因此求最小值就相 当于求函数 在条件 的条件下的极小值,用 拉格朗日乘数法, 设
求偏导数, 有
解得 满足下列关系:
这样的 使得区间 最短, 记作区间一 .
对于 ,因为 意味着 , 因此求最小值就相当于求函数 在条件 的条件下的极小值, 用拉格朗日乘数法, 设
其中 , 求偏导数, 有
解得 满足下列关系:
这样的 使得区间 最短, 记作区间二: .
注:考试时遇到复杂情形也可考虑等尾置信区间, 大概率可得分.
(2) 我认为区间一更精确, 可以比较区间长度, 区间一的长度是
由于 都是常数, 故其分母趋于 1 , 而分子趋于 0 , 且与 同阶.
区间二的长度是
这里由于 随 而动, 故需要进一步探讨, 先考虑分母, 根据 的定义, 有
其中 , 根据中心极限定理, 有 , 故由上式可看出 , 故有 , 因此 ,
同理 , 故有 的分母收敛于常数 4. 再考虑分子, 由于
即 , 再次根据中心极限定理, 我 们得知 是收敛于正常数的, 故对 而言, 其分子与 同阶, 比 更慢收敛于 0 , 再考虑到 , 故当 足够大时, 区间一更短.
注: 若考虑的是等尾置信区间, 依然是由 构造的置信区间更短, 讨论过程类似.
(3) 借助经验分布函数思想, 令 , 则有当 过小时拒绝原假设, 即检验函数是 , 意味着若 则拒绝原假设, 若 则以概率 拒绝原假设, 为使得其水平为 , 需保证 满足
这样的 是找得到的, 即令