复旦大学-432统计学-2023年
一、(10分) 从 到 这些整数里任意挑选 个, 求其中一个大于 , 另外一个小于 的概率.
Solution: , , 因此
二、(10分) 证明: 二元正态分布的边际分布是正态分布. 但两个边际正态分布联合却不一定是正态分布, 请举例说明.
Solution: 二元正态 , 令
容易验证 , 再考虑 , 得到
根据独立性直接得到 , 故 . 同理有 , 结论成立.
反之, 直接考虑 , 以及 , 而 没有二元密度函数, 不构成二元正态.
三、(10分) 设 , , 且它们独立, 求 的密度函数.
[考点透析] 我们在三模出了一道计算方式上几乎一致的题, 可以先看这个, 作为练习: 对于 , 尝试求 .
对于一个 , 有 , 这里 , 故
并且对于计算概率, 和 是完全一致的, 因此
所以有 .
因此对, 有.
现在再回到本题, 利用商的分布, 有 的 p.d.f. 是
其中 . 我们直接探讨 即可, 其中 , 有
这里 , 我们前面已经算过 , 而
再考虑 , 有
因为有 , 化简得
这里代入 , , 则有
因此有
去除瑕点, 写为
四、(10分) 设 , , 且它们独立, 求 的概率分布.
Solution: 利用微分法, 令 , 有
对应的分布函数是
五、(10分) 设是非负随机变量, 且, 证明
Solution: 由于时对求期望不影响, 故
而, 结论得证.
六、(15分) 设 是随机变量. 证明: 当且仅当
Solution: 充分性用马尔可夫型不等式很容易证明. 对于必要性: 我们先证明一个等式:
因此, 有
其中, 用洛必达法则, 有
命题得证.
七、(15分) , 是有界连续函数, 其导函数也有界连续 求证:
(1) (Stein引理) ;
(2) (Poincare不等式) .
[考点透析]: 第(1)问考察了很多次, 课上讲过很多次、考卷了出了很多次, 必须得分. 第 (2) 问的 Poincare 不等式在概率论中的版本较早地由 J. Nash (1959), H. Chernoff (1981), L. Chen (1982) 等人研究, 在他们的证明中需要用到二次可积函数的Hermite展开式 (类似傅里叶变换).
Solution: (1) 利用分部积分法, 有
(2) [法一]: 概率论方法. 利用方差性质以及柯西-施瓦茨不等式, 有
最后一步用了第一问的Stein引理.
[法二]: 我们来看一看H. Chernoff (1981)给出的证明. 利用 空间 (二次可积函数的全体) 的正交展开, 任意一个 都可以写为正交Hermite多项式的形式 (这也称为广义傅里叶展开), 即
其中 是Hermite正交函数列(), 满足
其中系数由 给出, 截止目前都和傅里叶展开几乎无差距. 而Hermite正交函数列有一个性质是 , 这个性质类似对应傅里叶展开里的 .
因此, 利用该展开式, 我们有
同时, 根据 有界, 求和与求导交换次序我们有
因此发现
八、(20分) (1) 请写出 的分布列;
(2) 请证明 的可加性;
(3) 利用中心极限定理证明: .
Solution: (1) 直接写出:
(2) 用特征函数, 泊松分布的特征函数是
两个独立的泊松分布, , , 且独立, 我们有 的特征函数是
由唯一性定理, .
(3) 设 , 题设概率等同于 , 而由泊松分布可加性, 我们设 是 i.i.d. 的 , 则有 , 根据中心极限定理, 有
九、(10分) 设 是i.i.d. 来自 的随机样本, 其次序统计量是 . 对于假设检验问题
给定拒绝域 , 要求第一类错误小于0.01, 问 至少是多少?
Solution: 第一类错误是
令其 , 解得
用计算器可以算出 , 没有计算器就只能得到上面结论.
十、(10分) 设总体为均匀分布 , 的先验分布是 , 现有观测值: 6.1, 6.5, 6.7, 6.9. 求 的后验分布.
Solution: 条件似然函数是
故 的联合密度是
积掉 , 即 , 故有
即 .
十一、(15分) 设有来自总体 的 i.i.d. 样本 .
(1) 叙述充分统计量的定义;
(2) 若 判断 是否为充分统计量.
Solution: (1) 是 的充分统计量意味着条件分布
与 无关, 即样本中 已经蕴含了 的所有信息.
其等价定义是“因子分解定理”, 即如果联合密度可以写成
的形式, 则 是 的充分统计量.
(2) 联合密度为
根据因子分解定理, 是充分统计量.
十二、(15分) 设有来自 的 i.i.d. 样本 .
(1) 求 的MLE;
(2) 第(1)问的MLE是否为有效估计?
Solution: (1) 似然函数和对数似然函数是
求导置零, 得 .
(2) 可以验证的是, 令 , 有
故有 , , 因而 , . 而对应的 Fisher 信息量是
故 C-R 下界是
因此 是有效估计.