
概率论与数理统计是考研数学重要组成部分。概率论与数理统计非常强调对基本概念、定理、公式的深入理解。重要基本知识要点如下:
一、考点分析
1随机事件和概率,包括样本空间与随机事件;概率的定义与性质(含古典概型、几何概型、加法公式);条件概率与概率的乘法公式;事件之间的关系与运算(含事件的独立性);全概公式与贝叶斯公式;伯努利概型。
2随机变量及其概率分布,包括随机变量的概念及分类;离散型随机变量概率分布及其性质;连续型随机变量概率密度及其性质;随机变量分布函数及其性质;常见分布;随机变量函数的分布。
3二维随机变量及其概率分布,包括多维随机变量的概念及分类;二维离散型随机变量联合概率分布及其性质;二维连续型随机变量联合概率密度及其性质;二维随机变量联合分布函数及其性质;二维随机变量的边缘分布和条件分布;随机变量的独立性;两个随机变量的简单函数的分布。
4随机变量的数字特征,随机变量的数字期望的概念与性质;随机变量的方差的概念与性质;常见分布的数字期望与方差;随机变量矩、协方差和相关系数。
5大数定律和中心极限定理,以及切比雪夫不等式。
6数理统计基本概念,包括总体与样本;样本函数与统计量;样本分布函数和样本矩。
7参数估计,包括点估计;估计量的优良性;区间估计。
8假设检验,包括假设检验的基本概念;单正态总体和双正态总体的均值和方差的假设检验。
二、解题思路
1如果要求的是若干事件中“至少”有一个发生的概率,则马上联想到概率加法公式;当事件组相互独立时,用对立事件的概率公式。
2若给出的试验可分解成(0-1)的n重独立重复试验,则马上联想到Bernoulli试验,及其概率计算公式。
3若某事件是伴随着一个完备事件组的发生而发生,则马上联想到该事件的发生概率是用全概率公式计算。关键:寻找完备事件组。
4若题设中给出随机变量X~N则马上联想到标准化~N(0,1)来处理有关问题。
5求二维随机变量(X,Y)的边缘分布密度的问题,应该马上联想到先画出使联合分布密度的区域,然后定出X的变化区间,再在该区间内画一条//y轴的直线,先与区域边界相交的为y的下限,后者为上限,而的求法类似。
6欲求二维随机变量(X,Y)满足条件Y≥g(X)或(Y≤g(X))的概率,应该马上联想到二重积分的计算,其积分域D是由联合密度的平面区域及满足Y≥g(X)或(Y≤g(X))的区域的公共部分。
7涉及n次试验某事件发生的次数X的数字特征的问题,马上要联想到对X作(0-1)分解。即令
8凡求解各概率分布已知的若干个独立随机变量组成的系统满足某种关系的概率(或已知概率求随机变量个数)的问题,马上联想到用中心极限定理处理。
9若为总体X的一组简单随机样本,则凡是涉及到统计量的分布问题,一般联想到用分布,t分布和F分布的定义进行讨论。
统计量定义:设X1,X2,X3,Xn为取自某总体的样本,若样本函数T=T(X1,X2,X3,Xn)中不含有任何未知参数,则称T为统计量
从统计量的定义可知,任何统计量都是不含参数的,统计量的取值只与样本有关一旦样本确定,统计量的值也就确定
由此可知,中位数,样本均值,样本方差都属于统计量,因为只要给定了一组样本,就立即可以算得其中位数,样本均值,样本方差
所以答案就是:中位数,样本均值,样本方差,统计量都不含参数
在一个实际问题归纳出的统计结构 中, 和 常可确定,而在可测空间 上用什么分布 去描述尚不确定但我们可知道 属于某个分布族 ,至于 中哪一个分布最适合还是不知道,要解决这个问题,就要从样本空间抽取样本,凭借样本中的信息对总体分布作出判断,这就是统计推断要研究的问题。
样本中含有总体信息,但较为分散,一般不宜直接用于统计推断,常常是把样本中的信息加工处理,用样本的函数形式集中起来,这类样本函数在统计中称为统计量,然后用统计量去作各种推断,下面先给出统计量的一般定义。
在统计中样本空间常为 维欧氏空间,即 ,而统计量的值域为 时,统计量就是不依赖于分布族的 个可测函数,即 称为向量统计量
定义中强调了两点:
统计量的分布称抽样分布,或称诱导分布,它在研究统计量的性质和评价一个统计推断的优良性等方面十分重要近代统计学的创始人之一Fisher曾把抽样分布,参数估计和假设检验列为统计推断的三个中心内容因此寻求抽样分布的理论与方法应十分重视
设 是从 到 的一个统计量它是样本 的函数因此对分布族 中每一个分布 都可确定统计量 的一个分布实际上,对任意 ,概率
这就是统计量 的分布,记为 ,即
容易验证:这样定义的 是 上的一个概率测度
分布函数可通过积分算得,下面给出几种特殊场合的一些结果:
1、样本矩
点矩和k阶样本中心矩,统称为样本矩。许多最常用的统计量,都可由样本矩构造。例如,样本均值(即α1)和样本方差是常用的两个统计量,前者反映总体中心位置的信息,后者反映总体分散情况。
2、次序统计量
最小次序统计量x⑴最大次序统计量x(n)称为极值,在那些如年枯水量、年最大地震级数、材料的断裂强度等的统计问题中很有用。
3、U统计量
这是W霍夫丁于1948年引进的,它在非参数统计中有广泛的应用。其定义是:设x1,x2,…,xn,为简单样本,m为不超过n的自然数,为m元对称函数,则称 为样本x1,x2,…,xn的以为核的U统计量。
4、秩统计量
把样本X1,X2,…,Xn 按大小排列为,若 则称Ri为xi的秩,全部n个秩R1,R2,…,Rn构成秩统计量,它的取值总是1,2,…,n的某个排列。秩统计量是非参数统计的一个主要工具。
5、样本均值
样本均值又叫样本均数。即为样本的均值。均值是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。它是反映数据集中趋势的一项指标。
6、样本方差
先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。
-样本均值
-样本方差
-统计量
统计量及其分布
这章的核心是认识经验分布函数,统计量以及三大抽样分布,这些构成了数理统计的基础。数理统计围绕着总体和样本,希望通过了解样本的情况,提出相应的统计量,并通过了解统计量的分布,也即抽样分布来估计总体参数。
经验分布函数参考经验分布函数与格里纹科定理
统计量
统计量是什么?从定义上说,统计量是不含未知参数的样本函数。统计量是一个函数,是对样本信息的一个精炼提取,以此反映总体情况的工具。我们通常记统计量为
常用的统计量有,样本均值,样本方差,样本峰度,样本偏度。
对于统计量的分布,称为抽样分布。通过了解抽样分布可以得到总体参数的点估计与区间估计,达到样本估计总体的目的。
充分统计量
统计量中有一个重要的概念是充分统计量,从数学上讲,样本的条件分布与总体参数无关,则T即为充分统计量,即
p(x|T;θ)=f(X|T(x1,x2xn)=t)p(x|T;θ)=f(X|T(x1,x2xn)=t)
通俗来讲意即我们定义的统计量T能够涵盖样本的所有信息,由此可导出 充分性原则:
对总体参数的估计都应基于充分统计量,并且UMVUE(一致最小方差无偏估计)一定可表示为充分统计量的函数
通常来说,充分统计量即用到了全部样本信息的统计量,如样本均值(是所有样本值的平均),样本的次序统计量( x(i)是将所有样本排序后得到的x(i)是将所有样本排序后得到的),不难理解这样的统计量能概括所有的样本信息,因此更适合做统计推断。关于UMVUE将在以后的微博阐述。
因子分解定理
要是每次都通过求样本的条件分布来判断充分统计量,是非常困难且计算量大的。这里给出因子分解定理,将能帮助判断是否是充分统计量:
设总体密度函数为
接下来判断充分统计量即找出相应的g和h了。举个例子:
假设总体服从指数分布,密度函数为,则
令,
则易得
因此是充分统计量。
通过这种方式,判断充分统计量变得容易的多。
三大抽样分布
下面将阐述统计学中三大重要的抽样分布卡方分布,F分布与t分布,基于这三种分布可得到许多假设检验方式。
卡方分布
设是来自总体N(0,1)的独立同分布样本,称的分布为自由度为n的分布,记为(n)
,因此均值为n,方差为2n
F分布
设X ~ ,Y ~ 相互独立,称服从F分布,记为F(n,m)
由此可知,F分布由两个服从卡方分布的随机变量构造而来。
t分布
设X ~ N(0,1),Y ~ 相互独立,称服从t分布,记为t(n)
当n=1时,t分布为柯西分布,n>1时期望为0,n>2时方差有限且等于,因此可以发现t分布是对称的,且当n->时,方差趋于1,t分布逐渐趋于标准正态分布。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)