首页 理论教育随机变量概率分布简介

随机变量概率分布简介

【摘要】:对于连续型随机变量,由于其可能取值无法一一列出,而且可以证明取个别值的概率等于零。因此连续型随机变量不存在分布律。此外,连续型随机变量也可用密度函数表示其统计规律。图X3.1频率密度图和频率分布图都会成为虚线表示的光滑曲线。前者称随机变量的概率密度曲线,后者称为随机变量的概率分布曲线。

离散型随机变量的统计规律,可以用随机变量的一切可能取值与其概率之间的对应关系来描述:

P(X=xi)=Pi(i=1,2,…)

称为离散型随机变量的分布律。

或表示为

它具有两个性质:①Pi≥0(i=1,2,…);②img=1。

对于连续型随机变量,由于其可能取值无法一一列出,而且可以证明取个别值的概率等于零。因此连续型随机变量不存在分布律。而分布函数可以作为一个统一的工具,可以表示离散型在内的任意随机变量的概率分布情况,它研究随机变量在某个区间取值的概率,水文计算中常研究概率P(X≥x)。此外,连续型随机变量也可用密度函数表示其统计规律。下面结合例子介绍分布函数、密度函数的含义及两者的关系。

【例X3.2】 华北地区保定站具有样本容量n=87年的年降水量系列。将年降水量作为随机变量X,其实测值即为X的取值x,进行如下统计计算。

(1)将年降水量分组,组距Δx=200mm,见表X3.2中第(1)、(2)栏。

表X3.2 保定站年降水量分组频率计算表

(2)统计87个年降水量数据在每组中出现的次数、累计次数即X≥x的次数,x为组下限值;计算组内频率和累计频率,见表X3.2第(3)、(4)、(5)、(6)栏。

图X3.1 保定站年降水量频率密度图和频率分布图

(a)频率密度图;(b)频率分布图

(3)计算Δp/Δx,称为组内平均频率密度,见表X3.2第(7)栏。

(4)绘图。将表X3.2第(2)栏与第(7)栏绘直方图,如图X3.1(a)实线所示。图中各长方形面积表示组内频率,所有长方形面积之和等于1。这种频率密度值随随机变量取值x变化的图形称为频率密度图。

将表X3.2第(2)栏与第(6)栏绘阶梯形实折线,如图X3.1(b)所示。这种P(X≥x)与x对应规律的图形,称为频率分布图。

若资料年数无限增多,分组组距无限缩小,且频率趋于概率。图X3.1频率密度图和频率分布图都会成为虚线表示的光滑曲线。前者称随机变量的概率密度曲线,后者称为随机变量的概率分布曲线。

图X3.1(a)中,概率密度曲线与纵轴包围的面积表示概率,若密度曲线相应的函数记为f(x),某点x相应的f(x)值的大小,则反映了随机变量X在x附近取值的密集程度,称f(x)为密度函数。

根据图X3.1(b)纵、横坐标的含义,容易看出P(X≥x)随x不同而不同,是x的函数,此函数称为随机变量X的分布函数,记为F(x),即

由图X3.1(b)与图X3.1(a)的关系,可得

式(X3.10)所示的f(x)与F(x)关系的图形表示如图X3.2所示。

另一方面,f(x)与F(x)的关系还可表示为

需要指出,算例中概率分布规律的推求方法只是用来说明概念,便于初学者理解f(x)、F(x)的含义,但计算复杂,实际工作中并不这样计算。水文计算中常常只推求概率分布曲线,由于利用样本资料推求,故称其为频率曲线,推求方法将在X3.6中介绍。

它具有两个性质:①Pi≥0(i=1,2,…);②img=1。

对于连续型随机变量,由于其可能取值无法一一列出,而且可以证明取个别值的概率等于零。因此连续型随机变量不存在分布律。而分布函数可以作为一个统一的工具,可以表示离散型在内的任意随机变量的概率分布情况,它研究随机变量在某个区间取值的概率,水文计算中常研究概率P(X≥x)。此外,连续型随机变量也可用密度函数表示其统计规律。下面结合例子介绍分布函数、密度函数的含义及两者的关系。

【例X3.2】 华北地区保定站具有样本容量n=87年的年降水量系列。将年降水量作为随机变量X,其实测值即为X的取值x,进行如下统计计算。

(1)将年降水量分组,组距Δx=200mm,见表X3.2中第(1)、(2)栏。

表X3.2 保定站年降水量分组频率计算表

(2)统计87个年降水量数据在每组中出现的次数、累计次数即X≥x的次数,x为组下限值;计算组内频率和累计频率,见表X3.2第(3)、(4)、(5)、(6)栏。

图X3.1 保定站年降水量频率密度图和频率分布图

(a)频率密度图;(b)频率分布图

(3)计算Δp/Δx,称为组内平均频率密度,见表X3.2第(7)栏。

(4)绘图。将表X3.2第(2)栏与第(7)栏绘直方图,如图X3.1(a)实线所示。图中各长方形面积表示组内频率,所有长方形面积之和等于1。这种频率密度值随随机变量取值x变化的图形称为频率密度图。

将表X3.2第(2)栏与第(6)栏绘阶梯形实折线,如图X3.1(b)所示。这种P(X≥x)与x对应规律的图形,称为频率分布图。

若资料年数无限增多,分组组距无限缩小,且频率趋于概率。图X3.1频率密度图和频率分布图都会成为虚线表示的光滑曲线。前者称随机变量的概率密度曲线,后者称为随机变量的概率分布曲线。

图X3.1(a)中,概率密度曲线与纵轴包围的面积表示概率,若密度曲线相应的函数记为f(x),某点x相应的f(x)值的大小,则反映了随机变量X在x附近取值的密集程度,称f(x)为密度函数。

根据图X3.1(b)纵、横坐标的含义,容易看出P(X≥x)随x不同而不同,是x的函数,此函数称为随机变量X的分布函数,记为F(x),即

由图X3.1(b)与图X3.1(a)的关系,可得

式(X3.10)所示的f(x)与F(x)关系的图形表示如图X3.2所示。

另一方面,f(x)与F(x)的关系还可表示为

需要指出,算例中概率分布规律的推求方法只是用来说明概念,便于初学者理解f(x)、F(x)的含义,但计算复杂,实际工作中并不这样计算。水文计算中常常只推求概率分布曲线,由于利用样本资料推求,故称其为频率曲线,推求方法将在X3.6中介绍。