什么是正态分布?

作者&投稿:奚唯 (若有异议请与网页底部的电邮联系)

正态分布在统计学中是一个很重要的概率分布类型,哪怕是在实际生活中也有着重要的指导与应用作用,比如:某学校学生的成绩分布,男子身高、工厂生产产品的尺寸等等。同时,正态分布也是许多检验的基础,在实际使用统计分析时,人们总是乐于正态检验。比如F检验以及t检验等在总体不是正态分布时一般没有意义。所以检验数据是否服从正态分布一直都是统计学比较重要的问题。所以本篇文章分别进行对检验正态分布的方法进行说明。

检验数据是否服从正态分布的方法有很多,常用的有正态性检验(S-W检验、K-S检验),查看峰度与偏度以及图示化(直方图、p-p/q-q图)等。正态性检验顾名思义判断总体是否服从正态分布的检验。它是统计判决中重要的一种特殊的拟合优度的假设检验。SPSSAU提供的正态性检验方法有三个如下:

针对三种正态性检验方法的区别如下:

SW检验一般需要样本量小于50,如果样本量大于50建议使用K-S检验,JB检验基于数据样本的偏度(统计数据分布偏斜方向和程度的度量)和峰度分析(表征概率密度分布曲线在平均值处峰值高低的特征数),一般用于大样本分析。正态性检验属于非参数检验,原假设为“样本来自的总体与正态分布无显著差异就符合正态分布”,即当p<0.05是拒绝原假设,数据不符合正态分布,p>0.05是接受原假设,数据符合正态分布。接下来进行查看

‘峰度和偏度’如何进行数据正态分布的检验。

偏度和峰度

偏度也称偏斜度,描述数据分布的偏斜程度和方向,峰度描述数据分布曲线陡峭平缓程度的统计量,理论上讲,标准正态分布偏度和峰度均为0,但现实中数据无法满足标准正态分布,因而如果峰度绝对值小于10并且偏度绝对值小于3,则说明数据虽然不是绝对正态,但基本可接受为正态分布。【参考文献:Kline R , Kline R B , Kline R . Principles and Practice of Structural Equation Modelling[J]. Journal of the American Statistical Association, 2011, 101(12).】。除此之外,还有图示化可以进行验证,比如直方图、p-p/q-q图。

图示化

除了用正态性检验和偏度和峰度的方法,还可以结合图形进行分析数据是否符合正态分布。其中包括直方图和p-p/q-q图。

直方图

如果使用直方图,直方图若呈现‘中间高,两边低,左右基本对称的钟形图’则基本服从正态分析,但是数据量过少等也可能影响结果导致很难呈现出标准的正态分布,如果是这种情况如果看见‘钟形’也可以接受的。比如:

上图可以看出,数据呈现的分布并不是很对称,但是也出现近似‘钟形’曲线,所以也可以勉强接受。

p-p/q-q图

p-p图和q-q图都是根据累计分布函数理论计算的,使用它们可以进行数据是何种分布的检验,但是常用于检验数据是否服从正态分布。如果图形中所有店都聚集在直线上,则说明变量分布服从于所要检验的分布,直观说法就是如果散点分布近似‘对角线’则可以认为正态分布。比如:

从上图可以看出散点分布近似‘对角线’则可以认为正态分布。q-q图也是如此。

几种方法说明

上述展示几种正态检验的方法,大体可以分为正态性检验,偏度与峰度以及图示化三种,其中正态性检验要求最为严格,但是从实用性角度,正态性检验远不如偏度与峰度以及图示化这俩种实用,有时常常会出现这样的结果,明明数据偏度绝对值小于3峰度绝对值小于10,或者p-p图呈现近似“对角线”的结果,但是正态性检验并不通过。此时建议不要对正态性检验过于依赖,因为正态性检验要求严格通常无法满足,所以在分析中可以使用其它两种方法辅助进行判断。



正态分布是自然界中真实存在的,某个随机变量如果可以被拆分成大量独立同分布随机变量的和,它就近似服从正态分布。

举个例子,一张100道选择题的考卷,每题分值一分,难度相近,那么一个人做这张考卷的得分就是100个随机变量的和,应该近似服从正态分布。

几乎与社会相关的大多是偏态分布,比如一定时间一定空间里的人、车的流量;人口增长与消亡的分布。

几乎与自然相关的大多也是近似的正态分布,比如人或动物的身高分布,体重分布。在天文、生态、医学等等。

正态分布的这种统计特性使得问题变得异常简单,任何具有正态分布的变量,都可以进行高精度分预测。

值得注意的是,大自然中发现的变量,大多近似服从正态分布。

正态分布很容易解释,这是因为:正态分布的均值,模和中位数是相等的,只需要用均值和标准差就能解释整个分布。

扩展资料:

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。

当μ=0,σ=1时的正态分布是标准正态分布。

参考资料:百度百科-正态分布



正态分布是一个概率型的分布,若随机变量x服从一个数学期望为u、方差为a2的正态分布,记为N(u,a2)。其概率密度函数为正态分布的期望值u决定了其位置,其标准差a决定了分布的幅度。当u=0,a=1时的正态分布是标准正态分布。

~

什么是正态分布
答:密度函数形如 的连续型分布叫作正态分布(亦叫Gauss分布).密度函数形如 的n元连续型分布叫作n元正态分布.

正态分布是什么意思?
答:正态分布(也称为高斯分布或钟形曲线)是统计学中最重要的分布之一,具有以下特征:对称性、单峰性、定义明确的均值和标准差、所有正态分布的两个特殊参数、中心极限定理、知名特性。1、对称性:正态分布是关于其均值的对称分布,呈现出左右对称的特征。均值、中位数和众数都位于分布的中心。2、单峰性...

正态分布是什么?
答:正态分布具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ2)。μ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小。正...

什么叫正态分布?
答:正态分布概率计算公式:F(x)=Φ[(x-μ)/σ],正态分布也称“常态分布”,又名高斯分布,正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。主要特点:⒈、估计频数分布 一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内...

什么是正态分布?
答:正态分布就是大部分属于中间值,只有一小部分属于过大和过小的值,它们分布在范围的两端。正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到,C.F.高斯在研究测量误差时从另一个角度导出了它。正态曲线呈钟型,...

正态分布是什么?
答:对于正态分布,其概率密度函数的数学表达式为:f(x) = (1 / (σ * √(2π))) * e^(-(x-μ)^2 / (2σ^2))其中,f(x) 表示随机变量 X 的概率密度函数,x 是实数,μ 是正态分布的均值(期望值),σ 是正态分布的标准差,π 是圆周率(约等于3.14159),e 是自然对数的底数(...

什么是正态分布?
答:正态分布(Normal Distribution),也称为高斯分布(Gaussian Dis tribution),是统计学中最重要的连续概率分布之一。它具有以下的基本概念:1. 均值(Mean):正态分布的均值表示分布的中心位置,通常用μ(mu)表示。正态分布的均值决定了分布的对称中心。2. 标准差(Standard Deviation):正态分布的...

什么是正态分布?
答:正态分布是一种概率分布,一般用符号μ和σ表示均值和标准差。其概率密度函数为:f(x) = (1/σ√2π)exp(-(x-μ)²/2σ²)其中,μ是正态分布的均值,σ是正态分布的标准差,e为自然常数。正态分布的标准化公式为:Y=(X-μ)/σ~N(0,1)其中,X是原始数据,Y是标准化后的...

什么是正态分布?
答:1、正态分布是高斯在研究误差时所发现的分布 2、若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。3、通过例题:4、由例题可知,读数...

什么是正态分布?
答:X服从一个数学期望为μ、方差为σ^2的正态分布。正态分布具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ2)。μ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μ邻近...