高斯分布演示(透彻理解高斯分布)
正态分布是与中的定量现象的一个方便模型。各种各样的心理学测试分数和现象比如计数都被发现近似地服从正态分布。
开始前,先看几个重要概念:
概率函数:把事件概率表示成关于事件变量的函数
概率分布函数:一个随机变量ξ取值小于某一数值x的概率,这概率是x的函数,称这种函数为随机变量ξ的分布函数,简称分布函数,记作F(x),即F(x)=P(ξ<x) (-∞<x<+∞),由它并可以决定随机变量落入任何范围内的概率。
概率密度函数:
概率密度等于变量在一个区间(事件的取值范围)的总的概率除以该段区间的长度。
概率密度函数是一个描述随机变量在某个确定的取值点附近的可能性的函数。
概率分布函数与概率密度函数的关系:
连续型随机变量X的概率分布函数F(x),如果存在非负可积函数f(x),使得对任意实数x,有
f(x)为X的概率密度
高斯分布
通过概率密度函数来定义高斯分布:
高斯分布的概率密度函数是:
均值为μ,标准差为σ
高斯分布的概率分布函数是:
高斯分布标准差在概率密度分布的数据意义
高斯分布重要量的性质
- 密度函数关于平均值对称
- 平均值是它的众数(statistical mode)以及中位数(median)
- 函数曲线下68.268949%的面积在平均值左右的一个标准差范围内
- 95.449974%的面积在平均值左右两个标准差2σ的范围内
- 99.730020%的面积在平均值左右三个标准差3σ的范围
其中第3-5条称为68-95-99.7法则
举一个例子:
检查一些示例数据:
女性体重的平均值= 127.8
标准偏差(SD)= 15.5
一个标准差的范围
两个标准差的范围
如何检查你的数据是不是高斯分布
· 看直方图! 是不是看起来像钟形?
· 计算描述性汇总度量 - 平均值,中位数和模式是否相似?
· 2/3的观察是否位于平均值的±标准差1内? 95%的观察值是否在平均值的±2标准差范围内?
中心极限定理
正态分布有一个很重要的性质:在特定条件下,大量统计独立的随机变量的和的分布趋于正态分布,这就是中心极限定理。中心极限定理的重要意义在于,依据这一定理的结论,其它概率分布能够用正态分布作为近似。
高斯分布可以从二项式(或泊松)推导出假设:
p不接近1或者0时,n非常大
我们有一个连续变量而不是一个离散变量
考虑扔一次硬币10,000次。
p(头)= 0.5,N = 10,000
对于二项分布:
平均数为μ = np=5000,标准差为σ = [np(1 − p)] 1/2=50。
此二项分布的概率在μ±1范围内:
高斯分布均值±一个标准差的概率积分:
高斯分布线性组合的重要性质
-
1. 乐不可言:高兴得无法用言语来表达。形容极为快乐。2. 乐不可支:快乐到不能自持的地步。形容快乐到极点。3. 乐不思蜀:比喻乐而忘返或乐而忘本。4. 乐此不疲:指对某事物特别有兴趣,因而沉浸于其中,不知疲倦。5. 乐而忘返:因高兴而忘记返回。6. 乐极生悲:高兴得过了头,将转而招致悲伤的事出现。[详细]
-
大熊猫是我国特有的野生动物,同时也是个国际巨星。全世界的动物园都抢着来租借中国的大熊猫 ,甚至不惜开出数百万美元的高价,只为能租借10年。外国民众也喜欢来观赏大熊猫,只要有大熊猫的展览,门票往往一抢而空。全世界人民喜欢大熊猫的原因很简单,那就是因为它很可爱。然而,很多人不知道的是,表面上蠢萌的大熊猫[详细]
-
在中国流传着很多传说,冥界就是其中之一,在冥界中人们常听到的就是阴曹地府和酆都鬼城,但通往这些地方许多磨难,而最令人悲伤的就是望乡台,这是让亡魂在看亲人最后一眼的地方,虽然这里没其他地方危险,但这是最让人悲伤的位置。其实在古代就有人间的望乡台,这是给远离故乡的人来登高望远,希望可以看到自己的家乡的地[详细]
-
iPhone也是支持直接查看电池健康以及App耗电量的,只需打开【设置】-【电池】,就可查看过去24小时哪些APP耗电较多。再点开【电池】界面的【电池健康】,就可查看此时的电池最大容量。苹果官方建议,iPhone电池健康度低于80%后更换电池。那么,iPhone电池低于80%一定要换吗?我们继续往下[详细]
-
济南市,山东省省会,副省级市,市政府驻市中区。位于山东省中西部,东临淄博市、南连泰安市,西南毗邻聊城市,西北依德州市,东邻滨州市。总面积10244.45平方千米,全市下辖10个区、2个县。截至2022年 ,常住人口941.5万人。2022年,济南市实现地区生产总值(GDP)为12027.5亿元。济南[详细]