置信区间通俗解释(什么是统计学中的置信区间?)
统计学有点像数学和概率学的混合体。统计学的意义在于描述你可以在世界范围内观察到的过程--橡树的高度或疫苗抵御疾病的可能性--而不必测量世界上每一棵橡树或给每个人接种疫苗,然后再决定一种药物的有效性。
因为概率描述的是涉及到偶然性的事物,所以我们必须接受,无论我们用统计学来衡量什么过程,我们都不会得到全貌。
为什么要使用统计学?
假设你把一枚硬币掷了四次。你得到三个头和一个尾。如果不使用统计学,我们可能会得出结论,得到人头的概率是75%,而抛硬币得到人头的真实概率是1:1,或者说是50-50的概率。如果我们改做40次抛硬币,肯定会更接近1:1的人头和人尾的比例,而统计学的使用也会反映这一点。
"统计学的大部分内容都与从样本--实际观测值--到人群的特征--所有可能的观测值--的推理有关,"佐治亚大学传染病生态学中心的研究教授约翰-德雷克在一封电子邮件中说。"例如,我们可能对橡树的高度感兴趣。我们不能测量世界上所有的橡树,但我们可以测量一些。我们可以计算出样本中橡树的平均高度,但这不一定会与所有橡树的平均高度相同。"
置信区间
由于我们无法测量世界上所有的橡树,统计学家根据概率和他们所掌握的所有数据得出一个估计的高度范围。这个范围被称为置信区间,它由两个数字组成:一个可能小于真实值,一个可能大于真实值。真实值可能介于两者之间。
"'95%的置信区间'意味着在100次置信区间中,有95次是这样构建的,区间将包括真实值,"德雷克说。"如果我们测量了100次橡树样本,基于其中95次实验中收集的数据的置信区间将包括群体平均值,或所有橡树的平均高度。因此,置信区间是对估计精度的衡量。当你收集更多的数据时,估计值会变得越来越精确。这就是为什么可信区间会随着数据的增多而变小。"
所以,置信区间有助于显示估计的好坏。当我们抛硬币只抛四次时,我们对75%的估计就有很宽的置信区间,因为我们的样本量非常小。如果我们抛掷40次硬币,我们的估计值的置信区间就会窄得多。
置信区间的实际意义与重复实验有关。在四次抛硬币的情况下,95%的置信区间意味着,如果我们重复100次抛硬币实验,在其中的95次中,我们得到人头的概率将落在这个置信区间内。
统计学的极限
统计学是有局限性的。你必须设计一项好的研究--统计不能告诉你任何你没有问过的问题。
假设你正在研究一种疫苗的疗效,但你没有将儿童纳入研究范围。你可以根据你收集的数据得出一个置信区间,但它不会告诉你任何关于疫苗对儿童的保护程度。
-
窗帘在每家每户都有使用,因为窗帘的作用实在太大了额,它不仅装饰点缀了我们的家庭环境,而且还保护了我们的隐私,调节了家里的光线,但在美丽的窗帘背后,却往往最容易被大家所忽略来清洁它。相信有的家庭可能从安装上去还没有清洗过。其实这种做法是错误的,因为窗帘离窗户最近,为我们挡住的都是外界的灰尘还有细菌,所[详细]
-
构图是设计师为了表现一定的思想、意境、情感,在一定范围内,运用审美原则,对各种形象或符号进行的合理安排。平面构图包括3个方面的构成要素,下面将逐一对这3个要素进行介绍。内容要素包括文字、插图、标志,在其转化成画面的过程中,必须将文字、插图、标志等转化为点、线、面等,并遵循平面构成的原理。同时,在转化[详细]
-
汉字作为中国文化的重要组成部分,在漫长的历史进程中,经历了漫长的发展。在其发展的过程中,汉字经历了从简单的象形文字,到复杂的结构性文字,再到今天的现代汉字演变的历程。汉字的演变历程汉字最早起源于中国约五千年前的商朝时期,当时的汉字是简单的象形文字,如人、马、鸟等。这些文字的形状就是对实物的简单模仿。[详细]
-
《破阵子.为陈同甫赋壮词以寄之》作者:辛弃疾 诵读:康爸原文:醉里挑灯看剑,梦回吹角连营。八百里分麾下炙,五十弦翻塞外声,沙场秋点兵。马作的卢飞快,弓如霹雳弦惊。了却君王天下事,赢得生前身后名。可怜白发生!译文: 醉酒时拨亮灯火端详着宝剑,睡梦里萦绕着座座军营的号角声。将鲜美的牛肉分赏给战士烤吃,军[详细]
-
1、一鼓作气(曹刿)出处:出自《左传·庄公十年》:“夫战,勇气也。一鼓作气,再而衰,三而竭。”释义:第一次击鼓时士气振奋。比喻趁劲头大的时候鼓起干劲,一口气把工作做完。2、一字千金(吕不韦)出处:出自《史记·吕不韦列传》:“布咸阳市门,悬千金其上,延诸侯游士宾客有能增损一字者予千金。”释义:增损一字[详细]