协方差的定义是什么
在概率论中,两个随机变量 X 与 Y 之间相互关系,大致有下列3种情况:
情况一,如上, 当 X, Y 的联合分布像上图那样时,我们可以看出,大致上有: X 越大 Y 也越大, X 越小 Y 也越小,这种情况,我们称为“正相关”。
情况二, 如上图, 当X, Y 的联合分布像上图那样时,我们可以看出,大致上有:X 越大Y 反而越小,X 越小 Y 反而越大,这种情况,我们称为“负相关”。
情况三,如上图, 当X, Y 的联合分布像上图那样时,我们可以看出:既不是X 越大Y 也越大,也不是 X 越大 Y 反而越小,这种情况我们称为“不相关”。
怎样将这3种相关情况,用一个简单的数字表达出来呢?
在图中的区域(1)中,有 X>EX ,Y-EY>0 ,所以(X-EX)(Y-EY)>0;
在图中的区域(2)中,有 X<EX ,Y-EY>0 ,所以(X-EX)(Y-EY)<0;
在图中的区域(3)中,有 X<EX ,Y-EY<0 ,所以(X-EX)(Y-EY)>0;
在图中的区域(4)中,有 X>EX ,Y-EY<0 ,所以(X-EX)(Y-EY)<0。
当X 与Y 正相关时,它们的分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有E(X-EX)(Y-EY)>0 。
当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和(3)中,所以平均来说,有(X-EX)(Y-EY)<0 。
当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有(X-EX)(Y-EY)=0 。
所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是
协方差
cov(X, Y) = E(X-EX)(Y-EY)
当 cov(X, Y)>0时,表明 X与Y 正相关;
当 cov(X, Y)<0时,表明X与Y负相关;
当 cov(X, Y)=0时,表明X与Y不相关。
这就是协方差的意义。
另外补充:
求特征协方差矩阵,如果数据是3维,那么协方差矩阵是
这里只有x和y,求解得
对角线上分别是x和y的方差,非对角线上是协方差。协方差大于0表示x和y若有一个增,另一个也增;小于0表示一个增,一个减;协方差为0时,两者独立。协方差绝对值越大,两者对彼此的影响越大,反之越小。
-
区分羊是公是母,很多人都会按照羊的角来判断,大众也都会觉得公羊有角,母羊没有角,那么这样区分到底对不对?其实这种想法是错误的,公羊和母羊有没有角,不是根据性别决定的,而是要看种类。1.山羊大部分山羊都是有角的,不过公羊和母羊的角长得不一样。山羊的角又长又尖,会向后或者是朝下弯曲,而母山羊的角则比较细[详细]
-
鱤鮈鱲鯮鮍鯝鲌,鱊鲃䱻鳤鮠鮡鮀,它们的拼音分别为:gǎn,jū ,liè ,zōng,pí, gù,bó,yù, bā,huá,guǎn ,wéi,zhào, tuó。其中比较常见的,比如说鱤鱼,之前我的文章中也有过介绍,此字念感。还有就是宽鳍鱲、长鳍鱲、斑鳍鱲之类的,这些原生鱼经常出现在我们的溪流[详细]
-
窗帘在每家每户都有使用,因为窗帘的作用实在太大了额,它不仅装饰点缀了我们的家庭环境,而且还保护了我们的隐私,调节了家里的光线,但在美丽的窗帘背后,却往往最容易被大家所忽略来清洁它。相信有的家庭可能从安装上去还没有清洗过。其实这种做法是错误的,因为窗帘离窗户最近,为我们挡住的都是外界的灰尘还有细菌,所[详细]
-
构图是设计师为了表现一定的思想、意境、情感,在一定范围内,运用审美原则,对各种形象或符号进行的合理安排。平面构图包括3个方面的构成要素,下面将逐一对这3个要素进行介绍。内容要素包括文字、插图、标志,在其转化成画面的过程中,必须将文字、插图、标志等转化为点、线、面等,并遵循平面构成的原理。同时,在转化[详细]
-
汉字作为中国文化的重要组成部分,在漫长的历史进程中,经历了漫长的发展。在其发展的过程中,汉字经历了从简单的象形文字,到复杂的结构性文字,再到今天的现代汉字演变的历程。汉字的演变历程汉字最早起源于中国约五千年前的商朝时期,当时的汉字是简单的象形文字,如人、马、鸟等。这些文字的形状就是对实物的简单模仿。[详细]