协方差矩阵的理解与统计学含义

2014-06-15 MedSci MedSci原创

一、统计学的基本概念 统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。 以这两个集合为例,[0, 8, 12, 20]和[8, 9, 11, 12],两个集合的均值都是10,

一、统计学的基本概念 统计学里最基本的概念就是样本的均值、方差、标准差。首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均。 以这两个集合为例,[0, 8, 12, 20]和[8, 9, 11, 12],两个集合的均值都是10,但显然两个集合的差别是很大的,计算两者的标准差,前者是8.3后者是1.8,显然后者较为集中,故其标准差小一些,标准差描述的就是这种“散布度”。之所以除以n-1而不是n,是因为这样能使我们以较小的样本集更好地逼近总体的标准差,即统计上所谓的“无偏估计”。而方差则仅仅是标准差的平方。   二、为什么需要协方差 标准差和方差一般是用来描述一维数据的,但现实生活中我们常常会遇到含有多维数据的数据集,最简单的是大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解更多,比如,一个男孩子的猥琐程度跟他受女孩子的欢迎程度是否存在一些联系。协方差

作者:MedSci



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (3)
#插入话题
  1. 2014-07-18 匿名用户

    简明扼要

    0

相关资讯

SUDAAN统计分析软件:在调查研究中复杂抽样中的应用

SUDAAN(Survey Data Analysis)统计软件是专门针对流行病学调查中复杂抽样的数据进行数据分析的统计学软件包,它可以对调查数据通过加权的方式进行统计学校正,从而提高了分析结果的精确度。该软件是美国北卡三角研究所(Research Triangle Institute in Cary,NC)于上世纪70年代研制开发的一种统计分析软件。该软件经过不断发展和改进,目前版本为SUD

统计方法选用手册

一、 两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(

统计学全新发展趋势

在过去的20、30年中,统计学在不少方面取得了很大进展,这主要得益于越来越快的电脑速度,使得很久以前只能停留在理论层次上的一些内容变成了现实。当前 的统计学教材内容几乎跟20年前没什么太大变化,但统计学的发展却是有巨大变化,这里根据个人的知识水平将其总结一下,为感兴趣的同仁提供一些发展方向的借鉴。尤其是贝叶斯分析方法(Bayesian Analysis),从相关到因果的研究,从线性向非线性方向发

生物统计学家:临床研究的幕后高手

【编者按】临床研究往往少不了统计学,其在肿瘤临床研究中的地位更是举足轻重。而在现实中,生物统计学家却是一个熟悉而又陌生的名字。熟悉是因为统计的“必要性”,陌生往往是因为统计的“高深莫测”。 本文作者Daniel Sargent教授和Qian Shi教授作为梅奥肿瘤研究中心的“掌门人”,将跟大家“揭露”生物统计学家在肿瘤临床试验中所扮演的角色。 日前,Chinese Clinical O

高级统计教程:从 Yule-Simpson悖论到因果推断

临床研究到底能不能做出因果关系?原则上,在研究中解释和研究因果推断(causal inference)的,均十分谨慎!因为一般认识中,统计并不能研究因果。那么真的不能或是能呢?这确实是一个问题:统计研究因果,能,还是不能?直接给出回答,比较冒险。 目前市面上能够买到的相关教科书仅有 2011 年图灵奖得主 Judea Pearl 的 Causality: Models, Reaso

高级统计:病因研究理论及偏倚

病因学说在推动医学科学的发展上曾起过重大的作用,而成为医学观点的生物医学模式的组成部分。一、病因的可能分类1.单病因说在单病因说的思想指导下,人们把病因归纳为:①生物因素,主要是各种病原微生物;②物理因素,如声、热、光、电、放射线等超过正常范围后均可致病,此外还有损伤;③化学因素,如农药、化学药品、各种营养要素等。由于发现单单上述病因因素常常不足以引致疾病,人们认识到病因与宿主因素(如性别、年