临床医学数据标准化的几种方法

2012-11-14 MedSci MedSci原创

数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 其中最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上,常见的数据归一化的方法有: min-max标准化(Min-max normalization)

数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 其中最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上,常见的数据归一化的方法有: min-max标准化(Min-max normalization) 也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下: 其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。 log函数转换 通过以10为底的log函数转换的方法同样可以实现归一下,具体方法如下: 看了下网上很多介绍都是x*=log10(x),其实是有问题的,这个结果并非一定落到[0,1]区间上,应该还要除以log10(max),max为样本数据最大值,并且所有的数据都要大于等于1。 atan函数转换 用反正切函数也可以实现数据的归一化: 使用这个方法需要注意的是如果想映射的区间为

作者:MedSci



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (9)
#插入话题
  1. 2015-10-06 段段

    非常感学,很实用

    0

  2. 2015-05-20 jasonuclear

    太有用了!终于在medsci上找到

    0

  3. 2014-08-07 oubaochi

    很有用的啊,也算作临床研究的基础知识吧

    0

  4. 2013-01-07 csjlsh

    很实用啊

    0

相关资讯

附表2 Excel 数据分析工具一览表

附表2 Excel 数据分析工具一览表 “F - 检验:双 样本方差分析” 分析工具 此分析工具可以进行双样本F - 检验,用来比较 两个样本总体的方差。例如,可以对参加游泳比赛 的两个队的时间记分进行F- 检验,查看二者的样 本方差是否不同。 “t - 检验:成 对双样本均值分

Excel2000中的数据地图

在EXCEL中应用图表来表现数据信息,要比单纯的数字更明确,更直观,让人一目了然。但有时我们在实际工作中还会碰到这种情况,即数据与省份有关(如图1),这时虽然也能用图表的方式来表现,但如果能将数据和地图结合起来,将会收到更加好的效果。利用Office2000中集成的数据地图功能,我们可以方便地完成上述操作。  由于采用Office2000典型的安装方式没有安装数据地图,所以首先请运行Office2

Excel的数据筛选功能

Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。如何区分这两种筛选模式,以便熟练掌握和应用,让我们来看看吧:自动筛选“自动筛选”一般用于简单的条件筛选,筛选时将不满足条件的数据暂时隐藏起来,只显示符合条件的数据。图1为某单位的职工工资表,打开“数据”菜单中“筛选”子菜单中的“自动筛选” 命令,以“基本工资”字段为例,单击其右侧向下的列表按钮,可根据要求筛选出基本工资为某

硕士论文存在的共性问题

    硕士论文是一面镜子,或许能反映出学生以后的人生。硕士论文是要保存在国家图书馆的,也可以在网上查到的。硕士论文将会伴随你的一生还远。有的人硕士期间就做出了影响其一生的成就而载入科技史册。如张泽院士在金属所读硕士期间的工作影响了他的一生。     硕士论文在一些普遍性的共性问题,值得老师们注意: