大数据分类利器---支持向量机(SVM)入门介绍
2015-10-25 MedSci MedSci原创
什么是分类分析? 让我们思考一个例子。假设某总体50%是男性,50% 是女性。你想要通过一个样本(集)获取一些规则,以确定总体其余部分成员的性别。使用支持向量机,相当于建立一个判断某人是男是女的机器。这是个典型的分类问题。我们试图通过一些规则,把总体分为两个可能的部分。出于简便考虑,这里假设两个用来区分的要素为:身高、头发长度。样本集的散点图如下: 图中的蓝色圆点代表女性,绿色方块代表男性
什么是分类分析? 让我们思考一个例子。假设某总体50%是男性,50% 是女性。你想要通过一个样本(集)获取一些规则,以确定总体其余部分成员的性别。使用支持向量机,相当于建立一个判断某人是男是女的机器。这是个典型的分类问题。我们试图通过一些规则,把总体分为两个可能的部分。出于简便考虑,这里假设两个用来区分的要素为:身高、头发长度。样本集的散点图如下: 图中的蓝色圆点代表女性,绿色方块代表男性。从图中可以推测: 1.总体中的男性平均身高更高 2.总体中的女性头发更长 如果某人身高180cm,头发4cm长,我们更可能将其判定为男性。这就是做分类分析的方式。 支持向量是什么?支持向量机(SVM)是什么? 支持向量就是单条记录的坐标。比如(45,150) 是对应一名女性的支持向量。支持向量机是能够区分男性和女性的最佳边界。在本例中,两个类别相隔清晰,所以更容易找到支持向量机。 如何确定当前案例的支持向量机? 当前的案例有很多可能的边界。下面是三种可能情况: 我们要如何确定哪条是最佳的边界? 要解释支持向量机目标函数(objective function)最简单的方法,是寻找与边界最近的支持向量(
作者:MedSci
版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#支持向量机#
36
不明觉厉
102
好复杂,看不明白
119
可以看看
75
好复杂
163