在R语言中比较不同机器学习算法的性能差异

2016-03-01 刘翔宇 译 CSDN

选择最好的机器学习模型 你如何根据需求选择最好的模型? 在你进行机器学习项目的时候,往往会有许多良好模型可供选择。每个模型都有不同的性能特点。 使用重采样方法,如交叉验证,就可以得到每个模型在未知数据上精准度的估计。你需要利用这些估计从你创建的一系列模型中选择一到两个最好的模型。 仔细比较机器学习模型 当你有了新数据集,使用多种不同的图形技术可视化数据是个好主意,你可以从不同角度来观

选择最好的机器学习模型 你如何根据需求选择最好的模型? 在你进行机器学习项目的时候,往往会有许多良好模型可供选择。每个模型都有不同的性能特点。 使用重采样方法,如交叉验证,就可以得到每个模型在未知数据上精准度的估计。你需要利用这些估计从你创建的一系列模型中选择一到两个最好的模型。 仔细比较机器学习模型 当你有了新数据集,使用多种不同的图形技术可视化数据是个好主意,你可以从不同角度来观察数据。 这种想法也可以用于模型选择。你应该使用不同的方法来进行估计机器学习算法的准确率,依此来选择一到两个模型。 你可以使用不同的可视化方法来显示平均准确率、方差和模型精度分布的其他性质。 比较并选择R语言的机器学习模型 在本节中,你将会学到如何客观地比较R语言机器学习模型。 通过本节中的案例研究,你将为皮马印第安人糖尿病数据集创建一些机器学习模型。然后你将会使用一系列不同的可视化技术来比较这些模型的估计准确率。 本案例研究分为三个部分: 准备数据集:加载库文件和数据集,准备训练模型。 训练模型:在数据集上训练标准机器学习模型,准备进行评估。 比较模型:使用8种不同的技术比较训练得到的模型。 准备数据集

作者:刘翔宇 译



版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (16)
#插入话题
  1. 2016-03-17 任然

    感觉很难的样子

    0

  2. 2016-03-08 sxlw

    一直想学R,但总是感觉好难,不好学

    0

  3. 2016-03-03 harry37640

    感觉好难

    0

  4. 2016-03-03 yangjxjc

相关资讯

生命未来研究所(FLI)发布人工智能优先研究计划

近日,由生命未来研究所(FLI)发表的一封关于促进人工智能健康发展的公开信引起了笔者的注意,信中呼吁人们要警惕人工智能副作用。随着人工智能的发展,他们担心人类所创造出的人工智能机器会有超越人类并影响人类生存的可能,因此,开展如何规避其潜在危害的同时获取其好处的研究十分重要。 生命未来研究所是什么机构 生命未来研究所是Future of Life Institute的英文缩写,简称FLI,它

全球八家机器学习智能服务,其中或助力医疗发展

机器学习是未来人工智能的核心技术,但是机器学习存在很大的技术壁垒。全球领先的公司,以及一些新兴公司对此进行了探索,试图通过提供智能机器学习的解决方案提升现有的预测算法。其中微软,google和Amazon 排在前列,这三家公司在云计算方面,在全球也是领先的。除此之外,还有一些公司也参与其中。但是机器学习需要大量的工作来保证其正确性,包括清除数据、建立基础结构、测试和再测试模型以及最终部署算法。

预测建模、监督机器学习和模式分类概览

本文全面地介绍了机器学习里的监督学习的主要概念,并对监督学习的典型工作流程进行了详细的解析,具有很好的实践指导意义。 模式分类(pattern classification)和机器学习(machine learning)是非常热的话题,几乎在所有的现代应用程序中都得到了应用:例如邮局中的光学字符识别(OCR),电子邮件过滤,超市条形码扫描,等等。 在这篇文章中,我会简要描述一个典型的监

机器学习和统计模型的差异

在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么? 这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者的区别似乎仅仅在于数据量和模型建立者的不同。这里有一张覆盖机器学习和统计模型的数据科学维恩图。 在这篇文章中,我将尽最大的努力来展示机器学习和统计模型的区别,同时也欢迎业界有经验的朋友对本文进行补充。 在我开始之前,让我们

Lancet:交叉试验预测抑郁结局:机器学习法

Lancet:交叉试验预测抑郁结局:机械学习法

机器学习算法——Python & R算法代码速查表

这两年机器学习的概念一直很火,无人车、人脸识别、语音识别,似乎无所不能。但有一点被忽略了,“机器学习”算法只是众多算法的一种,和快速排序、red-black BST 一样,它有自己独特的应用场景,而且只能在这个场景中使用。而且请注意,它并不像排序算法一样,可以保证百分之百的可用性,它的边界是有问题的。它更像那些固定算法的一个扩展,机器不用精确去执行程序代码的每一行,在程序以外,它提供给我们一些努力