0
推荐
1584
阅读
这才是玩数据的精髓,你还记得吗?
机器之心编译ID:almosthuman2014本文从最基础的概率论到各种概率分布全面梳理了基本的概率知识与概念,这些概念可能会帮助我们了解机器学习或开拓视野。这些概念是数据科学的核心,并经常出现在各种各样的话题上。重温基础知识总是有益的,这样我们就能发现以前并未理解的新知识。简介在本系列文章中,我想探讨一些统计...
1
推荐
2088
阅读
超级干货 :一个框架解决机器学习大部分问题
一个叫 Abhishek Thakur 的数据科学家,在他的 Linkedin 发表了一篇文章 Approaching (Almost) Any Machine Learning Problem,介绍他建立的一个自动的机器学习框架,几乎可以解决任何机器学习问题,项目很快也会发布出来。这篇文章迅速火遍 Kaggle,当然也是受到争议,很多人觉得并不全面。我最近也在准备参加 Kag...
0
推荐
1586
阅读
机器学习实战:Python信用卡欺诈检测
公众号:数据先锋(data_pioneer) 作者:唐宇迪对信用卡交易数据建立检测模型,使用Python库进行预处理与机器学习建模工作,代码通俗易懂。包括数据预处理与清洗,模型调参与评估等详细数据分析与建模流程。故事背景与Python环境故事背景:原始数据为个人交易记录,但是考虑数据本身...
0
推荐
1173
阅读
十大必须掌握的机器学习算法,竟然都如此有趣
导读:通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。今天的算法如下:决策树随机森林算法逻...
0
推荐
1694
阅读
如何通过牛顿法解决Logistic回归问题
选自TLP机器之心编译参与:Nurhachu Null、黄小天本文介绍了牛顿法(Newton's Method),以及如何用它来解决 logistic 回归。logistic 回归引入了伯努利分布(Bernoulli distribution)中的对数似然概念,并涉及到了一个称作 sigmoid 函数的简单变换。本文还介绍了海森矩阵(这是一...
0
推荐
2306
阅读
一文看懂自动驾驶中应用的机器学习算法
机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据融合(如激光雷达、雷达、摄像头或物联网),评估驾驶员状况或为驾驶场景分类等。在KDnuggets网站最近发表的一篇文章中,作者Savaram Ravindra将自动...
0
推荐
1909
阅读
初学者如何选择合适的机器学习算法
本文主要的目标读者是机器学习爱好者或数据科学的初学者,以及对学习和应用机器学习算法解决实际问题抱有浓厚兴趣的读者。面对大量的机器学习算法,初学者通常会问自己一个典型的问题:「我该使用哪一种算法?」有很多因素会影响这一问题的答案,比如:数据的大小、质量及性质可用计算时间任务的急迫性数据的使用用途在...
1
推荐
2078
阅读
如何用机器学习炒股赚钱?
相信很多人都想过让人工智能来帮你赚钱,但到底该如何做呢?瑞士日内瓦的一位金融数据顾问 Gaëtan Rickter 近日发表文章介绍了他利用 Python 和机器学习来帮助炒股的经验,其最终成果的收益率跑赢了长期处于牛市的标准普尔 500 指数。虽然这篇文章并没有将他的方法完全彻底公开,但已公开的内容或许能给我们带来如何用人...
0
推荐
2646
阅读
机器学习算法常用模型—逻辑回归
翻译/编辑/原创Vivian Ouyang 数据圈资深成员这个介绍主要是方便刚入行的数据科学家。通过这个指导,使你直接解决机器学习的问题以及从中获得经验。而且我会尽量用简单易懂的方式来介绍每一个算法,不会涉及很多数学,而是帮助你从原理上理解每个算法,每一个算法都附上R和Python的程序来帮助你直接去应用程序解...
0
推荐
1996
阅读
七种常用回归技术,如何正确选择回归模型?
回归分析是建模和分析数据的重要工具。本文解释了回归分析的内涵及其优势,重点总结了应该掌握的线性回归、逻辑回归、多项式回归、逐步回归、岭回归、套索回归、ElasticNet回归等七种最常用的回归技术及其关键要素,最后介绍了选择正确的回归模型的关键因素。什么是回归分析?回归分析是一种预测性的建模技术,它研究的...
0
推荐
2101
阅读
强文!看懂数据探索,完整指导!
翻译/编辑/部分原创 Vivian Ouyang 原作者:Sunil Ray 数据圈资深成员作者简介:美国达拉斯一家医院数据中心工作,职位是data scientist。主要做healthcare方面的数据分析建模在机器学习中,很多时候你会挣扎于怎么提高模型的准确率。在这种时刻,数据探索的一些方法将帮助你解决这个问题...
1
推荐
2192
阅读
机器学习算法介绍(附上R和Python程序)
翻译/编辑/原创:Vivian Ouyang 数据圈资深成员作者简介:美国达拉斯一家医院数据中心工作,职位是data scientist。主要做healthcare方面的数据分析建模这个介绍主要是方便刚入行的数据科学家。通过这个指导,使你直接解决机器学习的问题以及从中获得经验。先看看薪水,对号入座:而且我会尽量用简单...
0
推荐
1481
阅读
8个经过证实的方法:提高机器学习模型的准确率
导语提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改善。你会觉得无助和困顿,这是 90% 的数据科学家开始放弃的时候。不过,这才是考验真本领的时候!这也是普通的数据科学家跟大师级数据科学家的差距所在。...
4
推荐
1930
阅读
机器学习商业应用入门及七个实例
你可能听说过谷歌和Facebook这样的公司如何利用机器学习来开车、识别语音和分类图片。你可能会想,这很酷。但这和你的工作有什么关系呢?好吧,来看看这些公司如何使用机器学习吧。一家支付处理公司在几十亿次交易中,实时检测到了欺诈行为,每月减少损失达100万美元。一家汽车保险公司用详细的地理空间数据,预测保险索...
0
推荐
1756
阅读
癌症不再是绝症?基因组分析软件重大突破
近期,基因组学研究领域迎来了一个重大里程碑:隶属于麻省理工学院和哈佛大学的博德研究所开源了GATK4的源代码,这一全球最受欢迎的基因组分析软件,如今又实现了重大进步。英特尔一直在推动这一在基因组学研究领域中具有划时代意义成果的完成。英特尔和博德研究所开发了一个名为 “博德-英特尔基因组学堆栈(BIGsta...