机器学习

机器学习

0
推荐
19
浏览

签约 | 观远数据中标「王府井集团」数据大屏与敏捷BI项目

 近日,观远数据中标王府井集团数据大屏和敏捷BI平台项目。通过本次合作,观远数据将基于其架构先进、功能丰富的数据大屏与敏捷BI平台,结合王府井集团所拥有的零售行业深厚积淀,助力王府井集团搭建新一代...

观远数据 发表了文章 • 18 小时前

0
推荐
24
浏览

对话| Tims Senior IT 总监:国际品牌本土化,数字化要先行

 “老牌咖啡品牌20年中国市场的耕耘和资本市场对咖啡茶饮的追逐,都给Tims进入中国做足了市场教育。中国现磨现煮咖啡市场潜力巨大,只要Tims做好产品、服务等差异化营销,在中国依然很有戏。”Tims CoffeeHous...

观远数据 发表了文章 • 2 天前

0
推荐
26
浏览

喜讯| 观远数据携手10家客户入围【2019智慧零售潜力TOP100排行榜】

观远数据入围「2019智慧零售潜力TOP100排行榜」,恭喜共同入围的客户,特别感谢所有客户伙伴一路的支持和信任。 近日,《互联网周刊》&eNet研究院公布了「2019智慧零售潜力TOP100排行榜」,阿里云、苏宁...

观远数据 发表了文章 • 2 天前

0
推荐
56
浏览

机器战狗出警!美国警方带波士顿动力Spot执法,会破门会排爆!

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | wbur.org作者 | Ally Jarmanning  编辑 | 肖琴【导读】波士顿动力机器狗终于开始出警了!据外媒爆料,马萨诸...

数智物语 发表了文章 • 2019-11-27 16:58

0
推荐
57
浏览

双奖加冕 | 观远数据同时获得企服权威媒体36氪、崔牛会奖项

上周,观远数据获得企业服务领域权威媒体36氪、崔牛会的奖项认证。在此,特别感谢所有客户伙伴一路的支持和信任,期待一起共创未来! 新年将至,又到了各个行业的年终复盘时,企业服务行业也不例外,各类业...

观远数据 发表了文章 • 2019-11-26 11:56

0
推荐
66
浏览

即刻构建 数据赋能 | 看世界500强如何用AI赋能驱动业务增长

 11月22日,由AWS和观远数据联合主办的「零售与消费品行业会议」在广州圆满落幕。本次活动以“即刻构建 数据赋能”为主题,邀请了百余位零售快消行业嘉宾参加。观远数据合伙人 鲁伊莎、NOME(诺米家居)CIO 刘...

观远数据 发表了文章 • 2019-11-26 10:41

0
推荐
232
浏览

老板总是夸别人家的数据大屏?1小时教你批量搞定

认识观远的朋友都知道,我们一直强调自己所做的是“AI+BI”的智能数据分析解决方案,对,是产品加方案,而且是专攻零售消费行业的那种。但是从开始营业,观远就不断收到甲方爸爸关于专业之外的需求:能帮我们搭建个...

观远数据 发表了文章 • 2019-11-21 11:24

0
推荐
67
浏览

闭门分享 | 带你直击40人零售AI私享会干货现场

随着算法、算力、大数据的发展,智能技术应用所催生的商业价值正在逐步凸显,人工智能行业的投入和市场规模正在呈高速增长趋势。不管是零售还是快消领域,对于AI的探索早就已经开始。 11月15日,以“AI智能 ...

观远数据 发表了文章 • 2019-11-19 16:04

0
推荐
127
浏览

95后数据科学家教你从零自学机器学习,这有3本入门必看书籍

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 量子位(id:QbitAI)发自 | 凹非寺厌倦了现在的工作,想转行做数据科学,但是却没有计算机专业的相关学历,...

数智物语 发表了文章 • 2019-11-15 17:29

0
推荐
86
浏览

5个可以让你的模型在边缘设备上高效推理的算法

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI公园(id:AI_Paradise)作者 | James Le编译 | ronghuaiyang导读:深度学习模型这么大,这么慢,如何在边...

数智物语 发表了文章 • 2019-11-14 16:57

0
推荐
74
浏览

国民老公十年实习期暗淡收场,草根大学生又该如何立足职场?

国民老公、娱乐圈纪委、网红收割机、顶级投资人、IG老板……最近王思聪又收割了一份法院终审给出的“被执行人”身份,涉及资产近1.5个亿。这件事说明,王思聪2009年从王健林那里拿到手的5个亿的“练手钱”,到今天终于“...

Tempodata 发表了文章 • 2019-11-13 10:17

0
推荐
72
浏览

观远数据亮相「中国零售业博览会」,数据智能驱动零售新发展

11月7日,为期3天的第21届中国零售业博览会(CHINASHOP 2019)在青岛世界博览城开幕。展会由中国连锁经营协会(CCFA)主办,总展示面积13万㎡,参展企业近千家。  本次展会邀请中国零售连锁百强企业,...

观远数据 发表了文章 • 2019-11-12 15:14

0
推荐
153
浏览

第11个11.11会突破2500亿吗?

“oh my god”、“全体女生”……10月20日晚8点15分,“口红一哥”李佳琦开始了他的双十一预售直播,狂热的女粉丝挤爆了直播间。21日0点,天猫红包雨开始,“购物津贴”、“预售”……2019年的双十一购物狂欢节正式拉开战幕。从...

Tempodata 发表了文章 • 2019-11-08 11:04

0
推荐
92
浏览

深度学习的7个技巧,帮你训练出好的模型

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI公园(id:AI_Paradise)作者 | George Seif编译 | ronghuaiyang前戏这又是一篇介绍深度学习的技巧的文章,不过...

数智物语 发表了文章 • 2019-11-06 18:35

0
推荐
145
浏览

致数据分析师 | 如何让图表开口说话(总览篇)

导言《让图表开口说话》系列文章将会通过连载的形式为大家揭晓如何构建数据分析思路,如何结合实际场景剖析各种可视化图表的优缺点,真正实现“让数据更高效、让图表更直观”。 找到适合自己的东西是一件非常...

观远数据 发表了文章 • 2019-11-05 16:03

条新动态, 点击查看
brucelu

brucelu 回答了问题 • 2015-11-27 16:38 • 1 个回复 不感兴趣

在机器学习方面最经常用的算法有哪些?

赞同来自:

这个问题太大了,都可以写几篇大论文了。
简单说一下,目前的算法都有各种应用,只是行业不同而已哦。
按照机器学习的分法,最常见的分类就是有监督学习、无监督学习、半监督学习、强化学习。
有监督学习主要有:逻辑回归(Logistic Regression)、BP神经... 显示全部 »
这个问题太大了,都可以写几篇大论文了。
简单说一下,目前的算法都有各种应用,只是行业不同而已哦。
按照机器学习的分法,最常见的分类就是有监督学习、无监督学习、半监督学习、强化学习。
有监督学习主要有:逻辑回归(Logistic Regression)、BP神经网络(Back Propagation Neural Network)
无监督学习主要有:Apriori、k-means.
半监督学习主要是分类和回归,有:推理算法(Graph Inference)、拉普拉斯支持向量机(Laplacian SVM)
强化学习有:Q-learning、时间差学习(Tempral difference learning)
如果按照数据挖掘来分:
分类与回归:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机、逻辑回归等
关联:Apriori、FP-树频集等
聚类:k-means、k-medoids等
简单就这么看看吧,功能这一块不好说,不同算法的应用真的不一样,回头我整理一下写到博客里面。
个人感觉这个问题的需要明确几个细节才能考虑如何实现:
1 你说的自动化变量筛选是指建模前的数据预处理过程?
2 一般情况下这种类型的建模要涉及训练,评估,应用三个方面的工作,你说的自动化过程是指哪个方面?
3 一般确定一个风险预测模型后确实需要根据应用的实际效... 显示全部 »
个人感觉这个问题的需要明确几个细节才能考虑如何实现:
1 你说的自动化变量筛选是指建模前的数据预处理过程?
2 一般情况下这种类型的建模要涉及训练,评估,应用三个方面的工作,你说的自动化过程是指哪个方面?
3 一般确定一个风险预测模型后确实需要根据应用的实际效果不断对该模型进行调整,但这个调整周期都是需要一定时间和新的应用数据积累的,每日的地自动化如果是指模型调整而言好像不是很合适。
4 建议明确该风险模型的应用场景和目标,不同的应用场景和目标对于训练出的模型准确度的具体要求是不同的,进而也会影响模型的评估标准。
 
站在应用层面讲,对于那些数学结论的推导过程可以不用那么明白,简单点,如果能明白这个结论是基于什么假设的,另外对算法结果能够解读,即关键的几个参数是评价一个模型好坏的依据,这个还是要明白的,谢谢!
站在应用层面讲,对于那些数学结论的推导过程可以不用那么明白,简单点,如果能明白这个结论是基于什么假设的,另外对算法结果能够解读,即关键的几个参数是评价一个模型好坏的依据,这个还是要明白的,谢谢!
话术如下:
 
“阿尔法狗大家都听说过吧,阿尔法狗之所以厉害,不是因为他背会了多少棋谱或者记住什么规则,而是他不停的跟人去学习,他不需要懂所有的规则和可能,只要学会了下棋的人的套路就行了。这样的好处就是越学越厉害,你看阿尔法狗下李世石的时候还输了一次,后来改名... 显示全部 »
话术如下:
 
“阿尔法狗大家都听说过吧,阿尔法狗之所以厉害,不是因为他背会了多少棋谱或者记住什么规则,而是他不停的跟人去学习,他不需要懂所有的规则和可能,只要学会了下棋的人的套路就行了。这样的好处就是越学越厉害,你看阿尔法狗下李世石的时候还输了一次,后来改名master上围棋网就大杀四方,排名第一的天才少年柯洁都输了。”
 
“其实我们自己也有类似的例子,比如我们学开车,虽然有基本的规则红灯停绿灯行,但是具体你打方向盘打多少度,转多大弯,开多少速度,并不是很精确的去背公式:向左打90车头可以转45度弯,而是根据实际路况,凭感觉判断。这样一开始虽然会出一些问题,但是开的越久就学的越精,机械学习的原理也是如此,他把每一次的情况,用一些参数记录下来,比如你打了多少度,车头转了多少,过了什么样的弯,这些参数记录下来, 然后记录你开车的结果,剩下的交给算法去学习,让算法自己帮你总结经验,越总结越会开。这也是谷歌无人驾驶车的原理”
 
“所以,业务人员可以放心的抛弃传统的因果关系,假设,判断的思路,让算法来解决问题,我们只要聚焦算法的结果是否越来越朝着我们想要的方向发展就好了。正如同你自己开车不会纠结打方向盘打90度还是95度而是关注车到底转过弯没有一样”
一言不合就上书单,哈哈~
之前总结的一个学习路径供参考:
https://ask.hellobi.com/blog/wetalkdata/3980
 
如下是文字版本:
这是浩彬老撕自己的学习书单,希望能够帮助大家更好更快地理解数据科学,同时也希望继续完善... 显示全部 »
一言不合就上书单,哈哈~
之前总结的一个学习路径供参考:
https://ask.hellobi.com/blog/wetalkdata/3980
 
如下是文字版本:
这是浩彬老撕自己的学习书单,希望能够帮助大家更好更快地理解数据科学,同时也希望继续完善自己。


#关于这份学习清单#我会按照基础到入门给出详细推荐,并且附上个人点评。同时尽量做到各个资料在内容上并不重复(即使内容上有重复,也会在难度上做出区分),希望可以以最直接的方式告诉大家应该怎么选择。

Ps:这是第一版学习指南,由于最近时间比较紧张,预计在第二版中会加入业务材料的推荐和更多的学习索引,欢迎关注。

1先验知识

由于统计学概率论甚至到机器学习会对数学基础有一定要求,所以这里给出一些先验知识的内容推荐,主要是矩阵方面。

1.1 课程

可汗学院公开课:线性代数课程




可汗学院公开课:线性代数


因为网易公开课有翻译,这里是中文字幕课程链接,这里真要给网易100个赞,字幕做得很好。


“可汗学院(Khan Academy),是由孟加拉裔美国人萨尔曼·可汗创立的一家教育性非营利组织,主旨在于利用网络影片进行免费授课,现有关于数学、历史、金融、物理、化学、生物、天文学等科目的内容,教学影片超过2000段,机构的使命是加快各年龄学生的学习速度。”

1.2 参考书籍

(1)线性代数 豆瓣评分7.3




清华居余马老师的线性代数教材,比较经典的教材了,里面的知识足够支撑我们后续统计分析和机器学习需要。

(2)高等代数 豆瓣评分8.1




相比于线性代数,高等代数更加深入,一般线性代数为非数学专业所用,数学类专业一般学习高等代数。不过一般情况下,线性代数也足够使用了。

当然,在后续学习中有些算法也会用到微积分的知识,但是都比较基础,因此遇到不懂的时候直接查资料即可,就没有特定推荐材料了。

2统计分析学习资料

2.1 统计学/概率课程

同样推荐可汗学院的统计学和概率课程,而且刚好这两门课程也被网易公开课进行了翻译:

(1) 可汗学院公开课:统计学




可汗学院公开课:统计学

(2) 可汗学院公开课:概率




可汗学院公开课:概率


这两本课程总体不算太难,适合入门。个人觉得讲授还是蛮有特点的,粗暴直接,另外举的例子也是蛮有趣的。

2.2统计学/概率参考书

(1)统计学 豆瓣评分8.8
作者William Mendenhall / Terry Sincich




“《统计学(原书第5版)》内容丰富,很少涉及统计学理论的严格数学证明,绝大部分是与实际应用紧密联系的例子和练习,适合作为理工科各专业本科生、研究生的统计学教材,也可作为相关领域研究人员的参考读物。”

非常注重实用的统计学课程,偏应用,少数学证明,可读性比较强;

(2)统计学 豆瓣评分7.3
作者:贾俊平,何晓群,金勇进



统计比较通用的入门教材了,不知不觉竟然到了第六版,个人认为也算是兼顾数学证明和应用,可读性没有上面强,但是也非常的通俗易懂,有很多统计学专业的起始教材也会选择这本。

(3)统计推断 豆瓣评分8.8,/英本原本9.2
作者:William Mendenhall / Terry Sincich



非常经典经典的统计学教材,借用介绍“从概率论的基础开始,通过例子与习题的旁征博引,引进了大量近代统计处理的新技术和一些国内同类教材中不常见而又广为使用的分布。其内容既包括工科概率入门、经典统计和现代统计的基础,又加进了不少近代统计中数据处理的实用方法和思想”
可以作为研究生所用教材,有深度,但是作者循序渐进,解释得非常漂亮

3机器学习资料

3.1机器学习课程

强烈推荐Andrew NG吴恩达的斯坦福机器学习课程,英文授课,但是已有完善的中文字幕,内容非常丰富且充实(20节),并且讲解得非常的好,如果你想学习机器学习,一定不能错过!




Coursera地址:

Coursera - Free Online Courses From Top Universities

网易公开课地址:

斯坦福大学公开课 :机器学习课程

同时该课程配有课件讲义,同样建议大家在学习视频课程之余多看讲义和习题,虽然是英文,但是阅读上基本没有什么问题,就讲义本身也是非常的棒。

如果大家学习完Andrew NG的机器学习,还想通过其他课程触类旁通,相互借鉴的话,可以上Coursera上门搜索还有其他选择,例如台大的机器学习基础等等,但毫无疑问首推Andrew NG的课程;

另外现在国内也有越来越多的培训网站推出相关课程,大家有兴趣的可以自己搜搜,这里就不做推荐了;

3.2机器学习教材

(1)数据挖掘导论 豆瓣评分8.4,/英本原本8.8

作者: Pang-Ning Tan、Michael Steinbach、Vipin Kumar




介绍得非常全面的一本书,但可能因为需要涵盖的内容太多,所以难免有些算法只能简单介绍。尽管这样,个人认为也是非常难得一见的入门教材,有一定难度。这本书从简单的数据开始,到各种分类算法,聚类算法,关联规则都有相对完整的指引,我认为对于我们构建自身的统计挖掘体系是有很大的帮助。中文版本翻译还是挺好的,但是英文原版那是极好的。

(2)统计学习方法 豆瓣评分:8.9

作者:李航




个人认为中文教材里面少见的精品,虽然精简,但逻辑非常的清晰,非常详细地为我们剖析了算法原理,可能不太适合入门者,但是还是非常值得推荐阅读学习,建议将《数据挖掘导论》以及《统计学习方法》相互借鉴学习

(3)The Elements of Statistical Learning(统计学习基础)

豆瓣英本原版评分9.4 中文评分7.4




作者:Trevor Hastie

这本书被广大人民喜称为ESL,虽然书名是统计学习基础,但是此书一点都不基础,一点都不~另外此书还有一本专门的入门版本ISL(后面会介绍)

这本书涵盖了非常多的内容,讲解深入,有人评价说,“有了这本书就不需要其他机器学习教材”,虽然有点夸张,但是此书实际是机器学习的经典巨作,如果你真的希望好好研究机器学习,此书非常值得仔细研读,另外此书要求不低的统计理论和数学基础。

此外,这本书还有一个牛逼的地方在于,作者把书放在网上免费下载:

Elements of Statistical Learning: data mining, inference, and prediction.2nd Edition.







前面都是一些理论知识,但是数据科学里面实践应用又是另外一个重中之重,接下来谈一下借助工具进行实践应用的问题,由于Python还在整理当中,本次主要介绍SPSS与R语言:

4SPSS学习资料

考虑到SPSS分为统计模块Statistics以及数据挖掘模块Modeler , 因此也分为两大块介绍

4.1SPSS统计分析资料

SPSS Statistics 市面上的书籍比较多,从我个人的角度,认为张文彤老师的系列足以让大家加深对统计体系的理解,同时也能很好掌握在实际的应用当中如何使用统计分析帮助我们完成任务,我认为掌握统计分析原理实战和SPSS操作,以下两本书足矣。

(1) SPSS统计分析基础教程 豆瓣评分8.4




提供了包括医疗、经济、市场研究等方面的案例贯穿了全书,能够很好从实际应用角度把统计分析原理和SPSS操作结合起来,也提供了很好的结果解读,不失为一本极好的工具指南。

(2)高等学校教材(SPSS统计分析高级教程)豆瓣评分7.7




相比于基础教材,高级教程介绍了更多的统计算法模型,同时也提供了一些统计新方法和新观点的讲解。整体来说直观易懂,能够很好提升实战能力。

另外张文彤老师也有对应视频课程 《张文彤SPSS初中级教程》以及《张文彤SPSS高级教程》

4.2 SPSS机器学习教程

(1)Modeler官方的帮助文档和Sample文件




Modeler提供完备Sample数据和数据建模文件,并且配套中文说明,可以帮助入门者一步一步搭建数据建模流并理解实际应用场景。Modeler提供的帮助文档包括有算法说明,节点说明,Crisp-dm方法论,应用文档等,其中比较重要一本如:《IBM SPSS Modler 应用程序指南》

(2) IBM SPSS数据分析与挖掘实战案例精粹 豆瓣评分9.3

作者:张文彤,钟云飞




非常详尽工具手册,提供了医疗、金融、保险、汽车、快速消费品、市场研究、互联网等多个行业的数据分析/挖掘案例,基于实战需求,详细讲解整个案例的完整分析过程,并将模型和软件的介绍融于案例讲解之中,尤其是书本最后几章实践案例,从商业问题界定到商业应用,给出了非常详尽的建模指南,个人认为目前市面上Modeler最好的工具手册;另外即使不是使用SPSS,而是用其他工具,该书后面的例子也值得大家研读。

5R语言学习资料

(1)R语言实战 豆瓣评分8.8

作者:Robert I.Kabacoff




首先这本书绝对可以担当日常工具手册,从基本操作,数据处理,数据建模,图形展示都给出了非常详尽的介绍;其次虽然是工具手册,但是能够结合基本统计知识于简单案例,具有很强实践性,强烈建议各位把书中的代码都实现,相信能够大大提升R的功力。最后说一句,此书翻译得不错。

(2)An Introduction to Statistical Learning(统计学习导论) 英本版豆瓣评分9.5,中文版7.6

作者:Trevor Hastie,Robert Tibshirani ,Jerome Friedman


此书被广大人民群众称为ISL,没错,就是上面ESL的入门版本。无论作为统计教材推荐还是R语言教材推荐都称得上5星的读物。ISL虽然是入门版本,但是绝对不是因为内容简单。深入浅出,内容详细,常常读完有种恍然大悟的感觉,同时能够结合R语言介绍,大大的加分。

最后厚颜无耻地介绍我个人的公众号,wetalkdata,定期更新数据分析,数据挖掘方法,Statistics以及Modeler操作指南(比帮助手册更详细),而且还有送书活动!
David Chiu:以往舆情分析专注在于用声量了解民声,但我觉得这根本不通, 重点是要摘要出民众讨论的议题有哪些.
给个范例: 今天有些人在商城上购买电饭锅, 势必会留下评价. 我们就想是否可以能将这些评价做摘要, 让我们针对摘要做统计, 而不只是单纯看声量... 显示全部 »
David Chiu:以往舆情分析专注在于用声量了解民声,但我觉得这根本不通, 重点是要摘要出民众讨论的议题有哪些.
给个范例: 今天有些人在商城上购买电饭锅, 势必会留下评价. 我们就想是否可以能将这些评价做摘要, 让我们针对摘要做统计, 而不只是单纯看声量,因此我们实际的作法如下:

1. 先利用jiebaR 将文本断词, 
2. 接者求出词频矩阵
3. 将文章做分群
4. 根据同一群的资料做Multiple Sequence Alignment
5. 抽出句子
6. 最后对句子贴标
郭昱良

郭昱良 回答了问题 • 2017-03-14 15:31 • 2 个回复 不感兴趣

机器学习一般用什么数据库?

赞同来自:

一般而言,这取决于你所使用得机器学习平台。不过就现在机器学习的大趋势而言一般使用Python以及三方库,如Sciket-learning、Theano、Torch、TensorFlow、MxNet等机器学习深度学习库,所以我还是习惯使用MySQL,毕竟开源的嘛... 显示全部 »
一般而言,这取决于你所使用得机器学习平台。不过就现在机器学习的大趋势而言一般使用Python以及三方库,如Sciket-learning、Theano、Torch、TensorFlow、MxNet等机器学习深度学习库,所以我还是习惯使用MySQL,毕竟开源的嘛,资料也多
老头子

老头子 回答了问题 • 2017-01-12 15:54 • 2 个回复 不感兴趣

Oracle职业发展的困惑

赞同来自:

你想走宽还是想走深?
任何技术都有一定的限制性,我个人是觉得紧追技术前沿是很累的一件事,现在你能追,10年之后还能追么
同样是学习新技术,一个廉价的应届毕业生有可能做的比你还好。
多年后我们的学习能力必然比不上年轻的学生,而更多的是工作经验,已经领域内踩过的各... 显示全部 »
你想走宽还是想走深?
任何技术都有一定的限制性,我个人是觉得紧追技术前沿是很累的一件事,现在你能追,10年之后还能追么
同样是学习新技术,一个廉价的应届毕业生有可能做的比你还好。
多年后我们的学习能力必然比不上年轻的学生,而更多的是工作经验,已经领域内踩过的各种坑。
我不反对追新,但是过于迷茫就不合适了
你认为自己在oracle领域是局限自己,可能仅仅是因为你的工作环境限制你一直在吃老本,没有机会接触更深的东西。
而大部分时候工作都是这样的,花钱请你干活,想充电自己找时间,有人追求更新技术,有人追求工匠精神。
看你个人的追求是什么,路子这东西,有的人说自己越走越窄,有的人说自己越走越资深。
如果你认定了想转行,也不错,说明你有勇气重头再来。
既然有勇气,就别怕顺不顺利;不顺利,也要坚持。
追求自己内心的想法,工作已经很累了,别让自己在不感兴趣的领域里累上加累~
 
p.s
oracle的路子并不窄,你现在是做开发,你可以充电转去做模型、架构
而且做过EBS也有很好的路子,你做过的东西不少,为啥会认为自己路子窄呢。
让我这种只做过BI,java都忘干净的人怎么活 - -.
 
seng

seng 回答了问题 • 2017-03-06 13:43 • 1 个回复 不感兴趣

哪位大神说一下 如何更改jupyter的工作路径?

赞同来自:

启动的当前路径就是你的工作目录。
 
启动的当前路径就是你的工作目录。
 
哈哈哈,还真相信了……数据分析就是一个内部岗位,没有产生任何价值,所谓年薪百万都是编出来忽悠人的,指条明路哈:去阿里,百度做搜索算法,或者去今日头条做推荐算法,如果能录用的话,工资大概30w/年,根据部门绩效可能有些奖金,这是做算法的最好的去处了,银行,移动,... 显示全部 »
哈哈哈,还真相信了……数据分析就是一个内部岗位,没有产生任何价值,所谓年薪百万都是编出来忽悠人的,指条明路哈:去阿里,百度做搜索算法,或者去今日头条做推荐算法,如果能录用的话,工资大概30w/年,根据部门绩效可能有些奖金,这是做算法的最好的去处了,银行,移动,电信大把会做算法的人, 年薪也就十几万左右……数据分析真正的出路是管理线,做部门领导,带团队带项目,只要上了管理线,一个数据中心老大的薪资应该有60-80万/年。……拒绝迷信算法,正确看待发展前景,从我做起,人人有责,哈哈哈
单个特征选择,可以用决策树的split 的方法:gini index,信息增益等。
组合特征选择,决策树的整个路径。
单个特征选择,可以用决策树的split 的方法:gini index,信息增益等。
组合特征选择,决策树的整个路径。
3
推荐
2343
浏览

《人人都会数据分析》20万字电子版

去年的时间把之前的数据分析工作经历、大环境背景、职场选择、公司选择、岗位选择、统计学的基本常识、需要掌握的分析工具、怎么写好一个报告、互联网和金融行业的分析场景这些都整理了下。具体购买链接:https:/...

面包君 发表了文章 • 2018-01-03 15:15

3
推荐
1694
浏览

绪论:第一个机器学习样例

作为“绪论”的总结,我们来运用 Python 解决一个实际问题以对机器学习有具体的感受吧。由于该样例只是为了提供直观,我们就拿比较有名的一个小问题来进行阐述。俗话云:“麻雀虽小,五脏俱全”,我们完全可以通过这...

射命丸咲 发表了文章 • 2017-05-17 09:54

0
推荐
1253
浏览

机器学习入门算法:从线性模型到神经网络

段时间以来,我们频频听到「机器学习(machine learning)」这个词(通常在预测分析(predictive analysis)和人工智能(artificial intelligence)的上下文中)。几十年来,机器学习实际上已经变成了一门独立的...

天善智能 发表了文章 • 2017-04-27 11:13

2
推荐
2522
浏览

Python机器学习实践—决策树

这几期和大家聊聊使用Python进行机器学习题外话:之前一期 “ scrapy抓取当当网82万册图书数据 ” 的 Github 链接Python拥有强大的第三方库,使用Python进行科学计算和机器学习同样需要先配置运行环境。这里我们需...

watermelon 发表了文章 • 2017-02-13 10:33

6
推荐
1740
浏览

机器学习知识体系(转)

随着2016年Alpha Go在围棋击败李世石,2017年初卡内基梅隆大学人工智能系统Libratus在长达20天的鏖战中,打败4名世界顶级德州扑克玩家,这标志着人工智能技术又达到了一个新的高峰。人工智能已经不再是在各大公司...

余家昕 发表了文章 • 2017-02-03 16:06

4
推荐
1477
浏览

Python为何能坐稳 AI 时代头牌语言

谁会成为AI 和大数据时代的第一开发语言?这本已是一个不需要争论的问题。如果说三年前,Matlab、Scala、R、Java 和 Python还各有机会,局面尚且不清楚,那么三年之后,趋势已经非常明确了,特别是前两天 Faceboo...

天善智能 发表了文章 • 2017-02-03 09:04

9
推荐
5300
浏览

蓝色巨人IBM的变革与复兴,大数据时代的人工智能 IBM Watson

2016年是人工智能走向大众的元年大数据的火热还未退去,人工智能在2016年和2017年交替之际就被刷爆了。从 2016年12月29日到2017年1月4日,一位标注为韩国九段的神秘棋手 Master 在一周之内完胜包括中日韩朴廷桓、...

lvpin 发表了文章 • 2017-01-16 11:17

3
推荐
1413
浏览

案例+课件下载 | 品质课件!机器学习技术在Python 语言的商业应用

1、本文是12月15日(周四晚)机器学习技术在Python 语言的商业应用的课件;2、12月22日韦玮老师主讲《Spark网站流量异常大规模检测案例实战》直播地址:http://edu.hellobi.com/live/lesson/117/1702  ...

天善智能 发表了文章 • 2016-12-21 09:39

0
投票
0
回答
572
浏览
0
投票
1
回答
711
浏览

input data 问题

一只写程序的猿 回复了问题 • 2018-01-31 14:40
0
投票
0
回答
746
浏览
0
投票
0
回答
544
浏览
0
投票
0
回答
616
浏览
0
投票
0
回答
869
浏览
0
投票
0
回答
499
浏览

已经安装sklearn还是报错

洪恩浩荡 发起了问题 • 2017-12-04 22:47
0
投票
0
回答
662
浏览
0
推荐
127
浏览

95后数据科学家教你从零自学机器学习,这有3本入门必看书籍

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 量子位(id:QbitAI)发自 | 凹非寺厌倦了现在的工作,想转行做数据科学,但是却没有计算机专业的相关学历,...

数智物语 发表了文章 • 2019-11-15 17:29

0
推荐
92
浏览

深度学习的7个技巧,帮你训练出好的模型

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI公园(id:AI_Paradise)作者 | George Seif编译 | ronghuaiyang前戏这又是一篇介绍深度学习的技巧的文章,不过...

数智物语 发表了文章 • 2019-11-06 18:35

0
推荐
142
浏览

风险决策引擎是如何一步步鉴定客户资质?

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 汽车金融二三事在风控规则引擎里,是怎么结合评分卡来输出自动审批决策?下面通过一个简单的策略配置来进行了...

数智物语 发表了文章 • 2019-10-28 18:18

0
推荐
147
浏览

jieba 包 pip install 时 time out,手动下载安装

1. pip 安装总是 time outpip install jieba2. 指定 time out 时间,问题依旧pip --default-timeout=100 install jieba 3. 手动下载wget https://files.pythonhosted.org/packages/71/46/c6f9179f73b818d5827202a...

safa 发表了文章 • 2019-10-19 22:52

0
推荐
150
浏览

机器学习模型应用方法综述

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 数据派THU(id:DatapiTHU)作者:Julien Kervizic翻译:陈之炎     校对:李海明本文整理比...

数智物语 发表了文章 • 2019-10-17 18:55

0
推荐
202
浏览

最全的机器学习入门资料

上次我推荐了学习数据分析要看哪些书:数据分析有哪些好书值得推荐?这次推荐的是机器学习入门要看的书。我们从下面3步详细看下如何去学习。第1步:基础知识学习机器学习需要具备数学和编程基础。1)数学理论:微...

猴子聊人物 发表了文章 • 2019-10-17 11:31

0
推荐
276
浏览

利用 Spark 和 scikit-learn 将你的模型训练加快 100 倍

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | AI开发者(okweiwu)作者 | skura在 Ibotta,我们训练了许多机器学习模型。这些模型为我们的推荐系统、搜索引...

数智物语 发表了文章 • 2019-09-24 16:28

0
推荐
296
浏览

一张图看懂数据分析、机器学习、深度学习、人工智能的关系

​我是思宇:现在找到自己喜欢的工作了,分享下我当时换工作的经验。1.为什么要换工作?目标是什么?一定要明白自己换工作的原因,三思后行。当有换工作想法时,对自己当前工作情况做个总结,避免随意性地做决定。...

猴子聊人物 发表了文章 • 2019-09-11 17:18

0
推荐
253
浏览

机器学习札记18——SVM(1)

SVM支持向量机简介SVM(support vector machine)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使其区别于感知机,感知机只是找到一个分离超平面。SVM是非线性分类器学习策略...

皮大大 发表了文章 • 2019-09-05 20:55

0
推荐
315
浏览

机器学习札记17——线性回归LR

线性回归法思想解决回归问题算法可解释性强一般在坐标轴中:横轴是特征(属性),纵坐标为预测的结果,输出标记(具体数值)分类问题中,横轴和纵轴都是样本特征属性(肿瘤大小,肿瘤发现时间)问题产生image.png...

皮大大 发表了文章 • 2019-09-05 20:53

0
推荐
248
浏览

自动机器学习:最近进展研究综述

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。英文标题 | AutoML:A survey of State-of-the-art作 者 | Xin He, Kaiyong Zhao, Xiaowen Chu单 位 | Hong Kong Bap...

数智物语 发表了文章 • 2019-09-02 17:54

0
推荐
191
浏览

算法札记12——堆排序

树¶树一种抽象类型数据,用来模拟具有树状结构性质的数据集合。它是由多个有限节点组成一个层次关系的集合。特点:每个节点有0个或者多个子节点没有父节点的节点称之为根节点每个非根节点有且只有一个跟节点术语¶...

皮大大 发表了文章 • 2019-09-01 17:46

0
推荐
191
浏览

算法札记11——归并排序

归并排序算法思想归并排序算法会把序列分成长度相同的两个子序列,当无法继续往下分时(也就是每个子序列中只有一个数据时),就对子序列进行归并。归并指的是把两个排好序的子序列合并成一个有序序列。该操作会...

皮大大 发表了文章 • 2019-09-01 12:51

0
推荐
191
浏览

算法札记10——快速排序

快速排序算法思想快速排序算法首先会在序列中随机选择一个基准值(pivot),然后将除了基准值以外的数分为“比基准值小的数”和“比基准值大的数”这两个类别,再将其排列成以下形式:[ 比基准值小] 基准值 [比基准值...

皮大大 发表了文章 • 2019-09-01 12:49

0
推荐
182
浏览

算法札记7——栈和队列

栈概念栈是一种线性的数据结构,FILO(先进后出)的操作,可以用顺序表实现,也可以用链表来实现。想象成一个杯子,只能往上面倒水进去,把水倒出去的时候,上面的先出来。操作栈的基本操作包含:stack():创建空...

皮大大 发表了文章 • 2019-09-01 11:44

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”