数据科学家养成记

鲁伟 一个数据科学践行者的学习日记。数据挖掘与机器学习,R与Python,理论与实践并行。个人公众号:数据科学家养成记 (微信ID:louwill12)

0
推荐
2540
阅读

用数据分析告诉你数据分析师能挣多少钱

    随着大数据时代的到来和数据的市场价值得到认可,数据分析师、进阶一点的还有数据挖掘工程师、甚至是金字塔顶尖的数据科学家,这些作为21世纪最性感的职业已成功吸引无数像笔者这样的热血小青年,阿里的一句“开启AI时代”的口号就足以让我等激动的准备把此身奉献给高大上的数据科学行业。除去像计算机、数...

发表了文章 • 2017-06-19 10:40 • 0 条评论

0
推荐
4707
阅读

人工神经网络算法及其简易R实现

引子     一直在琢磨怎样把这些看起来高大上的数据挖掘和机器学习算法给大家用稍微通俗点的语言介绍出来,后来又觉得这要取决于我自己对算法的理解程度有多深以及会不会以一个传道授业解惑的角度来看待自己,所以就尽量做到自己的推文能让人看起来更友好一点。    人工神...

发表了文章 • 2017-06-19 10:33 • 0 条评论

1
推荐
2721
阅读

R语言数据分析练手小项目:杭州二手房数据分析

   记得上次小编用rvest包从某家网上爬取了杭州二手房数据,并详细介绍了爬取经过,后来小编有听到反馈说“哎,你这什么分析都没有啊”,当然什么分析都没有咯,小编给大家介绍就是如何用R语言来抓数据。后来小编一想,这好好的数据不能闲置,于是就拿来做一点分析,正好最近又在学习ggplot2,一起拿来进行简单...

发表了文章 • 2017-06-16 15:03 • 0 条评论

1
推荐
4069
阅读

朴素贝叶斯和贝叶斯网络算法及其R语言实现

 最近在硬怼data mining,总算把几个月前说好的正面刚算法的计划给开了个头。毕竟在小编的计划中将来是打算偏机器学习的,不懂算法实现肯定是转型无望了。既然小编是做贝叶斯方向的,所以数据挖掘算法这块就先从贝叶斯分类器开始,原本以为花不了多少时间,可这两年终归是离扎实的数学计算训练太远了,就算是正面刚...

发表了文章 • 2017-06-16 14:32 • 0 条评论

0
推荐
2921
阅读

大数据背后的神秘定理:贝叶斯公式

本文经《大数据文摘》公众号授权发布王晓峰/文    昨天下午趁着出去调研在湖滨银泰的星巴克做网易机器学习实习生岗位的笔试题,20道单选题连蒙带猜,3道编程大题不是C++就是Java,怼得我智商瞬间下线、手足无措。痛定思痛之余,决心恶补计算机基础,下些工夫学习数据结构与算法,琢磨着定有卷土重来之时...

发表了文章 • 2017-06-16 14:19 • 1 条评论

0
推荐
4621
阅读

R语言交互式绘制杭州市地图:leafletCN包简介

  作为一名地图控,曾经一度不敢看地图,只要瞄一眼心思就立马飞到三山五岳,四海五湖。初中高中上地理课时,每每会思索教材上那些漂亮的彩色地图是怎么画出来,后来我才明白这些炫目的彩图背后的实现原理并不难。相信有很多人和我一样,一开始被R语言吸引并不是因为其出色的统计计算和数据分析功能,而是由于...

发表了文章 • 2017-06-16 13:55 • 0 条评论

0
推荐
3176
阅读

基于jiebaR包的周杰伦歌词文本挖掘分析

  虽然现在NLP(自然语言处理)技术那么发达,但作为一个有志于在数据科学领域内搞出点动静的年轻人来说,用R来做一点文本挖掘还各种出错,各种困难不断,确实是有点说不过去。前两天看到R语言中文社区分享的一个关于jiebaR包分词工具的文章,于是也想尝个鲜,便琢磨着搞个东西给大家看看。在CSDN和知乎上看到有大...

发表了文章 • 2017-06-16 13:40 • 0 条评论

1
推荐
6670
阅读

R语言爬虫利器:rvest包+SelectorGadget抓取链家杭州二手房数据

自打春节后从家里回到学校以来就一直在捣鼓爬虫,总琢磨着个抓些数据来玩玩,在文档里保存一些自己的datasets。从一开始学Python3写scrapy框架到现在的rvest包R语言数据抓取,好歹有了自己固定的爬虫操作模式,这期间学着别人爬过当当网的商品数据,爬过豆瓣电影和图书top250,还爬过前程无忧的招聘信息等等,既然有了一...

发表了文章 • 2017-06-16 13:35 • 0 条评论