0
推荐
3575
阅读

利用pandas进行数据分析(三):缺失值处理

   在实际的数据处理过程中,数据缺失是一种再平常不过的现象了。缺失值的存在极大的影响了我们数据分析结果的可靠性,以至于在数据建模前我们必须对缺失值进行处理。实际的缺失值处理主要包括两个部分:即识别数据集中的缺失值和如何处理缺失。 相较于 Python, R在数据缺失处理方面提供了大量的函数和包,但...

发表了文章 • 2017-12-19 10:05 • 0 条评论

6
推荐
2355
阅读

以虎嗅网4W+文章的文本挖掘为例,展现数据分析的一整套流程

本文转载自微信公众号运营喵是怎样炼成的之前在八月份写过一篇针对外部数据分析的文章,《作为一个合格的“增长黑客”,你还得重视外部数据的分析!》,一部分读者向笔者反映,说对外部数据的分析跳出了原有的只针对企业内部数据分析(用户数据、销售数据、流量数据等)的窠臼,往往能给产品、运营、营销带来意想不到的启...

发表了文章 • 2017-12-11 11:22 • 0 条评论

1
推荐
2539
阅读

利用pandas进行数据分析(二):索引与层次化索引

     继上一节的 pandas基本数据结构的介绍之后,本节继续介绍 pandas中操作 Series和 DataFrame的基本手段。一个最常用的操作就是索引,如何根据分析目的对 Series和 DataFrame进行索引访问得到数据是利用 pandas进行数据分析的基本技能之一。索引用的好,对于数据访问、筛选和过滤以及理解 pandas数据...

发表了文章 • 2017-12-11 10:56 • 0 条评论

1
推荐
2064
阅读

利用pandas进行数据分析(一):Series和DataFrame数据结构

对于Python而言,坊间早有这种说法:在有了 pandas之后,Python才算有了数据分析的能力。在此之前,要想用Python来做数据分析,可能就没那么友好了,可见pandas在学习数据分析时候的重要程度。对于 pandas来说,很多功能的实现也是要基于科学计算库 numpy的,所以 numpy+ pandas的组合在Python数据分析中就显得尤为关键...

发表了文章 • 2017-12-04 14:17 • 0 条评论

0
推荐
1446
阅读

数据工作岗位薪资水平影响因素研究

在这个数据和信息爆炸的时代,依靠一手漂亮的数据分析能力找到一份令人艳羡的数据科学相关的工作早已不是什么稀罕事。坊间早有传言说数据科学家是21世纪最性感的职业,与数据相关的岗位像数据分析、数据挖掘等工作已是众多年轻人追求的目标。这么多人将找工作的目光聚集在数据相关岗位上,这些岗位机会除了能使得你走在...

发表了文章 • 2017-09-05 14:12 • 0 条评论

1
推荐
6031
阅读

kaggle:NBA球员投篮数据分析与可视化(一)

作为数据科学领域的金字招牌,kaggle已成为世界上最受欢迎的数据科学竞赛平台。在kaggle上,每个竞赛题下都藏匿着大批来自世界各地并且身怀绝技的数据科学家。作为一种众包模式,kaggle通过收取部分佣金将企业的数据挖掘问题发布在平台上并设立高额奖金来吸引数据科学家来解决。每位注册参加的kaggler都可以自由获取竞赛...

发表了文章 • 2017-06-22 13:47 • 0 条评论

0
推荐
2521
阅读

用数据分析告诉你数据分析师能挣多少钱

    随着大数据时代的到来和数据的市场价值得到认可,数据分析师、进阶一点的还有数据挖掘工程师、甚至是金字塔顶尖的数据科学家,这些作为21世纪最性感的职业已成功吸引无数像笔者这样的热血小青年,阿里的一句“开启AI时代”的口号就足以让我等激动的准备把此身奉献给高大上的数据科学行业。除去像计算机、数...

发表了文章 • 2017-06-19 10:40 • 0 条评论

1
推荐
2698
阅读

R语言数据分析练手小项目:杭州二手房数据分析

   记得上次小编用rvest包从某家网上爬取了杭州二手房数据,并详细介绍了爬取经过,后来小编有听到反馈说“哎,你这什么分析都没有啊”,当然什么分析都没有咯,小编给大家介绍就是如何用R语言来抓数据。后来小编一想,这好好的数据不能闲置,于是就拿来做一点分析,正好最近又在学习ggplot2,一起拿来进行简单...

发表了文章 • 2017-06-16 15:03 • 0 条评论