凡人求索--李凯旋

17年毕业于二本暖通工程专业,于17年9月到12月份经过三个月努力开始转行从事数据挖掘工作。工作期间一直有同学咨询转行经验,于是在18年底创立数据蛙互助学习社区,目前已经1300人一起学习,欢迎一起学习哈。微信号:lkx941013

0
推荐
910
阅读

年前的一个小计划

马上快过年了,公司(乙方)把很多新的项目也都放到了年后,领导说趁着时间有些空闲让我们赶快充电,也对我们加强了培训(业务方面和技术方面)。于是就想着年前把转行前匆忙学习的知识做一个回顾,同时也想到学习最好最快的方式不就是教吗?所以接下来准备建立一个学习社群(对的,是免费的)主要目的有两个:巩固自己...

发表了文章 • 2019-08-28 19:32 • 0 条评论

0
推荐
1412
阅读

数据挖掘之Spark学习

阅读路线:Hadoop与Spark比较Spark的安装Spark知识点一、Hadoop与Spark比较1.简单的比较刚开始学习Spark的时候,自己总是会想当然的理解两者之间的关系。Hadoop和Spark的处理任务有很多是一样的,比如说他们都是有数据计算处理的功能,但是在一些方面又并不相互重叠,比如说,Spark没有文件管理功能,因而必须依赖Hadoop...

发表了文章 • 2019-08-28 19:31 • 0 条评论

0
推荐
1189
阅读

数据挖掘工作所需技能—正则表达式

由于这两天所做的项目涉及到了文本分析的内容,并在处理脏乱文本(就是做一个词云图,要把英文、一些标点符号之类的给清除掉)时使用了正则表达式,所以特别来总结下。在以后的一段日子里,我会尽量总结在每周工作中遇到的知识点,一是为了让还在转行路上的朋友了解下实际的工作涉及的内容,二是为了巩固自己学习到的知识...

发表了文章 • 2019-08-28 19:28 • 0 条评论

0
推荐
1427
阅读

用Python 的Flask实现 RESTful API(学习篇)

这篇文章主要是自己的学习总结,阅读路线如下:理解API理解Restful API 理解装饰器理解Flask框架使用Python Flask 实现Restful API API的理解API(application programming interfaces),即应用程序编程接口。API由服务器(Server)提供(服务器有各种各样的类型,一般我们浏览网页用到的是web server,即网络服务器),...

发表了文章 • 2019-08-28 19:26 • 0 条评论

0
推荐
1152
阅读

入门机器学习到底需要多少数学知识

还记得上个月的时候,准备学习机器学习的知识,想着线性回归模型较简单一些,那就从它开始吧。可是仔细一看里面的知识包括矩阵、极大似然函数、求导等方面的知识,这些知识也只是大学的时候学习的,现在也早已还给了老师。于是开始搜索入门机器学习需要哪些数学知识,应该怎么去学,搜索的结果表明,概率论统计、线性代...

发表了文章 • 2019-08-28 19:24 • 0 条评论

0
推荐
856
阅读

自己找数据分析工作时所犯的错误

看到好多人都分享了如何成功转行数据分析工作的文章,确实能让我们有了别人能够做到,我们也能做到的信心。在大家对转行数据分析工作有信心并努力的同时,也希望大家在求职的过程中少走些弯路,所以今天想和大家分享下我在找工作的时候犯了哪些错,使找工作未果。(如果只是我自己的问题,大家也勿喷啊)阅读路线:找工作...

发表了文章 • 2019-08-28 19:23 • 0 条评论

0
推荐
1994
阅读

Kaggle泰坦尼克生存预测之随机森林学习

这篇文章讲述的是Kaggle上一个赛题的解决方案——Titanic幸存预测.问题背景是我们大家都熟悉的【Jack and Rose】的故事,豪华游艇与冰山相撞,大家惊慌而逃,可是救生艇的数量有限,无法人人都有。赛题官方提供训练数据和测试数据两份数据,训练数据主要是一些乘客的个人信息以及存活状况,测试数据也是乘客的个人信息但是...

发表了文章 • 2019-08-28 19:21 • 0 条评论

0
推荐
1911
阅读

数据分析师薪酬如何?爬虫拉勾网告诉你

首先说明这篇文章的数据来源,是爬虫拉勾网"数据分析师"这一职位信息所得来的。并且主要分析了数据分析师总体薪酬情况、不同城市薪酬分布、不同学历薪酬分布、北京上海工作经验薪酬分布情况、北上广深对数据分析职位需求量以及有招聘需求的公司所处行业的词云图分析。阅读路线:数据采集数据清洗与处理数据分析报告分析...

发表了文章 • 2019-08-28 19:19 • 0 条评论

0
推荐
934
阅读

Python数据分析包的学习

用Python进行数据分析时常用包有numpy、scipy、pandas,matplotlib,由于自己现在还是数据分析的初级阶段,一般情况下numpy、pandas、matplotlib包的一些基本知识就够自己在数据分析时使用了。接下来为大家数理下这几个包的使用阅读路线numpy包学习pandas包学习python绘图numpy包的学习numpy是Python的数值计算扩展,专...

发表了文章 • 2019-08-28 19:18 • 0 条评论

0
推荐
1000
阅读

SQL入门学习

数据库简单来讲就是一堆互相关联的数据,最基础的数据组成了表(table),也是我们经常看到的一张Excel的sheet。Mysql的安装Mysql安装注意首先去MySQL的官网下载,版本5.6以上即可,安装的过程不打算进行细说,谷歌有很多的教程。这里给大家分享下我踩过的坑。刚开始大家把下载好的程序,直接一路选择默认。但是填写Root用...

发表了文章 • 2019-08-28 19:16 • 0 条评论

0
推荐
814
阅读

航行距离和延误时间到底有没有关系呢?

今天想和大家讨论的问题是:飞机航行距离和延误时间有没有关系呢?我们的数据是R 中nycflights13包的航班数据。好了,搬好小板凳,我们要开始分析了。先简单了解下我们的数据> install.packages("dplyr")       #安装数据处理包> install.packages("nycflights13")&...

发表了文章 • 2019-08-28 19:12 • 0 条评论

0
推荐
986
阅读

初试数据分析(R)

这篇的文章主要目的是,根据提供的朝阳区医院2016年销售数据.xlsx数据表,得出月均消费次数、月均消费金额、客单价和消费趋势这五个结论。阅读路线:数据导入数据清洗数据分析数据导入为了方便,我把excel文件另存为了csv文件,并且重命名为2016.csv,然后放在Desktop文件夹下。设置工作路径>setwd("C:\\Users\\lkx\\De...

发表了文章 • 2019-08-28 19:11 • 0 条评论

0
推荐
1333
阅读

成为数据分析师要掌握的统计知识(进阶版)

阅读指南:总体均值和比例的统计推断总体方差的统计推断总体均值和比例的统计推断其实数据分析更多情况是两个总体的比较,譬如男女用户的差异、用户群体的差异、以及产品AB测试的好与坏,所以接下来对两个总体比较的情况进行学习。接下来讨论的内容为:σ1,σ2已知,u1-u2的区间估计和假设检验σ1,σ2未知,u1-u2的区间估计...

发表了文章 • 2019-08-28 18:39 • 0 条评论

0
推荐
1211
阅读

成为数据分析师要掌握的统计学知识(基础版)

阅读路线:概率介绍离散型概率分布和连续型概率分布抽样和抽样分布区间估计假设检验概率介绍概率是指的对于某一个特定事件的可能性的数值度量,且在0-1之间。我们抛一枚硬币,它有正面朝上和反面朝上两种结果,通常用样本空间S表示,S={正面,反面},而正面朝上这一特定的试验结果叫样本点。对于样本空间少的试验,我们...

发表了文章 • 2019-08-28 18:37 • 0 条评论

0
推荐
1117
阅读

R和Python数据结构对比

本文内容概要:R语言数据结构及实例操作Python语言数据结构及实例操作R语言数据结构及实例解析接下开始学习R语言的向量、矩阵、数组、数据框、列表这五个数据结构。1.向量向量是用于存储数值型、字符型或逻辑型数据的一维数组。函数c()可用来创建向量。单个向量中的数据必须拥有相同的数据类型.> name <...

发表了文章 • 2019-08-28 18:35 • 0 条评论