数据取经团

每天都有收获,每天有所突破,加油,坚持。

1
推荐
1648
阅读

R语言:亲,你有一封邮件待查收

作者:数据取经团 - 祥子前言自动化操作,定时来执行任务,替代人力不可为或很麻烦的事情。在很多互联网公司,自动化已经是很常见的。对于个人而言,我们也可以有自动化操作的,本文将介绍在windows下实现R语言自动执行发邮件的任务。是不是有新奇感,那就跟着小编来往下看。自动化操作?是不是要编写代码什么的鬼,我是...

发表了文章 • 2017-09-05 16:00 • 0 条评论

0
推荐
1318
阅读

40行代码+奇技淫巧搞定专属电脑壁纸库【附壁纸】

本文作者:数据取经团 - 施维项目效果项目背景最近电脑壁纸存量捉急,老是几张图片看得有点厌烦,就想着能不能一次性下载多一些壁纸,用幻灯片放映方式天天换壁纸,天天好心情。于是乎找了一个免费图片网址PEXELS, 开始撸一波代码,写个小爬虫搞个壁纸库。本文主要会解释一下代码的实现和整个写代码的流程,可供爬虫初...

发表了文章 • 2017-08-30 10:59 • 0 条评论

0
推荐
2721
阅读

Python从Mysql获取数据为数据分析做准备

本文作者:数据取经团 - 王大伟前言最近学了一下 sql ,因为做数据分析不会sql真不行。平时学的都是 Python,所以如果要用 pandas 做数据分析,数据除了导入 excel 和 csv 文件,应该还要会从数据库中导入数据到 Python 中,于是我进行了以下的学习和探索。环境Python 3.XIDE : juyter notebook安装必要的模块进入:http...

发表了文章 • 2017-08-23 13:41 • 0 条评论

1
推荐
1750
阅读

R模型部署之道:基于OpenCpu Cloud Server

本文作者:数据取经团 - 数据栗子内容概要:1、搭建opencpu云服务2、训练R模型,并打包3、部署模型正式内容:搭建OpenCpu Cloud Server上期探讨了R模型的pojo部署方法(详见:以莺尾花数据集为例,探讨R模型部署之道),今天探讨下如何使用opencpu搭建restful api,本次还是使用iris数据集。测试环境:Ubuntu 16.04(14.0...

发表了文章 • 2017-08-22 11:33 • 0 条评论

0
推荐
1838
阅读

自我代码提升之朴素贝叶斯

作者:数据取经团 - JQstyle(本文阅读时长:10分钟)朴素贝叶斯的简介       在机器学习的分类算法的各个门类中,贝叶斯分类方法是一个比较重要的组成部分。而隶属于贝叶斯分类方法的算法,均是以贝叶斯定理为基础的。  对于一个分类问题,目标是Y{y1,y2…yN},已知条件X{x1,x2…xN},需要通过用X来...

发表了文章 • 2017-08-17 13:39 • 0 条评论

0
推荐
1263
阅读

品读“成人用品”捆绑销售秘籍

作者:数据取经团 - 吕洞宾(本文阅读时长:10分钟)前言情人节到了,数据分析师小明准备给和他相恋7年的女朋友买一束玫瑰花,以表示自己对女票的爱意。他从淘宝上选了玫瑰花之后,发现系统下面有一个玫瑰花和成人用品联合销售的礼包,小明动了歪主意,于是他购买了联合礼包,和女朋友度过了一个美丽的情人节。之后,小...

发表了文章 • 2017-08-09 14:32 • 0 条评论

2
推荐
2965
阅读

以莺尾花数据集为例,探讨R模型部署之道

内容概要:1、iris数据集简介2、R模型部署的可能方案3、H2o.ai框架及pojo/mojo模型部署正式内容:iris data set简介Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长...

发表了文章 • 2017-08-03 15:26 • 1 条评论

0
推荐
1909
阅读

一道为了撸串的笔试题

作者:数据取经团-祥大这段时间,在北京游荡了好几圈,黑了3层皮,做了好几家的笔试题,我将整理分享出来,以供大家求职找工作参考。写这篇文章前,发生了这样的一段对话,只是为了撸串的交易周末撸串吃什么味的好呢?要好好砍他一顿(阴笑脸)。好了,开始正文下面的内容。第一题 两数的和 Given an array of integers,...

发表了文章 • 2017-07-28 10:31 • 0 条评论

0
推荐
2335
阅读

基于五种机器算法的信用风险评估

作者:数据取经团-白云飞  基于五种机器算法的信用风险评估是一个系列文章,从互金数据出发,经过数据预处理,特征工程,建立机器学习模型,以及模型评估四个部分来分析建模。文章将按照一般的建模流程来组织:确定业务目标→数据获取→数据检验→变量选择(数据清洗)→变量转化→数据输入模型算法→模型评估。本文的重点放在...

发表了文章 • 2017-07-26 15:25 • 0 条评论

1
推荐
2050
阅读

自我代码提升之K近邻算法

作者:数据取经团-王嘉琪 在机器学习和数据挖掘常用的方法中,常规的建模思路是输入给定的训练数据集(类别标签已知),通过一系列的训练建立预测模型,通过将需要预测的数据输入到训练完成的模型中得到预测结果。然而,并非所有的方法都包含了训练过程,K近邻算法就是其中之一。K近邻的基本思想  K近邻算法(KNN)是一...

发表了文章 • 2017-07-24 17:31 • 0 条评论

1
推荐
2125
阅读

数据可视化入门篇

作者:数据取经团-张俊红本篇要点:01、数据可视化是什么02、数据可视化的一般流程03、常见的数据种类04、通过可视化你想表达什么信息05、选择具体的可视化形式06、图表设计原则07、常用的可视化工具01|数据可视化是什么:数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息(来源于百度百科)。也就是说可...

发表了文章 • 2017-07-19 20:04 • 0 条评论

0
推荐
1749
阅读

《麦肯锡传奇》杂谈

作者:数据取经团-张龙祥 最近,自己在慢慢养成读书的习惯,记得晓雷之前给我讲过, 书是作者智慧的凝集,细细品读,将书中的智慧用到工作生活中,慢慢的迭代自己。起初的我还存有疑惑,如何用、怎么用,是我最应该学习的。       麦肯锡全集已经在我的书柜里面存放有半年之久了,它依旧崭新如...

发表了文章 • 2017-07-19 19:48 • 0 条评论

1
推荐
2108
阅读

爬虫界的一股清流——用安卓做一个朋友圈屏蔽检测器

作者:数据取经团-施维前言前段时间,新版微信加入了一个朋友圈只给看三天的新功能。于是就有了一个经典梗:朋友圈陌生人可以看十张照片,熟人只能看三天,只能友尽了!有了上面的段子之后,本人忽然意识到一个问题,那就是现在微信好友越来有越多,有的可能都只是为了加一下转个账什么的,连名字都不知道。这么多好友,...

发表了文章 • 2017-07-19 19:45 • 2 条评论

0
推荐
2935
阅读

Python数据分析告诉你为何上海的二手房你都买不起

作者:数据取经团-王大伟前言都说上海的房价高的吓死人,用上海话说就是:“vang 尬高得哈撒特宁”,二手房都买不起,那这房价到底有多高呢?我们酷爱来数据分析一波。。。环境Python3.X编辑器:Jupyter notebook导入链家网爬取的二手房数据import numpy as npimport pandas as pddf = pd.read_excel('house_lianjia.xlsx'...

发表了文章 • 2017-07-19 19:40 • 0 条评论

1
推荐
1937
阅读

朴素贝叶斯算法的案例实现

一、朴素贝叶斯分类算法的实现函数R中的e1071包中的naiveBayes()函数可以实现朴素贝叶斯算法,具体的函数格式如下:naiveBayes(x, y,laplace=0)常用变量具体的参数解释如下:naiveBayes(formula,data,laplace=0,subset)常用变量具体的参数解释如下:2、朴素贝叶斯分类算法的预测函数predict(object, newdata, type=c("cl...

发表了文章 • 2017-07-19 19:26 • 1 条评论