1
推荐
1648
阅读
R语言:亲,你有一封邮件待查收
作者:数据取经团 - 祥子前言自动化操作,定时来执行任务,替代人力不可为或很麻烦的事情。在很多互联网公司,自动化已经是很常见的。对于个人而言,我们也可以有自动化操作的,本文将介绍在windows下实现R语言自动执行发邮件的任务。是不是有新奇感,那就跟着小编来往下看。自动化操作?是不是要编写代码什么的鬼,我是...
0
推荐
1318
阅读
40行代码+奇技淫巧搞定专属电脑壁纸库【附壁纸】
本文作者:数据取经团 - 施维项目效果项目背景最近电脑壁纸存量捉急,老是几张图片看得有点厌烦,就想着能不能一次性下载多一些壁纸,用幻灯片放映方式天天换壁纸,天天好心情。于是乎找了一个免费图片网址PEXELS, 开始撸一波代码,写个小爬虫搞个壁纸库。本文主要会解释一下代码的实现和整个写代码的流程,可供爬虫初...
0
推荐
2721
阅读
Python从Mysql获取数据为数据分析做准备
本文作者:数据取经团 - 王大伟前言最近学了一下 sql ,因为做数据分析不会sql真不行。平时学的都是 Python,所以如果要用 pandas 做数据分析,数据除了导入 excel 和 csv 文件,应该还要会从数据库中导入数据到 Python 中,于是我进行了以下的学习和探索。环境Python 3.XIDE : juyter notebook安装必要的模块进入:http...
1
推荐
1750
阅读
R模型部署之道:基于OpenCpu Cloud Server
本文作者:数据取经团 - 数据栗子内容概要:1、搭建opencpu云服务2、训练R模型,并打包3、部署模型正式内容:搭建OpenCpu Cloud Server上期探讨了R模型的pojo部署方法(详见:以莺尾花数据集为例,探讨R模型部署之道),今天探讨下如何使用opencpu搭建restful api,本次还是使用iris数据集。测试环境:Ubuntu 16.04(14.0...
0
推荐
1838
阅读
自我代码提升之朴素贝叶斯
作者:数据取经团 - JQstyle(本文阅读时长:10分钟)朴素贝叶斯的简介 在机器学习的分类算法的各个门类中,贝叶斯分类方法是一个比较重要的组成部分。而隶属于贝叶斯分类方法的算法,均是以贝叶斯定理为基础的。 对于一个分类问题,目标是Y{y1,y2…yN},已知条件X{x1,x2…xN},需要通过用X来...
0
推荐
1263
阅读
品读“成人用品”捆绑销售秘籍
作者:数据取经团 - 吕洞宾(本文阅读时长:10分钟)前言情人节到了,数据分析师小明准备给和他相恋7年的女朋友买一束玫瑰花,以表示自己对女票的爱意。他从淘宝上选了玫瑰花之后,发现系统下面有一个玫瑰花和成人用品联合销售的礼包,小明动了歪主意,于是他购买了联合礼包,和女朋友度过了一个美丽的情人节。之后,小...
2
推荐
2965
阅读
以莺尾花数据集为例,探讨R模型部署之道
内容概要:1、iris数据集简介2、R模型部署的可能方案3、H2o.ai框架及pojo/mojo模型部署正式内容:iris data set简介Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长...
0
推荐
1909
阅读
一道为了撸串的笔试题
作者:数据取经团-祥大这段时间,在北京游荡了好几圈,黑了3层皮,做了好几家的笔试题,我将整理分享出来,以供大家求职找工作参考。写这篇文章前,发生了这样的一段对话,只是为了撸串的交易周末撸串吃什么味的好呢?要好好砍他一顿(阴笑脸)。好了,开始正文下面的内容。第一题 两数的和 Given an array of integers,...
0
推荐
2335
阅读
基于五种机器算法的信用风险评估
作者:数据取经团-白云飞 基于五种机器算法的信用风险评估是一个系列文章,从互金数据出发,经过数据预处理,特征工程,建立机器学习模型,以及模型评估四个部分来分析建模。文章将按照一般的建模流程来组织:确定业务目标→数据获取→数据检验→变量选择(数据清洗)→变量转化→数据输入模型算法→模型评估。本文的重点放在...
1
推荐
2050
阅读
自我代码提升之K近邻算法
作者:数据取经团-王嘉琪 在机器学习和数据挖掘常用的方法中,常规的建模思路是输入给定的训练数据集(类别标签已知),通过一系列的训练建立预测模型,通过将需要预测的数据输入到训练完成的模型中得到预测结果。然而,并非所有的方法都包含了训练过程,K近邻算法就是其中之一。K近邻的基本思想 K近邻算法(KNN)是一...
1
推荐
2125
阅读
数据可视化入门篇
作者:数据取经团-张俊红本篇要点:01、数据可视化是什么02、数据可视化的一般流程03、常见的数据种类04、通过可视化你想表达什么信息05、选择具体的可视化形式06、图表设计原则07、常用的可视化工具01|数据可视化是什么:数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息(来源于百度百科)。也就是说可...
0
推荐
1749
阅读
《麦肯锡传奇》杂谈
作者:数据取经团-张龙祥 最近,自己在慢慢养成读书的习惯,记得晓雷之前给我讲过, 书是作者智慧的凝集,细细品读,将书中的智慧用到工作生活中,慢慢的迭代自己。起初的我还存有疑惑,如何用、怎么用,是我最应该学习的。 麦肯锡全集已经在我的书柜里面存放有半年之久了,它依旧崭新如...
1
推荐
2108
阅读
爬虫界的一股清流——用安卓做一个朋友圈屏蔽检测器
作者:数据取经团-施维前言前段时间,新版微信加入了一个朋友圈只给看三天的新功能。于是就有了一个经典梗:朋友圈陌生人可以看十张照片,熟人只能看三天,只能友尽了!有了上面的段子之后,本人忽然意识到一个问题,那就是现在微信好友越来有越多,有的可能都只是为了加一下转个账什么的,连名字都不知道。这么多好友,...
0
推荐
2935
阅读
Python数据分析告诉你为何上海的二手房你都买不起
作者:数据取经团-王大伟前言都说上海的房价高的吓死人,用上海话说就是:“vang 尬高得哈撒特宁”,二手房都买不起,那这房价到底有多高呢?我们酷爱来数据分析一波。。。环境Python3.X编辑器:Jupyter notebook导入链家网爬取的二手房数据import numpy as npimport pandas as pddf = pd.read_excel('house_lianjia.xlsx'...
1
推荐
1937
阅读
朴素贝叶斯算法的案例实现
一、朴素贝叶斯分类算法的实现函数R中的e1071包中的naiveBayes()函数可以实现朴素贝叶斯算法,具体的函数格式如下:naiveBayes(x, y,laplace=0)常用变量具体的参数解释如下:naiveBayes(formula,data,laplace=0,subset)常用变量具体的参数解释如下:2、朴素贝叶斯分类算法的预测函数predict(object, newdata, type=c("cl...