0
推荐
3677
阅读

rmarkdown+flexdashboard制作dashboard原型

R语言作为一门统计计算和数据可视化为核心特色的工具性语言,其在可视化领域或者说数据呈现方面有着非常成熟和系统的解决方案。这里所说的解决方案不仅是指R语言里面有诸多的图形语法系统(比如base系统、grid系统、lattic系统等),更重要的是它拥有(目前比较成熟的)系统级输出方案,你可以理解为如何在项目中从一而...

发表了文章 • 2018-08-15 10:49 • 0 条评论

0
推荐
3988
阅读

金融数据获取的api接口

最近苹果的股价一路疯长,继周四突破万亿美元市值后,周五盘中高点、收盘价双创新高。盘中高点达208.74美元,收盘价报207.99美元,上涨0.29%,创历史收盘新高,市值达10045.76亿美元。在全球经济体的GGP排行中,已经可以稳稳排进前20名,真正的富可敌国了。为了看下苹果自上市以来的股价变动情况,特地研究了下R和Python...

发表了文章 • 2018-08-14 15:15 • 0 条评论

1
推荐
4062
阅读

批量将本地gis数据导入postgis数据库

以前在处理gis数据的时候,都是直接导入本地shp素材、本地geojson素材,本地topojson素材,自从接触postgis数据之后,深感使用规范的存储系统来统一管理gis数据的好处,特别是数据量大了之后,优势便更加明显,你可以选择将很多需要做空间计算的步骤转移到Postgis数据库内进行计算,要知道Postgis提供的空间计算能力与R...

发表了文章 • 2018-08-09 15:23 • 0 条评论

0
推荐
2009
阅读

机器学习笔记之K-means聚类

K-means聚类是聚类分析中比较基础的算法,属于典型的非监督学习算法。其定义为对未知标记的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据尽可能接近,类别间的数据相似度比较大。用于衡量距离的方法主要有曼哈顿距离、欧氏距离、切比雪夫距离,其中欧氏距离较为常用。算法原理如下:...

发表了文章 • 2018-07-03 16:05 • 0 条评论

0
推荐
1825
阅读

机器学习笔记之KNN分类

KNN分类器作为有监督学习中较为通俗易懂的分类算法,在各类分类任务中经常使用。KNN模型的核心思想很简单,即近朱者赤、近墨者黑,它通过将每一个测试集样本点与训练集中每一个样本之间测算欧氏距离,然后取欧氏距离最近的K个点(k是可以人为划定的近邻取舍个数,K的确定会影响算法结果),并统计这K个训练集样本点所属...

发表了文章 • 2018-07-02 16:56 • 0 条评论

4
推荐
2816
阅读

MySQL入门学习笔记——七周数据分析师实战作业

本篇推送主要涉及SQL语言中较为复杂的子查询与函数嵌套。虽然这个MySQL系列取名为MySQL基础入门,但是个人不打算做单个函数的用法总结,或者说简单罗列,(这些内容你可以通过很多途径了解)因为一方面以前有过SQL基础方面的学习经历(本科的计算机必修课以及计算机等级考试)现在应该更加深入一些,另一方面SQL是一门数...

发表了文章 • 2017-12-07 15:43 • 0 条评论