1
推荐
2916
阅读
flink基础环境配置
基础机器配置:MacBook Pro 其他机器可以搞个linux的虚拟机也一样。1、下载flink安装文件:路径:https://flink.apache.org/downloads.html一种是下载与hadoop匹配的版本,一种是下载纯净的flink版本,下面的是hadoop的全部版本,该案例下的是纯净版本:flink-1.5.2-src,没有使用hadoop绑定的版本,如果需要的话可以自...
1
推荐
1754
阅读
多个List字段值转换
该UDF适用场景,某个表有两个字段存储为有序list,一个存储多是key,一个存储value。例如,表a,含有字段c1,c2,数据格式如下:需要取出 006 对应 小白,002 对应小灰,003 对应小黑,用sql处理没法把这个关系很好的切换出来。可能有人考虑用split进行切割,split(c1,",")[0]、split(c2,",")[0] 这样也可以获取出来,但是...
7
推荐
2363
阅读
百闻不如一面【教你写简历】
前一篇简单谈了谈入门,这一篇谈谈简历怎么写。你有很好的能力,或者在某方面确实有欠缺,但是实际上你是能胜任某个岗位的,但是由于你简历太渣,没有被用人单位或者面试者所看中,那么你的机会就会溜走哦。好的简历相当于是一把打开面试的大门的钥匙,一定要学会包装自己,我来简单说一下一个靠谱的简历该怎么写。一、...
6
推荐
1944
阅读
百闻不如一面【谈谈入门】
曾经面试过很多家公司,面试过很多岗位,如今沉淀一下仔细想想,有很多地方可以给一些建议,这一篇写给想入门、想转行的同学。一、职业方向谈面试之前,先聊聊数据的职业方向如何,大数据方向根据目前的行业情况主要有:1、岗位:数据分析师(BI/BA) &n...
7
推荐
2039
阅读
数据开发成长之路回顾【2018】
回首想起自己走上大数据开发这条路,不禁莞尔一笑,2011年毕业,7月初入职,直到现在经历了将近7年的数据生涯。整理一下思绪,有几个地方需要总结,也希望我自己的总结经验能给其他新人一些借鉴。【懵懂期】--面试我相信大多数人现在毕业前都会有自己的职业规划,但是我没有太清晰的规划,我学的专业是经济学院统计系专...
2
推荐
1933
阅读
数据挖掘——初学篇(二)
监督式学习:常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)非监督式学习:Apriori算法以及k-Means算法。半监督式学习:论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM.)等强化学习:Q-Learning以及时间差学习(Temporal difference learning...
1
推荐
2057
阅读
数据挖掘——初学篇(一)
当今的数据行业日益成熟,大数据行业更是如日中天,数据挖掘自然也是耳熟能详了,但是其中有些地方容易对初学者或门外人产生一些误解,主要是三个部分:一、什么是挖掘首先,先介绍一个概念KDD(knowledge discovery in database)知识发现,知识发现是从信息中得到知识,从数据中找到价值。它包含数据挖掘、信息收集、...