大数据BI架构师

从C#到java,从sql到BI,从cube到Hadoop,从Hadoop到nosql+mpp+storm。一路走来,只为心中的执着。

3
推荐
1992
阅读

GreenPlum笔记之一

数据分布均匀是保证GP高效并行处理能力的基础。因此定义表时,如果选用HASH分布策略,保证数据分布均匀是获取高性能的关键所在。选择的依据遵从三大原则:第一个就是首先保证前面提到的所有节点数据存放是均匀的。第二,如果经常进行大表连接,那么尽量把连接键定义成数据分布键(如果多个列作为数据分布键,他们应该都...

发表了文章 • 2016-07-07 17:32 • 1 条评论

10
推荐
2509
阅读

2015年总结及2016年规划

每个年末都要进行总结,并对来年进行规划。老梁说,你要不也贴到社区?所以做了一个相当于摘抄式的总结。一、2015年    工作:带领团队成功实现从传统BI到大数据BI的转型    生活:和小孩、自己父母都生活在一起,其乐融融 做了管理,很多事情都需要从全新的角度去处理,手下的兄弟们也成长很快,很...

发表了文章 • 2016-01-28 13:11 • 8 条评论

2
推荐
2291
阅读

海量日志的一些组件

企业日志的几种情况:A.  服务器监控日志B.  内部应用程序日志C.  网站用户点击行为日志在这,我们和大家仅仅是交流下不同模式下的架构设计和使用场景而已。很多的内容我也并未深入研究下去,过程中如有不妥之处,请大家及时指正。服务器监控日志对企业来讲是非常重要的一个部分。这部分数据包含服务器的...

发表了文章 • 2015-12-10 23:32 • 0 条评论

8
推荐
2212
阅读

数据研发之路的小结

在做软件研发的早期,我还是以编程为主。那个时候的编程,不但要coding前后台,还要做SQL调优、维护,还要变现报表。也正是在这个时候,才确定自己想走数据研发这条路。09年是一个转折点。从这之后,所有的数据研发都是围绕多维数据库、MDX、SSRS、SSIS等。在这期间不断的给自己充电,深入了解每一项技术背后的原理。也...

发表了文章 • 2015-11-05 14:17 • 9 条评论