3
推荐
2003
阅读

GreenPlum笔记之一

数据分布均匀是保证GP高效并行处理能力的基础。因此定义表时,如果选用HASH分布策略,保证数据分布均匀是获取高性能的关键所在。选择的依据遵从三大原则:第一个就是首先保证前面提到的所有节点数据存放是均匀的。第二,如果经常进行大表连接,那么尽量把连接键定义成数据分布键(如果多个列作为数据分布键,他们应该都...

发表了文章 • 2016-07-07 17:32 • 1 条评论