如果只考虑开源数据库,要支持海量数据的数据仓库应用,维度建模的数据模型,MySQL和PostgreSQL该用哪个?为什么?

0
海量数据的数据仓库会对读取性能,数据一致性有较高要求。并且因为数据量太大,一些维护工作不希望很长时间锁定整个Table之类的行为
已邀请:
2

Bob - 同程旅游大数据+BI 架构师 2015-09-29 回答

如果是支撑OLTP的业务,那么构建Percona-XtraDB-Cluster-server版本的MySQL集群是非常实用的,Postgresql XC集群也适用。
如果是支撑OLAP业务,那最好是选择MPP版本的数据库。
开源的并行数据仓库其实选择的机会不多,常见的是Postgresql XL集群。但是此技术在大规模使用会有很多源代码上的BUG。商业版本则有GreenPlum 。
在2015-9月 企业级的GreenPlum已经开源,建议可以试用下。
0

seng - 从事BI、大数据、数据分析工作 2015-09-29 回答

需要明确你的海量数据到底是什么含义? 是表很多,还是单表数据量很大? 大到什么程度?
真的数据量很大的话, 目前版本的MySQL和PostgreSQL都不合适。
如果分区比较明确可以考虑PostgreSQL XL版本。

要回复问题请先登录注册