我想问个问题,既然基于hive模式做查询,元数据以mysql方式,那做集群和单机又有什么区别呢?存储处理不都是以关系型数据库?又怎么提现分布式的优势?

0
已邀请:
1

MarsJ - 大数据玩家~DS 2016-10-08 回答

元数据存MySQL,不是实际的Hive数据存MySQL,元数据是指的表名、Owner、表创建时间、表所包含的列名,Hive的元数据存储在MySQL中,而实际数据是存在HDFS上的,HDFS是分布式的。查询的时候会有与元数据交互的过程,但是数据量就极少了,操作时是直接针对于HDFS文件之上的操作

要回复问题请先登录注册