hadoop系统数据处理中应使用sql还是原生api?

0
hadoop大数据系统提供了原生api,为了使用更方便,使得原来熟悉sql的人更容易使用,衍生出phoenix、sparksql、hive等等sql工具。那么,我们在开发中应使用原生api还是sql?性能差距有多大?
已邀请:
0

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-11-01 回答

个人观点,欢迎讨论:
两者最大的一个区别实际上是面向的使用者不同。
调用api的,一般是程序员,算法工程师,大数据开发工程师等等,自动化,脚本化处理数据,大部分的工作重点在于系统,部署,架构,开发等等
使用sql的,一般是报表工程师,数据分析师,数据挖掘工程师等等,轻松,快速,方便的获取,验证数据。大部分的工作重点关注于数据,模型,展现等等。
至于你说的性能,sql最终还是需要解析去调用原生api或者重写api...所以sql的效率相对要低一下。。至于差距,只要不是特别复杂的业务,两者哪个方便来哪个。
0

erlybt - 小白问题多 2015-11-19 回答

场景不一样。sql大部分情况是人机接口,方便使用调试,一般来说业务的生产环境都是机机的,mr spark你不写applicantion搞不定的,hbase你不用api怎么玩。

性能差距是由你的使用方式和代码决定的,用哪个影响不大。
 

要回复问题请先登录注册