NOSQL Hadoop

hadoop系统数据处理中应使用sql还是原生api？

0

hadoop大数据系统提供了原生api，为了使用更方便，使得原来熟悉sql的人更容易使用，衍生出phoenix、sparksql、hive等等sql工具。那么，我们在开发中应使用原生api还是sql？性能差距有多大？

重要提示：提问者不能发表回复，可以通过评论与回答者沟通，沟通后可以通过编辑功能完善问题描述，以便后续其他人能够更容易理解问题.

2 个回复

0

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址：http://www.hellobi.com/course/39　有架构师，技术总监，CTO的职位请联系我！ 2015-11-01 回答

个人观点，欢迎讨论：
两者最大的一个区别实际上是面向的使用者不同。
调用api的，一般是程序员，算法工程师，大数据开发工程师等等，自动化，脚本化处理数据，大部分的工作重点在于系统，部署，架构，开发等等
使用sql的，一般是报表工程师，数据分析师，数据挖掘工程师等等，轻松，快速，方便的获取，验证数据。大部分的工作重点关注于数据，模型，展现等等。
至于你说的性能，sql最终还是需要解析去调用原生api或者重写api...所以sql的效率相对要低一下。。至于差距，只要不是特别复杂的业务，两者哪个方便来哪个。

0

erlybt - 小白问题多 2015-11-19 回答

场景不一样。sql大部分情况是人机接口，方便使用调试，一般来说业务的生产环境都是机机的，mr spark你不写applicantion搞不定的，hbase你不用api怎么玩。

性能差距是由你的使用方式和代码决定的，用哪个影响不大。

要回复问题请先登录或注册

hadoop系统数据处理中应使用sql还是原生api？

2 个回复

发起人

相关问题

问题状态

hadoop系统数据处理中应使用sql还是原生api？

与内容相关的链接

2 个回复

发起人

相关问题

问题状态