小猿看世界

大数据技术分享及实战

1
推荐
1325
阅读

Hbase-rdd二次开发

hbase-rdd是一个构建在SparkContext基础之上的用于对Hbase进行增删改查的第三方开源模块,目前最新版本为0.7.1。目前该rdd在操作hbase时,默认调用隐式方法implicit def stringToBytes(s: String): Array[Byte] = { Bytes.toBytes(s)}将RDD的key转换成字节b,然后调用Hbase的put(b)方法保存rowkey,之后将RDD的每一行存...

发表了文章 • 2017-03-01 16:40 • 2 条评论