大数据在线答疑

全部内容
精华
推荐
我的收藏
关于话题

投票

回答

1223

浏览

哪位大数据高手知道那种爬虫框架实现了聚焦爬虫或者说是主题爬虫

大数据在线答疑

芬飞发起了问题 • 2017-03-16 10:05

投票

已解决

2198

浏览

请教个问题，hadoop2.5(cdh5)在配置capacity scheduler的时候，配置的ACLs没起作用，谁遇到过

贡献

Hadoop 大数据在线答疑大数据

Bob 回复了问题 • 2015-10-08 18:26

投票

已解决

2394

浏览

hadoop大数据挖掘用什么做

贡献

大数据大数据在线答疑 Hadoop

seng 回复了问题 • 2015-09-25 16:27

投票

已解决

2365

浏览

海量数据访问，如何对1000000000000数据量的数据集进行随机汇总操作？

贡献

大数据在线答疑 Hadoop 大数据

seng 回复了问题 • 2015-09-25 16:25

投票

已解决

11636

浏览

问下各位，你们是如何卸载Hadoop的，是直接删除Hadoop文件就可以了是吧

贡献

大数据在线答疑 Hadoop 大数据

牟瑞回复了问题 • 2015-09-25 14:17

投票

回答

2043

浏览

我想问问hbase.98启动失败时他的日志文件在哪个文件下，我记得以前使用0.94版本时直接有个log文件啊，求大神告知

贡献

大数据在线答疑 Hadoop HBASE 大数据

牟瑞回复了问题 • 2015-09-25 14:13

投票

已解决

3587

浏览

做hive工作，以后的职业发展方向是什么？

贡献

Hive 大数据在线答疑职业生涯大数据

牟瑞回复了问题 • 2015-09-25 14:07

投票

回答

2804

浏览

搭建hbase的时候发现hadoop2.6.0需要重新编译本地库想问问如何操作

贡献

大数据在线答疑 Hadoop 大数据

贺呵呵回复了问题 • 2015-09-25 14:03

投票

已解决

7311

浏览

大数据与传统数据仓库项目比的优势和劣势在什么地方

贡献

Hadoop 大数据在线答疑大数据

牟瑞回复了问题 • 2015-09-25 13:54

投票

回答

4115

浏览

hadoop平台下如何做数据的血缘分析呢？

Hadoop 大数据在线答疑大数据

elefire 发起了问题 • 2015-09-25 13:53

投票

已解决

3423

浏览

请问 SparkContext的 textfile 如何使用正确的中文编码加载内容？好像默认没有这类参数，中文好像加载进来都乱码了。。。求大神支招。。

贡献

大数据在线答疑 Hadoop 大数据

牟瑞回复了问题 • 2015-09-25 13:22

投票

已解决

2039

浏览

各位大神！菜鸟求助应该如何学习hadoop

贡献

Hadoop 大数据在线答疑大数据

牟瑞回复了问题 • 2015-09-25 13:15

投票

已解决

2500

浏览

我在写一个服务，前端要看一张在hdfs里的图片，我应该传什么数据给前端啊？传图片名称+二进制数组吗？

贡献

大数据在线答疑 Hadoop 大数据

牟瑞回复了问题 • 2015-09-25 11:14

投票

已解决

2305

浏览

最近使用hadoop的HDFS，作为系统的文件服务器,在多个客户端上传文件，多个客户端只能下载他自己上传的文件，但是下载不了其它客户端上传的文件，请问是什么问题？

贡献

Hadoop 大数据在线答疑大数据

牟瑞回复了问题 • 2015-09-25 11:09

投票

已解决

2654

浏览

如何在较短时间内系统地学习大数据并从事研发工作？

贡献

大数据在线答疑 Hadoop 大数据快速入门

牟瑞回复了问题 • 2015-09-25 10:59

为了明天time 回答了问题 • 2015-09-22 17:58 • 3 个回复不感兴趣

请问各位有谁知道什么叫日志汇聚关于hive的

日志汇聚的话一般用flume来采集webserver产生的日志数据，Flume是一个高可用的，高可靠的，分布式的海量日志采集、聚合和传输的系统

牟瑞回答了问题 • 2015-09-24 08:14 • 1 个回复不感兴趣

hadoop有没有比较好的监控工具,我想监控到某个JOB情况，比如执行时间等等

hadoop本身就自带任务监控的。http://namenode:50070

simon_li0908 回答了问题 • 2015-09-24 08:45 • 2 个回复不感兴趣

大神们我在看hadoop实战中的mapreduce排序时有个问题不太明白请大神帮忙排序中为什么里面有key值重复但是reduce后 key值却没有去重

map 结束后有很多reduce。。又suffle和另一个东西帮我们排序。。。reduce接收到的是 1个Key 以及诸多map后key相同的 value的集合

牟瑞回答了问题 • 2015-09-24 08:11 • 1 个回复不感兴趣

大家好，我用shell 运行hadoop hive，产生很多进程，如何才能释放这些内存啊

使用kill命令，直接杀死进程。

牟瑞回答了问题 • 2015-09-25 11:09 • 1 个回复不感兴趣

最近使用hadoop的HDFS，作为系统的文件服务器,在多个客户端上传文件，多个客户端只能下载他自己上传的文件，但是下载不了其它客户端上传的文件，请问是什么问题？

没有遇到过这种情况啊。按道理来讲，端口是开放的，每个客户端都是可以访问的。
你看一下是不是hadoop的权限问题。
在hdfs-site.xml文件里面追加
<property>
<name>dfs.permissions&l... 显示全部 »

牟瑞回答了问题 • 2015-09-25 11:14 • 1 个回复不感兴趣

我在写一个服务，前端要看一张在hdfs里的图片，我应该传什么数据给前端啊？传图片名称+二进制数组吗？

如果是服务的话，建议你生成一个token给客户端，然后客户端采用 http://127.0.0.1/image?token=11111111111111111的方式来获取，
你拿到这个token以后做解析，然后返回图片的地址。
另外，为什么图片是存放在hdf... 显示全部 »

牟瑞回答了问题 • 2015-09-25 10:59 • 1 个回复不感兴趣

如何在较短时间内系统地学习大数据并从事研发工作？

不知道你所说的大数据研发是哪一类的研发，如果是hadoop的研发，可以简单的说一下观点：Hadoop开发工程师(偏向技术开发）：这类工作可能要求的Java会比较高，涉及面向对象编程，各种开发模式，各种开发框架，还要包括JVM调优，垃圾回收等等，可以尝试向Had... 显示全部 »

牟瑞回答了问题 • 2015-09-25 13:22 • 1 个回复不感兴趣

请问 SparkContext的 textfile 如何使用正确的中文编码加载内容？好像默认没有这类参数，中文好像加载进来都乱码了。。。求大神支招。。

中文乱码的问题有很多种，主要是看是哪种类型的乱码，如果是字符乱码，可以采用utf8转码的方式，如果是url请求的方式乱码，可以采用urldecode的方式来解码。

牟瑞回答了问题 • 2015-09-25 14:07 • 1 个回复不感兴趣

做hive工作，以后的职业发展方向是什么？

这个还是要看个人的喜欢：
1.报表工程师：利用HQL来生成各种各样的报表
2.大数据产品工程师：利用大数据来做一些产品。
3.ETL工程师：利用HQL来做ETL处理
4.数据分析师：利用HQL来做数据分析
5.数据挖掘工程师：用户行为分析，用户画像，数据建模。... 显示全部 »

牟瑞回答了问题 • 2015-09-25 13:15 • 1 个回复不感兴趣

各位大神！菜鸟求助应该如何学习hadoop

具体要看业务场景，其实hive的入门学习是很容易的，只要会点SQL，就可以应用Hive的简单操作。
但是如果要是深入学习的，hive的内容还是很多的
比如UDF，分区，分桶，SQL调优等等。
个人建议入门学习SQL语句是必须的。hadoop的话，可以参考Had... 显示全部 »

牟瑞回答了问题 • 2015-09-25 13:54 • 1 个回复不感兴趣

大数据与传统数据仓库项目比的优势和劣势在什么地方

优势：
1.非结构化数据：在大数据的场景下，存放大量的非结构化数据，针对不同的业务场景来做分析应用
2.处理数据量更大，在大数据的数据仓库里面采用分布式来存放数据，存放的数据量更大，TB，PB的数据都不成问题。
3.维度更多：传统的数据仓库，能加载30多个维度... 显示全部 »

牟瑞回答了问题 • 2015-09-25 14:17 • 1 个回复不感兴趣

问下各位，你们是如何卸载Hadoop的，是直接删除Hadoop文件就可以了是吧

如果你是安装apache hadoop，直接删除就可以了，如果你是采用的cloudra的hadoop版本，需要使用cloudra的卸载。
另外，记得删除$HADOOP_HOME等配置文件。

seng 回答了问题 • 2015-09-25 16:25 • 3 个回复不感兴趣

海量数据访问，如何对1000000000000数据量的数据集进行随机汇总操作？

分2部分时间
1，找到记录的时间
2，计算的时间

1.找到记录的时间数据可以按区间分割，可以减少定位时间，不过数据读取的时间少不了
2.计算的时间和记录数和计算复杂度有关，

在一定的数据量下这些工作量是不会减少，分布计算这是把这些分散到不同的机器上计算，... 显示全部 »

牟瑞回答了问题 • 2015-09-25 14:34 • 4 个回复不感兴趣

hadoop大数据挖掘用什么做

个人建议：如果你会SQL，可以先从Hive入手。如果你会点开发，可以从Python，R入手。
另外，算法，统计知识什么的也是不可缺少的。
建议书籍：
《深入浅出数据分析》
《R语言实战》
《智慧编程》
等等

Bob 回答了问题 • 2015-10-08 18:26 • 1 个回复不感兴趣

请教个问题，hadoop2.5(cdh5)在配置capacity scheduler的时候，配置的ACLs没起作用，谁遇到过

我们也做过yarn的多队列，这其中需要仔细计算每个队列的内存配置，确保没超出总额度后才能启动并加载出多个队列名称

投票

回答

1223

浏览

哪位大数据高手知道那种爬虫框架实现了聚焦爬虫或者说是主题爬虫

大数据在线答疑

芬飞发起了问题 • 2017-03-16 10:05

投票

已解决

2198

浏览

请教个问题，hadoop2.5(cdh5)在配置capacity scheduler的时候，配置的ACLs没起作用，谁遇到过

Hadoop 大数据在线答疑大数据

Bob 回复了问题 • 2015-10-08 18:26

投票

已解决

2394

浏览

hadoop大数据挖掘用什么做

大数据大数据在线答疑 Hadoop

seng 回复了问题 • 2015-09-25 16:27

投票

已解决

2365

浏览

海量数据访问，如何对1000000000000数据量的数据集进行随机汇总操作？

大数据在线答疑 Hadoop 大数据

seng 回复了问题 • 2015-09-25 16:25

投票

已解决

11636

浏览

问下各位，你们是如何卸载Hadoop的，是直接删除Hadoop文件就可以了是吧

大数据在线答疑 Hadoop 大数据

牟瑞回复了问题 • 2015-09-25 14:17

投票

回答

2043

浏览

我想问问hbase.98启动失败时他的日志文件在哪个文件下，我记得以前使用0.94版本时直接有个log文件啊，求大神告知

大数据在线答疑 Hadoop HBASE 大数据

牟瑞回复了问题 • 2015-09-25 14:13

投票

已解决

3587

浏览

做hive工作，以后的职业发展方向是什么？

Hive 大数据在线答疑职业生涯大数据

牟瑞回复了问题 • 2015-09-25 14:07

投票

回答

2804

浏览

搭建hbase的时候发现hadoop2.6.0需要重新编译本地库想问问如何操作

大数据在线答疑 Hadoop 大数据

贺呵呵回复了问题 • 2015-09-25 14:03

投票

已解决

7311

浏览

大数据与传统数据仓库项目比的优势和劣势在什么地方

Hadoop 大数据在线答疑大数据

牟瑞回复了问题 • 2015-09-25 13:54

投票

回答

4115

浏览

hadoop平台下如何做数据的血缘分析呢？

Hadoop 大数据在线答疑大数据

elefire 发起了问题 • 2015-09-25 13:53

投票

已解决

3423

浏览

请问 SparkContext的 textfile 如何使用正确的中文编码加载内容？好像默认没有这类参数，中文好像加载进来都乱码了。。。求大神支招。。

大数据在线答疑 Hadoop 大数据

牟瑞回复了问题 • 2015-09-25 13:22

投票

已解决

2039

浏览

各位大神！菜鸟求助应该如何学习hadoop

Hadoop 大数据在线答疑大数据

牟瑞回复了问题 • 2015-09-25 13:15

投票

已解决

2500

浏览

我在写一个服务，前端要看一张在hdfs里的图片，我应该传什么数据给前端啊？传图片名称+二进制数组吗？

大数据在线答疑 Hadoop 大数据

牟瑞回复了问题 • 2015-09-25 11:14

投票

已解决

2305

浏览

最近使用hadoop的HDFS，作为系统的文件服务器,在多个客户端上传文件，多个客户端只能下载他自己上传的文件，但是下载不了其它客户端上传的文件，请问是什么问题？

Hadoop 大数据在线答疑大数据

牟瑞回复了问题 • 2015-09-25 11:09

投票

已解决

2654

浏览

如何在较短时间内系统地学习大数据并从事研发工作？

大数据在线答疑 Hadoop 大数据快速入门

牟瑞回复了问题 • 2015-09-25 10:59

云技术、大数据(hadoop)入门常见问题回答

问题导读：当我们学习一门新技术的时候，我们总是产生各种各样的问题，这些问题整理出来，包括该1.如何学习hadoop？2.hadoop常见问题？3.还有hbase、hive安装使用等？你知道搭建hadoop平台需要些什么软件？简单来...

GeorgeYao 发表了文章 • 2015-09-23 13:42

更多...

话题描述

最佳回复者

: 牟瑞
获得 27 次赞同, 1 次感谢

: joe
获得 3 次赞同, 0 次感谢

: seng
获得 4 次赞同, 0 次感谢

: 为了明天time
获得 1 次赞同, 0 次感谢

: simon_li0908
获得 2 次赞同, 0 次感谢