通过Hadoop File Input,可以通过kettle操作hdfs上文件,语尽,具体操作如下:
1、选择控件hadoop file input
2、点击浏览输入server 和port,点击connect-〉ok
3、选中内容点击增加
注意:hdfs的默认端口是9000
附:
1)查看文件/etc/yarn1/conf/core-site.xml中fs.defaultFs,查看是否安装了HA(High Available), 高可用性群集
2)然后到hdfs-site.xml中查看nameservice,下面肯定对应了两个ip,这个就对应的fs.defaultFS;如果是单个的,fs.defaultFS 就是hdfs://IP或主机名:port
3)查看参数dfs.namenode.rpc-address