如何用kettle读取所趴数据所含的条目?

0
我们组分配给我分析文件的任务,主要就是看看趴下来的数据都有哪些条目,就像google scholar 里面paper有author啊、topic啊这些的,求教怎么用kettle读取这些呢?以及warc这种文件有什么简单粗暴的方法来读取么?
已邀请:

要回复问题请先登录注册