ETL

0
推荐
2634
阅读

Odi第6节-使用(三):设计器(接口)

上一节说到建立项目的框架,此节具体讨论一下项目中的具体数据抽取步骤"接口"的使用。 "接口"的名称可在"概览"中定义,勾选"临时区域与目标区不同"的话,可自定义原始数据在进入目标数据存储之前存在何处 "接口"的"映射"标签如下,如图:左边是数据源,右边是"临时数据存储"(即目标数据); 根据提示从"...

发表了文章 • 2015-10-03 09:04 • 0 条评论

0
推荐
2248
阅读

Odi第5节-使用(三):设计器(项目)

打开设计器标签,点开新建项目的图标 在弹出窗口中,"定义"选项下设置项目名称,如zc_bilocal 保存后生成新的项目文件夹,名称即zc_bilocal 打开zc_bilocal项目,项目的基本内容应该如下所示 之后的操作应该先打开"知识模块",先导入所需的知识模块如CKM、LKM、IKM 导入选择如下所示,导入所需...

发表了文章 • 2015-10-03 09:04 • 0 条评论

0
推荐
2312
阅读

Odi第3节-使用(二):设计器(数据库模型)

在"模型"窗口"新建模型文件夹"文件夹名称自定义,此处名称定为module_test可见"模型"窗口下多出个文件夹目录 打开module_test模型文件夹,选择新建模型在弹出窗口中,模型名称可自定义,但技术要选择"Oracle",逻辑方案选择已建立好的逻辑结构"ZC",建立完成后保存。 模型建立完成后,点开"Module_test"文件夹...

发表了文章 • 2015-10-03 09:03 • 0 条评论

0
推荐
2238
阅读

Odi第2节-使用(一):拓扑层文件系统配置

连接资料库打开"拓扑"标签,先建立"物理体系结构",因为需要用到平面文件(作为源数据或者目标数据),打开技术的"File"选项右键选择新建数据服务器 弹出界面后,根据个人需求填入"定义"和"JDBC"因为是使用本地的文件系统,所以可以忽略"主机"和"连接"的设置 在"JDBC"窗口下根据提示选择即可。保存物理体系结...

发表了文章 • 2015-10-03 09:02 • 0 条评论

0
推荐
1984
阅读

Odi第1节-使用(一):拓扑层数据库配置

连接资料库打开"拓扑"标签,先建立"物理体系结构",因为选用oracle数据库,打开技术的"oracle"选项右键选择新建数据服务器 弹出界面后,根据个人需求填入"定义"和"JDBC" 保存物理体系结构。在刚才建立的物理体系下,建立物理方案在定义窗口中填入方案先忽略"上下文"的设置。保存后退出。 建立逻辑体系结...

发表了文章 • 2015-10-03 09:02 • 0 条评论

0
推荐
3319
阅读

Kettle实现Transformation 循环及跳出

在ETL操作中,经常需要对某个操作进行循环调用,可是使用Kettle工具时,并没有循环的组件可以调用,但在Job中引用Transformation时,可通过设置Transformation 的高级属性(”执行每一个输入行”)来实现Transformation 的循环,而在Transformation执行过程中,可根据条件设置跳出循环,或者略过本次操作,进入...

发表了文章 • 2015-10-03 08:53 • 0 条评论

0
推荐
1823
阅读

ODI第20节-OdiInvokeWebService(二):保留天气数据

在上一篇中通过OdiInvokeWebService工具获取”杭州”的天气数据后,可选择保留输出到本地XML文件。保留步骤如下所示:1.得到展示数据,点击”确定”2.回到”属性”标签3.编辑”响应文件”的相关属性如下,保留天气数据,输出到E盘Weather.xml文件4.编辑”一般信息”后,打开”命令”窗口检查至此的所有配置5.保存后,运行查看测试结...

发表了文章 • 2015-10-02 22:16 • 0 条评论

0
推荐
1853
阅读

ODI第19节-OdiInvokeWebService(一):获取天气数据

数据抽取中常可能使用到实时的网络数据,如天气,汇率等等。ODI也提供了此类工具,如程序包的工具箱中的OdiInvokeWebService工具。 1.新建项目的程序包如下2.程序包命名如下3.打开”图表”标签,选择OdiInvokeWebService工具4.编辑OdiInvokeWebService工具,修改步骤名称如下5.选择”高级属性”,弹出窗口6.填入天气WSD...

发表了文章 • 2015-10-02 22:14 • 0 条评论

0
推荐
3106
阅读

Kettle数据抽取(转换)mysql出现乱码问题解决方法

在kettle中进行数据抽取,如果抽取的源数据库和目标数据库不是同一个数据库,可能会导致转换后的中文出现乱码情况,原因是由于在中文环境下有的数据库客户端默认编码格式是UTF-8,而另外的数据库编码格式是GBK,这样就导致数据乱码的情况出现。针对这个问题,只需要在Database connection中做一个配置即可,具体步骤如下...

发表了文章 • 2015-10-02 20:46 • 0 条评论