SPSS Modeler与数据库的链接查询

浏览: 2185

浩彬老撕曾经在《IBM SPSS Modeler最强工具书收藏系列(四)-数据读取奥秘》中提到怎么利用spss读取各种来源的数据,其中也重点介绍了如何通过odbc读取数据库数据。

考虑到数据库的数据读取相比于其他数据复杂,本文将进一步给大家介绍SPSS Modeler与数据的链接问题。

本文将使用1月份广州地区某移动监测站点PM2.5数据作为示例(该数据仅作示例使用,并非真实数据)。如果你对如何通过odbc链接读取数据库还有疑问请查看如下内容:

整个数据流如下图所示:

blob.png

1数据库源节点,使用SQL查询

在前面,我们介绍了如何读取整个表格的数据,但是在实际项目当中,可能由于数据量较大或者我们只需要其中的部分数据,那么直接全表读取就显得低效了。

blob.png

在【数据库源节点】中,我们可以进一步使用SQL查询数据,只需要在“模式”中选择“SQL查询”即可:

blob.png

当然,考虑到用户方便,我们可以直接导入缺省值,并在缺省值上直接进行修改:

blob.png

这里我们重新修改一下语句,选择广州白云区的PM2.5数据进行查询:

select

   date_time,

   zone,

   pm25

from d.gz_pm25

where zone = '白云区'

读取后接入表格节点,查看数据。

blob.png

2数据库导出节点,使用SQL建表

要将数据导回数据库当中,我们可以使用导出选项卡中的【数据库】节点。

blob.png

值得注意的是,由于我们是要建表,除了按照Modeler默认建表设置外,我们还可以进一步指定,在【导出】节点中,选择模式,将进一步设定建表的内容。在模式中,除了可以使用定制的creat table命令外,我们依然可以通过图形化界面的方式定义主键和字段的类型。

blob.png

设定完成后,点击运行,即可完成数据的导出。


近期热门文章精选

1.六行代码打造萌萌哒聊天机器人

2.超详细|关于梯度下降方法四知四会

3.如何通俗地理解决策树中的信息熵

4.真的只需要关心PM2.5?广州空气质量分析报告(附代码)

5.推荐资源|神经网络与深度学习

注:由于最近老撕比较忙,所以有些信息没有及时查看回复(微信规定48小时没有回复的话,则不能再次回复),所以如果浩彬老撕没有及时回复,大家可以再次留言。

作者简介:浩彬老撕

好玩的数据炼丹师,

曾经的IBM 数据挖掘攻城狮,

还没开始就过气数据科学界的段子手,

致力于数据科学知识分享,不定期送书活动

推荐 3
本文由 浩彬老撕 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册