SSIS 脚本组件 HTML问题

0
我在项目中遇到一些问题,在这里请教一下各位。
 
在项目中需要从电子病历中取数到BI数据库中,由于电子病历的存放是以html代码存放在相关数据库中
QQ图片20150609154620.png
该图是电子病历

QQ图片20150609154629.png
该图是html所在数据库
 
而我要做的是从Html代码中提取相关字段,存放到制作CUBE所在的数据库中
比如我用正则表达式可以获取电子病历中的姓名、年龄、病案号等
QQ图片20150609154633.jpg

 
我想把html中的姓名、年龄、病案号存到另一个数据库中,现在问题是怎么实施这一个过程,我在网上了解到可以用脚本组件来实现

QQ图片20150609155117.png

数据源就是html代码所在的数据库
然后下一步应该怎么操作,由于我对visual C#2010语法不熟悉,导致我无从下手,求各位指导
已邀请:
2

天桥下的郑成功 - Hadoop大数据开发工程师、数仓架构师、熟悉数据仓库设计、Hadoop、Spark、HBase、Hive、SSIS等开发 2015-06-09 回答

你的思路是正确的,大体步骤就是像你现在这样。
通过 Source -> ScriptComponent 的方式。
我看你已经用正则模拟器取到了你想要的数据,那么接下来就是如何用C#实现了。

1. 你现在需要做的就是先学习一下如何编写C#代码。
2. 如何调用C#的正则类,然后把你的正则表达式套用进去
3. 用表达式取到具体数值, 然后与该行进行数据绑定形成 多列 比如你截图的 Name、Age 这些
4. 最后输入到流里,最终流向 Destination

以下参考:
1. ScriptComponent类,请使用 Transformer模式。

2. 学习如何使用 ScriptComponent:
http://www.cnblogs.com/biwork/p/3494387.html

3. 如何调用C# 正则类
http://www.cnblogs.com/kissdod ... .html

这些学习完基本就能解决你说的问你了


 

要回复问题请先登录注册