SSIS 脚本组件 HTML问题
0
我在项目中遇到一些问题,在这里请教一下各位。
在项目中需要从电子病历中取数到BI数据库中,由于电子病历的存放是以html代码存放在相关数据库中
该图是电子病历
该图是html所在数据库
而我要做的是从Html代码中提取相关字段,存放到制作CUBE所在的数据库中
比如我用正则表达式可以获取电子病历中的姓名、年龄、病案号等
我想把html中的姓名、年龄、病案号存到另一个数据库中,现在问题是怎么实施这一个过程,我在网上了解到可以用脚本组件来实现
数据源就是html代码所在的数据库
然后下一步应该怎么操作,由于我对visual C#2010语法不熟悉,导致我无从下手,求各位指导
在项目中需要从电子病历中取数到BI数据库中,由于电子病历的存放是以html代码存放在相关数据库中
该图是电子病历
该图是html所在数据库
而我要做的是从Html代码中提取相关字段,存放到制作CUBE所在的数据库中
比如我用正则表达式可以获取电子病历中的姓名、年龄、病案号等
我想把html中的姓名、年龄、病案号存到另一个数据库中,现在问题是怎么实施这一个过程,我在网上了解到可以用脚本组件来实现
数据源就是html代码所在的数据库
然后下一步应该怎么操作,由于我对visual C#2010语法不熟悉,导致我无从下手,求各位指导
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
天桥下的郑成功 - Hadoop大数据开发工程师、数仓架构师、熟悉数据仓库设计、Hadoop、Spark、HBase、Hive、SSIS等开发 2015-06-09 回答
赞同来自: BIWORK 、梁勇
通过 Source -> ScriptComponent 的方式。
我看你已经用正则模拟器取到了你想要的数据,那么接下来就是如何用C#实现了。
1. 你现在需要做的就是先学习一下如何编写C#代码。
2. 如何调用C#的正则类,然后把你的正则表达式套用进去
3. 用表达式取到具体数值, 然后与该行进行数据绑定形成 多列 比如你截图的 Name、Age 这些
4. 最后输入到流里,最终流向 Destination
以下参考:
1. ScriptComponent类,请使用 Transformer模式。
2. 学习如何使用 ScriptComponent:
http://www.cnblogs.com/biwork/p/3494387.html
3. 如何调用C# 正则类
http://www.cnblogs.com/kissdod ... .html
这些学习完基本就能解决你说的问你了