求助(数据清理,规则如何定义,希望大神们帮帮小弟我)急!!

0
我现在有一批数据,是从别人系统下载下来的,里面有有一列维度是公司,这些公司名词后面的后缀不同(包括同一公司名后缀不同,不同公司后缀也会有不同的)我希望能统一后缀,将是同一家公司的规定为一个;
第二个我自己还有一个系统也有公司名,公司后缀也不一样;我想讲别人系统的公司名和本公司的统一,用一个标准;
希望大神帮帮我,怎么用数据库实现它,特别感谢!!
已邀请:
0

逆光 - BI爱好者 关注:数据学习社区 公众号获取更多资料 2015-10-13 回答

关于数据的问题通常需要工具来实现,就你说的情况通常需要自己做一个编码表的,然后通过ETL程序来进行编码转换。
0

老头子 - 专注是唯一的捷径 2015-10-13 回答

你的数据是如何的,有什么规律没?还有你的数据库是什么? 写个SQL处理成统一格式就可以了
比如:
之前电信项目里有的手机号带国家码,有的手机号不带。根据手机号码11位的规律,从后往前取11位就可以。
所以这个规则要根据你的数据格式来定的。

要回复问题请先登录注册