数据分析流程中的难点之一是数据清洗和整理,在实际工作中,如果数据是结构化的,大家是直接在分析软件(R或者其它)中进行,还是会用SQL进行预处理,然后让R直接去读去处理好以后的试图或者存储过程呢?

0
已邀请:
0

Bob - 同程旅游大数据+BI 架构师 2016-01-28 回答

一般情况下需要从专门的数据清洗团队那里获取数据。
通常情况下我们认为是数据仓库或者是ODS层。
 
如果是结构化的数据,那建议还是先用sql进行数据加工处理。毕竟所有的数据库引擎对sql的执行都有一定的自动优化措施。
然后让R读取处理好的结果表

要回复问题请先登录注册