旅游行业数据收集的渠道,方式,数据准确性怎么验证。还有数据预处理的过程有哪些,怎么做,发现异常数据怎么处理,是直接删除,还是经过数据清洗。怎么清洗

0
已邀请:
2

brucelu - 大数据、数据仓库、数据挖掘均有涉猎 2015-11-27 回答

这位哥们是说做挖掘类的数据探索吗?数据收集就是爬虫去取,用Python写个爬虫~
目前我这边不会去从别的公司去拿数据,公司内的数据已经满足现有的挖掘需求了。
数据预处理主要是做平均值填充,数据缺失的情况较少。
如果是数据异常的话,自然不能直接删除啊,必须要清洗,比如数据转换,数据填充,标准化,异常值删除等。

要回复问题请先登录注册