0
推荐
1674
阅读

机器学习基础与实践(三)----数据降维之PCA

本来想参考PRML来写,但是发现里面涉及到比较多的数学知识,写出来可能不好理解,我决定还是用最通俗的方法解释PCA,并举一个实例一步步计算,然后再进行数学推导,最后再介绍一些变种以及相应的程序。(数学推导及变种下次再写好了) 正文:  在数据处理中,经常会遇到特征维度比样本数量多得多的情况,如果拿到...

发表了文章 • 2017-12-25 10:26 • 0 条评论

0
推荐
2007
阅读

机器学习基础与实践(二)----数据转换

第一部分 模型的评估与数据处理 机器学习基础与实践(一)----数据清洗 机器学习基础与实践(二)----数据转换 机器学习基础与实践(三)----数据降维 第二部分 特征工程 机器学习基础与实践(四)----特征选择 机器学习基础与实践(五)----特征提取 机器学习基础与实践(六)----模型选择与...

发表了文章 • 2017-12-25 10:07 • 0 条评论

0
推荐
1851
阅读

机器学习基础与实践(一)----数据清洗

 想写这个系列很久了,最近刚好项目结束了闲下来有点时间,于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书,每本书都各有侧重点,机器学习实战和集体智慧编程更偏向与实战,侧重于对每个算法的实际操作过程,但是没有对整个数据挖掘项目做介绍,李航老师的统计学习方法和周志华老师的机器学习这两本...

发表了文章 • 2017-12-25 09:58 • 0 条评论

1
推荐
2378
阅读

【原】KMeans与深度学习自编码AutoEncoder结合提高聚类效果

这几天在做用户画像,特征是用户的消费商品的消费金额,原始数据(部分)是这样的:id goods_name goods_amount 男士手袋 1882.0 淑女装 2491.0 女士手袋 345.0 基础内衣 328.0 商务正装 4985.0 时尚 969.0 女饰品 86.0 专业运动 399.0 童装(中...

发表了文章 • 2017-12-20 14:24 • 0 条评论