2
推荐
2910
阅读
[Python]给函数传递不定个数的参数
问题起源在Python中常常看到有这样的函数,它们的入口参数的个数是不定的。比如有如下代码In: print zip([1, 2],[3, 4])
Out: [(1, 3), (2, 4)]
In: print zip([1, 2],[3, 4],[5, 6])
Out: [(1, 3, 5), (2, 4, 6)]其中zip是Python自带的一个函数,其作用么,相信聪明的你已经看出来了。那如果有一天我们也要写一个能接受...
3
推荐
12468
阅读
[scikit-learn] 特征二值化编码函数的一些坑
目录1. 前言2. 问题起源2.1. 对付数值型类别变量2.2. 对付字符串型类别变量2.3. 无用的尝试3. 另一种解决方案4. 参考资料1. 前言这几天埋头撰写『优雅高效地数据挖掘——基于Python的sklearn_pandas库』 一文,其中有一部分涉及如何批量并行地进行特征二值化,在此过程中发现了 scikit-learn (以下简称 sklearn)中,二值化...
1
推荐
2208
阅读
[Python]给函数传递不定关键字的参数
目录[Python]给函数传递不定关键字的参数目录前言两种传参方式:按位置传递和按关键字传递从一个例子说起老实做人变种人总结Bonus前言在上一篇文章『[Python]给函数传递不定个数的参数』中,我们主要讲解了*在函数定义和函数调用阶段的不同作用,并留了一个小问题:我们用*定义了add_int(*a)函数,现在有a_list=[1,2,3],...
4
推荐
4107
阅读
【强推】数据挖掘比赛通用框架
【原创,转载请注明来自公众号『数据挖掘机养成记』并注明作者『穆文』】1. 前言Kaggle上有篇名为「Approaching (Almost) Any Machine Learning Problem」的博客(点击底部阅读原文),作者是Kaggle比赛的专业户,博客是他参加Kaggle比赛的经验总结。在进入正题前随便扯几句:本文并非原博客的翻译版,而是90%的原创,是...
6
推荐
5142
阅读
自学机器学习、数据挖掘的几点建议
【原创,若要转载,请注明:来自微信公众号“数据挖掘机养成记”】前言背景:一直有朋友希望我能介绍下自学机器学习、数据挖掘的经历,然而当我认真回首研究生这两年半,发现浪掉的时间居多,学习的时间太少,积累还不够(虽然校招季收获比较多的数据挖掘相关offer,其实人脉、运气、面试经验等其他因素占了很大比重)。所...