作为一名新手,了解一点机器学习理论,想求推荐一些项目可以练手的,希望可以从中学到东西,有实际作用的?

0
本人本科生,最近看了一些机器学习理论,加之课程学习,没做过实际的应用项目,英文也不是很好,我知道国外有大数据比赛的项目,但是因为英文只能作罢。有没有国内的这方面的可以练手的?谢谢
已邀请:
3

哆啦A梦 - 学生 2015-09-16 回答

首先分为两个角度来回答你:
1.机器学习和学位有没有直接关系:
答案是否定的,先给你说一下研究生和博士的科研状况吧,每天都是看论文,作报告,应付老师的项目或者论文,然后就是为了做项目或者论文继续看论文,每天都是这么个循环,所以我觉得读研还是读博士,依人而定。现在计算机博士都是把毕业放在第一位,毕业的压力使得硕士、博士每天只能按照导师的要求看论文,很少有看书的时间和机会。
2.高等学历的研究方法是否可以借鉴:
答案是肯定的,但不是全部方法都可以借鉴,机器学习算法有很多种,研究生都是对某个算法进行深入研究,例如我身边同学有做自然语言处理的、深度学习、用户行为检测、图像识别,基本上用的算法都是GA,神经网络,贝叶斯啥的,因此可以说算法基本上在各个领域都有应用,认真研究一种算法,深入理解这个算法的性能,先决条件,产生结果就可以。我觉得这些在本科阶段就可以独自完成。
3.下面说说机器学习最关键的部分也是最容易忽略的部分:
先来一个问题:既然每个算法在各个领域都有应用,那么在这些领域中是不是有差别。答案也是肯定的,在不同领域的算法不同主要是采取模型不同例如在自然语言处理应用空间向量模型,在图像识别中就可以能应用RGB模型,研究生,博士的绝大部分时间就是在构建这些模型,不断的把每个领域的模型进行分解然后在进行组装成为自己独特的模型。那么这些模型的构建市面上有没有好的资料:答案是没有,市面上的资料基本上都是成熟的算法,我不知道在工业领域应用如何,但是科研是不可能用的,一个是不够高端,另一个是有抄袭嫌疑。互联网上也不会有这方面的资料,互联网上的会告诉你GA是什么,神经网络是什么,甚至代码都是现成的,但是不可能告诉你
在散文领域该用自然语言处理用哪种方法(当然现在基于情绪的中文自然语言处理还是不成熟的,英语领域准确率已经很高,还需要大家贡献力量来解决),这两个主要原因会把科研人员目光转向另外的知识媒体,就是论文。
4。论文的分类:
我的观点是论文可以分为3类:学位论文,综述,以及基于某个问题的论文。学位论文和综述可以作为新手的起点,因为学位论文会把一个方案的详细过程介绍出来,以及最终的实现结果。综述本身就是对于某个领域前人工作的系统总结,介绍的方法会很全(科研标准,很严格),可以帮助新人来快速认识某个领域。所以我觉得如果只是完了完成实验或者实现基本的功能,最好多看看学位论文,去GIT找找机器学习的开源项目跑一跑,熟悉整个机器学习的开发流程。
5

牟瑞 - 大数据 Hadoop 讲师 Hadoop入门课程地址:http://www.hellobi.com/course/39 有架构师,技术总监,CTO的职位请联系我! 2015-08-28 回答

其实一直想说,数据分析或者数据挖掘是一个很深很广的范畴,如何更好地学习,完全要看你的个人兴趣和爱好。
你所提到的英文不好只好作罢,这明显就是自己给自己找理由。机器学习领域里面哪篇有深度的Paper不是英文写的?如果你要是想以后从事这方面的工作,英文这关是必须的。否则,最后多半是个半吊子。
国内也有很多大数据的比赛,图像识别的,算法的等等。在这里例举两个网站,在这上面会不定期的有比赛举办,并且是有奖金的
http://www.pkbigdata.com/page/html/user/playerList.html
http://www.ccf.org.cn/sites/ccf/
还有一种方式是去找单位实习,现在很多单位都要找这方面的人才。
 
另外,再说句题外话,我个人是觉得,如果在机器学习领域有所成就,本科是很难有作为的,除非你特别的聪明,否则的话,还是读一个研究生,甚至是博士。
 
以上,有问题可以再交流。

要回复问题请先登录注册