机器学习:
机器学习概念:研究如何通过计算的手段,利用经验来改善系统自身的性能。
研究的主要内容:关于在计算几上从数据中产生“模型”的算法
机器学习的目标:使学得的模型能很好地适用于“新样本”(如果只能记住训练样本的数据那么当遇到新数据时模型便没用了)
泛化 - 模型使用与新样本的能力
样本空间(属性空间、输入空间)- 属性张成的空间
属性 - 反应时间或对象在某方面的表现或性质的事项
测试 - 学得模型后,使用其进行测试的过程,被预测的样本称为“测试样本”。例如在学得f之后对测试数据x得到的预测标记y=f(x)。
学习过程中使用的训练样本通常不拥有标记信息
按训练数据是否拥有标记信息,学习任务可大致分为两大类
有标记信息 - 监督学习:分类和回归
无标记信息 - 无监督学习:聚类
版本空间是否可理解为正类的假设?
我的博客:http://blog.csdn.net/lili_wuwu/article/details/52146026