0
推荐
1267
阅读

干货 | TF-IDF的大用处

有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等很多计算机前沿领域,但是出乎意料的是,有一个非常简单的经典算法,可以给出令人相当满意的结果。它简单到都不需要高等数学,普通人只用10...

发表了文章 • 2017-08-28 16:33 • 0 条评论

0
推荐
1562
阅读

干货 | 数据挖掘知识点整理

1.  数据、信息和知识是广义数据表现的不同形式。2.  主要知识模式类型有:广义知识,关联知识,类知识,预测型知识,特异型知识3.  web挖掘研究的主要流派有:Web结构挖掘、Web使用挖掘、Web内容挖掘4.  一般地说,KDD是一个多步骤的处理过程,一般分为问题定义、数据抽取、数...

发表了文章 • 2017-07-12 16:00 • 0 条评论