1
推荐
2370
阅读

结巴分词源码分析

闲来无事,在博客园的论坛里随意游荡,看到一个开源的python库,名字叫做结巴分词,一直很好奇这些自然语言的处理方式,但是网上的相关介绍却少的可怜,仅有的一些博客写介绍的比较浅。幸好代码量不多,花了两周的时间把代码和设计的算法仔细的梳理了一边,供大家参考,也希望能够抛砖引玉。分词算法介绍先看一下分词用...

发表了文章 • 2016-05-06 20:11 • 0 条评论