NLP【中文分词】
- 开源中文分词工具探析(五):FNLP 1537次阅读 / 0条评论 (2017-03-31)
- 开源中文分词工具探析(四):THULAC 1614次阅读 / 0条评论 (2017-03-31)
- 开源中文分词工具探析(三):Ansj 1384次阅读 / 0条评论 (2017-03-31)
- 中文分词工具探析(二):Jieba 1557次阅读 / 0条评论 (2017-03-31)
- 中文分词工具探析(一):ICTCLAS (NLPIR) 2136次阅读 / 0条评论 (2017-03-31)
- 【中文分词】结构化感知器SP 1509次阅读 / 0条评论 (2017-03-30)
- 【中文分词】条件随机场CRF 1960次阅读 / 0条评论 (2017-03-30)
- 【中文分词】最大熵马尔可夫模型MEMM 1791次阅读 / 0条评论 (2017-03-30)
- 【中文分词】二阶隐马尔可夫模型2-HMM 1735次阅读 / 0条评论 (2017-03-29)
- 【中文分词】隐马尔可夫模型HMM 1450次阅读 / 0条评论 (2017-03-29)
- 【中文分词】简单高效的MMSeg 1191次阅读 / 0条评论 (2017-03-29)
python
- 【Python实战】Django建站笔记 1606次阅读 / 0条评论 (2017-05-02)
- 【Python实战】Scrapy豌豆荚应用市场爬虫 2014次阅读 / 0条评论 (2017-05-02)
- 【Python实战】Pandas:让你像写SQL一样做数据分析(二) 1582次阅读 / 0条评论 (2017-05-02)
- 【Python实战】Pandas:让你像写SQL一样做数据分析(一) 2711次阅读 / 1条评论 (2017-04-28)
- 【Python实战】机型自动化标注(搜狗爬虫实现) 1707次阅读 / 0条评论 (2017-04-28)
- 【Python实战】Scrapy豌豆荚应用市场爬虫 1543次阅读 / 0条评论 (2017-03-23)
【十大经典数据挖掘算法系列】
- 【十大经典数据挖掘算法】CART 1347次阅读 / 0条评论 (2017-03-28)
- 【十大经典数据挖掘算法】Naïve Bayes 1482次阅读 / 0条评论 (2017-03-28)
- 【十大经典数据挖掘算法】kNN 1271次阅读 / 1条评论 (2017-03-27)
- 【十大经典数据挖掘算法】AdaBoost 1409次阅读 / 0条评论 (2017-03-27)
- 【十大经典数据挖掘算法】PageRank 1351次阅读 / 0条评论 (2017-03-27)
- 【十大经典数据挖掘算法】EM 1393次阅读 / 0条评论 (2017-03-24)
- 【十大经典数据挖掘算法】Apriori 1952次阅读 / 0条评论 (2017-03-24)
- 【十大经典数据挖掘算法】SVM 1443次阅读 / 0条评论 (2017-03-23)
- 【十大经典数据挖掘算法】k-means 1264次阅读 / 0条评论 (2017-03-22)
- 【十大经典数据挖掘算法】C4.5 1954次阅读 / 0条评论 (2017-03-22)
大数据
- 灵活可扩展的工作流管理平台Airflow 2567次阅读 / 0条评论 (2017-04-26)
- 工作流引擎Oozie(二):coordinator 1485次阅读 / 0条评论 (2017-04-26)
- 工作流引擎Oozie(一):workflow 1795次阅读 / 0条评论 (2017-04-26)
- 轻量级OLAP(二):Hive + Elasticsearch 2737次阅读 / 0条评论 (2017-04-24)
- 轻量级OLAP(一):Cube计算 2073次阅读 / 0条评论 (2017-04-24)
- 【Kylin实战】邮件报表生成 2112次阅读 / 0条评论 (2017-04-24)
- 【Kylin实战】Hive复杂数据类型与视图 2278次阅读 / 0条评论 (2017-04-24)
- Apache Kylin 部署之不完全指南 2961次阅读 / 0条评论 (2017-04-20)
- Kylin的cube模型 3107次阅读 / 0条评论 (2017-04-20)
- Pig + Ansj 统计中文文本词频 1326次阅读 / 0条评论 (2017-04-20)
- Pig 实现关键词匹配 1166次阅读 / 0条评论 (2017-04-20)
- 【Pig源码分析】谈谈Pig的数据模型 1994次阅读 / 0条评论 (2017-04-19)
- Hive UDF初探 1786次阅读 / 0条评论 (2017-04-19)
- 常用HiveQL总结 1864次阅读 / 0条评论 (2017-04-19)
数据结构与算法
- 【LeetCode题解】排序 1454次阅读 / 0条评论 (2017-04-18)
- 【LeetCode题解】链表Linked List 1327次阅读 / 0条评论 (2017-04-18)
- 【LeetCode题解】数组Array 1306次阅读 / 0条评论 (2017-04-17)
- 【LeetCode题解】二叉树的遍历 1466次阅读 / 0条评论 (2017-04-17)
- 整数压缩编码 ZigZag 1577次阅读 / 0条评论 (2017-04-13)
- 【数据压缩】LZ78算法原理及实现 1758次阅读 / 0条评论 (2017-04-13)
- 【数据压缩】LZ77算法原理及实现 1745次阅读 / 0条评论 (2017-04-11)
- 【数据压缩】Huffman编码 1488次阅读 / 0条评论 (2017-04-11)
- Top K问题的两种解决思路 1215次阅读 / 0条评论 (2017-04-11)
- 最长回文子串 1274次阅读 / 0条评论 (2017-04-07)
- 连续子数组最大和 1529次阅读 / 0条评论 (2017-04-07)
- 【动态规划】最长公共子序列与最长公共子串 1943次阅读 / 0条评论 (2017-04-07)
- 【图论】有向无环图的拓扑排序 1636次阅读 / 0条评论 (2017-04-07)
- 【图论】求无向连通图的割点 1397次阅读 / 0条评论 (2017-04-06)
- 【图论】深入理解Dijsktra算法 1461次阅读 / 0条评论 (2017-04-06)
- 【模式匹配】Aho-Corasick自动机 1922次阅读 / 0条评论 (2017-04-05)
- 【模式匹配】更快的Boyer-Moore算法 1584次阅读 / 0条评论 (2017-04-05)
- 【模式匹配】KMP算法的来龙去脉 1374次阅读 / 0条评论 (2017-04-05)
- 双数组Trie树 (Double-array Trie) 及其应用 1831次阅读 / 0条评论 (2017-04-01)
- Bloom Filter:海量数据的HashSet 1271次阅读 / 0条评论 (2017-04-01)
- 多叉树实现类目体系 1673次阅读 / 0条评论 (2017-04-01)
- Trie树的应用:查询IP地址的ISP 1455次阅读 / 0条评论 (2017-04-01)
编程语言
- Java实现过滤中文乱码 1759次阅读 / 0条评论 (2017-04-28)
- Java实时读取日志文件 1465次阅读 / 0条评论 (2017-04-28)
- 【JDK源码分析】String的存储区与不可变性 1850次阅读 / 0条评论 (2017-04-27)
- 【JDK源码分析】浅谈HashMap的原理 1418次阅读 / 0条评论 (2017-04-27)
- Java中的逆变与协变 1811次阅读 / 0条评论 (2017-04-27)
- Java实现过滤中文乱码 1602次阅读 / 0条评论 (2017-03-22)