自然语言处理

自然语言处理

0
推荐
3395
浏览

从零开始学Python自然语言处理(30)—— 这两年的NLP顶流BERT

昨晚和一个朋友吃饭,他是一家公司的部门技术负责人,因为我们都是做自然语言处理的,我问他最近找工作的应该挺多的吧,他点了点头,然后和我吐槽前两天面试的一个工作3年的程序员,原来是做NLP的,这次也是面试N...

ID王大伟 发表了文章 • 2020-06-16 15:42

0
推荐
4079
浏览

从零开始学Python自然语言处理(31)—— BERT文本分类实战

让大家都会用bert。几行keras代码就可以做基于bert的文本分类。并且薅一波kaggle的算力羊毛和数据羊毛,体验一下bert的加载和微调。之前也介绍过如何使用kaggle的GPU。戳:自己的小霸王跑不起来?带你薅一波kaggl...

ID王大伟 发表了文章 • 2020-06-11 22:52

0
推荐
3486
浏览

从零开始学Python自然语言处理(30)—— Encoder-Decoder实战演练

说到Encoder-Decoder框架,就算没用过也都听说过。这玩意儿在经典的机器翻译模型里经常出现。而且,该框架灵活多变,适用于多个场景,比如文本摘要、问答系统等。只要是这种输入一个序列,再输出一个序列的场景,...

ID王大伟 发表了文章 • 2020-06-11 20:38

0
推荐
2940
浏览

一个简单的Python中文NLP工具包——foolnltk

命名实体识别(NER)被越来越多地应用到实际任务中。经典的模型非biLSTM+CRF莫属。如果再套用当今最火爆的预训练模型bert,只用bert+crf就能做出比biLSTM+CRF准确率更高的模型。但是训练模型往往是需要耗费资源,...

ID王大伟 发表了文章 • 2020-06-11 16:40

0
推荐
1389
浏览

用Python做NLP?你不知道的NLP语料构建技巧

记得写毕业论文那会儿,经常会为缺语料发愁。由于大多数 NLP 问题都是有监督问题,因此往往我们缺的不是算法,而是标注好的语料。这种问题在中文语料上更是明显。今天就和大家分享一些中文 NLP 领域,构建语料的...

ID王大伟 发表了文章 • 2020-06-11 15:26

0
推荐
2251
浏览

从零开始学Python自然语言处理(29)—— 根据场景变换的ELMo

前文传送门:从零开始学自然语言处理(28)—— Bi-LSTM+CRF完成命名实体识别任务我的朋友,去面试NLP算法工程师,面试官问了一些问题,最后的几个问题,他没回答出。当时的问题如下:ELMo是什么?ELMo和经典的word...

ID王大伟 发表了文章 • 2020-06-08 23:16

0
推荐
2772
浏览

从零开始学Python自然语言处理(28)—— Bi-LSTM+CRF完成命名实体识别任务

前文传送门:从零开始学自然语言处理(27)—— 开辟新纪元的Transformer俗话说的好,NER该怎么做?双向LSTM+CRF啊。这LSTM听说比一般的RNN牛逼,那这双向的LSTM岂不是更牛逼了?(BERT心想:渣渣)不管是实际业务...

ID王大伟 发表了文章 • 2020-06-08 23:10

0
推荐
3054
浏览

从零开始学Python自然语言处理(27)—— 开辟新纪元的Transformer

前文传送门:从零开始学自然语言处理(26)—— 强大的Attention机制回想起朋友之前找工作的悲惨经历,本来面试回答的挺好,面试官最后问了个NLP的问题,直接让他和50w年薪的工作擦肩而过..当时面试的是数据挖掘工...

ID王大伟 发表了文章 • 2020-06-08 23:03

0
推荐
2997
浏览

从零开始学Python自然语言处理(26)—— 强大的Attention机制

前文传送门:从零开始学自然语言处理(25)—— 通用的Encoder-Decoder模型框架在上一次面试失利后,我回来仔细研究了一下Attention机制,研究完我不禁感悟,这机制真的厉害啊!因为我之前面试被问到的Encoder - De...

ID王大伟 发表了文章 • 2020-06-08 22:54

0
推荐
2615
浏览

从零开始学Python自然语言处理(25)—— 通用的Encoder-Decoder模型框架

前文传送门:从零开始学自然语言处理(24)—— 巧妙的条件随机场(CRF)(下)面试现场...问:什么是Encoder-Decoder模型框架?答:Encoder-Decoder框架其实是一个编码-解码框架,主要处理Sequence to Sequence(seq...

ID王大伟 发表了文章 • 2020-06-08 22:51

0
推荐
2997
浏览

从零开始学Python自然语言处理(24)—— 巧妙的条件随机场(CRF)(下)

前文传送门:从零开始学自然语言处理(23)—— 巧妙的条件随机场(CRF)(上)在上一篇中,我们讲解了条件随机场中的线性链条件随机场基本概念,在本篇中,我们继续学习。我们如何将线性链条件随机场转化为可计算的...

ID王大伟 发表了文章 • 2020-06-08 21:10

0
推荐
2519
浏览

从零开始学Python自然语言处理(23)—— 巧妙的条件随机场(CRF)(上)

前文传送门:从零开始学自然语言处理(22)—— 效果震撼的Bi-LSTM在讲完Bi-LSTM之后,我觉得有必要聊聊条件随机场,(conditional random field,简称CRF)。条件随机场并不是深度学习模型,它经常出现在机器学习的...

ID王大伟 发表了文章 • 2020-06-08 20:15

0
推荐
2887
浏览

从零开始学Python自然语言处理(22)—— 效果震撼的Bi-LSTM

前文传送门:从零开始学自然语言处理(21)—— 强大的长短期记忆网络(LSTM)(下)在上一章中,我们详细讲解了LSTM,LSTM在传统的RNN结构基础上,能处理长期依赖。但如果你比较细心,会发现LSTM作为有方向的单向传...

ID王大伟 发表了文章 • 2020-06-08 20:08

0
推荐
2561
浏览

从零开始学Python自然语言处理(一)—— jieba 分词

今天,我们正式开始《从零开始学自然语言处理》系列文章的更新。内容会涉及自然语言处理的各个方面知识内容和具体操作:包括但不仅限于词法分析,句法分析,语义分析,文本聚类,文本分类,情感分析,文本摘要生...

ID王大伟 发表了文章 • 2020-05-09 10:11

0
推荐
1717
浏览

ICLR2020推荐阅读论文50篇

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 香侬科技作者 | 香侬科技我们为大家整理了ICLR2020的相关论文,此次分享的是从Openreview中选取的部分论文,共50篇...

数智物语 发表了文章 • 2019-11-07 16:55

7
推荐
8606
浏览

NLP从入门到喜欢之jieba分词器

前言好久没写文章了,前段时间在准备程序猿考试。我今天很认真,就不发表情了!说到做到!之前说好的二手房的数据分析也没能如期发出来,因为要查文献了解一下业务知识,所以还在进行中。最近迷上了NLP今天介绍一...

ID王大伟 发表了文章 • 2017-05-23 13:27

0
投票
1
回答
1103
浏览
0
推荐
3395
浏览

从零开始学Python自然语言处理(30)—— 这两年的NLP顶流BERT

昨晚和一个朋友吃饭,他是一家公司的部门技术负责人,因为我们都是做自然语言处理的,我问他最近找工作的应该挺多的吧,他点了点头,然后和我吐槽前两天面试的一个工作3年的程序员,原来是做NLP的,这次也是面试N...

ID王大伟 发表了文章 • 2020-06-16 15:42

0
推荐
4079
浏览

从零开始学Python自然语言处理(31)—— BERT文本分类实战

让大家都会用bert。几行keras代码就可以做基于bert的文本分类。并且薅一波kaggle的算力羊毛和数据羊毛,体验一下bert的加载和微调。之前也介绍过如何使用kaggle的GPU。戳:自己的小霸王跑不起来?带你薅一波kaggl...

ID王大伟 发表了文章 • 2020-06-11 22:52

0
推荐
3486
浏览

从零开始学Python自然语言处理(30)—— Encoder-Decoder实战演练

说到Encoder-Decoder框架,就算没用过也都听说过。这玩意儿在经典的机器翻译模型里经常出现。而且,该框架灵活多变,适用于多个场景,比如文本摘要、问答系统等。只要是这种输入一个序列,再输出一个序列的场景,...

ID王大伟 发表了文章 • 2020-06-11 20:38

0
推荐
2940
浏览

一个简单的Python中文NLP工具包——foolnltk

命名实体识别(NER)被越来越多地应用到实际任务中。经典的模型非biLSTM+CRF莫属。如果再套用当今最火爆的预训练模型bert,只用bert+crf就能做出比biLSTM+CRF准确率更高的模型。但是训练模型往往是需要耗费资源,...

ID王大伟 发表了文章 • 2020-06-11 16:40

0
推荐
1389
浏览

用Python做NLP?你不知道的NLP语料构建技巧

记得写毕业论文那会儿,经常会为缺语料发愁。由于大多数 NLP 问题都是有监督问题,因此往往我们缺的不是算法,而是标注好的语料。这种问题在中文语料上更是明显。今天就和大家分享一些中文 NLP 领域,构建语料的...

ID王大伟 发表了文章 • 2020-06-11 15:26

0
推荐
2251
浏览

从零开始学Python自然语言处理(29)—— 根据场景变换的ELMo

前文传送门:从零开始学自然语言处理(28)—— Bi-LSTM+CRF完成命名实体识别任务我的朋友,去面试NLP算法工程师,面试官问了一些问题,最后的几个问题,他没回答出。当时的问题如下:ELMo是什么?ELMo和经典的word...

ID王大伟 发表了文章 • 2020-06-08 23:16

0
推荐
2772
浏览

从零开始学Python自然语言处理(28)—— Bi-LSTM+CRF完成命名实体识别任务

前文传送门:从零开始学自然语言处理(27)—— 开辟新纪元的Transformer俗话说的好,NER该怎么做?双向LSTM+CRF啊。这LSTM听说比一般的RNN牛逼,那这双向的LSTM岂不是更牛逼了?(BERT心想:渣渣)不管是实际业务...

ID王大伟 发表了文章 • 2020-06-08 23:10

0
推荐
3054
浏览

从零开始学Python自然语言处理(27)—— 开辟新纪元的Transformer

前文传送门:从零开始学自然语言处理(26)—— 强大的Attention机制回想起朋友之前找工作的悲惨经历,本来面试回答的挺好,面试官最后问了个NLP的问题,直接让他和50w年薪的工作擦肩而过..当时面试的是数据挖掘工...

ID王大伟 发表了文章 • 2020-06-08 23:03

0
推荐
2997
浏览

从零开始学Python自然语言处理(26)—— 强大的Attention机制

前文传送门:从零开始学自然语言处理(25)—— 通用的Encoder-Decoder模型框架在上一次面试失利后,我回来仔细研究了一下Attention机制,研究完我不禁感悟,这机制真的厉害啊!因为我之前面试被问到的Encoder - De...

ID王大伟 发表了文章 • 2020-06-08 22:54

0
推荐
2615
浏览

从零开始学Python自然语言处理(25)—— 通用的Encoder-Decoder模型框架

前文传送门:从零开始学自然语言处理(24)—— 巧妙的条件随机场(CRF)(下)面试现场...问:什么是Encoder-Decoder模型框架?答:Encoder-Decoder框架其实是一个编码-解码框架,主要处理Sequence to Sequence(seq...

ID王大伟 发表了文章 • 2020-06-08 22:51

0
推荐
2997
浏览

从零开始学Python自然语言处理(24)—— 巧妙的条件随机场(CRF)(下)

前文传送门:从零开始学自然语言处理(23)—— 巧妙的条件随机场(CRF)(上)在上一篇中,我们讲解了条件随机场中的线性链条件随机场基本概念,在本篇中,我们继续学习。我们如何将线性链条件随机场转化为可计算的...

ID王大伟 发表了文章 • 2020-06-08 21:10

0
推荐
2519
浏览

从零开始学Python自然语言处理(23)—— 巧妙的条件随机场(CRF)(上)

前文传送门:从零开始学自然语言处理(22)—— 效果震撼的Bi-LSTM在讲完Bi-LSTM之后,我觉得有必要聊聊条件随机场,(conditional random field,简称CRF)。条件随机场并不是深度学习模型,它经常出现在机器学习的...

ID王大伟 发表了文章 • 2020-06-08 20:15

0
推荐
2887
浏览

从零开始学Python自然语言处理(22)—— 效果震撼的Bi-LSTM

前文传送门:从零开始学自然语言处理(21)—— 强大的长短期记忆网络(LSTM)(下)在上一章中,我们详细讲解了LSTM,LSTM在传统的RNN结构基础上,能处理长期依赖。但如果你比较细心,会发现LSTM作为有方向的单向传...

ID王大伟 发表了文章 • 2020-06-08 20:08

0
推荐
2561
浏览

从零开始学Python自然语言处理(一)—— jieba 分词

今天,我们正式开始《从零开始学自然语言处理》系列文章的更新。内容会涉及自然语言处理的各个方面知识内容和具体操作:包括但不仅限于词法分析,句法分析,语义分析,文本聚类,文本分类,情感分析,文本摘要生...

ID王大伟 发表了文章 • 2020-05-09 10:11

0
推荐
1717
浏览

ICLR2020推荐阅读论文50篇

文章发布于公号【数智物语】 (ID:decision_engine),关注公号不错过每一篇干货。来源 | 香侬科技作者 | 香侬科技我们为大家整理了ICLR2020的相关论文,此次分享的是从Openreview中选取的部分论文,共50篇...

数智物语 发表了文章 • 2019-11-07 16:55