来,和人工智能对对联过大年!

浏览: 1568

作者:  veelion
公众号:猿人学Python

春节贴春联是中国人庆祝春节(过年)的特有习俗。但我真正对对联有些认识和喜欢,不是从年年贴春联开始的,而是从《唐伯虎点秋香》那段经典的对对子开始的。那工整又有韵律和意境的对子,配上有节奏的配乐读出来着实让人热血沸腾,大呼过瘾。

本文末尾有对对联的入口,可以与人工智能对(tiao)对(xi)联(ta)哦~

先来回味一下这段台词吧,你的耳边是否响起了对对子的节奏。。。

对穿肠:一乡二里共三夫子,不识四书五经六义,竟敢教七八九子,十分大胆!

宁王:对啊,怎麼不对呢?你不给我面子,我可真的要发飙了!

唐伯虎:让我来试试! 十室九贫,凑得八两七钱六分五毫四厘,尚且三心二意,一等下流!

对穿肠:好工整啊!

华太师:华安,你来的正是时候。

唐伯虎:没事,没事,没事。

对穿肠:在下是七省文状元兼参谋将军,绰号对王之王的对穿肠。阁下是?

唐伯虎:小弟读过两年书,尘世中一个迷途小书僮,华安。

对穿肠:好!我就来会一会你!

(两人互相凝视,蓄势待发,突然......亲了一下......众人跌倒在地!)

唐伯虎:对不起,我俩惺惺相惜,情不自禁。

对穿肠:言归正传,我们开始了。

图书里,龙不吟虎不啸,小小书僮可笑可笑。

唐伯虎:棋盘里,车无轮马无韁,叫声将军提防提防。

众 人:对得好!对得好!

对穿肠:莺莺燕燕翠翠红红处处融融洽洽。

唐伯虎:雨雨风风花花叶叶年年暮暮朝朝。

众 人:华安真行啊!对得好!

宁 王:快出对子对死他,对死他!

对穿肠:十口心思,思君思国思社稷。

唐伯虎:八目共赏,赏花赏月赏秋香。

对穿肠:我上等威风,显现一身虎胆。

唐伯虎:你下流贱格,露出半个龟头。

对穿肠:我堂堂参谋将军会输给你个书僮? 你家坟头来种树。

唐伯虎:汝家澡盆杂配鱼。

对穿肠:鱼肥果熟入我肚。

唐伯虎:你老娘来亲下厨!

(对穿肠倒地喷血)

唐伯虎:对对本为消遣作乐,今曰穿肠兄居然对到呕出几十两血,可谓空前绝后,小弟佩服佩服!

十年前,微软亚洲研究院推出了一个对联生成引擎,可以根据用户输入的上联自动生成下联,当时火了一把。那时候我觉得这个好神奇啊。

十年后,人工智能的风已经热吹了几年。随着硬件GPU计算能力的提升,和深度学习框架(TensorFlow,PyTorch,MxNet等等)的推出和发展,人工智能(其实就是更深层的机器学习)首先在图像处理领域大放异彩,人脸识别、物体检测等技术应用广泛。然而,在自然语言处理处理方面,深度学习的应用还没有图像处理那么成熟。不过,人工智能作古诗,对对子应用的看起来还不错。

今天,在春节到来之前,我就来用Python搭建一套人工智能对对联的系统,供朋友们在春节期间娱乐一下。

一、人工智能的实现

基于深度学习实现的对对联已经有好多种方法。这次我们主要参考这个实现:

https://github.com/wb14123/seq2seq-couplet

并且,这个作者还提供了70万条对联的数据,有了这个数据就可以训练我们自己的模型了。

做深度学习训练是最考验硬件的,必须上GPU,不然训练可能要一两个月才能完成。通常深度学习的系统环境是这样的:

CPU:现在常规的已经足够,计算主要靠GPU;

内存:至少16GB,越多越好;

GPU: NVIDIA,至少是gtx-1060吧。目前最具性价比的是gtx-1080 Ti

OS: Ubuntu 16.04 (普遍使用的版本)

Python: Python 3.6 版 (2.x的版本用的很少了)

深度学习框架: TensorFlow、PyTorch和MxNet最流行

我的机器已经配置好了TensorFlow和GPU等环境,不过GPU只是1070,性能有点弱弱。按照说明可以比较容易的配置好训练环境。训练跑起来后,就听到GPU风扇转起来了,发热量有点大。好在是冬天,可以取取暖。要是夏天就只能流汗了~

训练的过程很漫长。。。最终训练了一周。搞人工智能的活儿没点儿像样的硬件,还真耗不起青春啊。训练期间,有足够的时间去完成其它的功能。

二、Web API的建立

上面的github中有个Flask写的Server。不过,我更喜欢Sanic,就用Sanic写一个吧。服务器接收上联,生成下联后返回json数据,Sanic很容易搞定。如果你用过Sanic,就知道它有多么容易了。

这个Server程序一运行,就先加载训练好的模型。然后给Server写一个路由响应函数即可。

三、与公众号对接

这个对接之前没有做过。通过读开发文档,弄明白了流程:在公众号后台设置服务器地址用来接收腾讯服务器发送的消息,我的服务器处理后再返回给腾讯服务器。

举个例子,关注公众号的用户给公众号发送一条上联,腾讯服务器收到后转发给我的服务器,我的服务器生成下联返回给腾讯服务器,腾讯服务器再传给用户的微信客户端。

弄清楚了数据传输路径,再结合文档中描述数据的格式,就可以实现跟微信对接的程序了。

(0)验证微信消息来源

微信的API通过一个验证机制来让我们开发者服务器来确认消息是从微信服务器发来了,而不是其它人的消息。这个机制官方文档中有描述,我把它实现为一个函数,其中三个参数是微信服务器发过来的,而里面的token是我在公众号后台设置的,这个token很关键不能让别人知道,不然他就可以拿它伪装成微信服务器了。当然,我的token你看到了也没关系,我会改成别的哦。

(1)解析微信消息数据

微信服务器传过来的消息是一个xml结构的数据,具体格式参见其官方开发文档。我用lxml来解析这个xml结构:

(2)实现关注事件自动回复和关键字回复

之前已经在公众号后台设置了用户关注后自动打招呼,和基于关键词的自动回复。启用开发模式后,这个功能就要我自己实现了:

把设置的关键词和回复内容用dict保存,后面添加也很方便。用正则表达式匹配这些设置的关键词和微信消息内容,速度也够快。

(3)生成回复消息

我的服务器处理完微信服务器发过来的消息后,就要生成一个xml格式的消息返回给微信服务器,它接收后再发给微信用户,从而实现最终的自动回复微信用户。这个xml格式也是正在开发文档中描述。

这样,与微信服务器对接的功能就实现了。接下来,把这些功能放到Sanic服务器程序里面就好了。

不过,我不是这样做的。而是让对联功能的服务保持独立,因为它启动一次加载人工智能模型太费时间,调试不方便。把对外的web服务写成另外的Sanic服务程序,两者之间,通过requests访问:

完成后测试成功。可惜,只留下下面一条测试的截图(后面有解释)

到此为止,一切正常!

。。。。。。

但是,原来公众号设置的菜单不见了。后台显示开发模式下要自己开发这个菜单,没问题,难不倒我。根据文档试了试,竟然不成功?!

为什么呢?权限那里显示,菜单开发的权限只有在公众号认证后才能获得。晕,还要去认证公众号。好吧,公众号你赢了。也就是说,前面废了那么大劲儿从读文档到写程序对接的功夫全白费了,公众号对接的代码白写了~~,有需要的拿走不谢哦。

四、独立的网页

我就是不认证,就是不认证!但我可以换个思路,停用开发模式。增加一个菜单,菜单链接对对联的网页就可以了。做这个网页太简单了,还是上Sanic。有心的同学,可以在这个网页上发现对对联的API,你可以使用这个API开发自己的应用哦。

这个网页就是一个单页面,布局用bootstrap,用jQuery和服务器交互。因为就一个简单页面,没有用jinja模板,直接读取html文件并用 response.html() 返回即可。坏处是每次调整网页都有重启一下服务:

网页有点简陋,就是下面的样子,类似对话流。有兴趣的同学可以通过关注公众号和它对对子。

这个系统的搭建,主要是使用Python完成,涉及一点网页css和js的东西,也涉及系统和网络服务的知识,可以算得上一个全栈开发的例子。当然,主要的还是Python,不管是人工智能还是Web都有Python的用武之地。别想了,赶快学Python吧。


人工智能对对联的入口:

https://www.yuanrenxue.com/couplet

Python的爱好者社区历史文章大合集

2018年Python爱好者社区历史文章合集(作者篇)

2018年Python爱好者社区历史文章合集(类型篇)


福利:文末扫码立刻关注公众号,“Python爱好者社区”,开始学习Python课程:

关注后在公众号内回复课程即可获取:

小编的转行入职数据科学(数据分析挖掘/机器学习方向)【最新免费】

小编的Python入门免费视频课程!!!

小编的Python快速上手matplotlib可视化库!!!

崔老师爬虫实战案例免费学习视频。

陈老师数据分析报告制作免费学习视频。

玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。

推荐 0
本文由 Python爱好者社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册