0
推荐
2494
阅读

推荐系统遇上深度学习(十一)--神经协同过滤NCF原理及实战

好久没更新该系列了,最近看到了一篇关于神经协同过滤的论文,感觉还不错,跟大家分享下。论文地址:https://www.comp.nus.edu.sg/~xiangnan/papers/ncf.pdf1、Neural Collaborative Filtering1.1 背景本文讨论的主要是隐性反馈协同过滤解决方案,先来明确两个概念:显性反馈和隐性反馈:显性反馈行为包括用户明确表示对...

发表了文章 • 2018-06-02 19:14 • 0 条评论

0
推荐
2046
阅读

L1正则化及推导

想必大家对L1正则化已经是再熟悉不过了,而且大家也都知道L1正则化是可以得到稀疏解的,即具有特征选择的功能。本文就从几何和数学两个角度来复习以下L1正则化。1、L1正则化大部分的正则化方法是在经验损失的基础上增加一个结构化损失,用来限制模型的学习能力,提升模型的泛化能力。L1正则化方法即在经验损失的基础上增...

发表了文章 • 2018-06-02 19:11 • 0 条评论

1
推荐
2189
阅读

拟牛顿法面面俱到(一)--牛顿插值法

这次带来的是拟牛顿法系列,本系列的目标是完全理解拟牛顿法,包括其中涉及到的知识,比如泰勒公式、海森矩阵等,泰勒公式大家都很熟悉,不过它是怎么推导出来的呢?想必大家都不是很了解吧,这要从牛顿插值法说起,本节就先来讲解一下牛顿插值法。本文大都参考自知乎:https://www.zhihu.com/question/223204081、什么...

发表了文章 • 2018-05-22 01:27 • 1 条评论

1
推荐
2821
阅读

推荐系统遇上深度学习(二)--FFM模型理论和实践

推荐系统遇上深度学习系列:推荐系统遇上深度学习(一)--FM模型理论和实践:https://www.jianshu.com/p/152ae633fb001、FFM理论在CTR预估中,经常会遇到one-hot类型的变量,one-hot类型变量会导致严重的数据特征稀疏的情况,为了解决这一问题,在上一讲中,我们介绍了FM算法。这一讲我们介绍一种在FM基础上发展出来的算法...

发表了文章 • 2018-04-12 21:09 • 0 条评论

3
推荐
4299
阅读

深度学习遇上推荐系统(一)--FM模型理论和实践

1、FM背景在计算广告和推荐系统中,CTR预估(click-through rate)是非常重要的一个环节,判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。在进行CTR预估时,除了单特征外,往往要对特征进行组合。对于特征组合来说,业界现在通用的做法主要有两大类:FM系列与Tree系列。今天,我们就来讲讲FM算法。2、one-hot...

发表了文章 • 2018-04-10 23:41 • 1 条评论

0
推荐
2431
阅读

深度强化学习-Actor-Critic算法原理和实现

在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...

发表了文章 • 2018-04-02 00:50 • 0 条评论

0
推荐
3314
阅读

深度强化学习-Policy Gradient基本实现

在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...

发表了文章 • 2018-04-01 19:12 • 0 条评论

2
推荐
3160
阅读

Pointer-network理论及tensorflow实战

数据下载地址:链接:https://pan.baidu.com/s/1nwJiu4T 密码:6joq本文代码地址:https://github.com/princewen/tensorflow_practice/tree/master/myPtrNetwork1、什么是pointer-networkPointer Networks 是发表在机器学习顶级会议NIPS 2015上的一篇文章,其作者分别来自Google Brain和UC Berkeley。Pointer Network...

发表了文章 • 2018-03-02 00:37 • 0 条评论

4
推荐
4456
阅读

实战深度强化学习DQN-理论和实践

1、Q-learning回顾Q-learning 的 算法过程如下图所示:在Q-learning中,我们维护一张Q值表,表的维数为:状态数S * 动作数A,表中每个数代表在当前状态S下可以采用动作A可以获得的未来收益的折现和。我们不断的迭代我们的Q值表使其最终收敛,然后根据Q值表我们就可以在每个状态下选取一个最优策略。Q值表的更新公式为:...

发表了文章 • 2018-02-27 00:15 • 2 条评论

3
推荐
5920
阅读

使用Seq2Seq+attention实现简单的Chatbot

1、attention model原理介绍1.1 attention model为什么要有attention机制原本的Seq2seq模型只有一个encoder和一个decoder,通常的做法是将一个输入的句子编码成一个固定大小的state,然后作为decoder的初始状态(当然也可以作为每一时刻的输入),但这样的一个状态对于decoder中的所有时刻都是一样的。attention即为注意...

发表了文章 • 2018-02-24 17:29 • 2 条评论

1
推荐
4553
阅读

简单的Seq2Seq实现作对联

Seq2Seq全称Sequence to Sequence,在机器翻译、文章摘要等领域有着广泛的应用。其本身很简单,是一个如下图所示的Encoder-Decoder框架。本文不纠结于Seq2Seq的原理介绍,而是着重介绍代码实战。本文基于python3和tensorflow1.4 实现。本文代码参照github链接:https://github.com/NELSONZHAO/zhihu 以及 知乎专栏...

发表了文章 • 2018-02-23 14:47 • 0 条评论

2
推荐
2600
阅读

使用Tensorflow实现简单的RNN

之前我们用word2vec训练了词向量,但光词向量其实没有什么实际的用处,我们还要结合深度学习模型比如rnn,LSTM,seq2seq才行,所以我们首先来介绍一下如何使用时下最为流行的tensorflow模型实现一个简单的循环神经网络1、循环神经网络简介开始前,我们先回顾一下,简单的MLP三层神经网络模型:基本神经网络其中x是一个向...

发表了文章 • 2018-02-18 22:33 • 1 条评论

2
推荐
4035
阅读

windows下使用word2vec训练维基百科中文语料全攻略!

训练一个聊天机器人的很重要的一步是词向量训练,无论是生成式聊天机器人还是检索式聊天机器人,都需要将文字转化为词向量,时下最火的词向量训练模型是word2vec,所以,今天小编文文带你使用维基百科训练词向量。1、训练数据下载我们使用维基百科训练词向量,维基百科数据的下载地址为:https://dumps.wikimedia.org/zh...

发表了文章 • 2017-06-20 00:31 • 0 条评论

5
推荐
3995
阅读

手把手教你在windows7上安装tensorflow-gpu开发环境

今天是在畅游入职的第一天,没什么特别的任务安排,先给大家看一下畅游小本本上的一句话:搜狐畅游笔记本封面写的很有诗意有没有,小编也被这句话激励到了,撸起袖子来好好干!第一天没有什么特别的任务,就是安装一下开发环境,对于一台裸机来说,只能从头开始。1、安装anacondaanaconda想必大家都不陌生,由于网站登不...

发表了文章 • 2017-06-06 23:11 • 0 条评论