1
推荐
2950
阅读
推荐系统遇上深度学习(二)--FFM模型理论和实践
推荐系统遇上深度学习系列:推荐系统遇上深度学习(一)--FM模型理论和实践:https://www.jianshu.com/p/152ae633fb001、FFM理论在CTR预估中,经常会遇到one-hot类型的变量,one-hot类型变量会导致严重的数据特征稀疏的情况,为了解决这一问题,在上一讲中,我们介绍了FM算法。这一讲我们介绍一种在FM基础上发展出来的算法...
1
推荐
2031
阅读
Batch Normalization
今儿调模型大佬又给支了一招,叫Batch Normalization(下面简称BN),虽然还没有深刻理解这玩意是什么,但是是真的挺有效的,哈哈。因此本文只是总结一下BN的具体操作流程以及如何用tensorflow来实现BN,对于BN更深层次的理解,为什么要BN,BN是否真的有效大家可以参考知乎上的回答:https://www.zhihu.com/question/38102...
3
推荐
4450
阅读
深度学习遇上推荐系统(一)--FM模型理论和实践
1、FM背景在计算广告和推荐系统中,CTR预估(click-through rate)是非常重要的一个环节,判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。在进行CTR预估时,除了单特征外,往往要对特征进行组合。对于特征组合来说,业界现在通用的做法主要有两大类:FM系列与Tree系列。今天,我们就来讲讲FM算法。2、one-hot...
3
推荐
4949
阅读
对抗思想与强化学习的碰撞-SeqGAN模型原理和代码解析
1、背景GAN作为生成模型的一种新型训练方法,通过discriminative model来指导generative model的训练,并在真实数据中取得了很好的效果。尽管如此,当目标是一个待生成的非连续性序列时,该方法就会表现出其局限性。非连续性序列生成,比如说文本生成,为什么单纯的使用GAN没有取得很好的效果呢?主要的屏障有两点:1)...
1
推荐
3738
阅读
深度强化学习-DDPG算法原理和实现
在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...
0
推荐
2657
阅读
深度强化学习-Actor-Critic算法原理和实现
在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...
1
推荐
1807
阅读
买卖股票算法的后续
188. Best Time to Buy and Sell Stock IV这道题是股票系列的第四题,在第三题的基础上变成了我们最多可以进行N次交易,本题的解法也适用于第三题,只需要将N设置为2就行了嘛。首先,我们要确定的是,买和卖才算一次交易,而单独的买或者单独的卖不算一次交易。基于这个假定,如果k大于时间长度的一半的话,我们只需要简...
0
推荐
3458
阅读
深度强化学习-Policy Gradient基本实现
在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...
1
推荐
1985
阅读
如何买卖股票?不要慌,我有妙招!
Leetcode第121题到123题连续出现了三道买卖股票相关的题目,一年前的网易笔试和半年前的百度面试都遇到过121题,不过不用慌,看完本文,你一定能够完美解决买卖股票的问题。那么我们由易到难,依次介绍这三道题目。121. Best Time to Buy and Sell Stock121题题目是这样的:在所有的过程中,我们只允许一次的买卖,基于...
1
推荐
3894
阅读
一招解决4道leetcode hard题,动态规划在字符串匹配问题中的应用
在做leetcode的时候,遇到hard题大家往往都觉得头疼,但其实,掌握方法,举一反三,hard题有时候我们也能想到好的思路,顺利攻破,今天我们就介绍一下动态规划在字符串匹配中的应用,相同类型的题目在前120道题中居然出现了4次!有必要好好总结一下!这四道题分别是:10. Regular Expression Matching:https://leetcode....
0
推荐
2485
阅读
Pandas实现Hive中的窗口函数
1、Hive窗口函数我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。row_number()该函数的格式如下:row_Number() OVER (partition by 分组字段 ORDER BY 排序字段 排序方式asc/desc)
简单的说,我们使用partition by后面的字段对数据进行分组,在每个组内,使用ORDER BY后面的字段进行排序,并给...
1
推荐
2463
阅读
DQN三大改进(三)-Dueling Network
论文地址:https://arxiv.org/pdf/1511.06581.pdf代码地址:https://github.com/princewen/tensorflow_practice/tree/master/Dueling%20DQN%20Demo1、Dueling Network什么是Dueling Deep Q Network呢?看下面的图片上面是我们传统的DQN,下面是我们的Dueling DQN。在原始的DQN中,神经网络直接输出的是每种动作的 Q值, ...
1
推荐
3063
阅读
DQN三大改进(二)-Prioritised replay
Prioritised replay原文:https://arxiv.org/pdf/1511.05952.pdf代码地址:https://github.com/princewen/tensorflow_practice/tree/master/Prioritized_Replay_DQN_demo1、背景这篇文章我们会默认大家已经了解了DQN的相关知识,如果大家对于DQN还不是很了解,可以参考文章https://www.jianshu.com/p/10930c371cac。我们...
0
推荐
2487
阅读
DQN三大改进(一)-Double DQN
Double-DQN原文:https://arxiv.org/pdf/1509.06461v3.pdf代码地址:https://github.com/princewen/tensorflow_practice/tree/master/Double-DQN-demo1、背景这篇文章我们会默认大家已经了解了DQN的相关知识,如果大家对于DQN还不是很了解,可以参考文章https://www.jianshu.com/p/10930c371cac。我们简单回顾一下DQN的...
0
推荐
1837
阅读