wenwen

奋斗的小白,愿努力和汗水都不会辜负

1
推荐
2950
阅读

推荐系统遇上深度学习(二)--FFM模型理论和实践

推荐系统遇上深度学习系列:推荐系统遇上深度学习(一)--FM模型理论和实践:https://www.jianshu.com/p/152ae633fb001、FFM理论在CTR预估中,经常会遇到one-hot类型的变量,one-hot类型变量会导致严重的数据特征稀疏的情况,为了解决这一问题,在上一讲中,我们介绍了FM算法。这一讲我们介绍一种在FM基础上发展出来的算法...

发表了文章 • 2018-04-12 21:09 • 0 条评论

1
推荐
2031
阅读

Batch Normalization

今儿调模型大佬又给支了一招,叫Batch Normalization(下面简称BN),虽然还没有深刻理解这玩意是什么,但是是真的挺有效的,哈哈。因此本文只是总结一下BN的具体操作流程以及如何用tensorflow来实现BN,对于BN更深层次的理解,为什么要BN,BN是否真的有效大家可以参考知乎上的回答:https://www.zhihu.com/question/38102...

发表了文章 • 2018-04-11 23:35 • 0 条评论

3
推荐
4450
阅读

深度学习遇上推荐系统(一)--FM模型理论和实践

1、FM背景在计算广告和推荐系统中,CTR预估(click-through rate)是非常重要的一个环节,判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。在进行CTR预估时,除了单特征外,往往要对特征进行组合。对于特征组合来说,业界现在通用的做法主要有两大类:FM系列与Tree系列。今天,我们就来讲讲FM算法。2、one-hot...

发表了文章 • 2018-04-10 23:41 • 1 条评论

3
推荐
4949
阅读

对抗思想与强化学习的碰撞-SeqGAN模型原理和代码解析

1、背景GAN作为生成模型的一种新型训练方法,通过discriminative model来指导generative model的训练,并在真实数据中取得了很好的效果。尽管如此,当目标是一个待生成的非连续性序列时,该方法就会表现出其局限性。非连续性序列生成,比如说文本生成,为什么单纯的使用GAN没有取得很好的效果呢?主要的屏障有两点:1)...

发表了文章 • 2018-04-07 16:39 • 0 条评论

1
推荐
3738
阅读

深度强化学习-DDPG算法原理和实现

在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...

发表了文章 • 2018-04-05 20:30 • 0 条评论

0
推荐
2657
阅读

深度强化学习-Actor-Critic算法原理和实现

在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...

发表了文章 • 2018-04-02 00:50 • 0 条评论

1
推荐
1807
阅读

买卖股票算法的后续

188. Best Time to Buy and Sell Stock IV这道题是股票系列的第四题,在第三题的基础上变成了我们最多可以进行N次交易,本题的解法也适用于第三题,只需要将N设置为2就行了嘛。首先,我们要确定的是,买和卖才算一次交易,而单独的买或者单独的卖不算一次交易。基于这个假定,如果k大于时间长度的一半的话,我们只需要简...

发表了文章 • 2018-04-01 19:21 • 0 条评论

0
推荐
3458
阅读

深度强化学习-Policy Gradient基本实现

在之前的几篇文章中,我们介绍了基于价值Value的强化学习算法Deep Q Network。有关DQN算法以及各种改进算法的原理和实现,可以参考之前的文章:实战深度强化学习DQN-理论和实践:https://www.jianshu.com/p/10930c371cacDQN三大改进(一)-Double DQN:https://www.jianshu.com/p/fae51b5fe000DQN三大改进(二)-Prioritised...

发表了文章 • 2018-04-01 19:12 • 0 条评论

1
推荐
1985
阅读

如何买卖股票?不要慌,我有妙招!

Leetcode第121题到123题连续出现了三道买卖股票相关的题目,一年前的网易笔试和半年前的百度面试都遇到过121题,不过不用慌,看完本文,你一定能够完美解决买卖股票的问题。那么我们由易到难,依次介绍这三道题目。121. Best Time to Buy and Sell Stock121题题目是这样的:在所有的过程中,我们只允许一次的买卖,基于...

发表了文章 • 2018-03-21 01:47 • 0 条评论

1
推荐
3894
阅读

一招解决4道leetcode hard题,动态规划在字符串匹配问题中的应用

在做leetcode的时候,遇到hard题大家往往都觉得头疼,但其实,掌握方法,举一反三,hard题有时候我们也能想到好的思路,顺利攻破,今天我们就介绍一下动态规划在字符串匹配中的应用,相同类型的题目在前120道题中居然出现了4次!有必要好好总结一下!这四道题分别是:10. Regular Expression Matching:https://leetcode....

发表了文章 • 2018-03-19 00:27 • 0 条评论

0
推荐
2485
阅读

Pandas实现Hive中的窗口函数

1、Hive窗口函数我们先来介绍一下Hive中几个常见的窗口函数,row_number(),lag()和lead()。row_number()该函数的格式如下:row_Number() OVER (partition by 分组字段 ORDER BY 排序字段 排序方式asc/desc) 简单的说,我们使用partition by后面的字段对数据进行分组,在每个组内,使用ORDER BY后面的字段进行排序,并给...

发表了文章 • 2018-03-18 21:37 • 0 条评论

1
推荐
2463
阅读

DQN三大改进(三)-Dueling Network

论文地址:https://arxiv.org/pdf/1511.06581.pdf代码地址:https://github.com/princewen/tensorflow_practice/tree/master/Dueling%20DQN%20Demo1、Dueling Network什么是Dueling Deep Q Network呢?看下面的图片上面是我们传统的DQN,下面是我们的Dueling DQN。在原始的DQN中,神经网络直接输出的是每种动作的 Q值, ...

发表了文章 • 2018-03-05 21:16 • 0 条评论

1
推荐
3063
阅读

DQN三大改进(二)-Prioritised replay

Prioritised replay原文:https://arxiv.org/pdf/1511.05952.pdf代码地址:https://github.com/princewen/tensorflow_practice/tree/master/Prioritized_Replay_DQN_demo1、背景这篇文章我们会默认大家已经了解了DQN的相关知识,如果大家对于DQN还不是很了解,可以参考文章https://www.jianshu.com/p/10930c371cac。我们...

发表了文章 • 2018-03-04 17:03 • 0 条评论

0
推荐
2487
阅读

DQN三大改进(一)-Double DQN

Double-DQN原文:https://arxiv.org/pdf/1509.06461v3.pdf代码地址:https://github.com/princewen/tensorflow_practice/tree/master/Double-DQN-demo1、背景这篇文章我们会默认大家已经了解了DQN的相关知识,如果大家对于DQN还不是很了解,可以参考文章https://www.jianshu.com/p/10930c371cac。我们简单回顾一下DQN的...

发表了文章 • 2018-03-03 14:31 • 0 条评论

0
推荐
1837
阅读

公众号推荐:小小挖掘机

欢迎关注我的公众号:小小挖掘机以下是一些历史文章:谢谢大家的支持!

发表了文章 • 2018-03-03 12:55 • 0 条评论