wenwen

0

推荐

2402

阅读

从小白到入门算法，我的经验分享给你～

研究生三年，作为一名非计算机专业的学生，能够从一名纯小白(Python不会，机器学习没听说过)到最后校招拿到几个不错的offer，个人感觉可以给自己打个及格分吧。写本文的目的，一是对自己研究生阶段所学习的知识做一个总结，二是希望对那些刚接触机器学习，准备往这个方向发展的同学们提供一些可借鉴的经验。1、入门Pytho...

发表了文章 • 2019-04-30 22:27 • 0 条评论

0

推荐

3154

阅读

Categorical DQN-一种建模价值分布的深度强化学习方法！

之前介绍的DQN及其各种变体，网络输出的都是状态-动作价值Q的期望预估值。而本文将介绍的Categorical DQN，它建模的是状态-动作价值Q的分布。这样的估计方法使得估计结果更加细致可信。本文的论文名称为《A Distributional Perspective on Reinforcement Learning》，地址为：https://arxiv.org/abs/1707.06887。不过论...

发表了文章 • 2018-12-21 15:49 • 0 条评论

0

推荐

2810

阅读

增强模型的探索能力-强化学习NoisyNet原理及实现！

增加Agent的探索能力是强化学习中经常遇到的问题，一种常用的方法是采用e-greedy的策略，即以e的概率采取随机的动作，以1-e的概率采取当前获得价值最大的动作。本文我们将介绍另一种方法：NoisyNet，该方法通过对参数增加噪声来增加模型的探索能力。1、NoisyNet的原理我们的噪声通常添加在全连接层，考虑我们全连接层的...

发表了文章 • 2018-12-18 21:28 • 0 条评论

0

推荐

2118

阅读

强化学习反馈稀疏问题-HindSight Experience Replay原理及实现！

在强化学习中，反馈稀疏是一个比较常见同时令人头疼的问题。因为我们大部分情况下都无法得到有效的反馈，模型难以得到有效的学习。为了解决反馈稀疏的问题，一种常用的做法是为Agent增加一些内在的目标使反馈变的不再稀疏。本文将介绍一种修改目标，使有效回报数量变多的方法。该方法称为Hindsight Experience Replay，...

发表了文章 • 2018-12-17 17:15 • 0 条评论

0

推荐

2230

阅读

numpy中的hstack()、vstack()、stack()、concatenate()函数详解

本文主要介绍一下numpy中的几个常用函数，包括hstack()、vstack()、stack()、concatenate()。1、concatenate()我们先来介绍最全能的concatenate()函数，后面的几个函数其实都可以用concatenate()函数来进行等价操作。concatenate()函数根据指定的维度，对一个元组、列表中的list或者ndarray进行连接，函数原型：numpy.co...

发表了文章 • 2018-12-17 17:14 • 0 条评论

1

推荐

4010

阅读

一步步解析Attention is All You Need！

本文将通过细节剖析以及代码相结合的方式，来一步步解析Attention is all you need这篇文章。这篇文章的下载地址为：https://arxiv.org/abs/1706.03762本文的部分图片来自文章：https://mp.weixin.qq.com/s/RLxWevVWHXgX-UcoxDS70w，写的非常好！本文边讲细节边配合代码实战，代码地址为：https://github.com/princewen/...

发表了文章 • 2018-12-11 10:27 • 0 条评论

0

推荐

7917

阅读

Proximal Policy Optimization(PPO)算法原理及实现！

这两天看了一下李宏毅老师的强化学习课程的前两讲，主要介绍了Policy Gradient算法和Proximal Policy Optimization算法，在此整理总结一下。视频地址：https://www.bilibili.com/video/av24724071/?p=41、PG算法回顾在PG算法中，我们的Agent又被称为Actor，Actor对于一个特定的任务，都有自己的一个策略π，策略π通常用一...

发表了文章 • 2018-11-27 21:29 • 0 条评论

1

推荐

3494

阅读

ARIMA模型原理及实现

1、数据介绍再介绍本篇的内容之前，我们先来看一下本文用到的数据。本文用到的中国银行股票数据下载：http://pan.baidu.com/s/1gfxRFbH，提取码d3id。我们先来导入一下我们的数据，顺便画出收盘价数据的折线图：import pandas as pd import matplotlib.pyplot as plt ChinaBank = pd.read_csv('ChinaBank.csv',index_col...

发表了文章 • 2018-11-01 00:46 • 0 条评论

0

推荐

2802

阅读

残差网络ResNet网络原理及实现

论文地址：https://arxiv.org/pdf/1512.03385.pdf1、引言-深度网络的退化问题在深度神经网络训练中，从经验来看，随着网络深度的增加，模型理论上可以取得更好的结果。但是实验却发现，深度神经网络中存在着退化问题(Degradation problem)。可以看到，在下图中56层的网络比20层网络效果还要差。上面的现象与过拟合不同，...

发表了文章 • 2018-10-27 15:51 • 0 条评论

从小白到入门算法，我的经验分享给你～

推荐系统遇上深度学习(三十)--深度矩阵分解模型理论及实践

Categorical DQN-一种建模价值分布的深度强化学习方法！

增强模型的探索能力-强化学习NoisyNet原理及实现！

强化学习反馈稀疏问题-HindSight Experience Replay原理及实现！

numpy中的hstack()、vstack()、stack()、concatenate()函数详解

一步步解析Attention is All You Need！

Proximal Policy Optimization(PPO)算法原理及实现！

推荐系统遇上深度学习(二十八)--知识图谱与推荐系统结合之MKR模型原理及实现

推荐系统遇上深度学习(二十七)--知识图谱与推荐系统结合之RippleNet模型原理及实现

推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

推荐系统遇上深度学习(二十五)--当知识图谱遇上个性化推荐

推荐系统遇上深度学习(二十四)--深度兴趣进化网络DIEN原理及实战！

ARIMA模型原理及实现

残差网络ResNet网络原理及实现