All Categories → Machine Learning → policy-gradient

Top 62 policy-gradient open source projects

Minimal and Clean Reinforcement Learning Examples

✭ 2,863

python deep-learning machine-learning reinforcement-learning deep-reinforcement-learning dqn policy-gradient actor-critic a3c deep-q-network

Tianshou

An elegant PyTorch deep reinforcement learning library.

✭ 4,109

python Makefile pytorch dqn ppo policy-gradient imitation-learning ddpg mujoco benchmark library rl cql atari sac drl npg double-dqn trpo a2c td3 bcq

Multihopkg

Multi-hop knowledge graph reasoning learned via policy gradient with reward shaping and action dropout

✭ 202

jupyter-notebook pytorch reinforcement-learning knowledge-graph policy-gradient

Deep Algotrading

A resource for learning about deep learning techniques from regression to LSTM and Reinforcement Learning using financial data and the fitness functions of algorithmic trading

✭ 173

jupyter-notebook deep-learning tensorflow neural-network reinforcement-learning lstm policy-gradient

A2c

A Clearer and Simpler Synchronous Advantage Actor Critic (A2C) Implementation in TensorFlow

✭ 169

python computer-vision reinforcement-learning gym policy-gradient actor-critic

Show Adapt And Tell

Code for "Show, Adapt and Tell: Adversarial Training of Cross-domain Image Captioner" in ICCV 2017

✭ 146

python tensorflow reinforcement-learning image-captioning policy-gradient adversarial-networks

Policy Gradient

Minimal Monte Carlo Policy Gradient (REINFORCE) Algorithm Implementation in Keras

✭ 135

python keras reinforcement-learning deep-reinforcement-learning policy-gradient

Mlds2018spring

Machine Learning and having it Deep and Structured (MLDS) in 2018 spring

✭ 124

python reinforcement-learning spring gan chatbot generative-adversarial-network seq2seq image-generation policy-gradient actor-critic sequence-to-sequence deep-q-network

Pytorch Rl

Tutorials for reinforcement learning in PyTorch and Gym by implementing a few of the popular algorithms. [IN PROGRESS]

✭ 121

jupyter-notebook pytorch reinforcement-learning pytorch-tutorial rl policy-gradient actor-critic pytorch-tutorials

Easy Rl

强化学习中文教程，在线阅读地址：https://datawhalechina.github.io/easy-rl/

✭ 3,004

python Jupyter Notebook reinforcement-learning deep-reinforcement-learning dqn ppo policy-gradient q-learning a3c imitation-learning sarsa ddpg

Torchrl

Highly Modular and Scalable Reinforcement Learning

✭ 102

python python3 deep-learning machine-learning pytorch reinforcement-learning deep-reinforcement-learning dqn policy-gradient

Reinforcement learning

강화학습에 대한 기본적인 알고리즘 구현

✭ 100

python deep-learning pytorch tensorflow reinforcement-learning dqn policy-gradient

Deep Reinforcement Learning With Pytorch

PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....

✭ 1,345

python deep-learning pytorch algorithm deep-reinforcement-learning resnet dqn ppo policy-gradient actor-critic a3c trpo

Deeprl algorithms

DeepRL algorithms implementation easy for understanding and reading with Pytorch and Tensorflow 2(DQN, REINFORCE, VPG, A2C, TRPO, PPO, DDPG, TD3, SAC)

✭ 97

python deep-reinforcement-learning dqn ppo policy-gradient mujoco trpo

Reinforcement learning

Reinforcement learning tutorials

✭ 82

python reinforcement-learning dqn ppo policy-gradient a3c

Codegan

[Deprecated] Source Code Generation using Sequence Generative Adversarial Networks

✭ 73

python deep-learning paper rnn recurrent-neural-networks policy-gradient

Rl Course Experiments

✭ 73

jupyter-notebook deep-learning tensorflow neural-network reinforcement-learning deep-reinforcement-learning genetic-algorithm policy-gradient deep-q-network

Parl Sample

Deep reinforcement learning using baidu PARL(maze,flappy bird and so on)

✭ 37

python deep-reinforcement-learning dqn policy-gradient

Slm Lab

Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".

✭ 904

python pytorch reinforcement-learning benchmark deep-reinforcement-learning dqn ppo policy-gradient a3c

Btgym

Scalable, event-driven, deep-learning-friendly backtesting library

✭ 765

python hacktoberfest tensorflow reinforcement-learning time-series deep-reinforcement-learning openai-gym policy-gradient a3c unreal

Reinforcement Learning With Tensorflow

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

Rlseq2seq

Deep Reinforcement Learning For Sequence to Sequence Models

✭ 683

python nlp reinforcement-learning policy-gradient actor-critic

Pytorch Rl

PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

✭ 658

python pytorch reinforcement-learning generative-adversarial-network deep-reinforcement-learning ppo policy-gradient trpo

Hands On Reinforcement Learning With Python

Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow

✭ 640

jupyter-notebook reinforcement-learning deep-reinforcement-learning openai-gym ppo policy-gradient q-learning deep-learning-algorithms deep-q-network trpo

Seqgan

A simplified PyTorch implementation of "SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient." (Yu, Lantao, et al.)

✭ 502

python deep-learning nlp natural-language-processing gan generative-adversarial-network generative-model natural-language-understanding policy-gradient

Tensorflow Reinforce

Implementations of Reinforcement Learning Models in Tensorflow

✭ 480

python tensorflow reinforcement-learning deep-reinforcement-learning policy-gradient actor-critic deep-q-network

Deer

DEEp Reinforcement learning framework

✭ 455

python deep-reinforcement-learning policy-gradient q-learning

Reinforcement learning tutorial with demo

Reinforcement Learning Tutorial with Demo: DP (Policy and Value Iteration), Monte Carlo, TD Learning (SARSA, QLearning), Function Approximation, Policy Gradient, DQN, Imitation, Meta Learning, Papers, Courses, etc..

✭ 442

jupyter-notebook machine-learning tutorial reinforcement-learning deep-reinforcement-learning meta-learning dynamic-programming policy-gradient actor-critic q-learning a3c imitation-learning

Deep Rl Keras

Keras Implementation of popular Deep RL Algorithms (A3C, DDQN, DDPG, Dueling DDQN)

✭ 395

python keras reinforcement-learning dqn gym policy-gradient a3c ddpg

Pytorch Rl

This repository contains model-free deep reinforcement learning algorithms implemented in Pytorch

✭ 394

python deep-learning pytorch reinforcement-learning gan robotics generative-adversarial-network deep-reinforcement-learning dqn openai-gym vae variational-autoencoder gym policy-gradient ddpg mujoco

Awesome Monte Carlo Tree Search Papers

A curated list of Monte Carlo tree search papers with implementations.

✭ 387

python deep-learning machine-learning reinforcement-learning learning machine-learning-algorithms rl policy-gradient q-learning

Lagom

lagom: A PyTorch infrastructure for rapid prototyping of reinforcement learning algorithms.

✭ 364

python jupyter-notebook deep-learning machine-learning pytorch artificial-intelligence reinforcement-learning deep-reinforcement-learning research ppo policy-gradient ddpg mujoco

Text summurization abstractive methods

Multiple implementations for abstractive text summurization , using google colab

✭ 359

jupyter-notebook deep-learning machine-learning tensorflow nlp artificial-intelligence reinforcement-learning ai deeplearning rnn word2vec seq2seq machinelearning encoder-decoder policy-gradient text-summarization

Rl algorithms

Structural implementation of RL key algorithms

✭ 352

python python3 deep-learning pytorch reinforcement-learning dqn gym policy-gradient

Trpo

Trust Region Policy Optimization with TensorFlow and OpenAI Gym

✭ 343

jupyter-notebook machine-learning tensorflow reinforcement-learning policy-gradient mujoco

Ppo Pytorch

Minimal implementation of clipped objective Proximal Policy Optimization (PPO) in PyTorch

✭ 325

python pytorch deep-reinforcement-learning pytorch-tutorial ppo policy-gradient

Openai lab

An experimentation framework for Reinforcement Learning using OpenAI Gym, Tensorflow, and Keras.

✭ 313

python tensorflow keras reinforcement-learning deep-reinforcement-learning policy-gradient actor-critic experiment ddpg

Reinforcement Learning Kr

[파이썬과 케라스로 배우는 강화학습] 예제

✭ 282

python dqn openai-gym policy-gradient actor-critic

deep trading

This project aims to select a supervised algorithm that can predict stock prices basing on historical data and use the predictor generated to form trading strategies.

✭ 18

Jupyter Notebook python deep-neural-networks policy-gradient trading-strategies algorithmic-trading algorithm-trading

policy-gradient-pong

tensorflow implementation of Andrej Karpathy's blog about reinforcement learning. http://karpathy.github.io/2016/05/31/rl/

✭ 29

python reinforcement-learning tensorflow policy-gradient

ADL2019

Applied Deep Learning (2019 Spring) @ NTU

✭ 20

Jupyter Notebook python reinforcement-learning pytorch generative-adversarial-network gan policy-gradient image-generation ntu attention-mechanism bert adl actor-critic rnn-pytorch elmo deep-q-learning-network contextual-embeddings adl2019spring dialogue-modeling

rl implementations

No description or website provided.

✭ 40

Jupyter Notebook python machine-learning reinforcement-learning deep-learning deep-reinforcement-learning lstm dqn policy-gradient deep-q-network ddpg hierarchical-reinforcement-learning actor-critic reptile deep-q-learning meta-learning a2c

SeqGAN-PyTorch

Implementation of Sequence Generative Adversarial Nets with Policy Gradient in PyTorch

✭ 40

Jupyter Notebook python nlp pytorch gan policy-gradient seqgan

Deep-rl-mxnet

Mxnet implementation of Deep Reinforcement Learning papers, such as DQN, PG, DDPG, PPO

✭ 26

python mxnet deep-reinforcement-learning dqn policy-gradient reinforcement-learning-algorithms ddpg a2c td3

Paddle-RLBooks

Paddle-RLBooks is a reinforcement learning code study guide based on pure PaddlePaddle.

TRPO-TensorFlow

Trust Region Policy Optimization (TRPO) in pure TensorFlow

✭ 17

python reinforcement-learning tensorflow policy-gradient trpo trust-region-policy-optimization

td-reg

TD-Regularized Actor-Critic Methods

✭ 28

matlab python reinforcement-learning policy-gradient dpg trpo ppo spg temporal-difference

Deep-Reinforcement-Learning-CS285-Pytorch

Solutions of assignments of Deep Reinforcement Learning course presented by the University of California, Berkeley (CS285) in Pytorch framework

✭ 104

python Jupyter Notebook c C++reinforcement-learning deep-learning berkeley deep-reinforcement-learning openai-gym pytorch neural-networks policy-gradient deep-q-learning mujoco model-based-rl actor-critic-algorithm model-free-rl

Reinforcement Learning

Deep Reinforcement Learning Algorithms implemented with Tensorflow 2.3

✭ 61

Jupyter Notebook python reinforcement-learning policy-gradient reinforcement-learning-algorithms atari actor-critic ppo tensorflow2

HandyRL

HandyRL is a handy and simple framework based on Python and PyTorch for distributed reinforcement learning that is applicable to your own environments.

✭ 228

python machine-learning games reinforcement-learning deep-learning pytorch policy-gradient distributed-training

Explorer

Explorer is a PyTorch reinforcement learning framework for exploring new ideas.

✭ 54