All Projects → Rlseq2seq → Similar Projects or Alternatives

580 Open source projects that are alternatives of or similar to Rlseq2seq

Tensorflow Reinforce

Implementations of Reinforcement Learning Models in Tensorflow

Stars: ✭ 480 (-29.72%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

Pytorch Rl

Tutorials for reinforcement learning in PyTorch and Gym by implementing a few of the popular algorithms. [IN PROGRESS]

Stars: ✭ 121 (-82.28%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

Reinforcement learning tutorial with demo

Reinforcement Learning Tutorial with Demo: DP (Policy and Value Iteration), Monte Carlo, TD Learning (SARSA, QLearning), Function Approximation, Policy Gradient, DQN, Imitation, Meta Learning, Papers, Courses, etc..

Stars: ✭ 442 (-35.29%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

Mlds2018spring

Machine Learning and having it Deep and Structured (MLDS) in 2018 spring

Stars: ✭ 124 (-81.84%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

Reinforcement Learning With Tensorflow

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

Stars: ✭ 6,948 (+917.28%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

A2c

A Clearer and Simpler Synchronous Advantage Actor Critic (A2C) Implementation in TensorFlow

Stars: ✭ 169 (-75.26%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

Reinforcement Learning

Minimal and Clean Reinforcement Learning Examples

Stars: ✭ 2,863 (+319.18%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

Openai lab

An experimentation framework for Reinforcement Learning using OpenAI Gym, Tensorflow, and Keras.

Stars: ✭ 313 (-54.17%)

Mutual labels: reinforcement-learning, policy-gradient, actor-critic

Slm Lab

Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".

Stars: ✭ 904 (+32.36%)

Mutual labels: reinforcement-learning, policy-gradient

Torch Ac

Recurrent and multi-process PyTorch implementation of deep reinforcement Actor-Critic algorithms A2C and PPO

Stars: ✭ 70 (-89.75%)

Mutual labels: reinforcement-learning, actor-critic

Rl a3c pytorch

A3C LSTM Atari with Pytorch plus A3G design

Stars: ✭ 482 (-29.43%)

Mutual labels: reinforcement-learning, actor-critic

Deeprl Tutorials

Contains high quality implementations of Deep Reinforcement Learning algorithms written in PyTorch

Stars: ✭ 748 (+9.52%)

Mutual labels: reinforcement-learning, actor-critic

Btgym

Scalable, event-driven, deep-learning-friendly backtesting library

Stars: ✭ 765 (+12.01%)

Mutual labels: reinforcement-learning, policy-gradient

Mario rl

Stars: ✭ 60 (-91.22%)

Mutual labels: reinforcement-learning, actor-critic

Chainerrl

ChainerRL is a deep reinforcement learning library built on top of Chainer.

Stars: ✭ 931 (+36.31%)

Mutual labels: reinforcement-learning, actor-critic

Torchrl

Highly Modular and Scalable Reinforcement Learning

Stars: ✭ 102 (-85.07%)

Mutual labels: reinforcement-learning, policy-gradient

Reinforcement learning

강화학습에 대한 기본적인 알고리즘 구현

Stars: ✭ 100 (-85.36%)

Mutual labels: reinforcement-learning, policy-gradient

Hierarchical Actor Critic Hac Pytorch

PyTorch implementation of Hierarchical Actor Critic (HAC) for OpenAI gym environments

Stars: ✭ 116 (-83.02%)

Mutual labels: reinforcement-learning, actor-critic

Policy Gradient

Minimal Monte Carlo Policy Gradient (REINFORCE) Algorithm Implementation in Keras

Stars: ✭ 135 (-80.23%)

Mutual labels: reinforcement-learning, policy-gradient

Run Skeleton Run

Reason8.ai PyTorch solution for NIPS RL 2017 challenge

Stars: ✭ 83 (-87.85%)

Mutual labels: reinforcement-learning, actor-critic

Reinforcementlearning Atarigame

Pytorch LSTM RNN for reinforcement learning to play Atari games from OpenAI Universe. We also use Google Deep Mind's Asynchronous Advantage Actor-Critic (A3C) Algorithm. This is much superior and efficient than DQN and obsoletes it. Can play on many games

Stars: ✭ 118 (-82.72%)

Mutual labels: reinforcement-learning, actor-critic

Show Adapt And Tell

Code for "Show, Adapt and Tell: Adversarial Training of Cross-domain Image Captioner" in ICCV 2017

Stars: ✭ 146 (-78.62%)

Mutual labels: reinforcement-learning, policy-gradient

Pytorch sac

PyTorch implementation of Soft Actor-Critic (SAC)

Stars: ✭ 174 (-74.52%)

Mutual labels: reinforcement-learning, actor-critic

Pytorch Drl

PyTorch implementations of various Deep Reinforcement Learning (DRL) algorithms for both single agent and multi-agent.

Stars: ✭ 233 (-65.89%)

Mutual labels: reinforcement-learning, actor-critic

Deep-Reinforcement-Learning-With-Python

Master classic RL, deep RL, distributional RL, inverse RL, and more using OpenAI Gym and TensorFlow with extensive Math

Stars: ✭ 222 (-67.5%)

Mutual labels: policy-gradient, actor-critic

Reinforcement Learning

Deep Reinforcement Learning Algorithms implemented with Tensorflow 2.3

Stars: ✭ 61 (-91.07%)

Mutual labels: policy-gradient, actor-critic

Pytorch Rl

Deep Reinforcement Learning with pytorch & visdom

Stars: ✭ 745 (+9.08%)

Mutual labels: reinforcement-learning, actor-critic

Drq

DrQ: Data regularized Q

Stars: ✭ 268 (-60.76%)

Mutual labels: reinforcement-learning, actor-critic

Reaver

Reaver: Modular Deep Reinforcement Learning Framework. Focused on StarCraft II. Supports Gym, Atari, and MuJoCo.

Stars: ✭ 499 (-26.94%)

Mutual labels: reinforcement-learning, actor-critic

Deep Reinforcement Learning With Pytorch

PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....

Stars: ✭ 1,345 (+96.93%)

Mutual labels: policy-gradient, actor-critic

Pytorch A3c

PyTorch implementation of Asynchronous Advantage Actor Critic (A3C) from "Asynchronous Methods for Deep Reinforcement Learning".

Stars: ✭ 879 (+28.7%)

Mutual labels: reinforcement-learning, actor-critic

Rl algos

Reinforcement Learning Algorithms

Stars: ✭ 14 (-97.95%)

Mutual labels: reinforcement-learning, actor-critic

Rl Course Experiments

Stars: ✭ 73 (-89.31%)

Mutual labels: reinforcement-learning, policy-gradient

Rl algorithms

Structural implementation of RL key algorithms

Stars: ✭ 352 (-48.46%)

Mutual labels: reinforcement-learning, policy-gradient

Pytorch sac ae

PyTorch implementation of Soft Actor-Critic + Autoencoder(SAC+AE)

Stars: ✭ 94 (-86.24%)

Mutual labels: reinforcement-learning, actor-critic

Deep Algotrading

A resource for learning about deep learning techniques from regression to LSTM and Reinforcement Learning using financial data and the fitness functions of algorithmic trading

Stars: ✭ 173 (-74.67%)

Mutual labels: reinforcement-learning, policy-gradient

Paddle-RLBooks

Paddle-RLBooks is a reinforcement learning code study guide based on pure PaddlePaddle.

Stars: ✭ 113 (-83.46%)

Mutual labels: policy-gradient, actor-critic

Reinforcement Learning Kr

[파이썬과 케라스로 배우는 강화학습] 예제

Stars: ✭ 282 (-58.71%)

Mutual labels: policy-gradient, actor-critic

Easy Rl

强化学习中文教程，在线阅读地址：https://datawhalechina.github.io/easy-rl/

Stars: ✭ 3,004 (+339.82%)

Mutual labels: reinforcement-learning, policy-gradient

Reinforcement learning

Reinforcement learning tutorials

Stars: ✭ 82 (-87.99%)

Mutual labels: reinforcement-learning, policy-gradient

Lagom

lagom: A PyTorch infrastructure for rapid prototyping of reinforcement learning algorithms.

Stars: ✭ 364 (-46.71%)

Mutual labels: reinforcement-learning, policy-gradient

Pytorch Rl

This repository contains model-free deep reinforcement learning algorithms implemented in Pytorch

Stars: ✭ 394 (-42.31%)

Mutual labels: reinforcement-learning, policy-gradient

Pytorch A2c Ppo Acktr Gail

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) and Generative Adversarial Imitation Learning (GAIL).

Stars: ✭ 2,632 (+285.36%)

Mutual labels: reinforcement-learning, actor-critic

Awesome Monte Carlo Tree Search Papers

A curated list of Monte Carlo tree search papers with implementations.

Stars: ✭ 387 (-43.34%)

Mutual labels: reinforcement-learning, policy-gradient

Deep Rl Keras

Keras Implementation of popular Deep RL Algorithms (A3C, DDQN, DDPG, Dueling DDQN)

Stars: ✭ 395 (-42.17%)

Mutual labels: reinforcement-learning, policy-gradient

Explorer

Explorer is a PyTorch reinforcement learning framework for exploring new ideas.

Stars: ✭ 54 (-92.09%)

Mutual labels: policy-gradient, actor-critic

Multihopkg

Multi-hop knowledge graph reasoning learned via policy gradient with reward shaping and action dropout

Stars: ✭ 202 (-70.42%)

Mutual labels: reinforcement-learning, policy-gradient

ADL2019

Applied Deep Learning (2019 Spring) @ NTU

Stars: ✭ 20 (-97.07%)

Mutual labels: policy-gradient, actor-critic

rl implementations

No description or website provided.

Stars: ✭ 40 (-94.14%)

Mutual labels: policy-gradient, actor-critic

Dissecting Reinforcement Learning

Python code, PDFs and resources for the series of posts on Reinforcement Learning which I published on my personal blog

Stars: ✭ 512 (-25.04%)

Mutual labels: reinforcement-learning, actor-critic

Text summurization abstractive methods

Multiple implementations for abstractive text summurization , using google colab

Stars: ✭ 359 (-47.44%)

Mutual labels: reinforcement-learning, policy-gradient

Pytorch Cpp Rl

PyTorch C++ Reinforcement Learning

Stars: ✭ 353 (-48.32%)

Mutual labels: reinforcement-learning, actor-critic

Adeptrl

Reinforcement learning framework to accelerate research

Stars: ✭ 173 (-74.67%)

Mutual labels: reinforcement-learning, actor-critic

Trpo

Trust Region Policy Optimization with TensorFlow and OpenAI Gym

Stars: ✭ 343 (-49.78%)

Mutual labels: reinforcement-learning, policy-gradient

Pytorch Rl

PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

Stars: ✭ 658 (-3.66%)

Mutual labels: reinforcement-learning, policy-gradient

Hands On Reinforcement Learning With Python

Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow

Stars: ✭ 640 (-6.3%)

Mutual labels: reinforcement-learning, policy-gradient

Seqgan

A simplified PyTorch implementation of "SeqGAN: Sequence Generative Adversarial Nets with Policy Gradient." (Yu, Lantao, et al.)

Stars: ✭ 502 (-26.5%)

Mutual labels: policy-gradient

Habitat Lab

A modular high-level library to train embodied AI agents across a variety of tasks, environments, and simulators.

Stars: ✭ 587 (-14.06%)

Mutual labels: reinforcement-learning

Ai Toolbox

A C++ framework for MDPs and POMDPs with Python bindings

Stars: ✭ 500 (-26.79%)

Mutual labels: reinforcement-learning

Gym Anytrading

The most simple, flexible, and comprehensive OpenAI Gym trading environment (Approved by OpenAI Gym)

Stars: ✭ 627 (-8.2%)

Mutual labels: reinforcement-learning

1-60 of 580 similar projects

›

next*5