All Projects → imm-rl-lab → RL_course

imm-rl-lab / RL_course

Licence: other
The page of the Ural Federal University course "Reinforcement Learning and Neural Networks"

Programming Languages

Jupyter Notebook
11667 projects
python
139335 projects - #7 most used programming language

Projects that are alternatives of or similar to RL course

Practical rl
A course in reinforcement learning in the wild
Stars: ✭ 4,741 (+20513.04%)
Mutual labels:  course-materials, deep-reinforcement-learning
DRL in CV
A course on Deep Reinforcement Learning in Computer Vision. Visit Website:
Stars: ✭ 59 (+156.52%)
Mutual labels:  course-materials, deep-reinforcement-learning
Lunatech Scala 2 To Scala3 Course
Lunatech course - "Moving forward from Scala 2 to Scala 3"
Stars: ✭ 174 (+656.52%)
Mutual labels:  course-materials
kubernetes-hy.github.io
Course material for the DevOps with Kubernetes free MOOC by the University of Helsinki
Stars: ✭ 57 (+147.83%)
Mutual labels:  course-materials
abc
SeqGAN but with more bells and whistles
Stars: ✭ 25 (+8.7%)
Mutual labels:  deep-reinforcement-learning
SharkStock
Automate swing trading using deep reinforcement learning. The deep deterministic policy gradient-based neural network model trains to choose an action to sell, buy, or hold the stocks to maximize the gain in asset value. The paper also acknowledges the need for a system that predicts the trend in stock value to work along with the reinforcement …
Stars: ✭ 63 (+173.91%)
Mutual labels:  deep-reinforcement-learning
Practical-DRL
This is a practical resource that makes it easier to learn about and apply Practical Deep Reinforcement Learning (DRL) https://ibrahimsobh.github.io/Practical-DRL/
Stars: ✭ 66 (+186.96%)
Mutual labels:  deep-reinforcement-learning
Vue Master Class
🗂 Source code for The Vue 2 Master Class
Stars: ✭ 147 (+539.13%)
Mutual labels:  course-materials
MLclass
My main Machine Learning class
Stars: ✭ 56 (+143.48%)
Mutual labels:  course-materials
DQN-using-PyTorch-and-ML-Agents
A simple example of how to implement vector based DQN using PyTorch and a ML-Agents environment
Stars: ✭ 81 (+252.17%)
Mutual labels:  deep-reinforcement-learning
omd
JAX code for the paper "Control-Oriented Model-Based Reinforcement Learning with Implicit Differentiation"
Stars: ✭ 43 (+86.96%)
Mutual labels:  deep-reinforcement-learning
king-pong
Deep Reinforcement Learning Pong Agent, King Pong, he's the best
Stars: ✭ 23 (+0%)
Mutual labels:  deep-reinforcement-learning
AI-Projects
AI项目(强化学习、深度学习、计算机视觉、推荐系统、自然语言处理、机器导航、医学影像处理)
Stars: ✭ 39 (+69.57%)
Mutual labels:  deep-reinforcement-learning
UAV obstacle avoidance controller
UAV Obstacle Avoidance using Deep Recurrent Reinforcement Learning with Temporal Attention
Stars: ✭ 61 (+165.22%)
Mutual labels:  deep-reinforcement-learning
action-branching-agents
(AAAI 2018) Action Branching Architectures for Deep Reinforcement Learning
Stars: ✭ 91 (+295.65%)
Mutual labels:  deep-reinforcement-learning
good robot
"Good Robot! Now Watch This!": Repurposing Reinforcement Learning for Task-to-Task Transfer; and “Good Robot!”: Efficient Reinforcement Learning for Multi-Step Visual Tasks with Sim to Real Transfer
Stars: ✭ 84 (+265.22%)
Mutual labels:  deep-reinforcement-learning
Natural Language Processing Specialization
This repo contains my coursework, assignments, and Slides for Natural Language Processing Specialization by deeplearning.ai on Coursera
Stars: ✭ 151 (+556.52%)
Mutual labels:  course-materials
CS110Notes
1st time TAing for CS110 at Stanford: Principles of Computer Systems? - Stars are appreciated :)
Stars: ✭ 59 (+156.52%)
Mutual labels:  course-materials
Reinforcement-Learning-on-google-colab
Reinforcement Learning algorithm's using google-colab
Stars: ✭ 33 (+43.48%)
Mutual labels:  deep-reinforcement-learning
DSMO.course
Data Science and Matrix Optimization course
Stars: ✭ 64 (+178.26%)
Mutual labels:  course-materials

Страничка курса "Обучение с подкреплением и нейронные сети"

Курс посвящен методам обучения с подкреплением (Reinforcement learning) - одному из способов машинного обучения. В нем будет рассмотрена задача о создании систем, которые могли бы приспосабливаться к окружающей среде, а также обучаться на основе получаемого опыта. Такие задачи возникают во многих областях, включая информатику, технические науки, математику, физику, нейробиологию и когнитологию. В середине 2010-х годов методы обучения с подкреплением удалось эффективно применить для обучения глубоких нейронных сетей, что привело к ряду значимых результатов. В рамках спецкурса будут изложены основные методы обучения с подкреплением, приведены техники их успешного использования для глубоких нейронных сетей, рассмотрены примеры, предложены практические задания.

Лекции

Лекция 1. Введение в обучение с подкреплением. Метод Cross-Entropy (слайды/видео)

Лекция 2. Введение в нейронные сети. Deep Cross-Entropy Method (слайды/видео)

Лекция 3. Динамическое программирование (слайды/видео)

Лекция 4. Model-Free Reinforcement Learning (слайды/видео)

Лекция 5. Value Function Approximation (слайды/видео)

Лекция 6. Policy Gradient (слайды/видео)

Практики

Практика 1. Метод Cross-Entropy для решение Maze (код)

Практика 2. PyTorch и Deep Cross-Entropy (код 1/код 2/код 3/видео)

Практика 3. Решение Frozen Lake методами Policy Iteration и Value Iteration (код/видео)

Практика 4. Решение Taxi методами Monte-Carlo, SARSA и Q-Learning (код/видео)

Практика 5. Решение Cartpole методом DQN (код/видео)

Практика 6. Решение Pendulum методом DDPG (код/видео)

Домашние задания

Домашнее задание 1

Домашнее задание 2

Домашнее задание 3

Домашнее задание 4

Полезные ссылки

https://gym.openai.com/ Страничка библиотеки Gym для Python. В ней содержаться многие стандартные Environments для обучения с подкреплением.

https://github.com/MattChanTK/gym-maze Репозиторий сред c Maze

https://pytorch.org/ Сайт библиотеки PyTorch.

https://playground.tensorflow.org/ Страничка с хорошей визуализацией обучения нейронных сетей. Просто так :)

Видеолекции других курсов

A. Panin. Cross-Entropy Method. Короткая, но понятная лекция по применению метода Cross-Entropy к задачам обучения с подкреплением.

D. Silver. Introduction to Reinforcement Learning. Курс по Reinforcement Learning в University College London.

Литература

Р.С. Саттон, Э.Г. Барто. Обучение с подкреплением (1998). Уже ставшая классической монография по обучению с подкреплением.

C. Николенко, А. Кадурин, Е. Архангельская. Глубокое обучение. Погружение в мир нейронных сетей (2018). Пожалуй, единственная книга на русском, в которой последовательно и достаточно полно изложены основные моменты работы с нейронными сетями. Написана простым языком, но при этом включает в себя серьёзный обзор литературы со ссылками на первоисточники.

S. Mannor, R. Rubinstein, Y. Gat. The Cross-Entropy method for Fast Policy Search (2003). Статья про использование метода Cross-Entropy для оптимизации Policy в задачах обучения с подкреплением.

A. Costa, O. Jones, D. Kroese. Convergence properties of the cross-entropy method for discrete optimization (2007) В статье дается обоснование сходимости метода Cross-Entropy в задачах дискретной оптимизации. Однако, если пространство состояний и действий конечные, а среда детерминирована, то, кажется, задача Reinforcement Learning в рассматриваемую постановку задачи дискретной оптимизации вкладывается.

G. Cybenko. Approximation by Superpositions of a Sigmoidal Function (1989). Теорема Цыбенко об аппроксимации непрерывных функций суперпозициями сигмоидальных функций (считай нейронными сетями).

V. Mnih at el. Playing Atari with Deep Reinforcement Learning (2013). Статья про алгоритм DQN в приложении к играм Atari.

H. Van Hasselt, A. Guez, D. Silver. Deep Reinforcement Learning with Double Q-Learning (2016). Статья про алгоритм Double DQN.

S. Gu, T. Lillicrap, I. Sutskever, S. Levine. Continuous Deep Q-Learning with Model-based Acceleration (2016). Статья про алгоритм Continuous DQN.

D. Silver at el. Deterministic Policy Gradient Algorithms David (2014). Статья, в которой доказывается Deterministic Policy Gradient Theorem и приводится Deterministic Policy Gradient Algorithm.

T. Lillicrap at el. Continuous control with deep reinforcement learning (2016) Статья про алгоритм DDPG.

V. Mnih at el. Asynchronous Methods for Deep Reinforcement Learning (2016). Статья про асинхронный подход для решения задач Reinforcement Learning.

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].