Upside-Down-Reinforcement-Learning

Implementation of Schmidhuber's Upside Down Reinforcement Learning paper

Link to paper with theory: https://arxiv.org/pdf/1912.02875.pdf

Link to paper with implementation details and results: https://arxiv.org/pdf/1912.02877.pdf

Use as you wish. Tweet(@mfharoon)/email(hshams@hotmail.co.uk) me any interesting results you find and sets of hyperparameters that work for particular environments. I will share here. Thanks!

Working Hyper-Parameters

CartPole

replay_size = 600
last_few = 50
batch_size = 64
n_warm_up_episodes = 50
n_episodes_per_iter = 50
n_updates_per_iter = 100
command_scale = 0.02
lr = 0.001

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
.gitignore		.gitignore
README.md		README.md
Upside Down RL dev.ipynb		Upside Down RL dev.ipynb
Upside Down Reinforcement Learning.py		Upside Down Reinforcement Learning.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Upside-Down-Reinforcement-Learning

Working Hyper-Parameters

CartPole

About

Releases

Packages

Languages

haron1100/Upside-Down-Reinforcement-Learning

Folders and files

Latest commit

History

Repository files navigation

Upside-Down-Reinforcement-Learning

Working Hyper-Parameters

CartPole

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages