optimal-policy

Here are 6 public repositories matching this topic...

raklokesh / ReinforcementLearning_Sutton-Barto_Solutions

Solutions and figures for problems from Reinforcement Learning: An Introduction Sutton&Barto

reinforcement-learning qlearning mountain-car sarsa gradient-descent feature-engineering bandit-algorithm sutton-gambler sutton-book dynaq sutton-gridworld blackjack-montecarlo batch-update maximization-bias infinite-variance rl-sutton semi-gradient-sarsa short-corridor optimal-policy

Updated Jul 16, 2019
Python

ChaitanyaC22 / Deep-RL-Project---Maximize-total-profits-earned-by-cab-driver

Star

The goal of this project is to build an RL-based algorithm that can help cab drivers maximize their profits by improving their decision-making process on the field. Taking long-term profit as the goal, a method is proposed based on reinforcement learning to optimize taxi driving strategies for profit maximization. This optimization problem is fo…

Updated Jul 9, 2021
Jupyter Notebook

nicolaloi / Dynamic-Programming-and-Optimal-Control

Star

Infinite horizon policy optimization for drone navigation. Graded project for the ETH course "Dynamic Programming and Optimal Control".

linear-programming dynamic-programming policy-iteration value-iteration bellman-equation optimal-path drone-control optimal-policy

Updated Nov 2, 2021
MATLAB

IsmaelMousa / mdp-value-iteration

Star

Implementation of the MDP algorithm for optimal decision-making, focusing on value iteration and policy determination.

python ai algorithms pandas artificial-intelligence mdp markov-decision-processes value-iteration q-value optimal-policy

Updated Jun 12, 2024
Python

Megha-Bose / Markov-Decision-Process

Star

Computing optimal MDP policy using Value Iteration Algorithm and Linear Programming

linear-programming mdp value-iteration value-iteration-algorithm optimal-policy

Updated Apr 22, 2021
Python

etienneandre / ImpRator

Star

ImpRator (Inverse Method for Policy with Reward AbstracT behaviOR) is a prototype implementation to compute parameter valuations in parametric Markov decision processes such that optimal policies remain optimal.

markov-decision-processes policy-iteration parameter-synthesis optimal-policy

Updated Nov 8, 2023
OCaml

Improve this page

Add a description, image, and links to the optimal-policy topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the optimal-policy topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

optimal-policy

Here are 6 public repositories matching this topic...

raklokesh / ReinforcementLearning_Sutton-Barto_Solutions

ChaitanyaC22 / Deep-RL-Project---Maximize-total-profits-earned-by-cab-driver

nicolaloi / Dynamic-Programming-and-Optimal-Control

IsmaelMousa / mdp-value-iteration

Megha-Bose / Markov-Decision-Process

etienneandre / ImpRator

Improve this page

Add this topic to your repo