Algorithm Descriptions

🌱 DQN(Deep Q-Network)

🛫 DDQN(Double_DQN)

⚔️ Dueling DQN

🏅 PER(Prioritized_Experience_Replay)

🌊 Noisy Network

🎰 C51

🌈 Rainbow DQN

🧛 Munchausen RL

🎲 QR-DQN(Quantile_Regression_DQN)

📊 IQN(Implicit_Quantile_Network)

👪 APE-X

🤖 R2D2

🌴 DDPG(Deep_Deterministic_Policy_Gradient)

⏳ TD3(Twin_Delayed_DDPG)

🌀 PPO(Proximal_Policy_Optimization)

🛸 SAC(Soft_Actor-Critic)

⚾ MPO(Maximum_a_Posteriori_Policy_Optimization)

🥎 V-MPO(On-Policy Maximum a Posteriori Policy Optimization)

❔ ICM(Intrinsic Curiosity Module)

❓ RND(Random Network Distillation)