Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

Misc with no match

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

2,086

Full-text search

Active filters: ppo

sswt/ppo-LunarLander-v2-crl

Reinforcement Learning • Updated Sep 30, 2024

alient12/ppo-CartPole-v1

Reinforcement Learning • Updated Sep 30, 2024

eloise54/cleanRL-ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 1, 2024

ValentinGuigon/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 1, 2024

ValentinGuigon/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 1, 2024

gziz/ppo-scratch-LunarLander

Reinforcement Learning • Updated Oct 2, 2024

seangogo/ppo-CartPole-v1-ppo-from-scratch

Reinforcement Learning • Updated Oct 2, 2024

grib0ed0v/ppo-LunarLander-v2-unit8

Reinforcement Learning • Updated Oct 4, 2024

Klimxo/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 6, 2024

Klimxo/own-ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 6, 2024

Klimxo/own-ppo-LunarLender-v2

Reinforcement Learning • Updated Oct 6, 2024

teresayong/ppo-LunarLander-v2

Reinforcement Learning • Updated Oct 9, 2024

EntropicLettuce/ppo-CartPole-v1_d

Reinforcement Learning • Updated Oct 8, 2024

EntropicLettuce/ppo-LunarLander-v2-u8

Reinforcement Learning • Updated Oct 8, 2024

HIT-WZ/LunarLander

Reinforcement Learning • Updated Oct 8, 2024

amanoyaku/ppo-LunarLander-v2

Reinforcement Learning • Updated Dec 30, 2024 • 1

Juu24/Lunar_PPO

Reinforcement Learning • Updated Oct 10, 2024

nguyennhusonars/LunarLander-v2-II

Reinforcement Learning • Updated Oct 11, 2024

pableitorr/LunarLander-v2-UNIT8

Reinforcement Learning • Updated Oct 11, 2024

mohitpg/ppoll

Reinforcement Learning • Updated Oct 12, 2024

MartinVanBuren/ppo-unit-8-1

Reinforcement Learning • Updated Oct 13, 2024

sjkwon/sft-mdo-diverse-train-nllb-200-600M

Reinforcement Learning • Updated Oct 22, 2024 • 48

sjkwon/sft-mdo-diverse-train-nllb-200-600M-step200

Reinforcement Learning • Updated Oct 15, 2024 • 46

SwordAndTea/ppo-LunarLander-v2-scratch

Reinforcement Learning • Updated Oct 18, 2024

jerryvc/ppo-self-LunarLander-v2

Reinforcement Learning • Updated Oct 19, 2024

pkalkman/ppo-PongNoFrameskip-v4

Reinforcement Learning • Updated Oct 20, 2024 • 3

pkalkman/ppo-BreakoutNoFrameskip-v4

Reinforcement Learning • Updated Oct 20, 2024 • 2

Qingqing358/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 21, 2024

erdody/ppo-CartPole-v1

Reinforcement Learning • Updated Oct 23, 2024

erdody/CartPole-v1

Reinforcement Learning • Updated Oct 23, 2024