Edit Models filters

Inference status

Misc

Inference Endpoints

AutoTrain Compatible

text-generation-inference

Misc with no match

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

1,978

Full-text search

Active filters: ppo

sun-s/ppo-CartPole-v1

Reinforcement Learning • Updated 13 days ago

tensorblock/Moxoff-Phi3Mini-PPO-GGUF

Updated 9 days ago • 220

SD403/ppo-LunarLander-v2-Pytorch

Reinforcement Learning • Updated 12 days ago

pixeldoggo/ppo-LunarLander-v2-2

Reinforcement Learning • Updated 7 days ago

averydd/ppo-LunarLander-v2-unit812

Reinforcement Learning • Updated 7 days ago

nteku1/firstppomodel

Reinforcement Learning • Updated 5 days ago • 6

nteku1/final_ppomodel

Reinforcement Learning • Updated 5 days ago • 7

Vagnus/ppo-CartPole-v1

Reinforcement Learning • Updated 5 days ago

Setpember/Jon_GPT2L_PPO_epi_point1

Reinforcement Learning • Updated 2 days ago • 12

Setpember/Jon_GPT2L_PPO_epi_point5

Reinforcement Learning • Updated 5 days ago • 2

Setpember/Jon_GPT2L_PPO_epi_1

Reinforcement Learning • Updated 5 days ago • 5

Setpember/Jon_GPT2L_PPO_epi_2

Reinforcement Learning • Updated 2 days ago • 6

Setpember/Jon_ppo_stage1_epi_2

Reinforcement Learning • Updated 5 days ago • 6

Setpember/Jon_ppo_stage2_epi_2

Reinforcement Learning • Updated 5 days ago • 7

Setpember/Jon_ppo_stage1_epi_1

Reinforcement Learning • Updated 5 days ago • 6

Setpember/Jon_ppo_stage2_epi_1

Reinforcement Learning • Updated 5 days ago • 6

Setpember/Jon_ppo_stage1_epi_point5

Reinforcement Learning • Updated 5 days ago • 10

Setpember/Jon_ppo_stage2_epi_point5

Reinforcement Learning • Updated 5 days ago • 6

Setpember/Jon_ppo_stage1_epi_point1

Reinforcement Learning • Updated 5 days ago • 7

Setpember/Jon_ppo_stage2_epi_point1

Reinforcement Learning • Updated 5 days ago • 4

TPK-MAKG/ppo-ReImagined-LunarLander-v2

Reinforcement Learning • Updated 3 days ago

TPK-MAKG/ppo-ReImagined-LunarLander-v2-pt2

Reinforcement Learning • Updated 3 days ago

Setpember/Jon_GPT2L_PPO_epi_inf

Reinforcement Learning • Updated 2 days ago • 2

nteku1/Jon_GPT2L_PPO_epi_inf

Reinforcement Learning • Updated 2 days ago • 4

nteku1/Jon_GPT2L_PPO_epi_point1

Reinforcement Learning • Updated 1 day ago • 4

power-is-me/ppo-CartPole-v1

Reinforcement Learning • Updated 1 day ago

yunk3r/ppo-lunur-v2-part2

Reinforcement Learning • Updated 1 day ago

zfh1995/cleanrl-ppo-LunarLander-v2

Reinforcement Learning • Updated about 17 hours ago