Setpember
/

Jon_ppo_stage1_epi_point1

Reinforcement Learning

Inference Endpoints

Model card Files Files and versions Community

Jon_ppo_stage1_epi_point1

1 contributor

History: 2 commits

Setpember's picture

Push model using huggingface_hub.

21c956c verified 9 days ago

.gitattributes

1.52 kB

initial commit 9 days ago
README.md

1.28 kB

Push model using huggingface_hub. 9 days ago
adapter_config.json

638 Bytes

Push model using huggingface_hub. 9 days ago
adapter_model.safetensors

11.8 MB
LFS

Push model using huggingface_hub. 9 days ago
config.json

1.2 kB

Push model using huggingface_hub. 9 days ago
merges.txt

456 kB

Push model using huggingface_hub. 9 days ago
pytorch_model.bin
Detected Pickle imports (3)
- "torch.FloatStorage",
- "torch._utils._rebuild_tensor_v2",
- "collections.OrderedDict"
What is a pickle import?
6.65 kB
LFS

Push model using huggingface_hub. 9 days ago
special_tokens_map.json

470 Bytes

Push model using huggingface_hub. 9 days ago
tokenizer.json

2.11 MB

Push model using huggingface_hub. 9 days ago
tokenizer_config.json

509 Bytes

Push model using huggingface_hub. 9 days ago
vocab.json

798 kB

Push model using huggingface_hub. 9 days ago